[525] カナ文字読み込み時の想定外の現象
ふぃす [2019/10/16 14:20:23]
お世話になっております。
ver2.1.0から「ロード時に文字コードを判別する」のチェックが規定でつくようになりましたが、英数字とカナが含まれているデータを読み込んだ際に想定しない現象がありましたので確認いただければと思います。
「ロード時に文字コードを判別する」の状態で半角カタカナが含まれているcsvデータを読み込ませるとカタカナ部分が文字化けしました。
使用したcsvデータの中身は下記です。
88081,20191010,ハンカク カナ,1,19990101,3,1190866,,,001,,,,,,,002,,002,,
また、オプション設定からチェックを外しcsvを読み込ませると「Unicode 文字のマッピングがターゲットのマルチバイトコードページに存在しません」と出てきました。
どちらもSJIS形式のcsvデータになります。
よろしくお願いいたします。
Re: [525] カナ文字読み込み時の想定外の現象
あすかぜ [2019/10/17 07:11:50]
ご指摘ありがとうございます。2.1.0 のバグのようです。
調べてみたいと思います。
Re: [525] カナ文字読み込み時の想定外の現象
ふぃす [2019/10/17 09:37:34]
対応ありがとうございます。
こちらでも調べていた内容ですが、
文字化けした状態で
ファイル→文字コード指定再読み込み→Shift-JISを選択すると望ましい形で表現されました。
ちなみに、自動判別時の文字コードはEUCでした。
既知の内容でしたらすみません。
Re: [525] カナ文字読み込み時の想定外の現象
あすかぜ [2019/10/27 10:13:14]
はい、このファイルの内容の場合、
・Shift-JIS として開いた場合、ファイルを開くことができるが、半角カナを含む。
・EUC として開いた場合、ファイルを開くことができ、半角カナを含まない。
・UTF-8 として開いた場合、不正なデータでありファイルを開くことができない。
となっています。
「ロード時に文字コードを判別する」では半角カナの優先順位を下げているので、このファイルが EUC として開かれるのは期待通りの挙動です。
[ファイル]-[文字コード指定再読み込み]-[Shift-JIS] で再読み込みをするか、「ロード時に文字コードを判別する」と「UTF-8 を優先して使用する」のチェックを外すことでの対処をお願いします。
「ロード時に文字コードを判別する」のチェックを外し「UTF-8 を優先して使用する」をチェックしていた場合、ファイルを UTF-8 として開こうとしてエラーとなっていました。
Ver. 2.1.1 で UTF-8 として読み込めないファイルは Shift-JIS として開くように変更しました。
よろしくお願いします。
Re: [525] カナ文字読み込み時の想定外の現象
ふぃす [2019/10/28 16:52:49]
ver 2.1.1 ダウンロードさせていただきました。
修正対応ありがとうございます。