Excelで作成したcsvとtxtの文字コードまとめ
BLOG / 2017.02.10
InDesignのデータ結合用のデータソースを選択する際に毎度エラーを出してしまうので備忘録をまとめようとした際に、どうにもボリューミーになったので別に。
とりあえず手元で調べられるExcelの範囲内で。
文字コードの判別は、Sublime Text 3の文字コードの表示と、Mac ターミナルのnkfコマンドをインストールして見ているので、正しい表記なのかはソフト頼りなので気になる方はご自身で見て下さい。
保存形式 | 文字コード |
---|---|
CSV UTF-8 (カンマ区切り) .csv | UTF-8 with BOM |
CSV (カンマ区切り) .csv | CP932 |
テキスト (タブ区切り) .txt | CP932 |
Unicode テキスト .txt | UTF-16 LE with BOM |
個人的メモ:CP932なので、ファイルとしては私の名字の「﨑(たつ崎)」が表示できるけれど、InDesignはShift_JISで読み込むので四角の中にバツ(豆腐?)になる。 でも犛はどのみちダメだった。 |
保存形式 | 文字コード |
---|---|
CSV UTF-8 (カンマ区切り) .csv | UTF-8 with BOM |
CSV (コンマ区切り) .csv | Shift_JIS |
タブ区切りテキスト .txt | Shift_JIS |
UTF-16 Unicode テキスト .txt | UTF-16 LE with BOM |
個人的メモ:Shift_JISなので「﨑(たつ崎)」はアンダーバー(_)等になる。 |
保存形式 | 文字コード |
---|---|
CSV (コンマ区切り) .csv | Shift_JIS |
タブ区切りテキスト .txt | Shift_JIS |
UTF-16 Unicode テキスト .txt | UTF-16 LE with BOM |
保存形式 | 文字コード |
---|---|
CSV (カンマ区切り) .csv | CP932 |
テキスト (タブ区切り) .txt | CP932 |
Unicode テキスト .txt | UTF-16 LE with BOM |
所感
Webだと「BOM付きはダメ」と覚えるんですが、基本BOM付きなんですね。
Mac版Excel2016の、ファイルの保存形式にカンマとコンマが混ざってるのが気になる…。
InDesignでデータ結合する際はUnicodeテキストが一番良さそう。
補足
CP932という表記については文字コードに詳しい方は特に色々と思うところがあるかと思いますが、私が見ているSublime Text 3の環境ではCP932と表示されており、Windows-31Jとは確約できないので表記しないことにしました。
Mac ターミナルのnkfコマンドでも、Windowsで作成したExcelはCP932、Macで作成したExcelはShift_JISでした。
Shift_JISとCP932と分けて表記していれば、むしろ詳しい方は察してくれると期待して、ここが厳密に必要な方はご自身で確認されたほうが良いかと思います。
というかご自身で確認して下さい。
歴史については下記のサイトさんが大変わかりやすく、かつ読み物として面白かったです。
Shitf_JISとCP932とMS932とWindows-31Jを昔話風に語ってみた
また、今回はExcelで作成したcsvとtxtファイルの文字コードについての記事ですので、Excel自身がUTF-16の書き出し分けなど、文字コードに関する細かな設定をすることができないため、BOMの有無、LEやBE等は保留とします。