Excelで作成したcsvとtxtの文字コードまとめ

BLOG / 2017.02.10

InDesignのデータ結合用のデータソースを選択する際に毎度エラーを出してしまうので備忘録をまとめようとした際に、どうにもボリューミーになったので別に。
とりあえず手元で調べられるExcelの範囲内で。
文字コードの判別は、Sublime Text 3の文字コードの表示と、Mac ターミナルのnkfコマンドをインストールして見ているので、正しい表記なのかはソフト頼りなので気になる方はご自身で見て下さい

環境:Windows Excel 2016
保存形式 文字コード
CSV UTF-8 (カンマ区切り) .csv UTF-8 with BOM
CSV (カンマ区切り) .csv CP932
テキスト (タブ区切り) .txt CP932
Unicode テキスト .txt UTF-16 LE with BOM
個人的メモ:CP932なので、ファイルとしては私の名字の「﨑(たつ崎)」が表示できるけれど、InDesignはShift_JISで読み込むので四角の中にバツ(豆腐?)になる。 でも犛はどのみちダメだった。
環境:Mac Excel 2016
保存形式 文字コード
CSV UTF-8 (カンマ区切り) .csv UTF-8 with BOM
CSV (コンマ区切り) .csv Shift_JIS
タブ区切りテキスト .txt Shift_JIS
UTF-16 Unicode テキスト .txt UTF-16 LE with BOM
個人的メモ:Shift_JISなので「﨑(たつ崎)」はアンダーバー(_)等になる。
環境:Mac Excel 2011
保存形式 文字コード
CSV (コンマ区切り) .csv Shift_JIS
タブ区切りテキスト .txt Shift_JIS
UTF-16 Unicode テキスト .txt UTF-16 LE with BOM
環境:Windows Excel 2003
保存形式 文字コード
CSV (カンマ区切り) .csv CP932
テキスト (タブ区切り) .txt CP932
Unicode テキスト .txt UTF-16 LE with BOM

所感

Webだと「BOM付きはダメ」と覚えるんですが、基本BOM付きなんですね。
Mac版Excel2016の、ファイルの保存形式にカンマとコンマが混ざってるのが気になる…。
InDesignでデータ結合する際はUnicodeテキストが一番良さそう。

補足

CP932という表記については文字コードに詳しい方は特に色々と思うところがあるかと思いますが、私が見ているSublime Text 3の環境ではCP932と表示されており、Windows-31Jとは確約できないので表記しないことにしました。
Mac ターミナルのnkfコマンドでも、Windowsで作成したExcelはCP932、Macで作成したExcelはShift_JISでした。

Shift_JISとCP932と分けて表記していれば、むしろ詳しい方は察してくれると期待して、ここが厳密に必要な方はご自身で確認されたほうが良いかと思います。
というかご自身で確認して下さい。

歴史については下記のサイトさんが大変わかりやすく、かつ読み物として面白かったです。
Shitf_JISとCP932とMS932とWindows-31Jを昔話風に語ってみた

また、今回はExcelで作成したcsvとtxtファイルの文字コードについての記事ですので、Excel自身がUTF-16の書き出し分けなど、文字コードに関する細かな設定をすることができないため、BOMの有無、LEやBE等は保留とします。