next up previous
Next: B. インターネットで使って良い文字悪い文字 (日本語) Up: 情報処理II 第5回 情報の電子化 (1) Previous: 3.6.0.2 腕試し用プログラミング課題2

A. 日本語の文字コードの変換

UNIX 上のコマンドには自動的に文字コードを判別して必要な処理をしてく れるものがあるが (mule, less 等)、時にはユーザーが意識的に変換すること が必要になる。

それほど難しい作業でもないのでフリーソフトがある。二つほど紹介する。

nkf
(Network Kanji code conversion Filter) UNIX では定番。
nkf -e ファイル名 で日本語 EUC に変換したものを標準出力に書き出す。
nkf -j ファイル名 で JIS 漢字コードに変換したものを標準出力に書き出す。
nkf -s ファイル名 で MS 漢字コードに変換したものを標準出力に書き出す。
電子メールで使われる MIME のデコードもできる。
nkf -v でオプションの一覧が表示される。
waltz12% nkf -j kanji.txt > kanji.txt.jis
qkc
(Quick KANJI code Converter) Windows 版もある。行末の変換もしてくれる。
qkc -eu ファイル名 で日本語 EUC, 行末を UNIX 形式に変換する。
qkc -ms ファイル名 でシフトジス, 行末を MS-DOS 形式に変換する。
waltz12% cp kanji.txt kanji.txt.ms
waltz12% qkc -ms kanji.txt.ms


next up previous
Next: B. インターネットで使って良い文字悪い文字 (日本語) Up: 情報処理II 第5回 情報の電子化 (1) Previous: 3.6.0.2 腕試し用プログラミング課題2
Masashi Katsurada
平成20年10月18日