nkf -g ファイル名 でそのファイルの文字コードを判定 (推測 guess ということで -g) 出来る。
nkf 自体は小さなプログラムで自分で make するのも簡単だけど、
sudo port install nkf |
JIS, 日本語EUC, UTF-8 の間の変換とか,行末とか。 次の別名定義を参考にして下さい。
.profile に書き加え |
alias utf8='nkf --overwrite -w -Lu' alias euc='nkf --overwrite -e -Lu' alias sjis='nkf --overwrite -s -Lw' |
.tcshrc に書き加え |
alias utf8 'nkf --overwrite -w -Lu' alias euc 'nkf --overwrite -e -Lu' alias sjis 'nkf --overwrite -s -Lw' |
UTF-8 とは言っても、 Normalization form C (UTF-8), Normalization form D (UTF-8-MAC) がある。 Normalization form D から Normalization form C に変換するには、 入力がそうであることを --ic=UTF-8-MAC で明示すれば良い。
nkf --ic=UTF-8-MAC -w |
alias nonmac 'nkf --ic=UTF-8-MAC -w' |
実はずっと以前、ほんの少しだけ貢献したことがあって、 日本語マニュアルに名前を入れてもらっている。ちょっと嬉しい。
桂田 祐史