2004年02月17日
文字コードの変換
ファイルの文字コードを変換する方法は色々あるが、ここでは普段UNIXで使う次の2つの方法をまとめておく。
1.emacs を使って変換する方法
2.UNIXのコマンドラインから変換する方法
1.emacsを使って変換する方法
emacs(もしくはmule、xemacs)で変換したいファイルを開いて、次のコマンドを実行する。
古いバージョンでは,
キーバインド:C-x C-k f
関数名:set-file-coding-system
新しいバージョンでは,
キーバインド:C-x RET f
関数名:set-buffer-file-coding-system
ミニバッファに変換する文字コードを入力する.Unicodeが使えない場合もあるので,その場合は2の方法も併用するとよい。
2.UNIXのコマンドラインでプログラムを使って変換する方法
nkfかiconvというツールを使う。
JISに変換するには,
% nkf -j input > output
SHIFT_JISに変換するには,
% nkf -s input > output
EUC-JPに変換するには,
% nkf -e input > output
UTF-8に変換するには(JISからの場合),
% iconv -f iso-2022-jp -t utf-8 input > output