2004年02月17日

文字コードの変換

ファイルの文字コードを変換する方法は色々あるが、ここでは普段UNIXで使う次の2つの方法をまとめておく。
1.emacs を使って変換する方法
2.UNIXのコマンドラインから変換する方法

1.emacsを使って変換する方法

emacs(もしくはmule、xemacs)で変換したいファイルを開いて、次のコマンドを実行する。

古いバージョンでは,
キーバインド:C-x C-k f
関数名:set-file-coding-system

新しいバージョンでは,
キーバインド:C-x RET f
関数名:set-buffer-file-coding-system

ミニバッファに変換する文字コードを入力する.Unicodeが使えない場合もあるので,その場合は2の方法も併用するとよい。

2.UNIXのコマンドラインでプログラムを使って変換する方法

nkfかiconvというツールを使う。

JISに変換するには,
% nkf -j input > output

SHIFT_JISに変換するには,
% nkf -s input > output

EUC-JPに変換するには,
% nkf -e input > output

UTF-8に変換するには(JISからの場合),
% iconv -f iso-2022-jp -t utf-8 input > output