2000 年度「計算機基礎論3B」 日本語のコードについて

(いわゆる)日本語をコンピュータ内で扱うための 「コード」は大きく分けて3通りのものが使われています。 いずれも俗称だと思いますが「JISコード」「シフトJISコード」「EUCコード」 の三つです。

※ 「JIS」は「ジス」だが「EUC」は「イーユーシー」と読む。

WS で使われるのは普通「EUCコード」なので、 「JISコード」や「シフトJISコード」 で書かれたテキストファイルを画面出力するといわゆる「文字化け」が起こります。 コード変換は、nkf というプログラムで行なうことができます。 「nkf -e file1 > file2」で file1 の内容を「EUCコード」に変換しつつ file2 にコピーします。file2 が存在していれば上書きされます。 -e の代わりに -j とすれば「JISコード」に、 -s とすれば「シフトJISコード」に変換です。 一度、文字化けした状態を見ておくのもいい経験でしょう。

※ 「シフトJISコード」はパソコンでよく使われるコードである。 このページもそのコードで書いている。 それでも文字化けせずに読めるのは netscape が変換してくれているからだ。


岩瀬順一 <iwase@kappa.s.kanazawa-u.ac.jp>