2000 年度「計算機基礎論3B」 日本語のコードについて
(いわゆる)日本語をコンピュータ内で扱うための
「コード」は大きく分けて3通りのものが使われています。
いずれも俗称だと思いますが「JISコード」「シフトJISコード」「EUCコード」
の三つです。
※ 「JIS」は「ジス」だが「EUC」は「イーユーシー」と読む。
WS で使われるのは普通「EUCコード」なので、
「JISコード」や「シフトJISコード」
で書かれたテキストファイルを画面出力するといわゆる「文字化け」が起こります。
コード変換は、nkf というプログラムで行なうことができます。
「nkf -e file1 > file2」で file1 の内容を「EUCコード」に変換しつつ
file2 にコピーします。file2 が存在していれば上書きされます。
-e の代わりに -j とすれば「JISコード」に、
-s とすれば「シフトJISコード」に変換です。
一度、文字化けした状態を見ておくのもいい経験でしょう。
※ 「シフトJISコード」はパソコンでよく使われるコードである。
このページもそのコードで書いている。
それでも文字化けせずに読めるのは netscape が変換してくれているからだ。
岩瀬順一
<iwase@kappa.s.kanazawa-u.ac.jp>