2010年12月4日土曜日

Linuxと日本語(1) 日本語という言語の特殊性

 かつて、日本のパーソナル・コンピュータの9割はNECのPC-9800シリーズ(通称キューハチ)だったそうです。割合としては現在のWindowsパソコンと変わらないわけで、独占と呼んでいいシェアだと思います。まあ、大昔の話ですから数は決して多くなかったと思いますけど。

 どうしてキューハチがそれほどのシェアを誇っていたかというと、ハードウェアに日本語表示システムを組み込んでいたからだそうです。MS-DOSに日本語を表示するにはその方法が適当だったんでしょう。
 日本のPCが世界標準のPC/AT互換機になるのは、Windows95がリリースされ、日本語の問題がソフトウェア上で解決できるようになってからとか。

 日本のPC利用は、常に日本語表示/入力の問題とともにありました。

 コンピュータ利用における英語/日本語のちがいは、単なる言語の相違以上に大きいんです。
 英語は1バイト文字(半角)256種ですべてのアルファベットと記号をカバーすることができます。それだけあればどんなに複雑な文章であろうと表現することができる。
 ところが、日本語には漢字・ひらがな・カタカナの3種の文字があり、全角2バイト6万以上の文字種を得なければ表示できません。それだけあっても足りてないのが現状です。
 入力の際にもかならず「漢字変換」の機構が必要ですから、じつは「日本語の表示/入力ができる」というだけで相当のシステムリソースを消費しているのです。同じマシン上の同じソフトウェア、たとえばExcelを使って入力作業をする場合でも、日本語Excelのほうが挙動が鈍くなります(正確には、Excel日本語版は英語版と同じソフトではありません)。
 ことコンピュータへの導入だけに着目すれば、日本語はきわめて使い勝手の悪い、不便な言語だといえます。

 ……と、いうようなことを如実に理解できたのが、以前のLinuxでした。

 大昔、わたしは「はじめてのパソコン」Windows95マシンにSlackware Linuxをインストールし、デュアルブート環境をつくって悦に入っていたんですけど、「日本語の問題」ってすごく大きかったんです。
 当時はまだ日本語のLinuxディストリビューションはリリースされておらず、まず英語版のSlackwareをインストールし、そこにJEと呼ばれる日本語パッケージを入れて運用していました。日本語変換エンジンとしては、JEにふくまれるCannaまたはWnnを利用するのが一般的でした。

 CannaもWnnも、Windows上のATOKと比べると本当にお粗末なソフトでした。変換効率がぜんぜんちがう。
 当然といえば当然なんですけどね。CannaもWnnもフリーのオープンソース・ソフトだったんですけど、日本語変換なんて日本人しか使わないから、開発者の絶対数がすくない。オープンソース・マジックが効きにくい。
(「オープンソース」という言葉は当時まだなかったと思います)

 当時よく思ったのは、自分が英語圏に住んでたらLinuxを常用できたのになあ、ということでした。
 Windows95は安定性にかなり問題のあるOSでしたから、「恐怖の青画面」(知ってる人はオッサン/オバサンです)に出くわすことがとても多かった。そういうことのないLinuxはすごく魅力的に思えたんです。

 でも、日本語環境のお粗末さが、Linux常用をかたくなに阻んでいました。けっこうこういう人は多かったんじゃないかな、と思います。

 だから、それから何年かして、ジャストシステムがLinux版のATOKをリリースしたときは嬉しかったですねえ。
 もっとも、すぐには導入しなかったんです。なぜって……と話し出すと長くなりそうですので今回はこのへんで。

 そうそう、Cannaがその後どうなったかは寡聞にして知りませんが、Wnnは現在、携帯電話の変換エンジンとして活躍してるんですよ。Androidのデフォルト変換もWnnです。


This Page is created on Ubuntu Linux 10.10.
Ubuntu installed on IBM ThinkPad X41(The Last IBM Model - SSD remodeled).

0 件のコメント:

コメントを投稿