文字コード問題、この一年



加藤弘一


謹 告 
 本ページは本ページは古い情報にもとづくもので、間違いがあります。引きつづき参考として公開をつづけますが、文字コードに興味のある方は拙著『電脳社会の日本語』(文春新書)をお読みください。(2000年 4月 7日)

 わたしの運営する文芸ホームページ「ほら貝」に、「文字コード問題特設ページ」を設けたのは昨年の9月14日のことだった。つまり、この9月でちょうど一年たったことになる。

 当初は物書きとしての問題提起を中心に、簡単な解説とリンク集を合わせたこぢんまりしたページにするつもりだったが、思いがけず反響を呼び、多くの方々からご教示をいただいたり、情報提供をいただいたりするうちに、大がかりなページになっていった。「文字コード問題早わかり」という解説だけでも、原稿用紙二百枚以上の分量にふくれあがり、「早わかりの早わかり」を準備しなければならなくなっている。

 細部にいたるまで、懇切にご教示いただいた皆さんにあらためて感謝の意を表するとともに、誤りの訂正と最新情報によるアップデートを常に心がけているので、早い段階で「ほら貝」の解説を読まれた方は、もう一度、読みに来ていただきたいと思う。

 さて、文字コード問題は、この一年で大きな動きがいくつもあった。

 第一は、インターネット経由のメールの文字化けの頻発で、文字コード問題に対する一般の関心が格段に高まったことがある。

 インターネット経由メールの文字化けはさまざまな原因でおこるが、件数的に過半を占めると思われるのは、7bitのメールサーバーと8bitのメールサーバーの混在が一因となった文字化けである。RFC1468というインターネット・コミュニティの合意により、日本語は7bitで送りだすことになっているのだが、この約束を守らないメールソフトがあり、しかも初心者が購入することが多いWindows95のプリインストールマシンに標準で装備されているので、パソコン雑誌が軒並み文字化け対策の記事をのせる騒ぎになった。

 もちろん、インターネットの常識に反するソフトを作るのが悪いのだが、根本原因は7bitのASCIIコードにある。1962年の時点で7bitコードを採用したのは、画期的な選択だったが、1980年代には現実に追いつかれてしまい、現在では桎梏となっている。文字コードは都市計画と似たところがあり、非現実的なくらい余裕をもった設計でないと、将来に禍根を残すのである。

 第二に、ネットワーク社会が本格的にはじまろうとしているこの期におよんで、外字ライブラリが相次いで商品化されたことがある。外字ライブラリは昔からあるが、人名異体字や仏教関係の漢字を中心に八万字を収録したものや、鍼灸関係の1800字を収録したものなど、業種ごとの必要に迫られて作られたという印象が強い。

 ローカルなネットワークで外字を共有するXKP関連商品も出はじめたし、アドビのCIDフォント技術を使った異体字フォントも出た。CD-ROM出版物では、JIS表内文字の位置に異体字や表外字をマッピングした特別なフォントを用意し、フォント切り換えで表示する特殊外字方式を使っているものが多い。

 あくまで外字であるから、インターネットでは問題があるのだが、背に腹はかえられないということだろう。

 第三に、JIS X 0208が七年ぶりに改正された。今回は小変更をおこなわず、JISコード成立の経緯にさかのぼって規格の明確化をおこなうとともに、外字に使われてきた自由領域を廃止した点は評価したい。

 外字原則禁止は、ネットワーク社会を目前にしている現在、当然の措置であるが、改正後も外字機能をそなえたワープロ専用機が現役商品として店頭にならんでいるし、パソコン用の外字関連商品が次々と登場してきていることは、右に述べたとおりだ。

 JIS X 0208の今回の改正では、文字包摂を明文化した点も重要で、さまざまな難点をふくんでいるのだが、こみいった問題だけに、「ほら貝」に掲載した「小は大をかねるか?」をお読みいただきたい。

 第四に、外字原則禁止であいたJIS X 0208の隙間を使って、約5000字を増やすJIS X 0213の1998年公開レビュー、1999年施行が発表された。

 大規模な文字種の追加というと、JIS X 0212(補助漢字)の失敗を思いだすが、JIS X 0213の場合、JIS X 0208に寄生する形で文字種を増やすので、OSやアプリケーションの変更なしに、JIS X 0208+JIS X 0213のフォント(公開レビューと同時に無料配布するという)をインストールするだけで、1万1千字余に拡張された文字セットを使うことが出来る。

 無料のフォントを入れるだけでいいのだから、あるパーセンテージまでは急激な普及が予想されるが、自力では入れられないユーザーもすくなくないし、外字を使うシステムがまだ多数存在する状況では、83JIS登場時をはるかにこえる混乱が生じると予想される。詳しくは「ほら貝」に仮掲載中の「四つの悪夢」を見ていただきたいが、外字原則禁止からたった二年で、外字領域を使った文字拡張を強行するというのが無理な話なのだ。

 JIS X 0213は、最低五年間、凍結すべきだと考えるが、いかがだろうか。



付記
 この文章は「本とコンピュータ」第二号(1997年10月)に発表したもので、「この一年」とは 1997年10月時点における「一年」です。雑誌発表の文章をほら貝に転載する場合は、掲載後一年以上たってからにすることにしていますが、時事的な内容であることを考慮し、半年で転載しました。
 1998年 4月の時点でふりかえると、この文章の危惧はあたっていたなと思います。外字関連製品はあいかわらず出ていて、10日ほど前には「漢字職人」ver2.0が出ました。「今昔文字鏡」のTrueType版もまもなく出るようです(文字セットとしても、検字機能もすばらしいのですが、外字として使うというスキームは問題です)。
 JCS委員会側は JIS X 0213の宣伝をさかんにやっていますが、外字領域を使った拡張の危険性についてはまったく触れようとしません。コンピュータ・ジャーナリズムはJCS委員会の主張をオウム返しするだけです。ちょっと考えれば、どんなことになるかわかりそうなものなのに、この国のコンピュータ・ジャーナリズムはどうしようもありませんね。

Copyright 1998 Kato Koiti
This page was created on Apr06 1998; Updated on Apr08 1998.



文字コード

ほら貝目次