漢字シソーラスの水脈
    ――いわき明星大 田嶋一夫氏に聞く

加藤弘一 国文学研究資料館時代
JIS「批判」派として
補助漢字をめぐって
委員長交代劇の背景
統合漢字について
田嶋一夫氏 1941年、群馬県生まれ。早大卒。国立国文学研究資料館助教授をへて、現在、いわき明星大教授。

田嶋一夫氏

国文学研究資料館時代

――田嶋先生は漢字文献処理の第一人者でいらっしゃいますが、いつ頃からコンピュータにかかわられたのですか?

田嶋 国立国文学研究資料館は1972年5月に発足しますが、コンピュータによる文献データベースの構築は、最初から資料館の構想にはいっていまして、わたくしは設立の準備段階から関係していました。

――1972年というと、神代の昔ですね。

田嶋 今の感覚ではわかりにくいと思いますが、四段シフトとか八段シフトで漢字を直接入力する巨大なキーボードとか、文字盤からライトペンで目当ての漢字をポイントするものとか、いろいろな入力方式がありました。そういう原始的な入力方式ではもたつきますし、メモリをバッファに使うなんて考えられなかったですから、いきなり磁気テープにはできないんですよ。
 そこで、まず紙テープに鑚孔していき、入力が完了してから読みとり機で一気に磁気テープに変換し、コンピュータにもっていきました。画面で文字を確認することもできなかったので、内容確認のためだけに、いちいちコンピュータ写植機とか電動和文タイプ機で打ちだしていました。電動和文タイプ機は、三千本からの活字のはいった文字盤を前後左右に動かしますから、音と振動がすごかったです。編集も画面上ではできませんから、紙テープを切り貼りしました。

――紙テープは横一列が1バイトだと思いますが、そんなことができるんですか?

田嶋 神業をやっていたんですねえ(笑)。プログラム的に処理できないことを、人間の手で補っていました。

――まさに神代の時代ですね。漢字ですから、当然、欧米にもお手本がなかった。

田嶋 参考になるものなんてないですよ。当時、大規模な漢字システムを手がけていたのは、国文学研究資料館と国会図書館、それから明治生命でしたが、どこも同じようなレベルでした。

――国立国語研究所はどうだったんですか? 林大先生が中心になって進められた雑誌の用語調査までは手作業ですが、新聞の調査の方はコンピュータを使っていたように記憶しているんですが。

田嶋 あの調査は基本的には紙のカードを使った手作業で、コンピュータを使ったのは最後の統計処理だけだったのではないでしょうか。そのあたりのことは、日本女子大に移られた石綿先生や、国立国語研究所に残っておられる中野先生に直接お聞きになってください。

――わかりました。すると、国文学研究資料館では、紙のカードでやっていたようなデータ取りの作業まで、すべてコンピュータ化することを目指していたと考えてよろしいのでしょうか。

田嶋 そうです。ですから、キャラクタとしてどのくらいの数を用意すればいいのか、というところから調査しました。国会図書館や明治生命は三千程度の文字セットを用意していまして、電算写植機も三千程度なんですが、われわれは国文学の文献のデータベースを作ろうとしているわけですから、その程度では到底おさまらないだろうという予想を立てていました。いろいろ調査をすすめた結果、二万字あればいいだろうという結論に達しました。
 われわれが基本設計を進めている頃、JIS C 6226の開発が進んでいましたので、途中段階の試案や原案を入手し、基本的にはJISコードを使い、ない文字は拡張面におくというアーキテクチャを選びました。国文学研究資料館が導入を決めたHITACの日立も同じ考えでした。
 しかし、1969年から着手しているのに、JISがなかなか正式の規格にならないので、1976年3月段階の原案をもとに、見切り発車に近い形で文字コードを決めました。幸い、JIS正式版は、われわれがもとにした原案から漢字一字を削除しただけでした。HITACが国文学研究資料館に搬入されたのは、1977年1月でした。

――搬入されたということは、単なる箱状態ということですか?

田嶋 漢字を使わなければ動きましたよ。プログラム開発はできましたから、文献データベースのための漢字システムを自分たちの力で開発していったのです。今のパソコンでは、なにも意識しなくても漢字をプリントアウトできますが、漢字の打ちだせる「出力ライター」のプログラムを書くことからはじめました。

――「出力ライター」というのは、今でいうプリンタ・ドライバですか?

田嶋 ドライバも含めたプリントアウト・プログラムですね。これが動くようになってから、いよいよ国文学研究用のソフトウエアの開発に取りかかりました。まず、古典籍の目録、次に毎月刊行される論文の目録作りのためのプログラムを作成しました。

――国会図書館のJapan/MARCはまだなかったんですか?

田嶋 当時はJapan/MARCの仕様を決める審議会がはじまった段階で、国会図書館が磁気テープの頒布をはじめるのは1981年ですから、われわれは別個に機械可読文献目録を作成しました。「逐次刊行物目録作成システム」といいました。

――日本のMARC第一号ですね。運用するということは、データを継続的に入力し、蓄積していくことだと思うんですが、当初の二万字で間にあったんですか?

田嶋 間にあいませんでした。古典籍の方の一番最初の文字セットは三千数百字種でしたが、次のデータをくわえる際、二百字種追加しました。その後、大体、年間に数百字づつ、文字を追加していきました。論文の目録の方は異なり字種数は同じ位だったのですが、ここからも毎年百字種程度追加が必要でした。トータルで五千字種ほどだったんですが、JIS表外字が三百字ほど含まれていました。こういうデータを積み重ねていくうちに、母集団が増えるにしたがって、異なり字種数が増えていくことがわかりました。母集団がある程度大きくなると、増えるカーブはすこしづつ緩やかになっていきますが、ゼロになることはありえない。そういうことを、わたくしの場合、体験的に把握しました。

――つまり、学術的な文字セットは青天井というか、開集合になるということですね。

田嶋 そうです。これは文字コード問題を考える上で非常に重要なポイントになると思います。

――78JISの出た直後、「JIS漢字表の利用上の問題」で、「これ以上、漢字をふやしてはならない」と書かれていますが、運用をかさねた結果、増えざるをえないという確信をもたれたということですか。

田嶋 というか、漢字セットに関する限り、終わりということはありえないです。また、異体字をこれ以上増やさない、という気持ちでしたが。

――1980年前後にそういう認識をもたれていたのは、ほかにいらっしゃったんでしょうか。

田嶋 どうでしょうね。当時、古典籍のデータベースを作っていたのは、われわれだけだったのではないでしょうか。

――ただ、古典籍の場合、量的には有限だと思います。今でも古写本や原本が発見されていますが、現在判明している文献が何倍にもなることはないでしょう。だとしたら、文字セットが最終的に確定する可能性はあるのではないでしょうか?

田嶋 写本の場合、異体字や譌字だらけです。極端なことをいえば、どの字とどの字を同一と見るかは研究者によって違ってきますし、誤字が誤字でなかったとわかる場合もあり、それで論文が書けるくらいです。字種の区分は、研究の進展につれて動く可能性があるわけで、文字セットが最終的に確定することはないです。そのことは、あの論文でも婉曲に指摘しておきました。

――なるほど。翻刻の著作権が認められるだけのことはあるんですね。コンピュータで漢字が使えるようになったこと自体が驚きであった時代に、そこまで透徹した認識をお持ちだったのですか。JISの方は、実用第一に作っていましたから、文字セットを閉集合にしようという傾向があったのではないでしょうか。

田嶋 それはありました。1982年くらいだったと思いますが、83改正の委員長をつとめられた元岡達先生が、ある研究会の席で「JIS漢字の追加は、今回の改訂を最後に、一字たりと増やさない」と発言されたことがあり、わたくしは若輩の身を省みずに、思わず手を上げて反論しました。わたくしにとっては、忘れがたい思い出です。

駅前オブジェ


JIS「批判」派として

――「JIS漢字表の利用上の問題」という論文は、とりようによっては、JIS批判が含まれていたのではありませんか?

田嶋 78JISの功績が大であることはいうまでもありませんが、問題点が二つありました。
 一つは一字種一字体といいながら、「富」と「冨」のように異体字を別字として収録していたことです。「富」と「冨」が別字あつかいなのに、「高」と「髙」は包摂されており、選定規準があいまいということもありますが、それよりも重大なのは、文字セットを拡充するための一貫した規準が作れないという点です。

――最初から増やすつもりはなかったということのようですが。

田嶋 まあ、そうなんでしょうが、第二の問題点は字体設計の詳細は定めないとした点です。

――論文のこの部分ですね。

 また、漢字情報処理システムの普及とプリンタの発達によって、漢字プリンタアウトプットがそのまま印刷の版下になる場合がふえてきた。漢字プリンタアウトプットが単なる内部資料としての利用だけではない時代に、すでに入っているのである。漢字プリンタの文字フォントのデザインも、それだけの社会的責任を持つ時代になっているのである。
電子テキストがそのまま流通する時代をむかえて、この先駆的な御指摘はいよいよ重要性を増したと思います。

田嶋 この二点を指摘した論文を発表したことで、わたくしは「JIS批判者」の烙印を押されたようです。わたくしとしては批判したつもりは毛頭なく、実用上の課題を整理したにすぎないのですが。

――JIS関係者は、昔も今も変わりませんねえ(笑)。

田嶋 実はある方から、「JIS批判をしているとJISの委員になれないから、JIS批判をやめ、JISの委員になり、内部から改革すべきだ」と御忠告いただいたことがあります。別になりたいとは思いませんでしたが。

――97JISの委員会は、委員になりたい方々が委員になっている例が多いようですが、90JISまでの委員は仕方なく引きうけたという方がほとんどのようですね。ただ、田嶋先生が83JISの委員会にはいっていたら、83改正は別の形になっていたかもしれません。

田嶋 わたくしでなくとも、漢字データベースの運用経験のある方が委員におられたら、ああいう改正はやらなかったと思います。

――その点について、野村雅昭先生に何度もインタビューをお願いしているのですが、応じてくださらないので、関係資料を探したところ、「しにか」1990年10月号に掲載された鼎談で、こういう発言を見つけました。

古瀬 変えるなら早いうちに、ですか。
野村 そう。七八年版JIS制定から五年が経過していたんですが、ぎりぎりのところで、そういう選択だったわけです。ところが、こちらの予想以上に七八年版JISのユーザーが増えていた。見通しが甘かったと言われれば、そのとおりです。先発のメーカーが、そう簡単に切り替えられないことをもっと強く主張してくださるべきだった、なんてね(笑)。
ユーザーが多いかすくないかという問題ではないと思うんですが。

田嶋 システムを運営した経験がすこしでもあれば、文字を入れ換えるということがどういうことか、わかるはずなんですが。
 もう一つ、人名用漢字表で増えた4字の簡略字体を別字として追加するにあたって、いわゆる康煕字典体のあった場所を簡略字体で置きかえ、もとの字形は84区に移しました。ところが、78JISでは84区は自由領域にしていたんですよ。

――そうでした。78JISは、空き領域のうち、途中まで文字がはいっている区の後ろの部分は「将来の規格における増補が予想されるので、保留領域としての性格が強い」としていますが、「区単位にそっくり空いている場所、つまり第8〜15区及び第2水準漢字の後ろの第84〜94区」は自由領域としての性格が強いとしています。

田嶋 84区は外字エリアの最初ということもあって、もっとも使われていた場所でした。これも、わずかでも運用経験があれば、絶対にやらないと思います。
 84区に文字を追加する件は、83JISの委員会でも議論になったのか、外部にかなり伝わっていまして、いろいろな方が「そんなことをされては困る」と意見表明をされていました。わたくし自身、ある研究会の席で、絶対にやるべきではないということを、野村先生に直接お伝えしました。ところが、83JISができてみると、84区をつぶしただけでなく、300字近い字体変更や、22組の文字の入れ換えまでやっていて、言葉を失いました。

――委員会でもめれば、少数派は情報をリークしますから、84区に追加する件については対立があったのでしょう。現在のJCS委員会は公開レビューをやっていますが、当時、そういう外部の意見をとりいれる場があれば、歯止めになったでしょうか?

田嶋 どうでしょうね。84区問題はコンピュータ関係者の間でかなり話題になっていましたから。結局、委員会の中心になられた方が、問題の重大性を理解しておられなかったということでしょう。

――「しにか」の鼎談では、伊藤英俊氏が政令で決まった字体を第1水準に置く必要があったと、83改正を弁護されています。83年当時は第1水準漢字しか実装していないパソコンがほとんどだったから、しょうがないという論理なんですが、しかし、これはおかしいです。第1水準にまったく空きがないなら、伊藤発言もなりたちますが、第1水準の一番最後の47区の52〜94点が空いていて、43字が追加できます。政令文字の字形を第1水準に置かなければならないというなら、もとの字形には手をつけずにおいて、新しい字形を47区の後に追加するという方法があったはずです。
 また、追加4字のうち、三字は第1水準でしたが、「瑤」は第2水準です。「瑶」におきかえられた後も、第2水準のままです。政令文字の字形を第1水準に置かなければならないというなら、「瑶」を47区に追加すればよかったのです。いろいろ調べていくと、正字(いわゆる康煕字典体)を、外字エリアだった84区に放逐しようという意志が働いているのではないかと思えてなりません。
 野村先生は『漢字の未来』という御著書の中で、常用漢字表を激しく非難されていますが、やはりJIS改正を武器にして、常用漢字表をひっくりかえそうという意図があったのでしょうか。

田嶋 野村先生のお考えはわかりませんが、83改正の審議をされていた期間に、研究会などで、後に『漢字の未来』に書かれるような趣旨の御発言を盛んにされていたのはよくおぼえています。

駅前風景


補助漢字をめぐって

――田嶋先生は90JISと補助漢字で中心的な役割を果たされるわけですが、どういう経緯で委員になられたのですか?

田嶋 85年だったと思いますが、日本印刷産業連合会の方から、文字コードの研究会を作りたいので、座長になってくれないかという依頼を受けました。これからフロッピー入稿が増えたり、印刷がどんどん電子化していくのに、JISコードの漢字が足りなくて、余計な手間がかかるというのですね。
 その委員会で追加すべき漢字をリストアップしているうちに、JISが五年ごとの見直し時期をむかえ、88年改正では大幅に漢字を追加するという腹案を通産省がまとめました。この決定は日本印刷産業連合会の働きかけが影響していたので、連合会の委員会の座長だったわたくしも、JISの原案委員会に主査として参加することになりました。

――88年に予定されていた改正は90年にずれこんだわけですが、その経緯はどんなものだったのでしょうか?

田嶋 二年遅れたのは、主査をお引き受けするにあたり、追加する文字の字形にJISとして責任を持てるようにしてほしいとお願いし、日本規格協会内にフォント開発・普及センターという組織を設置したからです。フォント関係の会社が集まって共同開発する体制をととのえ、実際に平成明朝ができあがるまでに二年という時間が必要だったのです(注1)。

――田嶋先生のJIS批判がそういう形で結実したのですか。連合会の追加案についてお話しいただけませんか?

田嶋 主な会社の字母を調べたところ、数千字規模の追加が必要であることがわかりました。JIS X 0208の保留領域には、そんな数が入らないのは明らかですから、連合会の委員会としては、最初から ISO 2022系の補助的な文字コードを作る計画でした。

――JISの方では「第3水準漢字」という名称を使っていたようですが。

田嶋 非公式にそういうアナウンスが流れていましたが、連合会の委員会としては、最初から「補助漢字」で、それがJISの方にも取りいれられました。必要な人が補助的に使えばいいわけであって、「第3水準」という名称は不適当だと思います。
 普通の漢字の異なり字調査をしますと、六千字をこえる字数は出てこないんですが、印刷所の字母を調査しますと、一万二千字以上が出てきました。それを『大漢和辞典』で検字番号をもとにリストアップしたのですが、『大漢和』にない文字が五千以上出てきました。

――『大漢和』にないというと、国字が多いのですか?

田嶋 国字もありましたが、大体は異体字ですね。『大漢和』に入っている異体字と、入っていない異体字では、入っている異体字の方が共通度が高いだろうという想定のもとに、『大漢和』の収録文字を優先するような形で、漢字表による重みづけでしぼりこんでいきました。漢字表による重みづけは、いろいろ批判が出ていますが、当時としては、これしか方法がなかったと思います。

――そうですね。

田嶋 わたしとしては5800字の補助的文字セットは、ある程度、自信を持って選んだつもりです。JIS X 0208と JIS X 0212があれば、外字をかなり減らせ、安定的に情報交換ができるだろうと考えました。

――補助漢字には83改正で消された「鷗」のような、いわゆる「83JIS復活文字」がふくまれていますが、「 」、「 」などははいっていません。JIS X 0208には「単」と「單」が両方はいっているのに、なぜ復活させなかったのでしょうか?

田嶋 それは委員長の御判断です。

――候補には入っていたが、野村先生がはずされたということですか?

田嶋 そうです。

――どういう規準ではずされたのでしょうか?

田嶋 野村先生のお考えですから、わからないです。

――しかし、議論はされたわけですよね。

田嶋 したんですが、とにかく、頑として入れないとおっしゃるので。

――入れてしまうと、83改正を撤回したことになり、面子がつぶれるからでしょうか?

田嶋 その辺はわかりませんが、83改正を撤回せよととれるような主張を強硬にされたメーカーの方はおられましたよ。今さら撤回されては困るというメーカーの方もおられて、侃々諤々でしたが。

――90JISの委員会で批判するくらいなら、83JISの委員会で阻止していればよかったと思うのですが。

田嶋 ただ、実際に自分の手でシステムを運用してみないと、わからないことは多いです。理屈でわかることには限界があります。

委員長交代劇の背景

――野村先生としては、針の筵に座らされているようなものですね。

田嶋 83JIS批判はことあるごとに持ちだされまして、野村先生はお辛いお立場だったと思います。わたくしは主査という立場がありましたから、議論を深めるよりも、委員長と他の委員の間にはいって、穏やかにおさめる方向でずいぶん努力しました。今にして思えば、復活文字の問題にしても、もっと議論をしていればよかったのですが。

――野村先生を委員長、田嶋先生を主査にすえるというのは、恐るべき人事センスです。いかにも官僚の考えそうなことというか。
 しかし、結局、野村先生は1987年12月に委員長を辞任されます。そのきっかけは補助漢字を認めるかどうかだと言われています。しかし、その時点では補助漢字はほぼできあがっていたはずで、理屈があわないと思います。実際はどうだったのでしょうか?

田嶋 5800字にもおよぶ文字セットを補助的な文字セットとして認めるかどうかは、重要な問題であるから、投票で決めようと委員長提案がありまして、投票をおこなったのですが、18名のうち11名が賛成、1名が反対で承認されました。しかし、保留が1/3にあたる6名もいたために、こんなに保留が多くては責任がもてないと言われ、委員長を辞任されたのです。

――議論を尽くしていなかったということですか。しかし、委員会が発足してかなりたっていたんじゃないでしょうか?

田嶋 そうなんですが、文字を増やす件に関しては、議論はあまりありませんでした。

――意見らしい意見がなかったということですか?

田嶋 意見はたくさん出ました。ただ、古い話題については出ても、新しい話題についてはほとんど出なかったです。文字を増やす件について議論を提起しても、話がつづかず、困りました。

――話に詰まると、また83批判が蒸し返される、と(笑)。

田嶋 83JISの委員会の時も、多分、そうだったのでしょうが、自分の手でシステムを運用した経験がないと、ピンと来ないという面もあったとのだろう思います。

――当時、一万字を越える文字セットをあつかった経験があるのは、田嶋先生くらいでしたから、他の委員の方々が意見を述べることができなかったのは仕方なかった面があるのかもしれませんね。

田嶋 おそらく、委員になられた方々のほとんどは、文字を多くする必要も、増えた文字を使う必要も感じておられなかったのでしょう。
 わたしとしても、ちゃんと議論をして進めたかったですね。もっと他の委員の方々に議論をしかけて、漠然としたものでも意見を述べてもらった方がよかったと思います。その点については、悔いが残っています。

――今まで、補助漢字は使うに使えない状態がつづき、使われないままに批判ばかりが流布していました。97JISの中心的な委員の中には、JIS X 0212を廃止してしまえと強硬に主張している方がおられるそうですが、最近、ユニコードでようやく使えるようになりました。EUCやMuleでは昔から使えましたが、最近のLinux人気で、個人でも使えるような環境が整いました。ぼくは今昔文字鏡を使っているんですが、物書きにとって必要な文字の多くは補助漢字にはいっていることがわかりました。

田嶋 わたくしも自分で使ってみて、そんなに悪くないなと思っています。

――現在、JISでは3800字余の第3・第4水準漢字を準備中ですが、JSI X 0213のように、JIS X 0208やシフトJISの自由領域をつぶして追加するという方法はお考えでしたでしょうか?

田嶋 まったく考えませんでした。83改正の二の舞になりかねないことと、JIS X 0212は最初から補助的な文字セットとして作りましたから、JIS X 0208の拡張にするような性格のものではないのです。

――第3・第4水準漢字は83改正の二の舞になるのでしょうか?

田嶋 どうでしょう。わたくしも現在のJIS原案委員会の名簿に名前が載っていますから(笑)。ああいうことをやるなら、今回限りにしてほしいですね。

――国文学者のお立場としては、当用漢字字体表について、どうお考えですか?

田嶋 当用漢字字体表は、字体を手書文字で示していましたが、あれは誤解をまねいたと思います。いわゆる康煕字典体は「半」「平」ですが、手書では鷗外も漱石も「半」「平」と書いているんですよ。漱石の原稿は俗字と略字、譌字だらけで、誤字も相当あります。しかし、印刷の段階でいわゆる康煕字典体に直すのです。
 手書字体と印刷字体との使いわけが活字文化だといえると思うのですが、当用漢字字体表が出たために、「新字源」では「半」を旧字体、「半」を新字体と分けてしまい、新旧の字体があるかのような錯覚が広まってしまいました。

――当用漢字表が仮名遣の表音化をはかったように、字体表は活字の手書文字化をはかったということですね。確か、そういう趣旨のことは、前文に書いてあったと思います。
 そうすると、正字(いわゆる康煕字典体)を主体にした文字セットの作成を印刷産業連合会がもとめたというのは、論理が一貫しますね。

田嶋 われわれ国文畑の人間は版本や写本を相手にしています。版本や写本では、文字が出てくるごとに、一点一画が違うというのは当り前で、だから、翻刻という仕事が学問的な業績として認められているのです。オリジナルの文字が見たければ、画像で見るのが最善です。

――その辺りの認識は、国語学者や中国文学者、漢学者で微妙に違っているようですね。「JIS漢字表の利用上の問題」という論文で提唱されていた漢字データベースの背景がよくわかりました。

田嶋 わたくしの漢字データベース構想を、漢字をたくさん使わせようとしていると誤解された方がすくなくないんですが、そうではなく、一点一画にこだわる学術的な世界と、ある程度、字体差を包摂する日常的な世界を橋渡ししようというものです。書籍用の漢字に翻刻したテキストを、いつでも学術的な漢字にもどせるような仕組を作ることが必要だと思います。

田嶋一夫氏



統合漢字について

――最後にISO 10646に関するお仕事について語っていただけませんか。田嶋先生は CJK-JRG(中日韓合同研究会)の日本側の中心的な委員でしたね。

田嶋 1990年2月だったと思いますが、ソウルで漢字統合が可能かどうかを日中韓とユニコード社で話しあう臨時会議がありました。その後、CJK-JRGという継続的に漢字統合を議論する場が設けられ、後にIRGとなり、SC2/WG2の下の機関として正式に認知されます。わたしはソウル臨時会議の時からかかわっているのですが、日本の提案として、字種、字体、書体という三軸モデルを出し、もし漢字コードの国際標準化が可能だとしたら、Y軸(字体)上の差異を統合するしかないのではないかと問題提起したところ、中国・韓国・ユニコード社はいずれも了承しました。

――三軸モデルは日本規格協会のフォント開発・普及センターの異体字委員会で田嶋先生が中心になってまとめられたものですね。

田嶋 そうです。

――漢字統合という大問題がずいぶん短期間で合意に達したな、という印象をもっているのですが。

田嶋 実は議論の土台となる共通の認識があったのです。まず、韓国の関係者は先ほどから話にあがっている「JIS漢字表の利用上の問題」を読んでいて、わたしの異体字の考え方を知っていました。中国とアメリカには80年前後から何度も招聘され、漢字システムについてアドバイスしていており、漢字シソーラスをもとにした異体字のコントロールを理解していました。

――それははじめて聞きました。詳しく教えてください。

田嶋 まず中国ですが、1979年に10日間招かれ、漢字システムについて講演しました。GBコード制定で中心的な役割をはたす陳耀星氏はわたしの講演をすべて聞き、細かい部分まで意見を交換しました。陳氏とはその後も手紙のやりとりがあり、何回か中国に呼ばれまして、文字コードと漢字システムの構築について意見を述べました。異体字に関するわたしの考え方と、漢字シソーラス構想は、中国の文字コード関係者もよく知っていました。

――アメリカの場合もユニコード以前からですか?

田嶋 そうです。アメリカにRLG(Research Library Group)という図書館ネットワークがあり、東アジア文献の目録のために、1983年にEACC(East Asian Character Code)という文字コードを作るのですが、イェール大図書館の東アジア部長の金子英生氏が、当時、東アジア学会の委員長をやっていまして、彼の依頼でアメリカにゆき、助言してきました。その関係で、国文学研究資料館の紀要に発表した「漢字情報処理システムの課題」(1980年3月)という論文が英訳され、学会の機関誌に掲載されました(注2)。この論文はかなり広く読まれたらしく、ソウルで出会ったユニコーダーたちも読んでいて、おまえがタジマかと驚いていました。

 問題の論文のコピーをいただいたので、早速、読ませていただいた。アーキテクチャ中に「文字パターン発生装置」がふくまれているなど、時代を感じさせる部分もあるが、核心部分では「JIS漢字表の利用上の問題」の漢字シソーラス構想を敷衍し、三軸モデルの原型になる考え方が述べられていた。CJK統合漢字のルーツは、なんと、田嶋論文にあったのだ。

――漢字シソーラス=三軸モデルが最初からCJK統合漢字の前提だったとすると、各国字体の四欄併記は妥協の結果ではなく、はじめから決まっていたということですか?

田嶋 もちろんです。国際的にはコードポイントを統合するが、各国の国内規格では独自の字体を使うのは大前提です。

――田嶋先生が1980年前後に提唱された漢字シソーラス構想は、フォント・コントロールという、元の形とはずれた形で実現されようとしているわけですが、その場合、異体字フォントの標準化はどこがおこなうべきなのでしょうか? 国際的に異体字フォントを標準化しようという動きもあるようですが。

田嶋 異体字フォントはあくまで国単位に標準化すべきだと思います。フォントは書体のレベルにかかわりますから、中国、日本、韓国、すべて違うわけですよね。国際的な標準化がはたして可能なのか、わたくしは疑問に思います。

――漢字統合をめぐる各国の対応はどうだったのでしょうか? 中国の積極的な姿勢の裏にははかなり政治的な事情があったと聞いたのですが。

田嶋 政治的背景はわたくしにはわかりませんが、中国側の参加者は技術者ばかりで、漢字についてはわかっていないという印象でした。一人だけ、漢字学者が出席していましたが、まったく英語がわからないので、発言はほとんどしなかったと記憶しています。
 台湾の参加者はみなさん日本語ができましたので、突っこんだ話をすることができました。香港は実業家の方が漢字の専門家を連れて参加されていました。技術的な問題をまったく理解されていないので、話が噛みあわないのですが、時々、表面的に一致することがありました。本当は誤解しているんだろうなあと思っていましたが(笑)。
 ユニコード・コンソーシアムから毎回出てきたのは、アップル社のコリンズさんで、彼は東大で四年勉強し、日本の調査会社に二年勤務した経験があるだけに、日本語がきわめて堪能でした。

――ユニコードにつぶされたISO 10646の最初の原案はエディタの長谷川雅美さんがほとんどお一人で作られたと聞いています。長谷川さんにぜひお話をうかがいたいと思い、いろいろつてを探したのですが、どうしても連絡先がわかりませんでした。「空白の一日」のミーティングに日本人としてただ一人出た関係で、長谷川さんの責任を問う声が強かったらしく、外資系の日本DECの社員だったことについても、いろいろなことが言われていたようです。学術的な立場で国際規格制定に参加された田嶋先生から見ると、どうなんでしょうか?

田嶋 長谷川さんは大変できる方で、わたくしもいろいろ教えていただきました。人格的にも立派な方で、「空白の一日」の決定に関与していたとしても、エディタとして押し切られた面が強いのではないでしょうか。
 外資系云々ですが、何をもって国内の意見とするかが問題でしょう。ご存知のように、日本を代表して国際会議に出席される方は、長谷川さんだけでなく、外資系企業に属している方々が多かったです。旅費を国に頼るわけにはいきませんから、委員を出している企業に依頼して、国際会議に出張あつかいで派遣してもらうわけです。ですから、どうしても国際活動の重要性を認識している外資系企業の方が多くなります。

――SC2日本代表の報告を年代を追って調べましたが、その傾向はありますね。

田嶋 CJK-JRGの国内委員会にも、外資系企業の方々が何人も参加しておられたのですが、東京の会議の内容がその日のうちにアメリカ本社に伝わり、次の日には会社としての見解が出てきました。

――アメリカ企業らしい即断即決ですね。しかし、アメリカのコンピュータ・ベンダーは日本の動向をそんなに注目していたのですか?

田嶋 それはもう注目していました。わかっていないのは日本だけで(笑)。外資系の委員の活発な動きを見ていると、国内の意見とはなんなのだろうと思いました。地域で考えた意見ではあっても、それが日本の意見といえるのかどうかですよね。

――今日はお休みのところ、長時間にわたり、ありがとうございました。

(May15 1999)

1

 フォント開発には多額の費用と時間、ノウハウの蓄積が必要だが、当時、フォントの権利をもっている会社はパソコン関係の中小企業にフォントを提供することに乗り気ではなく、きわめて緊迫した状況にあったという。田嶋氏の回顧のように、規格の筋を通すという面も大きかったが、パソコン用フォントを求める業界の要望もあって、「フォント開発・普及センター」という組合をつくり、共同利用のフォントを通産省主導で作ったらしい。この間の事情は「書体ウォッチャー」に詳しい。

追記 その後、日本規格協会に取材し、FDPCの発足の経緯と活動の詳細がわかったので、『図解雑学文字コード』にまとめておいた。「書体ウォッチャー」の情報はすべて正しいわけではなかった。

2

 Tajima Kazuo "KANJI Information Processing System: The design and manipulating of A Kanji Character Set" in The Association for Asian Studies. The Committee on East Asia Libraries Bulletin. Feb 1981. #64 pp18-36

Copyright 1999 Tazima Kazuo
Kato Koiti
This page was created on Jul27 1999
文字コード ほら貝目次