English page もどる

Unicode 3.1.1 のリリースに関するコメント (2001-09-06)

Unicode 3.1.1 がリリースされました。東アジアのエンコーディング群と文字集合との変換表 (http://www.unicode.org/Public/MAPPINGS/EASTASIA/) が、廃止 (obsolete) となりました。これらの変換表はいま、 http://www.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/ に移動しています。上記ページに、廃止について、および、 私がこの文書で指摘した問題についての Asmus Freytag によるコメントがあります。 変換表が廃止されたことに従って、 私がこの文書の以下の章で述べた問題のうち、 変換表に関することも、廃止となります。

訳注: 「中日韓 (東アジア) のエンコーディング群」には、たとえば、 EUC-JP、Shift_JIS、ISO-2022-JP (いわゆる JIS コード、ただし、 符号化文字集合としての JIS X 0208 のこととまぎらわしいので、 JIS コードとの呼び方をするべきではない)、EUC-KR、EUC-CN (いわゆる GB2312。ただしこの呼び方も、 符号化文字集合の意味と混乱する)、GBK、GB18030、Big5、などがあります。 原文 (英語) では「local」という言葉が間に入っているので、 Unicode はここには含まれません。

たとえば、「EUC-JP 往復変換の互換性」の問題はもはや存在しません。 なぜなら、JIS0208 という変換表がもはや廃止となってしまったからです。 「変換表がベンダーによって異なる」問題も、「文字幅問題」もそうです。

しかしながら、このことは、問題がさらに大きくなったことを意味します。 いまや、 東アジアのエンコーディング群のための権威ある変換表が存在しないのです。 ベンダーたちは、任意の変換表を好き勝手に作ることができます。 少なくとも、(いまや http://www.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/ に移動した) さまざまな変換表が統一されるという望みは断たれてしまいました。

Unicode は、標準となるべく存在しています。 権威ある、統一された、みんなが参照できる変換表を提供していないということは、 Unicode が標準化団体としての責任を放棄していると言えます。 上記の Asmus Freytag によるコメントには、私が指摘した文字幅に関する問題は 「変換表の問題」であり「変換表の誤り」によるものだとあります。 それなら、正しい変換表を提供してもらいたいものです。

Unicode 3.1.1 がリリースされるより以前には、さまざまな変換表があり、 それらは数十の文字について問題を抱えていました。しかし今は、 権威ある変換表が失なわれてしまったので、 すべての文字が同様の問題を抱えているということになります。 (漢字を除きます。というのは、漢字については権威ある統一された変換表が Unicode Consortium から提供されているからです。)


Tomohiro KUBOTA <debian at tmail dot plala dot or dot jp>