今年のエープリルフールRFCの2つ目。
RFC5242 A Generalized Unified Character Code: Western European and CJK Sections (汎用化された統一キャラクタコード:西ヨーロッパ文字と漢字)
Unicode とは違ったアプローチで、いわゆるアルファベットなどと漢字を同じコード体系で表現しよう、というものです。
以前のエープリルフールRFC にあった、「IPv6 アドレスの簡潔な記法」と発想が似ています。
その発想は、とにかくコードの種類を減らす、というもの。
例えばアルファベットの w は uu のように u が二つ繋がったものとして表現するのです。
コードを減らすために、形が大体似ていれば OK という、かなりラディカルな考え方です。
確かに形だけとらえれば、縦棒と横棒、○と半円、、、などの基本的な形を組み合わせれば、大概の文字は表現できるでしょう。
その発想自体はまあ面白いけれど、それ以上の深みがこの RFC にないのが残念なところです。
でもまあ、日本語ドメイン名の実装なんかも引き合いに出されていますが、確かにそれらの実装も無理矢理という感が否めないので、その辺を皮肉っていると言うことなのかもしれません。