(メモ)同じ繁体字でも台湾と香港ではグリフが違う話

(表ではフォントに源ノ角ゴシックを指定しているので、インストールしてない人はsource-han-sansからどうぞ。どのファイルか迷う人はSuperOTCを入れればOK。)

百聞は一見にしかず、次の表に適当に漢字を比較させてみたのでどうぞ。

国および地域別のUnicodeコードポイントとグリフの比較
地域 言語タグ U+9AA8 U+6B21 U+771F U+4E03 U+904D
台湾(繁体字 zh-Hant-TW
香港(繁体字 zh-Hant-HK
中国(簡体字 zh-Hans
日本(参考) ja
韓国(参考) ko


…とそれだけではあまりにも味気ないので、補足説明をほんのちょっと。

ふと簡体字繁体字言語コードで表すときに、zh-Hanszh-Hantとしましょうというというような話をしていると*1、台湾と香港も表しわけた方がよい(つまり、zh-Hant-TWzh-Hant-HK)という話を@bobtungからもらったり*2



というわけで、適当な漢字を見繕って漢字を出しわけて表示させているのが上の表ということに。わかりやすさのために漢字は大きめに表示させつつ、おまけでいろいろ載せておきました。なお、「源ノ角ゴシック」バージョン 2.000 の技術的な特長について*3では一見Noto Sans CJKにも反映されているようにも見えるけれども、自分がダウンロードした限りではバージョン1.004なので、Notoは対応してないと思う、多分。*4

U+904D(遍)とか楽しいですね(?)

ちなみに、Hong Kong Supplementary Character Set-2016 (HKSCS-2016)からダウンロードできるPDFには香港と台湾のグリフが並んでいて、何が違くて何が同じみたいなのがコードポイントごとに並んでいる表があったりするので、マニアックな人は覗いてみるとよいかと。

*1:ちなみに、検索するとzh-cmn-Hansとかzh-cmn-Hantとかが出てくるんだけども、それはNu Html Checkerでwarningsになるので、そのように指定しないほうがよい。そのへんの少し込み入った話はHTMLとXMLにおける言語タグあたりを参照。

*2:Apple方面の話は公式のサポートページiPadのPagesで中国語、日本語、または韓国語テキストのフォーマットを設定するあたりにあるとおり。

*3:GitHub Splitting TWHK into TW & HK · Issue #48 · adobe-fonts/source-han-sansなんかを読むともっと詳しいことがわかるかもしれません…が長いので読んでいません。

*4:あれでも手元のPixel 3aで表示させたら違うように見えているので、スマホに入っているものはバージョンが新しいのかしら…?