(メモ)同じ繁体字でも台湾と香港ではグリフが違う話

(表ではフォントに源ノ角ゴシックを指定しているので、インストールしてない人はsource-han-sansからどうぞ。どのファイルか迷う人はSuperOTCを入れればOK。)

百聞は一見にしかず、次の表に適当に漢字を比較させてみたのでどうぞ。

国および地域別のUnicodeコードポイントとグリフの比較
地域 言語タグ U+9AA8 U+6B21 U+771F U+4E03 U+904D
台湾(繁体字 zh-Hant-TW
香港(繁体字 zh-Hant-HK
中国(簡体字 zh-Hans
日本(参考) ja
韓国(参考) ko


…とそれだけではあまりにも味気ないので、補足説明をほんのちょっと。

ふと簡体字繁体字言語コードで表すときに、zh-Hanszh-Hantとしましょうというというような話をしていると*1、台湾と香港も表しわけた方がよい(つまり、zh-Hant-TWzh-Hant-HK)という話を@bobtungからもらったり*2



というわけで、適当な漢字を見繕って漢字を出しわけて表示させているのが上の表ということに。わかりやすさのために漢字は大きめに表示させつつ、おまけでいろいろ載せておきました。なお、「源ノ角ゴシック」バージョン 2.000 の技術的な特長について*3では一見Noto Sans CJKにも反映されているようにも見えるけれども、自分がダウンロードした限りではバージョン1.004なので、Notoは対応してないと思う、多分。*4

U+904D(遍)とか楽しいですね(?)

ちなみに、Hong Kong Supplementary Character Set-2016 (HKSCS-2016)からダウンロードできるPDFには香港と台湾のグリフが並んでいて、何が違くて何が同じみたいなのがコードポイントごとに並んでいる表があったりするので、マニアックな人は覗いてみるとよいかと。

*1:ちなみに、検索するとzh-cmn-Hansとかzh-cmn-Hantとかが出てくるんだけども、それはNu Html Checkerでwarningsになるので、そのように指定しないほうがよい。そのへんの少し込み入った話はHTMLとXMLにおける言語タグあたりを参照。

*2:Apple方面の話は公式のサポートページiPadのPagesで中国語、日本語、または韓国語テキストのフォーマットを設定するあたりにあるとおり。

*3:GitHub Splitting TWHK into TW & HK · Issue #48 · adobe-fonts/source-han-sansなんかを読むともっと詳しいことがわかるかもしれません…が長いので読んでいません。

*4:あれでも手元のPixel 3aで表示させたら違うように見えているので、スマホに入っているものはバージョンが新しいのかしら…?

ChromeでのMathMLの実装状況のちょっとしたメモ

ありがとうIgalia。

とまあ、こういう感じのツイートが回ってきてたので、MathML in Chromiumとか眺めつつ適当にChromeのflagを弄くってたらまあこんな感じで実装状況が見れますよ的な。

Chrome 83.0.4103.116

Chrome Canary 86.0.4393.0

ページは毎度おなじみMathML 耐久テスト - Mozilla | MDNより。

83だと結構怪しい感じのレンダリングが、86.0.4393.0だと数学用フォントが有効になってたり、上付き・下付き文字がちゃんと効いてたりと、一見そこそこいい感じにはなっている…ように見える……けれども、スクリーンショットで分かるように、順列(といっていいのか?)の数字の入り方がおかしかったり、括弧の入り方がまだおかしかったりとまだまだ荒削りな感じ。ただし、着実に前進はしているので気軽に待ちましょう的な。Issue 6606: Missing MathML implementationを観測すればどんなパッチが入ったかを知ることができるけれども、まあいまさら説明するまでもないかも。

なお、MathMLをレンダリングさせるには、chrome://flags/#enable-experimental-web-platform-featuresを有効にすればOK。

簡単ですけどそんな感じで一つ(何)。