ついにOkapi FrameworkにHTML Filterが実装された

これはウェブ仕様そのものやそれに付随する話ではなく、筆者がウェブ仕様の翻訳環境として用いているOmegaTの話です。



@yu_tang_さんに昨日教えていただいたのですが、悠久の時を経てOkapiにOmegaT用のプラグインとしてやってきました。*1

現時点でのプラグインのダウンロードは、スナップショットのディレクトリーからokapiFiltersForOmegaT-1.0-m29-SNAPSHOT-dist.zipを直接ダウンロードすることで入手できます。

インストールの仕方はreadme.htmlに書いてあるとおり、OmegaTをインストールしているディレクトリーの直下になければpluginsというディレクトリーを作成し、そこにzip内にあるjarファイルをコピーするだけです。

OmegaTのHTMLフィルターを無効にすればOkapiのHTMLフィルターでHTMLがパースされます。デフォルトのルールでパースはされるのですが、現状では例えばhtml要素のlang属性は翻訳対象にならないようです。HTML Filter - OkapiWikiによれば、YAMLで設定ファイルを記述できるようですが、HTML Configuration Syntaxのセクションにあるリンクが切れていて、サンプル設定ファイルを読むことができないという。@yu_tang_さんのツイートからたどれますが、どうやらYAMLを受け付けないようで、FPRMという形式で書かなければならないようですorz

なので、今すぐには使えないかなという感触。あと、XLIFFっぽくパースされるせいか、OmegaT上のタグが、OmegaTのHTMLタグと別のタグになってしまっているために、翻訳メモリーを打ち直さないといけないのがかなり辛いところ。これどうにかなりませんかねぇ。

ただ、スナップショットで作成されたばかりですし、OmegaTからある程度はオプションでごにょごにょできるようにはなるんじゃないかなーとか妄想はしていますので、ちょっと待っていればいいのかなという感触。

しかし本家Yahoo! groupに登録するのがめんどっちいなぁ……。

*1:OmegaTにバグレポを投げたのが2013年の8月で、Okapiにリクエストを出したのが2014年10月でしたからゆうに1年は経っていて、問題を認識してたのは3年は前になるかなとか。 OmegaTのHTMLフィルターのバグについてははてなダイアリーOmegaTでHTMLを扱う際に悩まされる数々のバグ - 血統の森+はてなにある程度まとめてあります。