総務省の電子書籍アクセシビリティガイドラインが斜め上っぽい

以下に既述したものは、2015年5月当時のものです。この文書は6月に更新されていますので、一部当てはまらない箇所があります。また、 「アクセシビリティに対応した電子書籍制作ガイドライン」が更新されたというエントリーも書いています。


タイトルのとおりです。特にオチはありません。


カレントアウェアネス・ポータルの"電子書籍に代替テキスト"の話題がTLに流れてきたのですが、そのエントリーからリンクが貼られている総務省、「音声読み上げによるアクセシビリティに対応した電子書籍制作ガイドライン」を公開という少し前の話題に行き着きました。

総務省|情報バリアフリー環境の整備|アクセシビリティに対応した電子書籍の普及促進

障害者が円滑に情報を取得・利用し、意思表示やコミュニケーションができるよう、情報の利用におけるアクセシビリティの向上が重要な課題となっています。
電子書籍は、視覚障害等により紙の出版物の読書に困難を抱える者への出版物の利用拡大に資するものと期待されており、総務省では、アクセシビリティに対応した電子書籍の普及・促進に取り組んでいます。

総務省|情報バリアフリー環境の整備|アクセシビリティに対応した電子書籍の普及促進

なるほど、もっともらしい事が書いてありますが、現在のところ「アクセシビリティに対応した電子書籍制作ガイドライン」に、音声読み上げによるアクセシビリティに対応した電子書籍制作ガイドライン(平成27年4月)(PDF注意)しかないのはさておき、いきなりTTSとかレベル高いな?と。

中身を見てみる

とまあ、意識高いガイドラインのタイトルとは裏腹に、結論から言うと残念な中身になっております。以下、ざっくりと目を通して気付いた点など。


4ページ目。Media OverlaysのURLがhttp://www.idpf.org/EPUB/30/spec/EPUB30-mediaoverlays.htmlだが、ipdfが自動転送設定をループさせている()のでこのページを開けない(そしてなぜか3.0.1を見に行っていない)。正しいURLはhttp://www.idpf.org/epub/301/spec/epub-mediaoverlays.html。参考日本語訳はhttp://imagedrive.github.io/spec/epub301-mediaoverlays.xhtml


以下いろいろ引用しつつ。

このため、SSMLの仕様では規定があり、EPUB3で規定のない属性のうち、言語を制御することのできる属性を定義する。

1.1.音声読み上げのために必要なメタデータ

EPUB3にない属性をこのガイドラインで勝手に定義すると言うことでしょうか。それはEPUB仕様に反するのでは…

通常のlang属性は、xml:langとして、その文章の発音する言語(language)が何であるかを規定するものである。
(中略)
基本的にマニフェストファイルに記載することを推奨するが、その際、xml:langで記載してしまうと、その文章がxml:langで規定された言語ということになってしまい、あらかじめ、複数の言語を指定することができない。そこで、現在のEPUB3には規定がない、ssml:langやvoice:language等の新しい属性を設定することで、TTSソフトの事前起動を可能にする。

<記述例>

<metadata ssml:lang=jp”> #日本語のTTSソフトを利用する。
<metadata ssml:lang=en”> #英語のTTSソフトを利用する。
1.1.1.lang属性

EPUB仕様のことはよく分かってないのですが、記述例がマークアップとしてお察し……(ダブルクオーテーションがなぜか全角、閉じタグがない、コメントがXML文法でない)。

Gender 属性についても、lang属性と同様に記載する。
なお、SSML仕様にある、発話者指定(gender)や言語指定(lang)については、EPUB3では規定されていないため、今後EPUB上の仕様を検討し、IDPFへの規格化の打診をすることが必要と考える。

1.1.2.gender属性

EPUB3.0.1には、

EPUB 3 CSS Profile は、[CSS3Speech-20110818] で定義されている構文を使用する CSS3 Speech Module [CSS3Speech] と [CSS3Speech] で定義されているセマンティクスから以下のプロパティの -epub- 接頭辞版を包含する:

3.3.3 CSS 3.0 Speech - EPUB Content Documents 3.0.1(日本語訳版)

と(接頭辞付きですが)プロパティーがあって、このうち-epub-voice-familyで性別を選択することができることになっています(詳細はCSS Speech Module(日本語訳) 12.1. voice-family プロパティを参照)。
このガイドラインを誰が書いたのかは知りませんが、EPUB3仕様をちゃんと読んでいるのでしょうか…?

音声発音の記述言語は現在、IPAJEITA、SAMPA、L&H+が利用されているが、本指針では、日本語については、JEITAを利用することとし、外国語はIPAを利用する。

日本語の場合:<span ssml:alphabet=”X-JEITA” ssml:ph=”****”> **** </span>
※phは、Phonemeを省略したもの
英語の場合:<span ssml:alphabet=”IPA”xml:lang=”en”> **** </span>
2.1.1.音声表記について

とありますが、SSML仕様では、

alphabet属性は、音素/音声の発音文字を指定する任意の(OPTIONAL)属性です。この場合の発音文字とは、複数の人間の言葉の発音を表わすための記号の集合を意味します。この属性に有効な値は、発音文字レジストリ(Pronunciation Alphabet Registry)で定義されている値である「ipa」(次の段落を参照)および「x-organization」や「x-organization-alphabet」の形式のベンダー固有の文字列のみです。例えば、電子情報技術産業協会[JEITA]は、自身の音素文字[JEIDAALPHABET]に対し「x-JEITA」や「x-JEITA-IT-4002」のような文字の使用を促進したいと思うかもしれません

3.1.10 phoneme要素 - 音声合成マークアップ言語(SSML)バージョン1.1

と、SSML仕様では小文字のxで始まるように書いてありますが、ガイドラインは大文字…SSMLはXML応用なので、たぶん大文字・小文字を区別すると思うのですがこれは。

XHTMLファイルに記載されているSSML付きテキストをリーダーは、TTSソフトに渡して、音声化を行う際の留意点を列挙する。
テキスト中の< > & ‘ “などの文字は、実体参照記法の形式(< > & ' " など)であればディスプレイに表示上問題はないが、TTSソフトに渡す場合は、実体参照記法で渡すと読めないTTSソフトが存在する。そのため、実体参照記法の形式で記載されている場合は、TTSソフトに引き渡す前に<>&’ ”に変換する必要がある。

2.2.5.SSMLデータの受け渡し機能

実体参照を使わずにどうやってwell-fromedなXMLを書けと言うんでしょうか……実体参照を認識できない実装が悪いのでは。

ルビ(ruby)とSSMLの混在の場合は、TTSソフト側にSSML部分だけを渡すこととする。

<span ssml:ph="アジサイ“>
<ruby><rb>紫陽花</rb><rt>あじさい</rt></ruby>
</span>

上記の記載の場合、TTSソフト側に渡す文字列は、以下のようになる。

<span ssml:ph="アジサイ“>紫陽花</span>
2.2.5.SSMLデータの受け渡し機能

ガイドラインに書いてあることと、SSML仕様のrubyの例示がなんか違う感じなのですが。

<speak version="1.1"
       xmlns="http://www.w3.org/2001/10/synthesis"
       xmlns:xhtml="http://www.w3.org/1999/xhtml"
       xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
       xsi:schemaLocation="http://www.w3.org/2001/10/synthesis
                 http://www.w3.org/TR/speech-synthesis11/synthesis.xsd"
       xml:lang="ja">
<!-- 引用にあたり中略 -->
  <s>今日は七月
    <xhtml:ruby>
      <xhtml:rb>二十日</xhtml:rb>
      <xhtml:rt role="alphabet:x-JEITA">ハツカ</xhtml:rt>
    </xhtml:ruby>
    です。
  </s>
2.2.3 他の名前空間を持つSSMLの使用 - 音声合成マークアップ言語(SSML)バージョン1.1

手元で試していないのでなんともですが。


と素人が読んでもざっくりこんな感じです。どうしてこうなった。

おそらく、日本語固有の問題を除けば、IDPF文書のText-to-Speech Overview | Text-to-Speech | EPUB 3 Accessibility Guidelinesを読んだ方がまだ信頼できるでしょう。

なお、総務省|情報バリアフリー環境の整備|情報バリアフリー環境の整備によれば、情報流通行政局情報流通振興課が担当窓口だそうです。総務省へはメールフォームで意見を送れるみたいなので、気が向けば送ることにします。