オーディオブックの世界を「合成音声」が席巻する時代は訪れるのか

米国で人気のオーディオブックの業界で、合成音声によるナレーションが存在感を増している。書籍を効率よく音声化できることに出版社は期待しているが、プロのナレーターや一部のファン、そしてアマゾンからも反対の声が上がっている。

声優のヒース・ミラーはメイン州にあるボート小屋を改造した自宅のスタジオに座ると、新しいオーディオブックのナレーションを録音し始めた。彼は録音に先立ち、その本の文面を少なくとも1回は丁寧に読み通している。そして最高のパフォーマンスを出すために、ミラーは登場人物の特徴とその声がどうあるべきなのかメモを残していく。

この2年以上にわたって、ミラーの主な仕事はオーディオブックでの声の出演だ。人気のファンタジーシリーズ『He Who Fights With Monsters(モンスターたちと戦う男)』のナレーションなどが、彼の代表作として知られている。

ところが、英国のSF作家のジョン・リクターのツイートを見たことがきっかけで、ミラーは2021年12月からしばらくインターネット上を探し回る“オンライン探偵”となった。リクターは自身の最新のオーディオブックに、ミラーのような芸術的な技は必要なかったと明かしていたのである。つまり、彼のオーディオブックでは合成音声がナレーションを務めていたのだ。

アマゾンの子会社が運営するオーディオブックサイト「Audible」に掲載されていたリクターの本のナレーション担当は「ニコラス・スミス」となっていて、読み手が人間ではないことは明かされていなかった。合成音声の使用は、「人間がナレーションを務めなければならない」と定めるAudibleの規約に違反している。だが、この「スミス」がAudibleに掲載されている複数の出版社による5〜6本の作品でナレーションを務めていることを知り、ミラーは驚いた。

「スミス」の声は、一般的な合成音声より表現豊かに聞こえるものの、ミラーの耳には明らかに人工的に聞こえ、人間のナレーターと比べると聴き心地は悪かった。新型コロナウイルスを表す「COVID(コービッド)」を「kah-viid(カービード)」のように発音するなど、明らかなミスもあった。

見えてきた合成音声スタートアップの存在

この「スミス」についてミラーが追跡していくと、その声は音声共有サービス「SoundCloud」に投稿されていたサンフランシスコのスタートアップSpeechkiによる合成音声のサンプルと一致した。Speechkiはオーディオブックの出版用として、77の方言と言語を網羅した300種類以上の合成音声を提供している。

そこでミラーは、ほかのプロのナレーターやオーディオブックのファンたちと合成音声のオーディオブックについてオンラインで議論し、そうした作品の存在をAudibleを運営するオーディブルに報告した。この報告を受けて同社は、最終的にそれらの作品をサイトから削除している。

合成音声を用いていたオーディオブックの数は、それほど多くはなかった。しかし、一部の出版社が採用するほど合成音声の質が高くなっていることを知り、ミラーは自分の技術や収入の行く末について心配するようになったという。「ちょっと恐ろしい気がします。ナレーションはわたしだけでなく、わたしの尊敬する多くの人々の生計手段ですから」

リクターは最新の著作のオーディオ版に合成音声を選んだ理由について、合成音声のコンセプトと「不気味の谷」を感じる音声が自分の作品にぴったりだったからだと説明している。リクターの作品には高性能な人工知能(AI)が主要なキャラクターとして登場する。また、オーディブルの方針についても知らなかったという。「誰かを怒らせたり、不快にさせたりする意図はありませんでした」と、リクターは言う。

会員限定記事会員サービス詳細