PR

WIRED WIRED

AIが生成した“存在しない人物”が、一人ひとりに語りかける:ディープフェイクは実用化の段階へ

 AIが生成した本物らしく見える画像や動画であるディープフェイクの実用化が始まった。実際には存在しない“モデル”をAIが生成したり、こうしたモデルが一人ひとりに最適化されたフレーズやさまざまな言語で語りかける動画を作成したりといった技術が、企業の現場で使われ始めている。

TEXT BY TOM SIMONITE

TRANSLATION BY MUTSUMI FUNAYAMA

WIRED(US)

IMAGE BY ELENA LACEY; LUIS ALVAREZ/GETTY IMAGES
IMAGE BY ELENA LACEY; LUIS ALVAREZ/GETTY IMAGES

広告大手のWPPが、世界中に数万人いる社員に対し、ちょっと変わった企業研修ビデオを送付した。AIの基本的なコンセプトを説明する映像なのだが、プレゼンターはビデオを観る社員たち一人ひとりの名前を呼び、それぞれの言語で話している。

そしてこの映像そのものが、AIにどんなことが可能なのかを証明するパワフルなデモンストレーションになっている。というのも、話し手の顔も、話す言葉も、すべてソフトウェアによって合成されたものなのだ。

この合成によってつくられた研修ビデオを、WPPは“ディープフェイク”とは呼んでいない。だが、実際のところディープフェイクとは、AIによってつくられた本物らしく見える画像や動画に適用される定義の曖昧な用語である。この研修ビデオがディープフェイクと呼ばれても、仕方ないだろう。

AIによる画像制作は、これまで嫌がらせやポルノ、詐欺などに使われることでよく知られてきた。それがいまでは、大企業によって社内研修のような退屈ともいえる目的にも使われるようになっている。

一人ひとりに最適化した映像を自動生成

WPPの人工的な研修ビデオは、ロンドンのスタートアップであるSynthesiaが開発した技術によるものだが、まだ完璧とはいえない。WPPの最高技術責任者(CTO)のステファン・プレトリアスによると、プレゼンターの話し方の韻律はテンポが外れることもある。見せてもらった初期の映像は動きこそスムーズだったが、韻律は重大な欠点といえる。

それでも一人ひとりに最適化され、言語までローカライズされた状態で多くの相手に届ける能力は、これまでの企業ビデオよりはるかに人を引きつけることができるのだと、プレトリアスは語る。「このテクノロジーは、ものすごい速さで進歩しています」

こうしたAIが生成するディープフェイク風のビデオの製作は、低コストで時間もかからない。新型コロナウイルスの感染拡大による影響で従来の方法によるビデオ撮影が難しく、危険なものになっているいま、それが大きな利点になっている。

プレトリアスによると、WPPの全社規模の社内教育なら全世界の従業員のために20種類の脚本が必要になることもあり、それぞれ数万ドル(数百万円)の制作費がかかる。「Synthesiaの技術を使えば、多様なアバターが相手の言語を自在に操り、一人ひとりの名前と所属部署名で呼びかけることができます。しかもコストは合計10万ドル(約1,070万円)程度です」と、プレトリアスは言う。

続きを読む

あなたへのおすすめ

PR

PR

PR

PR

ブランドコンテンツ