産経ニュース

グーグルの画像認識システムはまだ「ゴリラ問題」を解決できていない 見えてきた「機械学習の課題」

WIRED WIRED

記事詳細

更新


グーグルの画像認識システムはまだ「ゴリラ問題」を解決できていない 見えてきた「機械学習の課題」

 グーグルの「Google フォト」が黒人をゴリラとタグ付けした問題から2年以上が経ったいま、同社の画像認識システムはどこまで進化したのか。『WIRED』US版が5万枚以上の写真を使って調査したところ、一部の霊長類には写真検索が機能しないという実態が明らかになると同時に、機械学習の課題が浮き彫りになった。

PHOTO: RICK MADONIK/TORONTO STAR/GETTY IMAGES PHOTO: RICK MADONIK/TORONTO STAR/GETTY IMAGES

自分と友人の写真を「Google フォト」が「ゴリラ」とタグ付けしている--。ある黒人のソフトウェア開発者が、そんなツイートをする出来事が2015年にあった。

グーグルは「非常にショックを受けており、心からお詫びする」との声明を出し、問題に対応した同社のエンジニアはゴリラのタグを当面は使用停止にすると公表。そのうえで、「長期的な解決策に取り組んでいく」と話していた。

2年以上経ったいま、その“解決策”はGoogle フォトのタグの一覧からゴリラやそのほかの霊長類の名前を削除することにとどまっている。グーグルをはじめとするIT企業は、自律走行車やヴァーチャルアシスタントなどに画像認識技術を活用していく考えだが、この苦し紛れの場当たり的な措置は、技術の進歩において企業が直面する問題を浮き彫りにしている。

一部の霊長類には写真検索が機能せず

Google フォトはウェブサイトまたはアプリから利用でき、ユーザーは5億人に達する。写っているものを機械学習技術によって自動的に分類する機能があり、保存した画像のコレクションをキーワード検索することも可能だ。

『WIRED』US版が4万枚の動物の写真を使ってこのシステムをテストしてみたところ、パンダやプードルを含む多くの動物は見事に検出された。だが、「ゴリラ」「チンパンジー」「猿」といった単語では「検索結果はありません」との答えしか返ってこなかった。

一方で、検索が機能した霊長類もある。「ヒヒ」「テナガザル」「マーモセット」「オランウータン」は大丈夫だったし、オマキザルとゲレザは後ろに「サル(Monkey)」という単語を付けずに検索すれば結果が表示された。

ダイアン・フォッシー研究所とNPOのChimp Havenが提供しているチンパンジーとゴリラの写真20枚を使った第2のテストでは、「森林」「ジャングル」「動物園」といった検索単語で類人猿を探し出すことができたが、残りはやはり見つけるのが難しいという事実が明らかになっている。

ここまでの結論を言うと、Google フォトではヒヒはヒヒとして認識されるがサルはそうではなく、ゴリラとチンパンジーは透明人間のように見えない存在だ。

続きを読む

このニュースの写真

  • グーグルの画像認識システムはまだ「ゴリラ問題」を解決できていない 見えてきた「機械学習の課題」