PR

WIRED WIRED

人工知能vs.プロゲーマーの闘い、人間が制する――その戦術から見えたAIの「弱点」と可能性

Messenger

原因は学習方法にあり?

「ボットたちは一瞬一瞬の身の振り方がとても上手だが、マクロレヴェルの意思決定が苦手なようだ」と、マイク・クックはツイートしていた。クックは、英国ファルマス大学とドイツのマックス・プランク・ソフトウェアシステム研究所でAIを研究している。

この精密な戦術と不安定な戦略というコンビネーションは、OpenAIのボットがDota 2のプレイ方法をどう学習したかを反映しているのかもしれない。

OpenAIのボットは、強化学習という手法で一からゲームを学習した。この強化学習は、グーグルの親会社であるアルファベットが掲げる目標のいくつかでも中心的役割を果たしている。

強化学習において、ソフトウェアはトライ&エラーを通じてタスクを学習する。何回も何回もタスクに挑戦し、さまざまなアクションを試して、うまくいったものを使い続けるのだ。

今回のOpenAIのボットは、スピードアップされたDota 2のゲーム数百万試合を通じて対paiN戦に備えた。彼らの対戦相手は、自分のクローンだ。

15分以上先を「計画」できない弱点

そんなボットの学習方法は、人間のアプローチとはだいぶ違う。人間の場合、ゲームの目的や有効な戦略の立て方を学ぶことで(幸運なことに)数百万試合をプレイせずとも初心者からプロゲーマーになることができる。

一方で強化学習を行ったボットは、少なくとも現在は高いレヴェルでゲームに参加できていない。ボットたちは一瞬一瞬の最適なアクションを予想することで動いているのだ。

続きを読む

あなたへのおすすめ

PR

PR

PR

PR

ブランドコンテンツ