ゲームのルールを教えなくても人工知能は人間を打ち負かせるか

ph1

シバタアキラ (@punkphysicist) です。

「雨の日に水色の服を着たカップルは月末になると朝食にファストフードを食べる可能性が高い」。もしそんな複雑なパターンを機械が自ら見つけられるようになったら、私たちの仕事やビジネスに与える影響は計り知れない。

「知性とは何か」。宇宙の始まりの謎と並ぶくらい大きな問題だ。人工知能(AI)の探求はコンピュータの黎明期から進められてきたが、最近になって人工知能研究への本格的な投資が相次いでいる。2013年に米グーグルとNASA(米航空宇宙局)が共同設立した「量子人工知能研究所(Quantum Artificial Intelligence Lab)」をはじめとして、米フェイスブックや米ヤフーなどのネット企業大手が人工知能の研究所を設立したり、人工知能分野の専門会社を買収したりする動きが盛んだ。

ニューロン(神経細胞)やシナプシス(接合部)といった脳の構造に着想を得た機械学習の技術として、人工ニューラルネットワーク(ANN)がある。改良を重ねるうちに、実際の脳の仕組みとは乖離してきたが、かつてより手書き認識や音声認識で優れた能力を発揮することが知られている。私の以前の研究分野であった素粒子の分析においても、観測された粒子を分類する目的で人工ニューラルネットワークの技術がよく使われていた。

群を抜く予測精度を発揮するディープラーニング

一方で、人工ニューラルネットワークに汎用性の高い問題解決能力を持たせるには、脳神経でいうところのニューロンとシナプスが何段にも及ぶ深い階層構造を作り、高い複雑性を持つモデルが必要である。しかしながらモデルの複雑性を高めると、学習させるために必要なデータが膨大になってしまう。この問題を克服する鍵となる技術の1つが、ディープラーニング(深層学習)だ。ディープラーニングはモデルの学習方法に革新的な工夫をすることで、ニューラルネットワークの利用価値を大きく高め、様々な分野で群を抜く予測・分類精度を発揮している。

ディープラーニングを巡る大変面白い論文があるので紹介したい。論文のタイトルは「深層強化学習でアタリのテレビゲームをプレイする(Playing Atari with Deep Reinforcement Learning)」。この論文は2011年に英国で設立されたディープマインドが発表し、同社が大きく注目を集めるきっかけとなったものだ。同社は2014年1月にグーグルが買収している。1977年に発売され、初めてROMカートリッジを使った家庭用ゲーム機として一世を風靡した「Atari 2600」のゲームを、人工知能にプレイさせるとどうなるのか? しかもルールの説明は一切なしで。

テレビゲームを人工知能にプレイさせるという人目を引くテーマに加え、この論文研究の凄いところは、元来人工ニューラルネットワークが得意としていたパターン認識・分類の領域を超え、現在の状態に基づいて次の行動を選択する「強化学習」を可能にしたことだ。汎用性の高い学習モデルに、人間がゲームをするときと同じインプット(画面のグラフィックと得点)だけを与えて、時には人間をも凌ぐプレイヤーに育て上げたことが、非常に高い技術力のデモンストレーションになった。

最先端の人工知能の実力はどの程度のものか?私は今までアタリのゲーム機をプレイしたことが一度もなかったが、Atari 2600のエミュレータを使い、論文で結果が報告されている「Qbert」と「Seaquest」というゲームをプレイしてみた。ディープマインドの人工知能である「DQN」はQbertで最高4500点、Seaquestで1740点を出したとされる。

ルールは見ないという同じ条件で私がそれぞれ15分ほどプレイしたところ、Q*bertでは8000点、Seaquestでは2500点を出した。私はテレビゲームは基本的に時間の無駄だと思っているような人間なので、人並み以上の技術を持っていないことには自信がある。どうしたディープマインド? 今回DQNが特にいい得点を叩きだしたゲームは、エミュレータ上で動かすことができなかったが、それにしてもこのあっけなさ…。

データサイエンティストさえ、職を失う日が来る?

この続きは日経ビッグデータにて御覧ください