読者です 読者をやめる 読者になる 読者になる

作って遊ぶ機械学習。

~基礎的な確率モデルから最新の機械学習技術まで~

Googleの人工知能が囲碁のトッププレイヤーを撃破

一般の方向け ディープラーニング

オセロ、チェス、将棋に続き、ついに囲碁までもコンピュータが人間を上回るようになったみたいですね。

www.wired.com

 

概略は以下の通りです。 

GoogleのDeepMindの研究員が開発したAlphaGoという囲碁人工知能システムが、欧州のチャンピオンを倒した。

・深層学習(ディープラーニング)を使って過去の対局データ(棋譜)を大量に学習し、人間のように局面を「直観的に」判断するような技術を実現した。

・他にも強化学習や従来の探索アルゴリズムを組み合わせたり、AI同士を競わせるなどして戦略を向上させた。

 

んーなるほど。どれだけ過去に同じアプローチで研究が行われていたかはちょっと調べていないのですが、私はもう数年はかかるんじゃないかと思っていました。

 

囲碁の難しさ

囲碁はオセロやチェスと比べると格段に難しい問題です。IBMが開発したディープブルーというシステムがチェスのチャンピオンを倒したのは1997年ですが、当時の技術はしらみつぶし探索に近い手法を利用して最善の手を選択していました。

しかし囲碁ではボードのサイズが19x19と非常に大きく、単純計算をするとたった7手先を読むだけで80京通り(800000000000000000通り)の組み合わせを探索しなければならず、現状ではどんなにパワフルなコンピュータであってもしらみつぶし探索は使えません。

 

・深層学習(ディープラーニング)を利用

今回囲碁チャンピオンを倒したアルゴリズムに関して特筆すべき点は、パターン認識アルゴリズムである深層学習を用いているところでしょう。これは極めて自然なアプローチだと思います。囲碁のプロ棋士たちはよく「模様」という言葉を使って盤上の戦況を判断します。これは本当に文字通り「模様」で、特に対局の序盤から中盤では「白石はこのあたりが厚いから(集まっているから)有利そうだ」とか「このあたりに石を打っておけば黒の陣地拡大を抑えられる」といった、大局的な「見た目」から次の一手を決めます。終盤になってくると、可能な手数が限られてくるので、しらみつぶし探索のようなロジカルな読みに次第に移行していきます。大局的な(直観的な)局面の判断と、局所的な(精緻な)読みの組み合わせを要するところが囲碁の難しいところであり、面白いところでもあります。今回のアルゴリズムでは、このような人間の棋士が普通に行っているような「直観的な判断」を、画像認識などで使われているパターン認識の技術を用いてコンピュータに学習させたわけです。

 

・大量の棋譜データで学習

さて、学習の仕組みがあるだけではアルゴリズムは強くなりません。特筆すべきもう1つのポイントは、充実した過去のプロ棋士の対局データ(棋譜)を利活用したことです。これをアルゴリズムに与えることにより、どのような局面でどのように手を打ったら良いのかを学習することができます。このアプローチは将棋のAIでも同じで、電脳戦でプロ棋士に勝ったコンピュータは大量の棋譜データから指し手の方針を学習しています。

 

・現時点で「最良」のアプローチではあるが「最高」ではない

ここからは私の個人的な考えです。私はこの深層学習を使ったアプローチが現時点では「最良」ではありますが、囲碁を解くための「最高」のアプローチではないと思っています。強い囲碁AIを作るという課題は、深層学習が得意とする画像や音声などの認識技術とは決定的に違う点があります。それは目標の設定の仕方です。

例えば、画像認識は、写真に写っている物体が何なのかを当てるといった問題ですが、これは人間が正しいラベルを与えているので、人間の認識能力を実現することが最終的なゴールになります。したがって深層学習のような人間の認識プロセスを模倣するようなアプローチがおそらく一番素直かつ最適なアプローチであると言えるでしょう。

しかし囲碁はゴールが異なります。囲碁は厳格なルールなもとに作られた、極めて人工的な問題です。人間の指し手を模倣すること自体がゴールではありません。囲碁では、究極的にはしらみつぶし探索が最強であり、人間は過去の長い歴史の経験をもとに「そこそこ効率的な」探索手法を発見し、それを棋譜や定石にまとめたに過ぎません。極端な話になりますが、例えば量子コンピュータなどが実現して極めて困難な探索問題をしらみつぶしに近い手法で高速に解けるようになったとしたら、今のプロ棋士や今回のテクノロジーとは全く異なる指し筋になるでしょうし、比べ物にならないほど強いものになると思われます。

人間のプレイヤーを倒してしまった以上、今後この研究が進むかどうかはわかりません。しかし、人間もAI技術も囲碁という問題に対してある程度の近似解を得たに過ぎず、我々はまだ囲碁を制していないと言えると思います。