AlphaZero

概念

AI効果（フランス語版）
生成的人工知能
大規模言語モデル
ハルシネーション
汎用人工知能

機械学習
計画
コンピュータビジョン
再帰的自己改良（英語版）
自然言語処理
人工知能の安全（英語版）
知的推論
汎用ゲーム対戦（英語版）
汎用人工知能
ロボット工学

研究手法

記号処理（英語版）
状況対応的手法（英語版）
進化的アルゴリズム
人工知能処理系の集積（英語版）
複合型人工知能（英語版）
ベイジアンネットワーク

機械学習
ディープラーニングニューラルネットワーク

応用（英語版）

医療（英語版）
- 精神医療（英語版）
音楽（英語版）
機械翻訳
金融（英語版）
軍事（英語版）
計画（英語版）
産業（英語版）
政府（英語版）
生物情報学（英語版）
地球科学（英語版）
ディープフェイク
美術（英語版）
物理学（英語版）

課題と哲学（英語版）

歴史とできごと

歴史
進化（英語版）人工知能時代（英語版）人工知能の冬（英語版）人工知能ブーム（英語版）年表（英語版）
できごと
Logic Theorist (1955) パーセプトロン (1958) General Problem Solver (1959) Prolog (1972) ディープ・ブルー対ガルリ・カスパロフ (1996-1997) AlphaGo対李世ドル (2016)

フィクション

法規制

規制（フランス語版）
人知法

組織

Agence francophone pour l'intelligence artificielle
DeepMind
OpenAI
Partnership on AI

著作

Open letter on artificial intelligence (2015)
AI Superpowers(2018)
Déclaration de Montréal pour un développement responsable de l'intelligence artificielle(2018)
Artificial Intelligence: A Modern Approach(2020)

一覧

映画（英語版）
家庭用ロボット（英語版）
計画（英語版）
チャットボット（英語版）
ディープラーニング（英語版）
美術家（英語版）
フィクション
話題（英語版）

用語集

用語集（英語版）

手法

モンテカルロ木探索を使用した自己対戦によって、ディープラーニングを用いた強化学習をする。

AlphaGo Zeroとの関係

詳細は「AlphaGo Zero」を参照

AlphaZero (AZ) は、AlphaGo Zero (AGZ) アルゴリズムのより汎化された変種であり、囲碁とともに将棋とチェスがプレーできる。AZとAGZとの間の違いには以下の内容が含まれる^[1]。

AZは探索ハイパーパラメータ（英語版）の設定のためにハードコードされている。
ニューラルネットワークは絶えず更新される。
（チェスと異なり）囲碁は任意の鏡映と回転下で対称である。AGZはこれらの対称性をうまく利用するようにプログラムされている。AZはされていない。
（囲碁と異なり）チェスには引き分けがある。したがって、AZは引き分けの可能性が考慮できる。

性能

囲碁

囲碁を8時間自己学習した後に前バージョンのAlphaGo Zeroと対戦して、AlphaZeroは60勝40敗であった^[4]。

将棋

将棋プログラムelmoとの100局において、AlphaZeroは90勝8敗2分であった^[4]。このとき、思考時間はチェス同様一手ごとに1分与えられた。

チェス

AlphaZeroとStockfishとのチェス対局において、それぞれのプログラムは一手ごとに1分の思考時間が与えられた。AlphaZeroは白（先手）で25勝、黒（後手）で3勝し、残りの72局で引き分けた^[4]。

AlphaZeroはStockfishを初めて打ち負かしたプログラムではない。Komodo（英語版）と呼ばれるプログラムが、今回より前にStockfishを破っていた^[4]。Komodoのラリー・カウフマン（英語版）はAlphaZeroの勝利を重要視せず、「AlphaZeroは効果的に自分のオープニングブックを構築しているので、オープニングブックを用いるトップエンジンに対してよりフェアに戦えたのだろう」と主張した^[5]。

評価

新聞は、訓練にわずか4時間しかかからなかったとの大見出しを付けた: 『朝食と昼食の間と大差ない時間でやってのけた』^[2]^[6]。WIRED誌は、AlphaZeroを「初のマルチスキルAIボードゲームチャンピオン」として大々的に宣伝した^[7]。AI専門家のJoanna Bysoは、Googleは「パブリシティ（宣伝）の才覚」によって競合他社に対して有利な立場に立ったと述べた。「すぐれたプログラマーを雇えるだけではありません。AI部門に注目する各国政府や規制当局者との交渉においてできる限り強い立場に立つ上でも有益なので、非常に政治的でもあるのです。」^[4]

オランダのチェスグランドマスターであるピーター・ハイネ・ニールセン（英語版）はBBCのインタビューに対して、「私はいつも、人間より優れた生命が地球に降り立ち、チェスをどうプレーするのか見せてくれたらどんな風になるのだろうと思っていました。今、わかりました」と語った^[4]。ノルウェーのグランドマスターであるヨン・ルズヴィ・ハンメル（英語版）はAlphaZeroの特徴について、深遠なポジショナルプレイ（駒の位置を良くする指し方）を用いながらの「常軌を逸した攻撃的チェス」と述べた^[2]。

脚注

^ ^a ^b Silver, David; Hubert, Thomas; Schrittwieser, Julian; Antonoglou, Ioannis; Lai, Matthew; Guez, Arthur; Lanctot, Marc; Sifre, Laurent; Kumaran, Dharshan; Graepel, Thore; Lillicrap, Timothy; Simonyan, Karen; Hassabis, Demis (5 December 2017). "Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm". arXiv:1712.01815 [cs.AI]。
^ ^a ^b ^c Knapton, Sarah; Watson, Leon (2017年12月6日). “Entire human chess knowledge learned and surpassed by DeepMind's AlphaZero in four hours” (英語). Telegraph.co.uk. http://www.telegraph.co.uk/science/2017/12/06/entire-human-chess-knowledge-learned-surpassed-deepminds-alphazero/ 2017年12月6日閲覧。
^ Vincent, James (2017年12月6日). “DeepMind’s AI became a superhuman chess player in a few hours, just for fun”. The Verge. https://www.theverge.com/2017/12/6/16741106/deepmind-ai-chess-alphazero-shogi-go 2017年12月6日閲覧。
^ ^a ^b ^c ^d ^e ^f “'Superhuman' Google AI claims chess crown”. BBC News. (2017年12月6日). http://www.bbc.com/news/technology-42251535 2017年12月7日閲覧。
^ “Google's AlphaZero Destroys Stockfish In 100-Game Match - Chess.com”. Chess.com. https://www.chess.com/news/view/google-s-alphazero-destroys-stockfish-in-100-game-match 2017年12月7日閲覧。
^ Badshah, Nadeem (2017年12月7日). “Google's DeepMind robot becomes world-beating chess grandmaster in four hours”. The Times. https://www.thetimes.co.uk/article/google-s-deepmind-alphazero-becomes-world-beating-chess-grandmaster-in-four-hours-hcppp9vr2 2017年12月7日閲覧。
^ “Alphabet's Latest AI Show Pony Has More Than One Trick”. WIRED. (2017年12月6日). https://www.wired.com/story/alphabets-latest-ai-show-pony-has-more-than-one-trick/ 2017年12月7日閲覧。