人間対Pc2

人間対PC
佐竹俊哉
13年6月3日月曜日

人間対PC
• 第二回将棋電王戦
• PC側の３勝１敗１分
け
• トップのA級棋士に
も勝った

人間対PC
チェス...1988年にグランドマスター(チ
ェス選手の最高位のタイトル)に初勝利
囲碁...まだプロには勝てない

Topic
• 将棋＆囲碁

ゲーム木
• ゲームの可能な
手順を表現
今
二手後
一手後

ゲーム木(例)

完全なゲーム木
• 指せる全ての手を終局まで表現したゲ
ーム木
• 3目並べとかならできる(26830通り)
• 将棋は駒と盤面多すぎて局面多すぎ
• 詰将棋

• 全部の局面が作
れたら・・
勝負
勝
負勝勝勝
勝負
勝

(・ω・)
• 将棋は局面多すぎ・・・

じゃあどうするか

とりあえず
• ある深さまで手を読む
• そこでの局面を評価して完全なゲーム
木と似たようなことをする

ミニマックス法
• ある局面の優劣を「評価関数」で評価
• 数値の大きさに応じて、+なら先手, −な
ら後手が優勢とする

• MaxをどうMinにするかを調べる
• (ネガマックス法という派生も)

9 13
13
6 7 8
7-5
7
-5
: Maxを調べる
: Minを調べる

• これで1~3手ぐらいなら読めるけど...
• まだ弱すぎ

どうやって無駄を減らす？

αβ探索
• それぞれの頂点で最大や最小のみを選
択することに注目

7 4
7
×
57
7
-3
5
×515 ×
[-∞, 7]
[7, ∞]
探索順序

αβ探索
• 要は調べる必要の無い所を無視
• 得られる結果はミニマックス法と同じ
• うまく使えば、同じ時間でミニマック
ス法の2倍先まで読める

将棋
• αβ探索したり、序盤は棋譜のデータか
ら学習して定石を使ったり
• より高速化する方法が研究されている

囲碁
• αβ探索は別に将棋に限らず有効な手段
だった
• 囲碁にも使えるのでは？？？

囲碁
• 結論から言うと無理
• ▂▅▇█▓▒░(’ω’)░▒▓█▇▅▂うわああ
あああああ

囲碁
• 19路盤囲碁
• 9路盤囲碁も..
• なぜだろう
将棋
9路盤囲碁
19路盤囲碁
10
10
10
71
38
171

(再掲)
7 4
7
×
57
7
-3
5
×515 ×
[-∞, 7]
[7, ∞]
探索順序

(再掲)
7 4
7
×
57
7
-3
5
×515 ×
[-∞, 7]
[7, ∞]
探索順序
これ！！

囲碁
• それぞれの局面での評価値を利用して
いる
• つまり、評価関数が作れないと無理

評価の難しさ
• 石たちの価値が同じ
• 領域が決まるのは最後
• オセロとかのように角を取るべきとか
がない
• 捨石とか

囲碁
• 評価関数を使わずに探索できないか？
• 対局が終わった最後の状態なら勝ち負
けがわかる

(原始)モンテカルロ法
• 局面を評価する代わりに適当に打って
みる

プレイアウト
• 乱数を用いて、最後までプレイするこ
とをプレイアウトと呼ぶ
こんな感じにしてしまう

• プレイアウトをたくさんして勝てそう
な手を選ぶ

• このままだと運任せすぎて全然勝てな
い
• もうちょっとしっかりとした手を

モンテカルロ木探索
• 有利な手には多くの
プレイアウトを
• プレイアウト回数が
増えすぎたら段が増
える

モンテカルロ木探索
• 将棋の時と違って、勝ちか負けかだけ
を見る
• スコア差ではなく勝率重視

囲碁
• これでそれなりの性能
• UCTという戦略も

将棋＆囲碁
• 同じようなゲームとは言っても状況が
全然違った
• まだまだこれからの進化が期待

PCの強み
• 圧倒的な計算速度
• ムーアの法則(「半導体の集積密度は18
∼24ヶ月で倍増する」という法則)に表
れるように、進化している
• 人間の設計したアルゴリズム通りに動
く

PCの弱み
• いくら計算が速いといっても限度有り
(考えうる状態が多すぎると計算しきれ
ない)
• こうした方針を取れば良いという良い
戦略が無いとうまく動かない

まとめ
• 全てアルゴリズムにかかっている
• 自分で考えるのも楽しい

！結局人間対人間！

ご清聴ありがとうございました

人間対Pc2

Recommended

Recommended

More Related Content

Viewers also liked

Viewers also liked (12)

More from Ken Ogura

More from Ken Ogura (14)

人間対Pc2