SlideShare a Scribd company logo
人間対PC
佐竹俊哉
13年6月3日月曜日
人間対PC
• 第二回将棋電王戦
• PC側の3勝1敗1分
け
• トップのA級棋士に
も勝った
13年6月3日月曜日
人間対PC
チェス...1988年にグランドマスター(チ
ェス選手の最高位のタイトル)に初勝利
囲碁...まだプロには勝てない
13年6月3日月曜日
Topic
• 将棋&囲碁
13年6月3日月曜日
将棋
13年6月3日月曜日
ゲーム木
• ゲームの可能な
手順を表現
今
二手後
一手後
13年6月3日月曜日
ゲーム木(例)
13年6月3日月曜日
完全なゲーム木
• 指せる全ての手を終局まで表現したゲ
ーム木
• 3目並べとかならできる(26830通り)
• 将棋は駒と盤面多すぎて局面多すぎ
• 詰将棋
13年6月3日月曜日
• 全部の局面が作
れたら・・
勝 負
勝
負 勝 勝 勝
勝負
勝
13年6月3日月曜日
(・ω・)
• 将棋は局面多すぎ・・・
13年6月3日月曜日
じゃあどうするか
13年6月3日月曜日
とりあえず
• ある深さまで手を読む
• そこでの局面を評価して完全なゲーム
木と似たようなことをする
13年6月3日月曜日
ミニマックス法
• ある局面の優劣を「評価関数」で評価
• 数値の大きさに応じて、+なら先手, −な
ら後手が優勢とする
13年6月3日月曜日
ミニマックス法
• MaxをどうMinにするかを調べる
• (ネガマックス法という派生も)
13年6月3日月曜日
9 13
13
6 7 8
7-5
7
-5
: Maxを調べる
: Minを調べる
13年6月3日月曜日
ミニマックス法
• これで1~3手ぐらいなら読めるけど...
• まだ弱すぎ
13年6月3日月曜日
どうやって無駄を減らす?
13年6月3日月曜日
αβ探索
• それぞれの頂点で最大や最小のみを選
択することに注目
13年6月3日月曜日
7 4
7
×
57
7
-3
5
×515 ×
[-∞, 7]
[7, ∞]
探索順序
13年6月3日月曜日
αβ探索
• 要は調べる必要の無い所を無視
• 得られる結果はミニマックス法と同じ
• うまく使えば、同じ時間でミニマック
ス法の2倍先まで読める
13年6月3日月曜日
将棋
• αβ探索したり、序盤は棋譜のデータか
ら学習して定石を使ったり
• より高速化する方法が研究されている
13年6月3日月曜日
囲碁
13年6月3日月曜日
囲碁
• αβ探索は別に将棋に限らず有効な手段
だった
• 囲碁にも使えるのでは???
13年6月3日月曜日
囲碁
• 結論から言うと無理
• ▂▅▇█▓▒░(’ω’)░▒▓█▇▅▂うわああ
あああああ
13年6月3日月曜日
囲碁
• 19路盤囲碁
• 9路盤囲碁も..
• なぜだろう
将棋
9路盤囲碁
19路盤囲碁
10
10
10
71
38
171
13年6月3日月曜日
(再掲)
7 4
7
×
57
7
-3
5
×515 ×
[-∞, 7]
[7, ∞]
探索順序
13年6月3日月曜日
(再掲)
7 4
7
×
57
7
-3
5
×515 ×
[-∞, 7]
[7, ∞]
探索順序
これ!!
13年6月3日月曜日
囲碁
• それぞれの局面での評価値を利用して
いる
• つまり、評価関数が作れないと無理
13年6月3日月曜日
評価の難しさ
• 石たちの価値が同じ
• 領域が決まるのは最後
• オセロとかのように角を取るべきとか
がない
• 捨石とか
13年6月3日月曜日
囲碁
• 評価関数を使わずに探索できないか?
• 対局が終わった最後の状態なら勝ち負
けがわかる
13年6月3日月曜日
(原始)モンテカルロ法
• 局面を評価する代わりに適当に打って
みる
13年6月3日月曜日
プレイアウト
• 乱数を用いて、最後までプレイするこ
とをプレイアウトと呼ぶ
こんな感じにしてしまう
13年6月3日月曜日
(原始)モンテカルロ法
• プレイアウトをたくさんして勝てそう
な手を選ぶ
13年6月3日月曜日
• このままだと運任せすぎて全然勝てな
い
• もうちょっとしっかりとした手を
(原始)モンテカルロ法
13年6月3日月曜日
モンテカルロ木探索
• 有利な手には多くの
プレイアウトを
• プレイアウト回数が
増えすぎたら段が増
える
13年6月3日月曜日
モンテカルロ木探索
• 将棋の時と違って、勝ちか負けかだけ
を見る
• スコア差ではなく勝率重視
13年6月3日月曜日
囲碁
• これでそれなりの性能
• UCTという戦略も
13年6月3日月曜日
将棋&囲碁
• 同じようなゲームとは言っても状況が
全然違った
• まだまだこれからの進化が期待
13年6月3日月曜日
PCの強み
• 圧倒的な計算速度
• ムーアの法則(「半導体の集積密度は18
∼24ヶ月で倍増する」という法則)に表
れるように、進化している
• 人間の設計したアルゴリズム通りに動
く
13年6月3日月曜日
PCの弱み
• いくら計算が速いといっても限度有り
(考えうる状態が多すぎると計算しきれ
ない)
• こうした方針を取れば良いという良い
戦略が無いとうまく動かない
13年6月3日月曜日
まとめ
• 全てアルゴリズムにかかっている
• 自分で考えるのも楽しい
13年6月3日月曜日
!結局人間対人間!
13年6月3日月曜日
ご清聴ありがとうございました
13年6月3日月曜日

More Related Content

Viewers also liked

Viewers also liked (12)

かけざん
かけざんかけざん
かけざん
 
Mage
MageMage
Mage
 
PC解体
PC解体PC解体
PC解体
 
ゲーム木探索技術とコンピュータ将棋への応用
ゲーム木探索技術とコンピュータ将棋への応用ゲーム木探索技術とコンピュータ将棋への応用
ゲーム木探索技術とコンピュータ将棋への応用
 
Npc april fool2014
Npc april fool2014Npc april fool2014
Npc april fool2014
 
Imo
ImoImo
Imo
 
Amortize analysis of Deque with 2 Stack
Amortize analysis of Deque with 2 StackAmortize analysis of Deque with 2 Stack
Amortize analysis of Deque with 2 Stack
 
エニグマ暗号とは何だったのか
エニグマ暗号とは何だったのかエニグマ暗号とは何だったのか
エニグマ暗号とは何だったのか
 
AlphaGo の論文を読んで (MIJS 分科会資料 2016/11/08)
AlphaGo の論文を読んで (MIJS 分科会資料 2016/11/08)AlphaGo の論文を読んで (MIJS 分科会資料 2016/11/08)
AlphaGo の論文を読んで (MIJS 分科会資料 2016/11/08)
 
辺彩色
辺彩色辺彩色
辺彩色
 
バンディットアルゴリズム入門と実践
バンディットアルゴリズム入門と実践バンディットアルゴリズム入門と実践
バンディットアルゴリズム入門と実践
 
ハッキング実演
ハッキング実演ハッキング実演
ハッキング実演
 

More from Ken Ogura (14)

計算量
計算量計算量
計算量
 
Shio dtm
Shio dtmShio dtm
Shio dtm
 
Hairetu2
Hairetu2Hairetu2
Hairetu2
 
Lunch
LunchLunch
Lunch
 
Divisor
DivisorDivisor
Divisor
 
Homework
HomeworkHomework
Homework
 
Pool
PoolPool
Pool
 
Sns
SnsSns
Sns
 
Pencil
PencilPencil
Pencil
 
Spell check
Spell checkSpell check
Spell check
 
Black board
Black boardBlack board
Black board
 
Donyoku
DonyokuDonyoku
Donyoku
 
Nazoki
NazokiNazoki
Nazoki
 
人材発掘うっはうは
人材発掘うっはうは人材発掘うっはうは
人材発掘うっはうは
 

人間対Pc2