SlideShare a Scribd company logo
2.完備情報の戦略形ゲーム
首都大学東京講義 ゲーム理論23
2.1 戦略形ゲームと利得行列
24 首都大学東京講義 ゲーム理論
モデル1: I市コンビニ戦争PART1
2つのコンビニ,セレブとファミモ
どちらの駅に出店するか?
A駅(Akabadai)の店舗利用客 1200人
B駅(Black River)の店舗利用客 300人
違う場所に出店すれば客を独占
同じ場所に出店ーファミモが人気
ファミモはセレブの2倍の客数を獲得できる
A駅に出店:セレブ400人,ファミモ800人
B駅に出店:セレブ100人,ファミモ200人
客数を利得と考える
25 首都大学東京講義 ゲーム理論
プレイヤー・戦略・利得
戦略形ゲームの第1歩
プレイヤー・利得・戦略が何かを明らかにする
 プレイヤー セレブ ファミモ
 セレブの戦略 A駅に出店する,B駅に出店す
る
 ファミモの戦略 A駅に出店する,B駅に出店
する
26 首都大学東京講義 ゲーム理論
戦略形ゲームの結果と利得
戦略形ゲームの結果は,プレイヤーが選択した戦略の
組合せ
セレブの
戦略
ファミモの
戦略
セレブの
利得
ファミモの
利得
A駅 A駅 400 800
A駅 B駅 1200 300
B駅 A駅 300 1200
B駅 B駅 100 200
27 首都大学東京講義 ゲーム理論
ポイント3
プレイヤー,戦略,利得が何であるか考える
特に自分と相手の利得は何かを考える
敵を知り,己を知れば,百戦危うからず
でもどうすればいいかはゲーム理論は教えて
くれない!?
28 首都大学東京講義 ゲーム理論
利得行列を作って考えよう
A駅 B駅
A駅
B駅
( 400, 800) (1200, 300)
( 300,1200) ( 100, 200)
セレブ
ファミモ
29 首都大学東京講義 ゲーム理論
カッコの左側がセレブの利得
A駅 B駅
A駅
B駅
( 400, 800) (1200, 300)
( 300,1200) ( 100, 200)
セレブ
ファミモ
30 首都大学東京講義 ゲーム理論
カッコの右側はファミモの利得
A駅 B駅
A駅
B駅
( 400, 800) (1200, 300)
( 300,1200) ( 100, 200)
セレブ
ファミモ
31 首都大学東京講義 ゲーム理論
利得行列の読み方
A駅 B駅
A駅
B駅
( 400, 800) (1200,300)
( 300,1200) ( 100, 200)
セレブ
ファミモ
(1200, 300)
セレブの利得は1200,ファミモの利得は300
セレブがA駅を,ファミモがB駅を選択したならば?
32 首都大学東京講義 ゲーム理論
モデル2:I市コンビニ戦争PART2
I市コンビニ戦争PART1を以下のように変えてみる
A駅(Akabadai)の店舗利用客 600人
B駅(Black River)の店舗利用客 300人
同じ場所に出店ーファミモが人気
ファミモはセレブの2倍の客数を獲得できる
A駅に出店:セレブ200人,ファミモ400人
B駅に出店:セレブ100人,ファミモ200人
客数を利得と考える
33 首都大学東京講義 ゲーム理論
I市コンビニ戦争PART2 利得行列
A駅 B駅
A駅
B駅
( 200, 400) ( 600, 300)
( 300, 600) ( 100, 200)
セレブ
ファミモ
34 首都大学東京講義 ゲーム理論
モデル3:I市コンビニ戦争PART3
I市コンビニ戦争PART1を以下のように変えてみる
A駅(Akabadai)の店舗利用客 600人
B駅(Black River)の店舗利用客 750人
同じ場所に出店ーファミモが人気
ファミモはセレブの2倍の客数を獲得できる
A駅に出店:セレブ200人,ファミモ400人
B駅に出店:セレブ250人,ファミモ500人
客数を利得と考える
35 首都大学東京講義 ゲーム理論
I市コンビニ戦争PART3 利得行列
A駅 B駅
A駅
B駅
( 200, 400) ( 600, 750)
( 750, 600) ( 250, 500)
セレブ
ファミモ
36 首都大学東京講義 ゲーム理論
モデル4:精巧堂 vs 便乗工房
人形Aと人形Bのどちらを売り出すか?
精巧堂は,便乗工房と異なる人形にしたい
便乗工房は精巧堂と同じ人形にしたい
両者が人形Aを売り出せば,利得は120ずつ
両者が人形Bを売り出せば,利得は96ずつ
精巧堂が人形A,便乗工房が人形B
利得は精巧堂が216,便乗工房が24
精巧堂が人形B,便乗工房が人形A
利得は精巧堂が192,便乗工房が48
37 首都大学東京講義 ゲーム理論
精巧堂 vs 便乗工房
人形A 人形B
人形A
人形B
( 120, 120) ( 216, 24)
( 192, 48) ( 96, 96)
精巧堂
便乗工房
38 首都大学東京講義 ゲーム理論
宿題:戦略形ゲームを作る
あなたの身近な問題を,同時ゲームとしてモデル化し,
利得行列を作ってみよう!
ストーリーも面白くつけてください
同時ゲームに単純化できるような題材を選びましょう
39 首都大学東京講義 ゲーム理論
2.2.戦略形ゲームを解く
40 首都大学東京講義 ゲーム理論
ゲームの解とは?
戦略的思考の基本
自分がどうするかだけではなく,相手がどうするかも考える
結果的には,自分も含めたゲームで,すべてのプレイヤーがど
のような戦略を選択するかを予測する
これをゲームを解くと呼ぶ
ゲームの解はすべてのプレイヤーの戦略の組である
41 首都大学東京講義 ゲーム理論
ポイント4
ゲームを解く思考方法
1:各プレイヤーの視点に立つ
2:自分以外のプレイヤーのすべての戦略に
対して,どの戦略が一番利得を高くするか考
える
3:1,2をすべてのプレイヤーと戦略について
繰り返す
42 首都大学東京講義 ゲーム理論
支配戦略(絶対優位の戦略)を探せ
各プレイヤーの立場で,どの戦略を選ぶ事が最善か考える
(詳しく)各プレイヤーの立場で,自分以外のプレイヤーが選んだ
戦略それぞれに対し,自分の最善の戦略を考える
戦略的思考の第1歩
支配戦略(絶対優位な戦略)
相手がどの戦略を選んでも,自分にとって(他の戦略より)良い戦
略
43 首都大学東京講義 ゲーム理論
「セレブ」の支配戦略を探せ!
A駅 B駅
A駅
B駅
( 400, 800) (1200, 300)
( 300,1200) ( 100, 200)
セレブ
ファミモ
セレブの立場で考える
ファミモが「A駅」に出店するなら?
セレブは「A駅」に出店するのが良い
44 首都大学東京講義 ゲーム理論
「セレブ」の支配戦略を探せ!
A駅 B駅
A駅
B駅
( 400, 800) (1200, 300)
( 300,1200) ( 100, 200)
セレブ
ファミモ
セレブの立場で考える
ファミモが「B駅」に出店するなら?
セレブは「A駅」に出店するのが良い
45 首都大学東京講義 ゲーム理論
ファミモの支配戦略
A駅 B駅
A駅
B駅
( 400, 800) (1200, 300)
( 300,1200) ( 100, 200)
セレブ
ファミモ
46 首都大学東京講義 ゲーム理論
ファミモの支配戦略
A駅 B駅
A駅
B駅
( 400, 800) (1200, 300)
( 300,1200) ( 100, 200)
セレブ
ファミモ
セレブがA駅を選択しても,B駅を選択しても
→ファミモはA駅を選ぶことが良い
A駅を選ぶことはファミ
モの支配戦略
47 首都大学東京講義 ゲーム理論
支配戦略
セレブの立場で考える
ファミモが「A駅」を選ぶならば
 自分は「A駅」を選ぶ方が良い
ファミモが「B駅」を選ぶならば
 やはり「A駅」を選ぶ方が良い
「A駅」はセレブの支配戦略
ファミモも同じ
「A駅」はファミモにとっても支配戦略
結果・・・2つのコンビニとも「A駅」を選ぶ
48 首都大学東京講義 ゲーム理論
ポイント5
支配戦略とは,相手のどの戦略に対しても,
自分の他の戦略より良い戦略である
支配戦略があるときは,その戦略を選択せ
よ.また相手もそうするはずである
49 首都大学東京講義 ゲーム理論
支配戦略均衡
50 首都大学東京講義 ゲーム理論
全プレイヤーに支配戦略がある場合のゲームの解
すべてのプレイヤーが支配戦略を選ぶ戦略の組
支配戦略均衡
支配戦略とゲームの解を求めよ
51
U
D
L R
( 1, 9)
( 2, 4)
( -6, 8)
( -5, 2)
( 4, 5)
( 3, 3)
( 0, 6)
( -1, 4)
( -2, 5)
( -3, 1)
問1
問2
U
D
L M R
1
2
1
2
ゲームの解は戦略の組
( 1, 5)
( 3, 4)
( -2, 4)
( -1, 2)
ゲームの解は?
( 3 , 4 )
正しくは
(D , L )
ゲームの解は利得の
組ではなく戦略の組
この例だと(1,2)
では分からない!
1
2
( 1, 2)
( 0, 3)
( 2, 0)
( 1, 2)
1
2
52 首都大学東京講義 ゲーム理論
U
D
L R
U
D
L R
モデル4:短期的な成果主義の失敗
A君,B君,会社の同僚で良きライバル
職場のネットワーク環境の整備⇒2人の成果には直接
結びつかない
両方が,整備に協力⇒それぞれ +4万
一方が協力し,一方が協力しない
協力した方は自分の業績が落ち -10万
協力しない方は業績が伸びて +6万
両方とも協力しない時は何も変わらず 0
53 首都大学東京講義 ゲーム理論
支配戦略はどうなる: 短期的な成果主義の失敗
協力する 協力しない
協力する
協力しない
( 4, 4) ( -10, 6)
( 6, -10) ( 0, 0)
A君
B君
相手が「協力する」ならば?,相手が「協力しない」
ならば?
54 首都大学東京講義 ゲーム理論
短期的な成果主義の失敗:ゲームの解は
協力する 協力しない
協力する
協力しない
( 4, 4) ( -10, 6)
( 6, -10) ( 0, 0)
A君
B君
本当?
55 首都大学東京講義 ゲーム理論
「短期的な成果主義」ゲームの特徴
どちらのプレイヤーにとっても...
相手が「協力する」を選ぶと
→自分は「協力する」より「協力しない」方が良い
相手が「協力しない」を選んでも
→自分は「協力する」より「協力しない」方が良い
すなわち「協力しない」ことは支配戦略
しかし両方が「協力しない」よりは,両方が「協力した」
時の方が利得が高い
囚人のジレンマ!
56 首都大学東京講義 ゲーム理論
モデル5:囚人のジレンマ
数学者タッカー(A.W.Tucker)が作り出した以下のような
ストーリー
2人の囚人AとB,重罪を犯している
別件で逮捕,重罪の自白を迫られるが黙秘
司法取引:「おまえだけが自白すれば無罪だぞ」
57 首都大学東京講義 ゲーム理論
囚人のジレンマの利得行列
黙秘 自白
黙秘
自白
(懲役1年,懲役1年)
A
B
(懲役10年,無罪)
(無罪,懲役10年) (懲役5年,懲役5年)
58 首都大学東京講義 ゲーム理論
囚人のジレンマ
黙秘 自白
黙秘
自白
( -1, -1) ( -10, 1)
( 1, -10) ( -5, -5)
A
B
( -5, -5)
59 首都大学東京講義 ゲーム理論
囚人のジレンマ
囚人のジレンマ
個人の合理性と社会全体の合理性の矛盾
ゲーム理論の大きなテーマ
身の回りの囚人のジレンマ
地球環境問題,ゴミ問題
共有地の悲劇,動植物の乱獲
東西冷戦,2国間紛争
60 首都大学東京講義 ゲーム理論
囚人のジレンマの解決には?
コミットメントと契約
あらかじめ協定を結ぶ,契約をする
契約を破ったときは有効な罰則
罰則が効かないときは??
長期的関係
1回のゲームではなく,何回もゲームを繰り返している繰り返し
ゲーム
トリガー戦略,しっぺ返し戦略
モニターできないときは?
8章で詳しく!
61 首都大学東京講義 ゲーム理論
2.3 最適反応戦略を考える
62 首都大学東京講義 ゲーム理論
モデル2:I市コンビニ戦争PART2
I市コンビニ戦争PART1を以下のように変えてみる
A駅(Akabadai)の店舗利用客 600人
B駅(Black River)の店舗利用客 300人
同じ場所に出店ーファミモが人気
ファミモはセレブの2倍の客数を獲得できる
A駅に出店:セレブ200人,ファミモ400人
B駅に出店:セレブ100人,ファミモ200人
客数を利得と考える
63 首都大学東京講義 ゲーム理論
セレブには支配戦略がない!
A駅 B駅
A駅
B駅
( 200, 400) ( 600, 300)
( 300, 600) ( 100, 200)
セレブ
ファミモ
ファミモがA駅を選べば→B駅が良い
ファミモがB駅を選べば→A駅が良い
セレブの立場で考える
あなたがセレブな
らどうする?
64 首都大学東京講義 ゲーム理論
セレブはファミモの戦略に
よって良い戦略が異なる
⇒支配戦略がない!
ゲーム理論を習わない人の考え方
A駅 B駅
A駅
B駅
( 200, 400) ( 600, 300)
( 300, 600) ( 100, 200)
セレブ
ファミモ
一番高い利得(600)を考えると→A駅が良い
最悪の場合(100)を避けると?→A駅が良い
あなたがセレブならどうする?
セレブはA駅を選
ぶのが良いの
か?
65 首都大学東京講義 ゲーム理論
ポイント6
ゲーム理論では,相手を自然や機械のよう
に,デタラメな不確実性とは考えない
「一番大きなチャンスを狙う」「最悪の場合を
避ける」のような考え方ではダメ
66 首都大学東京講義 ゲーム理論
最適反応戦略
最適反応戦略
相手の戦略に応じた最適の戦略
「戦略○○に対する最適反応戦略」という言い方をする
セレブの最適反応戦略
ファミモがA駅を選ぶと,セレブはB駅が最適反応戦略
67 首都大学東京講義 ゲーム理論
A駅 B駅
A駅
B駅
( 200, 400) ( 600, 300)
( 300, 600) ( 100, 200)
セレブ
ファミモ
最適反応戦略
最適反応戦略
相手の戦略に応じた最適の戦略
「戦略○○に対する最適反応戦略」という言い方をする
セレブの最適反応戦略
ファミモがA駅を選ぶと,セレブはB駅が最適反応戦略
ファミモがB駅を選ぶと,セレブはA駅が最適反応戦略
68 首都大学東京講義 ゲーム理論
A駅 B駅
A駅
B駅
( 200, 400) ( 600, 300)
( 300, 600) ( 100, 200)
セレブ
ファミモ
ポイント7
ゲーム理論では,最適反応戦略を考察する
相手のすべての戦略に対して,自分のどの
戦略が一番良いかを列挙することから始め
る
69 首都大学東京講義 ゲーム理論
最適反応戦略
セレブの最適反応戦略
ファミモがA駅を選ぶと,セレブはB駅が最適反応戦略
ファミモがB駅を選ぶと,セレブはA駅が最適反応戦略
70 首都大学東京講義 ゲーム理論
A駅 B駅
A駅
B駅
( 200, 400) ( 600, 300)
( 300, 600) ( 100, 200)
セレブ
ファミモ
ファミモの最適反応戦略
セレブがA駅を選ぶと,ファミモはA駅が最適反応戦略
セレブがB駅を選んでも,ファミモはA駅が最適反応戦略
A駅を選ぶことはファミモの支配戦略
ファミモは支配戦略である「A駅」を選択するはず
首都大学東京講義 ゲーム理論71
A駅 B駅
A駅
B駅
( 200, 400) ( 600, 300)
( 300, 600) ( 100, 200)
セレブ
ファミモ
セレブはファミモがA駅を選択するならば
→最適反応戦略のB駅を選択する
( 300, 600)
一方に支配戦略がある場合
一方のプレイヤーが支配戦略を選び,もう一方が,そ
の最適反応戦略を選ぶ戦略の組
今回のように,2人ゲームにおいて一方のプレイ
ヤーに支配戦略がある場合
ゲームの解
★支配戦略
すべての戦略に対し,同じ戦略が最適反応戦略
72 首都大学東京講義 ゲーム理論
ポイント8
一方のプレイヤーに支配戦略があれば,そ
のプレイヤーが支配戦略を選び,もう一方の
プレイヤーが,それに対する最適反応戦略を
選択することがゲームの解となる
相手がどう行動するか読め
自分の良い方向ばかりに考えては行けな
い
73 首都大学東京講義 ゲーム理論
ゲームの解を求めよ
U
D
L R
( 0, 5)
( 1, 4)
( 9, 4)
( -1, 2)
( 3, 1)
( 2, 9)
( 0, 2)
( -1, 3)
( -2, 0)
( -3, 8)
問題A
問題B
1
2
1
2
U
D
L M R
モデル7: 小国の交渉力
大国と小国,水質汚染の費用負担の交渉
妥協か強硬か
大国 : 交渉決裂よりは全額負担
小国 : 等分負担よりも決裂
75 首都大学東京講義 ゲーム理論
小国の交渉力 利得行列
強硬 妥協
強硬
妥協
大国
小国
大国の
全額負担
交渉決裂
大国の
80%負担
等分負担
利得が数字で入っていないが,考え方は同じ
76 首都大学東京講義 ゲーム理論
先取りポイント
ゲーム理論では利得の「数値」を正確
に求めなくても良い
プレイヤーが好む順番さえついていれ
ば,多くの場合に解を求めることがで
きる
ゲーム理論に「確率」を使わない場合
77 首都大学東京講義 ゲーム理論
利得の大小関係
強硬 妥協
強硬
妥協
大国
小国
大国の
全額負担
交渉決裂
大国の
80%負担
等分負担
大国の損得 小国の損得
78 首都大学東京講義 ゲーム理論
利得行列 大小関係
強硬 妥協
強硬
妥協
大国
小国
大国の
全額負担
交渉決裂
大国の
80%負担
等分負担
小国は「強硬」が支配戦略
小国の「強硬」に対する大国の最適反応戦略は「妥
協」
79 首都大学東京講義 ゲーム理論
各プレイヤーの好みの順に利得を入れる
強硬 妥協
強硬
妥協
( 1 , 2 ) ( 4 , 1 )
( 2 , 4 ) ( 3 , 3 )
大国
小国
( 1 , 2 ) ( 4 , 1 )
( 2 , 4 ) ( 3 , 3 )
小国は「強硬」が支配戦略
80 首都大学東京講義 ゲーム理論
各プレイヤーの好みの順に利得を入れる
強硬 妥協
強硬
妥協
( 1 , 2 ) ( 4 , 1 )
( 2 , 4 ) ( 3 , 3 )
大国
小国
小国は「強硬」が支配戦略
小国の「強硬」に対する大国の最適反応戦略は「妥協」
81 首都大学東京講義 ゲーム理論
モデル8: 合理的な豚
大きな豚と小さな豚が大きな檻に入れられている
一方の隅のボタンを押すと,もう一方の隅にエサが出て
くる(5単位)
エサは食べたい
レバーは押しに行きたくない(-1単位)
一緒にボタンに行くと,大きな豚がエサを総どり
餌場
ボタン
82 首都大学東京講義 ゲーム理論
合理的な豚 利得行列
ボタン 待つ
ボタン
待つ
( 4 , -1)
小豚
( 5 , -1)
( 2 , 2)
( 0 , 0)
大豚
83 首都大学東京講義 ゲーム理論
小豚は「待つ」が支配戦略
ボタン 待つ
ボタン
待つ
( 4 , -1)
小豚
( 5 , -1)
( 2 , 2)
( 0 , 0)
大豚
84 首都大学東京講義 ゲーム理論
子豚が待って,大豚がボタンを押す
ボタン 待つ
ボタン
待つ
( 4 , -1)
小豚
( 5 , -1)
( 2 , 2)
( 0 , 0)
大豚
小豚の「待つ」に対する大豚の最適反応戦
略は「ボタンを押す」
実際にそうなるらしい!
85 首都大学東京講義 ゲーム理論
小さいものがなぜ妥協しない?
大国・大豚は,自分が妥協してもまだ余裕がある
子豚・小国は妥協の余地がない
 妥協しないことが支配戦略
 応用⇒自分を妥協できなくして,交渉力を高め
る
 背水の陣
86 首都大学東京講義 ゲーム理論
ポイント9
自分を後に引けなくして交渉力を強めること
ができる
このときは,自分の気持ちを高めるだけでは
なく,相手にそれを知らせることが重要であ
る
87 首都大学東京講義 ゲーム理論
2.4 予想の先に行きつくもの
---ナッシュ均衡
88 首都大学東京講義 ゲーム理論
I市コンビニ戦争PART3 利得行列
A駅 B駅
A駅
B駅
( 200, 400) ( 600, 750)
( 750, 600) ( 250, 500)
セレブ
ファミモ
89 首都大学東京講義 ゲーム理論
セレブには支配戦略がない
A駅 B駅
A駅
B駅
( 200, 400) ( 600, 750)
( 750, 600) ( 250, 500)
セレブ
ファミモ
90 首都大学東京講義 ゲーム理論
ファミモにも支配戦略はない
A駅 B駅
A駅
B駅
( 200, 400) ( 600, 750)
( 750, 600) ( 250, 500)
セレブ
ファミモ
セレブ,ファミモ,共に
支配戦略がない!
91 首都大学東京講義 ゲーム理論
支配戦略がないとき
支配戦略がないときはどうするか
お互いが徹底的に手を読みあう
手を読みあった先に行きつくもの
 その状態から,自分だけでは,それ以
上利得を高くできない状態
均衡
ゲーム理論では,その概念を考えた研究者の
名前をとってナッシュ均衡と呼ぶ
92 首都大学東京講義 ゲーム理論
ナッシュ均衡
すべてのプレイヤーが最適反応戦略を取り合う戦略の
組をナッシュ均衡と呼ぶ
 言い換えると?
 戦略の組がナッシュ均衡であるとは
 どのプレイヤーも
 自分以外のプレイヤーが,そのナッシュ均衡
の戦略を選択しているもとでは
 自分だけが戦略を変えても利得が高くできな
い
93 首都大学東京講義 ゲーム理論
ナッシュ均衡
A駅 B駅
A駅
B駅
( 200, 400) ( 600, 750)
( 750, 600) ( 250, 500)
セレブ
ファミモ
セレブが「B駅」に出店し
ファミモが「A駅」に出店する
自分が戦略を変えても利得を高くすることができない予測
94 首都大学東京講義 ゲーム理論
もう1つのナッシュ均衡
A駅 B駅
A駅
B駅
( 200, 400) ( 600, 750)
( 750, 600) ( 250, 500)
セレブ
ファミモ
セレブが「A駅」に出店し
ファミモが「B駅」に出店する
自分が戦略を変えても利得を高くすることができない予測
これもやはりナッシュ均衡!
95 首都大学東京講義 ゲーム理論
ナッシュ均衡の求め方
各プレイヤーごとに考える
そのプレイヤー以外の戦略を1つずつ考える
それに対する最適反応戦略を考え,最適反応戦略の利得に下
線を引く
最適反応戦略が2つあるときは2つに下線を引く
すべてのプレイヤーについて上記の作業が終わったな
ら,全プレイヤーの利得に下線が引かれている戦略の
組がナッシュ均衡
96 首都大学東京講義 ゲーム理論
ナッシュ均衡を求める
x1
y1
x2
y2
( 3, 4)
( 2, 2)
( 0, 2)
( 1, 3)
z2
( 2, 0)
( 2, 9)
( x1 , x2 ) ( y1 , z2 )
 y2 に対する最適反応戦略は?
 y1 (利得の下に線を引く)
 z2 に対する最適反応戦略は?
 x1とy1 (2つあるので2つとも線を引く)
 次はプレイヤー2
 x1の最適反応戦略は?
 x2
 y1の最適反応戦略は?
 z2
両方の利得に下線が
引かれているのがナッ
シュ均衡
 プレイヤー1を考える
 x2 に対する最適反応戦略は?
 x1 (利得の下に線を引く)
1
2
97 首都大学東京講義 ゲーム理論
演習:ナッシュ均衡を求めよ
( 0, 2)
( 1, 4)
( 9, 4)
( -1, 2)
( 3, 1)
( 8, 1)
( 4, 2)
( -1, 1)
( 2, 0)
( -5, 0)
問題A
問題B
98 首都大学東京講義 ゲーム理論
U
D
L R1
2
1
2
U
D
L M R
演習:ナッシュ均衡を求めよ
( 5, 5)
( 1, 1)
( 1, 1)
( 2, 2)
問題C
ナッシュ均衡は「最適な戦略を取り合う」といい加減
に覚えてはいけない
⇒最適反応戦略の定義を考える
99 首都大学東京講義 ゲーム理論
U
D
L R1
2
なぜナッシュ均衡がゲームの解か?
ナッシュ均衡以外が解であると?
そのような理論・予測・予言のもとでは,人間は行動を変える
 機械や計算機は理論通りに動く,天体運動は理論が発表されても軌道
は変えない⇒しかし人間は?
 (例) 経済物理学――株の暴落する日を予言できるか?
 渋滞・帰省ラッシュの予測――アナウンス効果を考慮する
 じゃんけんの出しやすい手
ゲームの解をプレイヤーが知っても,それがゲームの
解であり続けるには,ナッシュ均衡でなければならない
必要条件
ナッシュ均衡の自己拘束性
しかし十分ではない-
-複数均衡の問題
100 首都大学東京講義 ゲーム理論
今までのゲームの解とナッシュ均衡
これまで学んだゲームの解
支配戦略均衡
2人ゲームで「一方が支配戦略があり,もう一方はその最適反
応戦略を選ぶ」
両方ともナッシュ均衡の特殊ケース
ゲームの解はナッシュ均衡だけでOK!
101 首都大学東京講義 ゲーム理論
今までの解はナッシュ均衡
協力する
( 4, 4 )
( 6,-10)
( -10, 6)
( 0, 0 )
協力しない
協力する
協力しない
ボタン
( 4 , -1 )
( 5 , -1 )
( 2 , 2 )
( 0 , 0 )
待つ
ボタン
待つ
囚人のジレンマ
合理的な豚
102 首都大学東京講義 ゲーム理論
ポイント10
ナッシュ均衡が,すべての戦略形ゲームの
解
103 首都大学東京講義 ゲーム理論
精巧堂 vs 便乗工房
人形A 人形B
人形A
人形B
( 120, 120) ( 216, 24)
( 192, 48) ( 96, 96)
精巧堂
便乗工房
混合戦略まで考えればすべてのn人ゲー
ムにナッシュ均衡は存在する
確率を用いた混合戦略の考え方が必要!⇒5章
J. F. Nash
(1951)
104 首都大学東京講義 ゲーム理論
ナッシュの生涯
ナッシュの業績
ナッシュ均衡を考えただけではなく,(次の章の混合戦略まで
含めれば),すべてのゲーム理論にナッシュ均衡が必ず存在
することを数学的に証明した
1994年にノーベル経済学賞
精神的な病に苦しむ半生
映画「ビューティフルマインド」
105 首都大学東京講義 ゲーム理論
2002年
アカデミー賞
受賞作品
ビューティフル
マインド
106 首都大学東京講義 ゲーム理論
John F. Nash
の実際の写真
小説「Beautiful Mind」
より
107 首都大学東京講義 ゲーム理論
私とナッシュ博士
2000年スペイン Bilbao
第1回ゲーム理論国際学会 Game2000
108 首都大学東京講義 ゲーム理論
109
再びナッシュ博士と写真を!
2010年,リスボンのヨーロッパOR学会
これ以上は
頑張れませ
んでした
3たびナッシュ博士と写真を!
2012年,イスタンブールのゲーム理論国際学会
110 首都大学東京講義 ゲーム理論
J.F.Nash
R.Selten
飯村先生 私

More Related Content

What's hot

ゼロから学ぶゲーム理論
ゼロから学ぶゲーム理論ゼロから学ぶゲーム理論
ゼロから学ぶゲーム理論
Yosuke YASUDA
 
[DL輪読会]Recent Advances in Autoencoder-Based Representation Learning
[DL輪読会]Recent Advances in Autoencoder-Based Representation Learning[DL輪読会]Recent Advances in Autoencoder-Based Representation Learning
[DL輪読会]Recent Advances in Autoencoder-Based Representation Learning
Deep Learning JP
 
DeepLearningTutorial
DeepLearningTutorialDeepLearningTutorial
DeepLearningTutorial
Takayoshi Yamashita
 
ポーカーAIの最新動向 20171031
ポーカーAIの最新動向 20171031ポーカーAIの最新動向 20171031
ポーカーAIの最新動向 20171031
Jun Okumura
 
Tech-Circle #18 Pythonではじめる強化学習 OpenAI Gym 体験ハンズオン
Tech-Circle #18 Pythonではじめる強化学習 OpenAI Gym 体験ハンズオンTech-Circle #18 Pythonではじめる強化学習 OpenAI Gym 体験ハンズオン
Tech-Circle #18 Pythonではじめる強化学習 OpenAI Gym 体験ハンズオン
Takahiro Kubo
 
パターン認識 第10章 決定木
パターン認識 第10章 決定木 パターン認識 第10章 決定木
パターン認識 第10章 決定木 Miyoshi Yuya
 
Black-Scholesの面白さ
Black-Scholesの面白さ Black-Scholesの面白さ
Black-Scholesの面白さ
Katsuya Ito
 
契約理論って何だろう?
契約理論って何だろう?契約理論って何だろう?
契約理論って何だろう?
Yosuke YASUDA
 
最近傍探索と直積量子化(Nearest neighbor search and Product Quantization)
最近傍探索と直積量子化(Nearest neighbor search and Product Quantization)最近傍探索と直積量子化(Nearest neighbor search and Product Quantization)
最近傍探索と直積量子化(Nearest neighbor search and Product Quantization)
Nguyen Tuan
 
金融予測アルゴリズムのより良い評価手法について
金融予測アルゴリズムのより良い評価手法について金融予測アルゴリズムのより良い評価手法について
金融予測アルゴリズムのより良い評価手法について
Kentaro Imajo
 
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
 
NUPSC招待講演:アルゴリズムで広がる世界
NUPSC招待講演:アルゴリズムで広がる世界NUPSC招待講演:アルゴリズムで広がる世界
NUPSC招待講演:アルゴリズムで広がる世界
Kentaro Imajo
 
強化学習その1
強化学習その1強化学習その1
強化学習その1
nishio
 
2SAT(充足可能性問題)の解き方
2SAT(充足可能性問題)の解き方2SAT(充足可能性問題)の解き方
2SAT(充足可能性問題)の解き方
Tsuneo Yoshioka
 
[DL輪読会]Bayesian Uncertainty Estimation for Batch Normalized Deep Networks
[DL輪読会]Bayesian Uncertainty Estimation for Batch Normalized Deep Networks[DL輪読会]Bayesian Uncertainty Estimation for Batch Normalized Deep Networks
[DL輪読会]Bayesian Uncertainty Estimation for Batch Normalized Deep Networks
Deep Learning JP
 
[DL輪読会]近年のオフライン強化学習のまとめ —Offline Reinforcement Learning: Tutorial, Review, an...
[DL輪読会]近年のオフライン強化学習のまとめ —Offline Reinforcement Learning: Tutorial, Review, an...[DL輪読会]近年のオフライン強化学習のまとめ —Offline Reinforcement Learning: Tutorial, Review, an...
[DL輪読会]近年のオフライン強化学習のまとめ —Offline Reinforcement Learning: Tutorial, Review, an...
Deep Learning JP
 
[DL輪読会]Deep Learning 第2章 線形代数
[DL輪読会]Deep Learning 第2章 線形代数[DL輪読会]Deep Learning 第2章 線形代数
[DL輪読会]Deep Learning 第2章 線形代数
Deep Learning JP
 
勾配降下法の 最適化アルゴリズム
勾配降下法の最適化アルゴリズム勾配降下法の最適化アルゴリズム
勾配降下法の 最適化アルゴリズム
nishio
 
DQNからRainbowまで 〜深層強化学習の最新動向〜
DQNからRainbowまで 〜深層強化学習の最新動向〜DQNからRainbowまで 〜深層強化学習の最新動向〜
DQNからRainbowまで 〜深層強化学習の最新動向〜
Jun Okumura
 
関数データ解析の概要とその方法
関数データ解析の概要とその方法関数データ解析の概要とその方法
関数データ解析の概要とその方法
Hidetoshi Matsui
 

What's hot (20)

ゼロから学ぶゲーム理論
ゼロから学ぶゲーム理論ゼロから学ぶゲーム理論
ゼロから学ぶゲーム理論
 
[DL輪読会]Recent Advances in Autoencoder-Based Representation Learning
[DL輪読会]Recent Advances in Autoencoder-Based Representation Learning[DL輪読会]Recent Advances in Autoencoder-Based Representation Learning
[DL輪読会]Recent Advances in Autoencoder-Based Representation Learning
 
DeepLearningTutorial
DeepLearningTutorialDeepLearningTutorial
DeepLearningTutorial
 
ポーカーAIの最新動向 20171031
ポーカーAIの最新動向 20171031ポーカーAIの最新動向 20171031
ポーカーAIの最新動向 20171031
 
Tech-Circle #18 Pythonではじめる強化学習 OpenAI Gym 体験ハンズオン
Tech-Circle #18 Pythonではじめる強化学習 OpenAI Gym 体験ハンズオンTech-Circle #18 Pythonではじめる強化学習 OpenAI Gym 体験ハンズオン
Tech-Circle #18 Pythonではじめる強化学習 OpenAI Gym 体験ハンズオン
 
パターン認識 第10章 決定木
パターン認識 第10章 決定木 パターン認識 第10章 決定木
パターン認識 第10章 決定木
 
Black-Scholesの面白さ
Black-Scholesの面白さ Black-Scholesの面白さ
Black-Scholesの面白さ
 
契約理論って何だろう?
契約理論って何だろう?契約理論って何だろう?
契約理論って何だろう?
 
最近傍探索と直積量子化(Nearest neighbor search and Product Quantization)
最近傍探索と直積量子化(Nearest neighbor search and Product Quantization)最近傍探索と直積量子化(Nearest neighbor search and Product Quantization)
最近傍探索と直積量子化(Nearest neighbor search and Product Quantization)
 
金融予測アルゴリズムのより良い評価手法について
金融予測アルゴリズムのより良い評価手法について金融予測アルゴリズムのより良い評価手法について
金融予測アルゴリズムのより良い評価手法について
 
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
 
NUPSC招待講演:アルゴリズムで広がる世界
NUPSC招待講演:アルゴリズムで広がる世界NUPSC招待講演:アルゴリズムで広がる世界
NUPSC招待講演:アルゴリズムで広がる世界
 
強化学習その1
強化学習その1強化学習その1
強化学習その1
 
2SAT(充足可能性問題)の解き方
2SAT(充足可能性問題)の解き方2SAT(充足可能性問題)の解き方
2SAT(充足可能性問題)の解き方
 
[DL輪読会]Bayesian Uncertainty Estimation for Batch Normalized Deep Networks
[DL輪読会]Bayesian Uncertainty Estimation for Batch Normalized Deep Networks[DL輪読会]Bayesian Uncertainty Estimation for Batch Normalized Deep Networks
[DL輪読会]Bayesian Uncertainty Estimation for Batch Normalized Deep Networks
 
[DL輪読会]近年のオフライン強化学習のまとめ —Offline Reinforcement Learning: Tutorial, Review, an...
[DL輪読会]近年のオフライン強化学習のまとめ —Offline Reinforcement Learning: Tutorial, Review, an...[DL輪読会]近年のオフライン強化学習のまとめ —Offline Reinforcement Learning: Tutorial, Review, an...
[DL輪読会]近年のオフライン強化学習のまとめ —Offline Reinforcement Learning: Tutorial, Review, an...
 
[DL輪読会]Deep Learning 第2章 線形代数
[DL輪読会]Deep Learning 第2章 線形代数[DL輪読会]Deep Learning 第2章 線形代数
[DL輪読会]Deep Learning 第2章 線形代数
 
勾配降下法の 最適化アルゴリズム
勾配降下法の最適化アルゴリズム勾配降下法の最適化アルゴリズム
勾配降下法の 最適化アルゴリズム
 
DQNからRainbowまで 〜深層強化学習の最新動向〜
DQNからRainbowまで 〜深層強化学習の最新動向〜DQNからRainbowまで 〜深層強化学習の最新動向〜
DQNからRainbowまで 〜深層強化学習の最新動向〜
 
関数データ解析の概要とその方法
関数データ解析の概要とその方法関数データ解析の概要とその方法
関数データ解析の概要とその方法
 

Viewers also liked

ゲーム理論スライド01章
ゲーム理論スライド01章ゲーム理論スライド01章
ゲーム理論スライド01章
fumiwo
 
マインドマップのつくりかたforセミナー
マインドマップのつくりかたforセミナーマインドマップのつくりかたforセミナー
マインドマップのつくりかたforセミナー
Yoshikazu Asada
 
良い?悪い?コードコメントの書き方
良い?悪い?コードコメントの書き方良い?悪い?コードコメントの書き方
良い?悪い?コードコメントの書き方
Shigenori Sagawa
 
Developers Summit 2014 【13-D-7】 コミュニティLT - Story 5. 「新人技術者にどうプログラミングを教えたか」
Developers Summit 2014 【13-D-7】 コミュニティLT - Story 5. 「新人技術者にどうプログラミングを教えたか」Developers Summit 2014 【13-D-7】 コミュニティLT - Story 5. 「新人技術者にどうプログラミングを教えたか」
Developers Summit 2014 【13-D-7】 コミュニティLT - Story 5. 「新人技術者にどうプログラミングを教えたか」
Fujio Kojima
 
Eurostat consommation d'énergie
Eurostat consommation d'énergieEurostat consommation d'énergie
Eurostat consommation d'énergie
Société Tripalio
 
Insee prix à la consommation-janvier 2017
Insee prix  à la consommation-janvier 2017Insee prix  à la consommation-janvier 2017
Insee prix à la consommation-janvier 2017
Société Tripalio
 
Eurostat secteur de la construction-baisse
Eurostat secteur de la construction-baisseEurostat secteur de la construction-baisse
Eurostat secteur de la construction-baisse
Société Tripalio
 
Communiqué FEC FO 05 action du 7 mars
Communiqué FEC FO 05 action du 7 marsCommuniqué FEC FO 05 action du 7 mars
Communiqué FEC FO 05 action du 7 mars
Société Tripalio
 
Insee prix du pétrole
Insee prix du pétroleInsee prix du pétrole
Insee prix du pétrole
Société Tripalio
 
Eurostat excédent des échanges courants
Eurostat excédent des échanges courantsEurostat excédent des échanges courants
Eurostat excédent des échanges courants
Société Tripalio
 
Insee prix des produits de grande consommation
Insee prix des produits de grande consommationInsee prix des produits de grande consommation
Insee prix des produits de grande consommation
Société Tripalio
 
Accord sur le travail du dimanche soirée : Vallée Village
Accord sur le travail du dimanche soirée : Vallée VillageAccord sur le travail du dimanche soirée : Vallée Village
Accord sur le travail du dimanche soirée : Vallée Village
Société Tripalio
 
Dares universal credit
Dares universal creditDares universal credit
Dares universal credit
Société Tripalio
 

Viewers also liked (13)

ゲーム理論スライド01章
ゲーム理論スライド01章ゲーム理論スライド01章
ゲーム理論スライド01章
 
マインドマップのつくりかたforセミナー
マインドマップのつくりかたforセミナーマインドマップのつくりかたforセミナー
マインドマップのつくりかたforセミナー
 
良い?悪い?コードコメントの書き方
良い?悪い?コードコメントの書き方良い?悪い?コードコメントの書き方
良い?悪い?コードコメントの書き方
 
Developers Summit 2014 【13-D-7】 コミュニティLT - Story 5. 「新人技術者にどうプログラミングを教えたか」
Developers Summit 2014 【13-D-7】 コミュニティLT - Story 5. 「新人技術者にどうプログラミングを教えたか」Developers Summit 2014 【13-D-7】 コミュニティLT - Story 5. 「新人技術者にどうプログラミングを教えたか」
Developers Summit 2014 【13-D-7】 コミュニティLT - Story 5. 「新人技術者にどうプログラミングを教えたか」
 
Eurostat consommation d'énergie
Eurostat consommation d'énergieEurostat consommation d'énergie
Eurostat consommation d'énergie
 
Insee prix à la consommation-janvier 2017
Insee prix  à la consommation-janvier 2017Insee prix  à la consommation-janvier 2017
Insee prix à la consommation-janvier 2017
 
Eurostat secteur de la construction-baisse
Eurostat secteur de la construction-baisseEurostat secteur de la construction-baisse
Eurostat secteur de la construction-baisse
 
Communiqué FEC FO 05 action du 7 mars
Communiqué FEC FO 05 action du 7 marsCommuniqué FEC FO 05 action du 7 mars
Communiqué FEC FO 05 action du 7 mars
 
Insee prix du pétrole
Insee prix du pétroleInsee prix du pétrole
Insee prix du pétrole
 
Eurostat excédent des échanges courants
Eurostat excédent des échanges courantsEurostat excédent des échanges courants
Eurostat excédent des échanges courants
 
Insee prix des produits de grande consommation
Insee prix des produits de grande consommationInsee prix des produits de grande consommation
Insee prix des produits de grande consommation
 
Accord sur le travail du dimanche soirée : Vallée Village
Accord sur le travail du dimanche soirée : Vallée VillageAccord sur le travail du dimanche soirée : Vallée Village
Accord sur le travail du dimanche soirée : Vallée Village
 
Dares universal credit
Dares universal creditDares universal credit
Dares universal credit
 

ゲーム理論スライド02章