ゲーム理論BASIC 演習69 -3人ゲームの混合戦略ナッシュ均衡-

ゲーム理論 BASIC 演習69
3人ゲームの混合戦略ナッシュ均衡

1. 混合戦略ナッシュ均衡の定義
2. 有用な定理
3. 3人ゲームのナッシュ均衡

混合戦略ナッシュ均衡
プレイヤー以外の混合戦略をとし固定する
を満たすときはに対する最適反応戦略という
戦略の組が混合戦略ナッシュ均衡であるとは,
すべてのプレイヤーに対して
を満たすときをいう
ゲーム理論BASIC第8回参照
i p−i
∈ P−i
Fi
(p*i
, p−i
) ≥ Fi
(pi
, p−i
), ∀pi
∈ Pi
p*i
p−i
(p*1
, ⋯, p*n
) ∈ P
Fi
(p*i
, p*−i
) ≥ Fi
(pi
, p*−i
), ∀pi
∈ Pi

混合戦略に関する定理
定理
混合拡大したゲームにおいて, 2つ以上の純戦略に対し,正の確率を与える混合戦略が,
他のプレイヤーの戦略の組に対して最適反応とする.
このときその正の確率で用いられる純戦略も他のプレイヤーの戦略の組に対する最適反応となる.
ゲーム理論BASIC演習第8回参照
(N, {Pi
}i∈N, {Fi
}i∈N) pi
p−i
p−i

以下のゲームにおける混合戦略ナッシュ均衡を求めよ
3人ゲームのナッシュ均衡
3が純戦略c1
1＼2 b1 b2
a1 0, 1, 1 0, 0, 0
a2 2, 2, 2 1, 1, 3
3が純戦略c2
1＼2 b1 b2
a1 0, 0, 0 1, 1, 1
a2 1, 0, 1 0, 1, 0

純戦略の範囲では, , がナッシュ均衡.
(補足)プレイヤー3の最適反応の考え方
プレイヤー1, ２の戦略を固定して, を選んだ場合の利得1とを選んだ場合の利得0を比較.
同様にを固定した上で考えれば良い.
(a2, b1, c1) (a1, b2, c2)
(a1, b1) c1 c2
(a1, b2), (a2, b1), (a2, b2)
3が純戦略c1
1＼2 b1 b2
a1 0, 1, 1 0, 0, 0
a2 2, 2, 2 1, 1, 3
3が純戦略c2
1＼2 b1 b2
a1 0, 0, 0 1, 1, 1
a2 1, 0, 1 0, 1, 0
3が純戦略c1:
1＼2 b1 b2
a1 0, 1, 1 0, 0, 0
a2 2, 2, 2 1, 1, 3
3が純戦略c2:
1＼2 b1 b2
a1 0, 0, 0 1, 1, 1
a2 1, 0, 1 0, 1, 0

各プレイヤーの混合戦略を , , とする.
ただし, .
(1)すべてのプレイヤーが正の確率で混合戦略を使うとし, 定理を利用する.
(2)1人のプレイヤーが純戦略を用いるとして, 残りのプレイヤーの最適反応を考える.
p1
= (p,1 − p) p2
= (q,1 − q) p3
= (r,1 − r)
p, q, r ∈ [0,1]
3が純戦略c1
1＼2 b1 b2
a1 0, 1, 1 0, 0, 0
a2 2, 2, 2 1, 1, 3
3が純戦略c2
1＼2 b1 b2
a1 0, 0, 0 1, 1, 1
a2 1, 0, 1 0, 1, 0
p
1 − p
q 1 − q
p
1 − p
q 1 − q
r 1 − r

(1)すべてのプレイヤーがすべての選択肢に対し正の確率を与える混合戦略を使うとし, 定理を利用する.
定理より各プレイヤーの正の確率で使われる純戦略も同じ期待利得を与えるので, 以下の3式が同時に成り立つ：
・・・(1)
・・・(2)
・・・(3)
(2)と(1)より, となり, と矛盾するため,
すべてのプレイヤーがすべての選択肢に対し正の確率を与える混合戦略を含むようなナッシュ均衡は存在しない.
p, q, r ∈ (0,1)
1 ⋅ (1 − q)(1 − r) = 2 ⋅ qr + 1 ⋅ (1 − q)r + 1 ⋅ q(1 − r) ⇔ 1 − 2r − 2q + rq = 0
1 ⋅ pr + 2 ⋅ (1 − p)r = 1 ⋅ (1 − p)r + 1 ⋅ p(1 − r) + 1 ⋅ (1 − p)(1 − r) ⇔ r =
1
2
1 ⋅ pq + 2 ⋅ (1 − p)q + 3 ⋅ (1 − p)(1 − q) = 1 ⋅ (1 − p)q + 1 ⋅ p(1 − q) ⇔ 4pq − 2q − 4p + 3 = 0
q = 0 q ∈ (0,1)
3が純戦略c1
1＼2 b1 b2
a1 0, 1, 1 0, 0, 0
a2 2, 2, 2 1, 1, 3
3が純戦略c2
1＼2 b1 b2
a1 0, 0, 0 1, 1, 1
a2 1, 0, 1 0, 1, 0
p
1 − p
q 1 − q
p
1 − p
q 1 − q
r 1 − r
を取ったときの利得
a1 を取ったときの利得
a2
b1 を取ったときの利得
b2
c1 を取ったときの利得
c2

プレイヤー1が , すなわちを選ぶことが最適な場合,
プレイヤー2の期待利得：
右図より,
の場合がナッシュ均衡
a1 p = 1
1 ⋅ (1 − q)(1 − r) ≥ 2 ⋅ qr + 1 ⋅ (1 − q)r + 1 ⋅ q(1 − r) ⇔ 1 − 2r − 2q + rq ≥ 0 ⇔ r ≤
1 − 2q
2 − q
qr + (1 − q)(1 − r) = 1 − q − r + 2qr = (2r − 1)q + 1 − r
qr + (1 − q)(1 − r) = 1 − q − r + 2qr = (2q − 1)r + 1 − q
((p,1 − p), (q,1 − q), (r,1 − r)) = ((1,0), (0,1), (0,1))
3が純戦略c1
1＼2 b1 b2
a1 0, 1, 1 0, 0, 0
a2 2, 2, 2 1, 1, 3
3が純戦略c2
1＼2 b1 b2
a1 0, 0, 0 1, 1, 1
a2 1, 0, 1 0, 1, 0
1
0
q 1 − q
1
0
q 1 − q
r 1 − r
q
r
0
1
1
1
2
1
2
プレイヤー2の最適反応
プレイヤー1の
が最適反応
p = 1

プレイヤー1が , すなわちを選ぶことが最適な場合,
右図より,
a2 p = 0
1 ⋅ (1 − q)(1 − r) ≤ 2 ⋅ qr + 1 ⋅ (1 − q)r + 1 ⋅ q(1 − r) ⇔ 1 − 2r − 2q + rq ≤ 0 ⇔ r ≥
1 − 2q
2 − q
2qr + (1 − q)r + (1 − q)(1 − r) = (2r − 1)q + 1
2qr + 3(1 − q)r + q(1 − r) = (3 − 2q)r + q
((p,1 − p), (q,1 − q), (r,1 − r)) = ((0,1), (1,0), (1,0))
3が純戦略c1
1＼2 b1 b2
a1 0, 1, 1 0, 0, 0
a2 2, 2, 2 1, 1, 3
3が純戦略c2
1＼2 b1 b2
a1 0, 0, 0 1, 1, 1
a2 1, 0, 1 0, 1, 0
0
1
q 1 − q
0
1
q 1 − q
r 1 − r
q
r
0
1
1
1
2
1
2
プレイヤー1の
が最適反応
p = 0

プレイヤー2がを選ぶ場合, すなわちを選ぶ場合,
右図より,
b1 q = 1
1 ⋅ pr + 2 ⋅ (1 − p)r ≥ 1 ⋅ (1 − p)r + 1 ⋅ p(1 − r) + 1 ⋅ (1 − p)(1 − r) ⇔ r ≥
1
2
2(1 − p)r + (1 − p)(1 − r) = (−r − 1)p + r + 1
pr + 2(1 − p)r + (1 − p)(1 − r) = r − p + 1
((p,1 − p), (q,1 − q), (r,1 − r)) = ((0,1), (1,0), (1,0))
3が純戦略c1
1＼2 b1 b2
a1 0, 1, 1 0, 0, 0
a2 2, 2, 2 1, 1, 3
3が純戦略c2
1＼2 b1 b2
a1 0, 0, 0 1, 1, 1
a2 1, 0, 1 0, 1, 0
p
1 − p
1 0 1 0
r 1 − r
p
r
0
1
1
p
1 − p
1
2
プレイヤー2の
が最適反応
q = 1

右図より,
b2 q = 0
1 ⋅ pr + 2 ⋅ (1 − p)r ≤ 1 ⋅ (1 − p)r + 1 ⋅ p(1 − r) + 1 ⋅ (1 − p)(1 − r) ⇔ r ≤
1
2
(1 − p)r + p(1 − r) = (1 − 2r)p + r
3(1 − p)r + p(1 − r) = (3 − 4p)r + p
((p,1 − p), (q,1 − q), (r,1 − r)) = ((1,0), (0,1), (0,1))
((p,1 − p), (q,1 − q), (r,1 − r)) =
((
3
4
,
1
4)
, (0, 1),
(
1
2
,
1
2))
3が純戦略c1
1＼2 b1 b2
a1 0, 1, 1 0, 0, 0
a2 2, 2, 2 1, 1, 3
3が純戦略c2
1＼2 b1 b2
a1 0, 0, 0 1, 1, 1
a2 1, 0, 1 0, 1, 0
p
1 − p
0 1 0 1
r 1 − r
p
r
0
1
1
p
1 − p
1
2
3
4
プレイヤー2の
が最適反応
q = 0

右図より,
c1 r = 1
1 ⋅ pq + 2 ⋅ (1 − p)q + 3 ⋅ (1 − p)(1 − q) ≥ 1 ⋅ (1 − p)q + 1 ⋅ p(1 − q) ⇔ 4pq − 2q − 4p + 3 ≥ 0
2(1 − p)q + (1 − p)(1 − q) = (−q − 1)p + q + 1
pq + 2(1 − p)q + (1 − p)(1 − q) = q − p + 1
((p,1 − p), (q,1 − q), (r,1 − r)) = ((0,1), (1,0), (1,0))
3が純戦略c1
1＼2 b1 b2
a1 0, 1, 1 0, 0, 0
a2 2, 2, 2 1, 1, 3
3が純戦略c2
1＼2 b1 b2
a1 0, 0, 0 1, 1, 1
a2 1, 0, 1 0, 1, 0
p
1 − p
1 0
p
q
0
1
1
p
1 − p
q 1 − q q 1 − q
3
2
1
2
プレイヤー3の
が最適反応
r = 1

右図より,
c2 r = 0
1 ⋅ pq + 2 ⋅ (1 − p)q + 3 ⋅ (1 − p)(1 − q) ≤ 1 ⋅ (1 − p)q + 1 ⋅ p(1 − q) ⇔ 4pq − 2q − 4p + 3 ≤ 0
(1 − p)q + p(1 − q) = (1 − 2q)p + q
p(1 − q) + (1 − p)(1 − q) = 1 − q
((p,1 − p), (q,1 − q), (r,1 − r)) = ((1,0), (0,1), (0,1))
3が純戦略c1
1＼2 b1 b2
a1 0, 1, 1 0, 0, 0
a2 2, 2, 2 1, 1, 3
3が純戦略c2
1＼2 b1 b2
a1 0, 0, 0 1, 1, 1
a2 1, 0, 1 0, 1, 0
p
1 − p
1
0
p
q
0
1
1
p
1 − p
q 1 − q q 1 − q
3
2
プレイヤー3の
が最適反応
r = 0
1
2

以上より, ナッシュ均衡は３つ：
,
((p,1 − p), (q,1 − q), (r,1 − r)) = ((0,1), (1,0), (1,0)), ((1,0), (0,1), (0,1))
((
3
4
,
1
4)
, (0, 1),
(
1
2
,
1
2))
3が純戦略c1
1＼2 b1 b2
a1 0, 1, 1 0, 0, 0
a2 2, 2, 2 1, 1, 3
3が純戦略c2
1＼2 b1 b2
a1 0, 0, 0 1, 1, 1
a2 1, 0, 1 0, 1, 0
p
1 − p
p
1 − p
q 1 − q q 1 − q
r 1 − r
(a2, b1, c1) (a1, b2, c2)

ゲーム理論BASIC 演習69 -3人ゲームの混合戦略ナッシュ均衡-

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

More from ssusere0a682

More from ssusere0a682 (20)

ゲーム理論BASIC 演習69 -3人ゲームの混合戦略ナッシュ均衡-