6. モデル化
N
B
1
3
A
A
(V − t, t + a)
B
Aの利得 Bの利得
チョコレートを贈る
チョコレートを贈らない
2
3
好意をもつ
好意をもたない
(0, 0)
(0, 0)
チョコレートを贈る
チョコレートを贈らない
(−t, t)
(−t − H, t − a)
(−t, t)
気持ちを伝える
気持ちを伝えない
気持ちを伝えない
気持ちを伝える
7. モデル化
N
S
1
3
A
A
(V − t, t + a)
S
Aの利得 Bの利得
贈る
贈らない
2
3
好意をもつ
好意をもたない
(0, 0)
(0, 0)
(−t, t)
(−t − H, t − a)
(−t, t)
伝える
伝えない
伝えない
伝える
贈る
贈らない
B
B
8. モデル化
N
S
1
3
A
A
(V − t, t + a)
S
Aの利得 Bの利得
贈る
贈らない
2
3
好意をもつ
好意をもたない
(0, 0)
(0, 0)
(−t, t)
(−t − H, t − a)
(−t, t)
伝える
伝えない
伝えない
伝える
贈る
贈らない
:両思いだった嬉しい
V
:チョコレートコスト
t
:正の実数
V, H, a, t
V − t > 0
B
B
9. モデル化
N
S
1
3
A
A
(V − t, t + a)
S
Aの利得 Bの利得
贈る
贈らない
2
3
好意をもつ
好意をもたない
(0, 0)
(0, 0)
(−t, t)
(−t − H, t − a)
(−t, t)
伝える
伝えない
伝えない
伝える
贈る
贈らない
:両思いだった嬉しい
a
:チョコレート
t
B
B
:正の実数
V, H, a, t
V − t > 0
10. モデル化
N
S
1
3
A
A
(V − t, t + a)
S
Aの利得 Bの利得
贈る
贈らない
2
3
好意をもつ
好意をもたない
(0, 0)
(0, 0)
(−t, t)
(−t − H, t − a)
(−t, t)
伝える
伝えない
伝えない
伝える
贈る
贈らない
:両思いじゃなかった悲しい
−a
:嬉しくない
H
B
B
:正の実数
V, H, a, t
V − t > 0
11. モデル化
N
S
1
3
A
A
(V − t, t + a)
S
Aの利得 Bの利得
贈る
贈らない
2
3
好意をもつ
好意をもたない
(0, 0)
(0, 0)
(−t, t)
(−t − H, t − a)
(−t, t)
伝える
伝えない
伝えない
伝える
贈る
贈らない
B
B
:正の実数
V, H, a, t
V − t > 0
12. 完全ベイジアン均衡
完全ベイジアン均衡 : 戦略の組 と信念の体系 の組 で,
が のもとで逐次合理的であり, が に整合的であるものを(弱)完全ベイジアン均衡という.
行動戦略の逐次合理性 : 展開形ゲーム において, 信念の体系 が与えられているとする.
このとき, 戦略の組 が, プレイヤー の情報集合 において以下を満たすとき,
は信念の体系 のもとで情報集合 において逐次合理的であるという.
信念の体系と整合性 : 展開形ゲーム において, 戦略の組 が与えられているとする.
このとき, 信念の体系 が, 任意のプレイヤー の任意の情報集合 において
であれば, すべての の点 について
となるとき, は戦略の組 において整合的であるという.
b μ (b, μ)
b μ μ b
Γ μ
b = (b1
, ⋯, bn
) i ui
l
b μ ui
l
Hi
(ui
l, μ, (bi,ui
l, b−i,ui
l)) ≥ Hi
(ui
l, μ, (b′

i,ui
l, b−i,ui
l)), ∀b′

i,ui
l ∈ Bi,ui
l
Γ b = (b1
, ⋯, bn
)
μ i ui
l
Prob(ui
l |b) > 0 ui
l x*
μ(x*) =
Prob(x*|b)
∑x∈ui
l
Prob(x|b)
μ b
行動戦略によって到達可能な
経路における合理性のみ考える
行動の最適性
行動と信念の整合性
13. 完全ベイジアン均衡
N
S
1
3
A
A
(V − t, t + a)
S
Aの利得 Bの利得
贈る
贈らない
2
3
好意をもつ
好意をもたない
(0, 0)
(0, 0)
(−t, t)
(−t − H, t − a)
(−t, t)
伝える
伝えない
伝えない
伝える
贈る
贈らない
Bの利得最適行動を考える.
Bの情報集合における信念を とおく.
は確率分布であるから, .
「伝える」場合の期待利得は
「伝えない」場合の期待利得は
「伝える」が最適になるのは,
「伝えない」が最適になるのは,
μ
μ 0 ≤ μ ≤ 1
μ(t + a) + (1 − μ)(t − a) = t + 2μa − a
μt + (1 − μ)t = t
t + 2μa − a ≥ t ⇔ μ ≥
1
2
t + 2μa − a < t ⇔ μ <
1
2
B
B
μ
1 − μ
:正の実数
V, H, a, t
V − t > 0
14. 完全ベイジアン均衡
N
S
1
3
A
A
(V − t, t + a)
S
Aの利得 Bの利得
贈る
贈らない
2
3
好意をもつ
好意をもたない
(0, 0)
(0, 0)
(−t, t)
(−t − H, t − a)
(−t, t)
伝える
伝えない
伝えない
伝える
贈る
贈らない
Aの行動と信念の整合性を考える.
Aの行動(純戦略)としては,
(好意をもつAの行動-好意をもたないAの行動)として
(贈らない-贈らない)
(贈らない-贈る)
(贈る-贈らない)
(贈る-贈る)
の4通りある.
B
B
μ
1 − μ
:正の実数
V, H, a, t
V − t > 0
15. 完全ベイジアン均衡
N
S
1
3
A
A
(V − t, t + a)
S
Aの利得 Bの利得
贈る
贈らない
2
3
好意をもつ
好意をもたない
(0, 0)
(0, 0)
(−t, t)
(−t − H, t − a)
(−t, t)
伝える
伝えない
伝えない
伝える
贈る
贈らない
Aの行動と信念の整合性を考える.
(贈らない-贈らない)の場合,
任意の信念で整合的.
Bの行動として,
「伝える」が最適になるのは,
で整合的になるが,
Bが「伝える」を選ぶのであれば,
好意をもつAは「贈らない」より「贈る」を
選ぶことが最適となる.
ゆえに,
((贈らない-贈らない), 伝える)となる
完全ベイジアン均衡は存在しない.
μ ≥
1
2
B
B
μ
1 − μ
:正の実数
V, H, a, t
V − t > 0
16. 完全ベイジアン均衡
N
S
1
3
A
A
(V − t, t + a)
S
Aの利得 Bの利得
贈る
贈らない
2
3
好意をもつ
好意をもたない
(0, 0)
(0, 0)
(−t, t)
(−t − H, t − a)
(−t, t)
伝える
伝えない
伝えない
伝える
贈る
贈らない
Aの行動と信念の整合性を考える.
(贈らない-贈らない)の場合,
任意の信念で整合的.
Bの行動として,
「伝えない」が最適になるのは,
で整合的になるが,
Bが「伝えない」を選ぶのであれば,
どちらのタイプのAも「贈らない」を選択す
るのが最適.
ゆえに,
((贈らない-贈らない), 伝えない, )
は完全ベイジアン均衡である.
μ <
1
2
0 ≤ μ <
1
2
B
B
μ
1 − μ
:正の実数
V, H, a, t
V − t > 0
17. 完全ベイジアン均衡
N
S
1
3
A
A
(V − t, t + a)
S
Aの利得 Bの利得
贈る
贈らない
2
3
好意をもつ
好意をもたない
(0, 0)
(0, 0)
(−t, t)
(−t − H, t − a)
(−t, t)
伝える
伝えない
伝えない
伝える
贈る
贈らない
Aの行動と信念の整合性を考える.
(贈らない-贈る)の場合,
信念 が整合的.
Bの行動として, のため,
「伝えない」が最適になる.
Bが「伝えない」を選ぶのであれば,
好意をもたないAは「贈る」より「送らな
い」を選ぶことが最適となる.
ゆえに,
((贈らない-贈る), 伝えない)となる
完全ベイジアン均衡は存在しない.
μ =
0
2
3
= 0
μ <
1
2
B
B
0
1
:正の実数
V, H, a, t
V − t > 0
18. 完全ベイジアン均衡
N
S
1
3
A
A
(V − t, t + a)
S
Aの利得 Bの利得
贈る
贈らない
2
3
好意をもつ
好意をもたない
(0, 0)
(0, 0)
(−t, t)
(−t − H, t − a)
(−t, t)
伝える
伝えない
伝えない
伝える
贈る
贈らない
Aの行動と信念の整合性を考える.
(贈る-贈らない)の場合,
信念 が整合的.
Bの行動として, のため,
「伝える」が最適になる.
Bが「伝える」を選ぶのであれば,
どちらのタイプのAも行動を変えるインセン
ティブはない.
ゆえに,
((贈る-贈らない), 伝える, )
は完全ベイジアン均衡である.
μ =
1
3
1
3
= 1
μ ≥
1
2
μ = 1
B
B
0
1
:正の実数
V, H, a, t
V − t > 0
19. 完全ベイジアン均衡
N
S
1
3
A
A
(V − t, t + a)
S
Aの利得 Bの利得
贈る
贈らない
2
3
好意をもつ
好意をもたない
(0, 0)
(0, 0)
(−t, t)
(−t − H, t − a)
(−t, t)
伝える
伝えない
伝えない
伝える
贈る
贈らない
Aの行動と信念の整合性を考える.
(贈る-贈る)の場合,
信念 が整合的.
Bの行動として, のため,
「伝えない」が最適になる.
Bが「伝えない」を選ぶのであれば,
どちらのタイプのAも「贈る」より「贈らな
い」を選ぶことが最適となる.
ゆえに,
((贈る-贈る), 伝えない, )
は完全ベイジアン均衡はない.
μ =
1
3
1
3
+
2
3
=
1
3
μ <
1
2
μ =
1
3
B
B
2
3
1
3
:正の実数
V, H, a, t
V − t > 0
20. 完全ベイジアン均衡
N
S
1
3
A
A
(V − t, t + a)
S
Aの利得 Bの利得
贈る
贈らない
2
3
好意をもつ
好意をもたない
(0, 0)
(0, 0)
(−t, t)
(−t − H, t − a)
(−t, t)
伝える
伝えない
伝えない
伝える
贈る
贈らない
完全ベイジアン均衡は(純戦略の範囲で)
以下の二つのパターンがある:
((贈らない-贈らない), 伝えない, )
((贈る-贈らない), 伝える, )
とくに, 後者のパターンから,
好意をもつAだけが贈ることになるので,
チョコレートを贈る行為が
自身の好意を伝えるシグナルとして機能して
いる.
0 ≤ μ <
1
2
μ = 1
B
B
0
1
:正の実数
V, H, a, t
V − t > 0
21. 注意点
N
S
1
3
A
A
(V − t, t + a)
S
Aの利得 Bの利得
贈る
贈らない
2
3
好意をもつ
好意をもたない
(0, 0)
(0, 0)
(−t, t)
(−t − H, t − a)
(−t, t)
伝える
伝えない
伝えない
伝える
贈る
贈らない
B
B
2
3
1
3
:正の実数
V, H, a, t
V − t > 0
(1) あくまで, 今回のモデル設定において, チョコレートシグナリングがうまく機能することがわかるだけで,
客観的な分布(事前確率)や利得が異なれば別の均衡が存在しうることに注意されたい.
(2) 今回, 好意がある(1), なし(0)だけで考えていたが,
贈るものの「質」を考慮して, どれくらいの好意をもっているかを分析したり,
受け取り側も好意を考慮してみるなど, 様々なバリエーションが考えられる.