Submit Search
Upload
ゲーム理論BASIC 演習69 -3人ゲームの混合戦略ナッシュ均衡-
•
0 likes
•
557 views
ssusere0a682
Follow
3人ゲームの混合戦略ナッシュ均衡
Read less
Read more
Education
Report
Share
Report
Share
1 of 16
Download now
Download to read offline
Recommended
「ガロア表現」を使って素数の分解法則を考える #mathmoring
「ガロア表現」を使って素数の分解法則を考える #mathmoring
Junpei Tsuji
合同数問題と保型形式
合同数問題と保型形式
Junpei Tsuji
素数の分解法則(フロベニウスやばい) #math_cafe
素数の分解法則(フロベニウスやばい) #math_cafe
Junpei Tsuji
線形代数の視覚的理解のためのノート
線形代数の視覚的理解のためのノート
Kenji Hiranabe
x^2 + ny^2 の形で表せる素数 - めざせプライムマスター!
x^2 + ny^2 の形で表せる素数 - めざせプライムマスター!
Junpei Tsuji
強化学習入門
強化学習入門
Shunta Saito
Kabsch Fit on PyMOL
Kabsch Fit on PyMOL
Masahito Ohue
x^2+ny^2の形で表せる素数の法則と類体論
x^2+ny^2の形で表せる素数の法則と類体論
Junpei Tsuji
Recommended
「ガロア表現」を使って素数の分解法則を考える #mathmoring
「ガロア表現」を使って素数の分解法則を考える #mathmoring
Junpei Tsuji
合同数問題と保型形式
合同数問題と保型形式
Junpei Tsuji
素数の分解法則(フロベニウスやばい) #math_cafe
素数の分解法則(フロベニウスやばい) #math_cafe
Junpei Tsuji
線形代数の視覚的理解のためのノート
線形代数の視覚的理解のためのノート
Kenji Hiranabe
x^2 + ny^2 の形で表せる素数 - めざせプライムマスター!
x^2 + ny^2 の形で表せる素数 - めざせプライムマスター!
Junpei Tsuji
強化学習入門
強化学習入門
Shunta Saito
Kabsch Fit on PyMOL
Kabsch Fit on PyMOL
Masahito Ohue
x^2+ny^2の形で表せる素数の法則と類体論
x^2+ny^2の形で表せる素数の法則と類体論
Junpei Tsuji
Integral
Integral
Eko Supriyadi
二次形式と素数で遊ぼう - 第2回 #日曜数学会
二次形式と素数で遊ぼう - 第2回 #日曜数学会
Junpei Tsuji
「日本語LaTeX」が多すぎる件について
「日本語LaTeX」が多すぎる件について
Takayuki Yato
ggplot2をつかってみよう
ggplot2をつかってみよう
Hiroki Itô
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
Masashi Komori
射頻電子 - [第三章] 史密斯圖與阻抗匹配
射頻電子 - [第三章] 史密斯圖與阻抗匹配
Simen Li
Chap nombres complexes
Chap nombres complexes
Karim Amane
Quantum Mechanics A Paradigms Approach 1st Edition McIntyre Solutions Manual
Quantum Mechanics A Paradigms Approach 1st Edition McIntyre Solutions Manual
Andersonasaa
Prml
Prml
syou6162
データ解析6 重回帰分析
データ解析6 重回帰分析
Hirotaka Hachiya
[DL輪読会]Deep Learning 第13章 線形因子モデル
[DL輪読会]Deep Learning 第13章 線形因子モデル
Deep Learning JP
凸包
凸包
Yasutaka Hiraki
東京都市大学 データ解析入門 7 回帰分析とモデル選択 2
東京都市大学 データ解析入門 7 回帰分析とモデル選択 2
hirokazutanaka
代数方程式とガロア理論
代数方程式とガロア理論
Junpei Tsuji
Wzory na pochodne
Wzory na pochodne
taskbook
普通のプログラミング言語R
普通のプログラミング言語R
Shuyo Nakatani
Paper Study: OptNet: Differentiable Optimization as a Layer in Neural Networks
Paper Study: OptNet: Differentiable Optimization as a Layer in Neural Networks
ChenYiHuang5
私を SKI に連れてって
私を SKI に連れてって
Susisu
数式をnumpyに落としこむコツ
数式をnumpyに落としこむコツ
Shuyo Nakatani
2022年度秋学期 応用数学(解析) 第12回 複素関数論ダイジェスト(1) 複素関数・正則関数 (2022. 12. 15)
2022年度秋学期 応用数学(解析) 第12回 複素関数論ダイジェスト(1) 複素関数・正則関数 (2022. 12. 15)
Akira Asano
ゲーム理論 BASIC 演習107 -フリーライダー-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習107 -フリーライダー-#ゲーム理論 #gametheory #数学
ssusere0a682
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ssusere0a682
More Related Content
What's hot
Integral
Integral
Eko Supriyadi
二次形式と素数で遊ぼう - 第2回 #日曜数学会
二次形式と素数で遊ぼう - 第2回 #日曜数学会
Junpei Tsuji
「日本語LaTeX」が多すぎる件について
「日本語LaTeX」が多すぎる件について
Takayuki Yato
ggplot2をつかってみよう
ggplot2をつかってみよう
Hiroki Itô
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
Masashi Komori
射頻電子 - [第三章] 史密斯圖與阻抗匹配
射頻電子 - [第三章] 史密斯圖與阻抗匹配
Simen Li
Chap nombres complexes
Chap nombres complexes
Karim Amane
Quantum Mechanics A Paradigms Approach 1st Edition McIntyre Solutions Manual
Quantum Mechanics A Paradigms Approach 1st Edition McIntyre Solutions Manual
Andersonasaa
Prml
Prml
syou6162
データ解析6 重回帰分析
データ解析6 重回帰分析
Hirotaka Hachiya
[DL輪読会]Deep Learning 第13章 線形因子モデル
[DL輪読会]Deep Learning 第13章 線形因子モデル
Deep Learning JP
凸包
凸包
Yasutaka Hiraki
東京都市大学 データ解析入門 7 回帰分析とモデル選択 2
東京都市大学 データ解析入門 7 回帰分析とモデル選択 2
hirokazutanaka
代数方程式とガロア理論
代数方程式とガロア理論
Junpei Tsuji
Wzory na pochodne
Wzory na pochodne
taskbook
普通のプログラミング言語R
普通のプログラミング言語R
Shuyo Nakatani
Paper Study: OptNet: Differentiable Optimization as a Layer in Neural Networks
Paper Study: OptNet: Differentiable Optimization as a Layer in Neural Networks
ChenYiHuang5
私を SKI に連れてって
私を SKI に連れてって
Susisu
数式をnumpyに落としこむコツ
数式をnumpyに落としこむコツ
Shuyo Nakatani
2022年度秋学期 応用数学(解析) 第12回 複素関数論ダイジェスト(1) 複素関数・正則関数 (2022. 12. 15)
2022年度秋学期 応用数学(解析) 第12回 複素関数論ダイジェスト(1) 複素関数・正則関数 (2022. 12. 15)
Akira Asano
What's hot
(20)
Integral
Integral
二次形式と素数で遊ぼう - 第2回 #日曜数学会
二次形式と素数で遊ぼう - 第2回 #日曜数学会
「日本語LaTeX」が多すぎる件について
「日本語LaTeX」が多すぎる件について
ggplot2をつかってみよう
ggplot2をつかってみよう
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
射頻電子 - [第三章] 史密斯圖與阻抗匹配
射頻電子 - [第三章] 史密斯圖與阻抗匹配
Chap nombres complexes
Chap nombres complexes
Quantum Mechanics A Paradigms Approach 1st Edition McIntyre Solutions Manual
Quantum Mechanics A Paradigms Approach 1st Edition McIntyre Solutions Manual
Prml
Prml
データ解析6 重回帰分析
データ解析6 重回帰分析
[DL輪読会]Deep Learning 第13章 線形因子モデル
[DL輪読会]Deep Learning 第13章 線形因子モデル
凸包
凸包
東京都市大学 データ解析入門 7 回帰分析とモデル選択 2
東京都市大学 データ解析入門 7 回帰分析とモデル選択 2
代数方程式とガロア理論
代数方程式とガロア理論
Wzory na pochodne
Wzory na pochodne
普通のプログラミング言語R
普通のプログラミング言語R
Paper Study: OptNet: Differentiable Optimization as a Layer in Neural Networks
Paper Study: OptNet: Differentiable Optimization as a Layer in Neural Networks
私を SKI に連れてって
私を SKI に連れてって
数式をnumpyに落としこむコツ
数式をnumpyに落としこむコツ
2022年度秋学期 応用数学(解析) 第12回 複素関数論ダイジェスト(1) 複素関数・正則関数 (2022. 12. 15)
2022年度秋学期 応用数学(解析) 第12回 複素関数論ダイジェスト(1) 複素関数・正則関数 (2022. 12. 15)
More from ssusere0a682
ゲーム理論 BASIC 演習107 -フリーライダー-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習107 -フリーライダー-#ゲーム理論 #gametheory #数学
ssusere0a682
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ssusere0a682
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ssusere0a682
【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slide
【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slide
ssusere0a682
ゲーム理論 BASIC 演習103 -一対多マッチング- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習103 -一対多マッチング- #ゲーム理論 #gametheory #数学
ssusere0a682
ゲーム理論 BASIC 演習102 -一対一マッチング 3- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習102 -一対一マッチング 3- #ゲーム理論 #gametheory #数学
ssusere0a682
ゲーム理論 BASIC 演習101 -一対一マッチング- Gametheory
ゲーム理論 BASIC 演習101 -一対一マッチング- Gametheory
ssusere0a682
ゲーム理論 BASIC 演習100- 一対一マッチング - Gametheory
ゲーム理論 BASIC 演習100- 一対一マッチング - Gametheory
ssusere0a682
バレンタインデー:贈り物はシグナリング
バレンタインデー:贈り物はシグナリング
ssusere0a682
ゲーム理論 BASIC 演習99 -リスク回避的な入札者 2-
ゲーム理論 BASIC 演習99 -リスク回避的な入札者 2-
ssusere0a682
ゲーム理論 BASIC 演習98 -リスク回避的な入札者 -
ゲーム理論 BASIC 演習98 -リスク回避的な入札者 -
ssusere0a682
ゲーム理論 BASIC 演習オークション関連補足 - 収入同値定理 -
ゲーム理論 BASIC 演習オークション関連補足 - 収入同値定理 -
ssusere0a682
ゲーム理論 BASIC 演習97 -敗者支払いオークション Sad Loser Auction -
ゲーム理論 BASIC 演習97 -敗者支払いオークション Sad Loser Auction -
ssusere0a682
ゲーム理論 BASIC 演習96 -サンタクロースオークション Santa Claus Auction-
ゲーム理論 BASIC 演習96 -サンタクロースオークション Santa Claus Auction-
ssusere0a682
ゲーム理論 BASIC 演習94 -留保価格付きセカンドプライスオークション-
ゲーム理論 BASIC 演習94 -留保価格付きセカンドプライスオークション-
ssusere0a682
ゲーム理論 BASIC 演習93 -チープトーク:利害対立-
ゲーム理論 BASIC 演習93 -チープトーク:利害対立-
ssusere0a682
ゲーム理論 BASIC 演習92 -チープトーク-
ゲーム理論 BASIC 演習92 -チープトーク-
ssusere0a682
ゲーム理論 BASIC 演習91 -情報の非対称性により取引消滅-
ゲーム理論 BASIC 演習91 -情報の非対称性により取引消滅-
ssusere0a682
ゲーム理論 BASIC 演習89 -安全保障理事会決議における投票力指数-
ゲーム理論 BASIC 演習89 -安全保障理事会決議における投票力指数-
ssusere0a682
ゲーム理論 BASIC 演習88 -投票ゲームにおけるシャープレイ•シュービック指数-
ゲーム理論 BASIC 演習88 -投票ゲームにおけるシャープレイ•シュービック指数-
ssusere0a682
More from ssusere0a682
(20)
ゲーム理論 BASIC 演習107 -フリーライダー-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習107 -フリーライダー-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slide
【ゲーム理論入門】ChatGPTが作成した ゲーム理論の問題を解く #3 Slide
ゲーム理論 BASIC 演習103 -一対多マッチング- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習103 -一対多マッチング- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習102 -一対一マッチング 3- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習102 -一対一マッチング 3- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習101 -一対一マッチング- Gametheory
ゲーム理論 BASIC 演習101 -一対一マッチング- Gametheory
ゲーム理論 BASIC 演習100- 一対一マッチング - Gametheory
ゲーム理論 BASIC 演習100- 一対一マッチング - Gametheory
バレンタインデー:贈り物はシグナリング
バレンタインデー:贈り物はシグナリング
ゲーム理論 BASIC 演習99 -リスク回避的な入札者 2-
ゲーム理論 BASIC 演習99 -リスク回避的な入札者 2-
ゲーム理論 BASIC 演習98 -リスク回避的な入札者 -
ゲーム理論 BASIC 演習98 -リスク回避的な入札者 -
ゲーム理論 BASIC 演習オークション関連補足 - 収入同値定理 -
ゲーム理論 BASIC 演習オークション関連補足 - 収入同値定理 -
ゲーム理論 BASIC 演習97 -敗者支払いオークション Sad Loser Auction -
ゲーム理論 BASIC 演習97 -敗者支払いオークション Sad Loser Auction -
ゲーム理論 BASIC 演習96 -サンタクロースオークション Santa Claus Auction-
ゲーム理論 BASIC 演習96 -サンタクロースオークション Santa Claus Auction-
ゲーム理論 BASIC 演習94 -留保価格付きセカンドプライスオークション-
ゲーム理論 BASIC 演習94 -留保価格付きセカンドプライスオークション-
ゲーム理論 BASIC 演習93 -チープトーク:利害対立-
ゲーム理論 BASIC 演習93 -チープトーク:利害対立-
ゲーム理論 BASIC 演習92 -チープトーク-
ゲーム理論 BASIC 演習92 -チープトーク-
ゲーム理論 BASIC 演習91 -情報の非対称性により取引消滅-
ゲーム理論 BASIC 演習91 -情報の非対称性により取引消滅-
ゲーム理論 BASIC 演習89 -安全保障理事会決議における投票力指数-
ゲーム理論 BASIC 演習89 -安全保障理事会決議における投票力指数-
ゲーム理論 BASIC 演習88 -投票ゲームにおけるシャープレイ•シュービック指数-
ゲーム理論 BASIC 演習88 -投票ゲームにおけるシャープレイ•シュービック指数-
ゲーム理論BASIC 演習69 -3人ゲームの混合戦略ナッシュ均衡-
1.
ゲーム理論 BASIC 演習69 3人ゲームの混合戦略ナッシュ均衡
2.
1. 混合戦略ナッシュ均衡の定義 2. 有用な定理 3.
3人ゲームのナッシュ均衡
3.
混合戦略ナッシュ均衡 プレイヤー 以外の混合戦略を とし固定する を満たすとき
は に対する最適反応戦略という 戦略の組 が混合戦略ナッシュ均衡であるとは, すべてのプレイヤーに対して を満たすときをいう ゲーム理論BASIC第8回参照 i p−i ∈ P−i Fi (p*i , p−i ) ≥ Fi (pi , p−i ), ∀pi ∈ Pi p*i p−i (p*1 , ⋯, p*n ) ∈ P Fi (p*i , p*−i ) ≥ Fi (pi , p*−i ), ∀pi ∈ Pi
4.
混合戦略に関する定理 定理 混合拡大したゲーム において, 2つ以上の純戦略に対し,正の確率を与える混合戦略
が, 他のプレイヤーの戦略の組 に対して最適反応とする. このときその正の確率で用いられる純戦略も他のプレイヤーの戦略の組 に対する最適反応となる. ゲーム理論BASIC演習 第8回参照 (N, {Pi }i∈N, {Fi }i∈N) pi p−i p−i
5.
以下のゲームにおける混合戦略ナッシュ均衡を求めよ 3人ゲームのナッシュ均衡 3が純戦略c1 1\2 b1 b2 a1
0, 1, 1 0, 0, 0 a2 2, 2, 2 1, 1, 3 3が純戦略c2 1\2 b1 b2 a1 0, 0, 0 1, 1, 1 a2 1, 0, 1 0, 1, 0
6.
純戦略の範囲では, , がナッシュ均衡. (補足)プレイヤー3の最適反応の考え方 プレイヤー1,
2の戦略を固定 して, を選んだ場合の利得1と を選んだ場合の利得0を比較. 同様に を固定した上で考えれば良い. (a2, b1, c1) (a1, b2, c2) (a1, b1) c1 c2 (a1, b2), (a2, b1), (a2, b2) 3人ゲームのナッシュ均衡 3が純戦略c1 1\2 b1 b2 a1 0, 1, 1 0, 0, 0 a2 2, 2, 2 1, 1, 3 3が純戦略c2 1\2 b1 b2 a1 0, 0, 0 1, 1, 1 a2 1, 0, 1 0, 1, 0 3が純戦略c1: 1\2 b1 b2 a1 0, 1, 1 0, 0, 0 a2 2, 2, 2 1, 1, 3 3が純戦略c2: 1\2 b1 b2 a1 0, 0, 0 1, 1, 1 a2 1, 0, 1 0, 1, 0
7.
各プレイヤーの混合戦略を , ,
とする. ただし, . (1)すべてのプレイヤーが正の確率で混合戦略を使うとし, 定理を利用する. (2)1人のプレイヤーが純戦略を用いるとして, 残りのプレイヤーの最適反応を考える. p1 = (p,1 − p) p2 = (q,1 − q) p3 = (r,1 − r) p, q, r ∈ [0,1] 3人ゲームのナッシュ均衡 3が純戦略c1 1\2 b1 b2 a1 0, 1, 1 0, 0, 0 a2 2, 2, 2 1, 1, 3 3が純戦略c2 1\2 b1 b2 a1 0, 0, 0 1, 1, 1 a2 1, 0, 1 0, 1, 0 p 1 − p q 1 − q p 1 − p q 1 − q r 1 − r
8.
(1)すべてのプレイヤーがすべての選択肢に対し正の確率を与える混合戦略を使うとし, 定理を利用する. 定理より各プレイヤーの正の確率で使われる純戦略も同じ期待利得を与えるので, 以下の3式が同時に成り立つ: ・・・(1) ・・・(2) ・・・(3) (2)と(1)より,
となり, と矛盾するため, すべてのプレイヤーがすべての選択肢に対し正の確率を与える混合戦略を含むようなナッシュ均衡は存在しない. p, q, r ∈ (0,1) 1 ⋅ (1 − q)(1 − r) = 2 ⋅ qr + 1 ⋅ (1 − q)r + 1 ⋅ q(1 − r) ⇔ 1 − 2r − 2q + rq = 0 1 ⋅ pr + 2 ⋅ (1 − p)r = 1 ⋅ (1 − p)r + 1 ⋅ p(1 − r) + 1 ⋅ (1 − p)(1 − r) ⇔ r = 1 2 1 ⋅ pq + 2 ⋅ (1 − p)q + 3 ⋅ (1 − p)(1 − q) = 1 ⋅ (1 − p)q + 1 ⋅ p(1 − q) ⇔ 4pq − 2q − 4p + 3 = 0 q = 0 q ∈ (0,1) 3人ゲームのナッシュ均衡 3が純戦略c1 1\2 b1 b2 a1 0, 1, 1 0, 0, 0 a2 2, 2, 2 1, 1, 3 3が純戦略c2 1\2 b1 b2 a1 0, 0, 0 1, 1, 1 a2 1, 0, 1 0, 1, 0 p 1 − p q 1 − q p 1 − p q 1 − q r 1 − r を取ったときの利得 a1 を取ったときの利得 a2 を取ったときの利得 b1 を取ったときの利得 b2 を取ったときの利得 c1 を取ったときの利得 c2
9.
(2)1人のプレイヤーが純戦略を用いるとして, 残りのプレイヤーの最適反応を考える. プレイヤー1が ,
すなわち を選ぶことが最適な場合, プレイヤー2の期待利得: プレイヤー3の期待利得: 右図より, の場合がナッシュ均衡 a1 p = 1 1 ⋅ (1 − q)(1 − r) ≥ 2 ⋅ qr + 1 ⋅ (1 − q)r + 1 ⋅ q(1 − r) ⇔ 1 − 2r − 2q + rq ≥ 0 ⇔ r ≤ 1 − 2q 2 − q qr + (1 − q)(1 − r) = 1 − q − r + 2qr = (2r − 1)q + 1 − r qr + (1 − q)(1 − r) = 1 − q − r + 2qr = (2q − 1)r + 1 − q ((p,1 − p), (q,1 − q), (r,1 − r)) = ((1,0), (0,1), (0,1)) 3人ゲームのナッシュ均衡 3が純戦略c1 1\2 b1 b2 a1 0, 1, 1 0, 0, 0 a2 2, 2, 2 1, 1, 3 3が純戦略c2 1\2 b1 b2 a1 0, 0, 0 1, 1, 1 a2 1, 0, 1 0, 1, 0 1 0 q 1 − q 1 0 q 1 − q r 1 − r q r 0 1 1 1 2 1 2 プレイヤー2の最適反応 プレイヤー3の最適反応 プレイヤー1の が最適反応 p = 1
10.
(2)1人のプレイヤーが純戦略を用いるとして, 残りのプレイヤーの最適反応を考える. プレイヤー1が ,
すなわち を選ぶことが最適な場合, プレイヤー2の期待利得: プレイヤー3の期待利得: 右図より, の場合がナッシュ均衡 a2 p = 0 1 ⋅ (1 − q)(1 − r) ≤ 2 ⋅ qr + 1 ⋅ (1 − q)r + 1 ⋅ q(1 − r) ⇔ 1 − 2r − 2q + rq ≤ 0 ⇔ r ≥ 1 − 2q 2 − q 2qr + (1 − q)r + (1 − q)(1 − r) = (2r − 1)q + 1 2qr + 3(1 − q)r + q(1 − r) = (3 − 2q)r + q ((p,1 − p), (q,1 − q), (r,1 − r)) = ((0,1), (1,0), (1,0)) 3人ゲームのナッシュ均衡 3が純戦略c1 1\2 b1 b2 a1 0, 1, 1 0, 0, 0 a2 2, 2, 2 1, 1, 3 3が純戦略c2 1\2 b1 b2 a1 0, 0, 0 1, 1, 1 a2 1, 0, 1 0, 1, 0 0 1 q 1 − q 0 1 q 1 − q r 1 − r q r 0 1 1 1 2 プレイヤー3の最適反応 1 2 プレイヤー2の最適反応 プレイヤー1の が最適反応 p = 0
11.
(2)1人のプレイヤーが純戦略を用いるとして, 残りのプレイヤーの最適反応を考える. プレイヤー2が を選ぶ場合,
すなわち を選ぶ場合, プレイヤー1の期待利得: プレイヤー3の期待利得: 右図より, の場合がナッシュ均衡 b1 q = 1 1 ⋅ pr + 2 ⋅ (1 − p)r ≥ 1 ⋅ (1 − p)r + 1 ⋅ p(1 − r) + 1 ⋅ (1 − p)(1 − r) ⇔ r ≥ 1 2 2(1 − p)r + (1 − p)(1 − r) = (−r − 1)p + r + 1 pr + 2(1 − p)r + (1 − p)(1 − r) = r − p + 1 ((p,1 − p), (q,1 − q), (r,1 − r)) = ((0,1), (1,0), (1,0)) 3人ゲームのナッシュ均衡 3が純戦略c1 1\2 b1 b2 a1 0, 1, 1 0, 0, 0 a2 2, 2, 2 1, 1, 3 3が純戦略c2 1\2 b1 b2 a1 0, 0, 0 1, 1, 1 a2 1, 0, 1 0, 1, 0 p 1 − p 1 0 1 0 r 1 − r p r 0 1 1 プレイヤー1の最適反応 プレイヤー3の最適反応 p 1 − p 1 2 プレイヤー2の が最適反応 q = 1
12.
(2)1人のプレイヤーが純戦略を用いるとして, 残りのプレイヤーの最適反応を考える. プレイヤー2が を選ぶ場合,
すなわち を選ぶ場合, プレイヤー1の期待利得: プレイヤー3の期待利得: 右図より, b2 q = 0 1 ⋅ pr + 2 ⋅ (1 − p)r ≤ 1 ⋅ (1 − p)r + 1 ⋅ p(1 − r) + 1 ⋅ (1 − p)(1 − r) ⇔ r ≤ 1 2 (1 − p)r + p(1 − r) = (1 − 2r)p + r 3(1 − p)r + p(1 − r) = (3 − 4p)r + p ((p,1 − p), (q,1 − q), (r,1 − r)) = ((1,0), (0,1), (0,1)) ((p,1 − p), (q,1 − q), (r,1 − r)) = (( 3 4 , 1 4) , (0, 1), ( 1 2 , 1 2)) 3人ゲームのナッシュ均衡 3が純戦略c1 1\2 b1 b2 a1 0, 1, 1 0, 0, 0 a2 2, 2, 2 1, 1, 3 3が純戦略c2 1\2 b1 b2 a1 0, 0, 0 1, 1, 1 a2 1, 0, 1 0, 1, 0 p 1 − p 0 1 0 1 r 1 − r p r 0 1 1 プレイヤー1の最適反応 プレイヤー3の最適反応 p 1 − p 1 2 3 4 プレイヤー2の が最適反応 q = 0
13.
(2)1人のプレイヤーが純戦略を用いるとして, 残りのプレイヤーの最適反応を考える. プレイヤー3が を選ぶ場合,
すなわち を選ぶ場合, プレイヤー1の期待利得: プレイヤー2の期待利得: 右図より, の場合がナッシュ均衡 c1 r = 1 1 ⋅ pq + 2 ⋅ (1 − p)q + 3 ⋅ (1 − p)(1 − q) ≥ 1 ⋅ (1 − p)q + 1 ⋅ p(1 − q) ⇔ 4pq − 2q − 4p + 3 ≥ 0 2(1 − p)q + (1 − p)(1 − q) = (−q − 1)p + q + 1 pq + 2(1 − p)q + (1 − p)(1 − q) = q − p + 1 ((p,1 − p), (q,1 − q), (r,1 − r)) = ((0,1), (1,0), (1,0)) 3人ゲームのナッシュ均衡 3が純戦略c1 1\2 b1 b2 a1 0, 1, 1 0, 0, 0 a2 2, 2, 2 1, 1, 3 3が純戦略c2 1\2 b1 b2 a1 0, 0, 0 1, 1, 1 a2 1, 0, 1 0, 1, 0 p 1 − p 1 0 p q 0 1 1 プレイヤー2の最適反応 p 1 − p q 1 − q q 1 − q 3 2 1 2 プレイヤー1の最適反応 プレイヤー3の が最適反応 r = 1
14.
(2)1人のプレイヤーが純戦略を用いるとして, 残りのプレイヤーの最適反応を考える. プレイヤー3が を選ぶ場合,
すなわち を選ぶ場合, プレイヤー1の期待利得: プレイヤー2の期待利得: 右図より, c2 r = 0 1 ⋅ pq + 2 ⋅ (1 − p)q + 3 ⋅ (1 − p)(1 − q) ≤ 1 ⋅ (1 − p)q + 1 ⋅ p(1 − q) ⇔ 4pq − 2q − 4p + 3 ≤ 0 (1 − p)q + p(1 − q) = (1 − 2q)p + q p(1 − q) + (1 − p)(1 − q) = 1 − q ((p,1 − p), (q,1 − q), (r,1 − r)) = ((1,0), (0,1), (0,1)) 3人ゲームのナッシュ均衡 3が純戦略c1 1\2 b1 b2 a1 0, 1, 1 0, 0, 0 a2 2, 2, 2 1, 1, 3 3が純戦略c2 1\2 b1 b2 a1 0, 0, 0 1, 1, 1 a2 1, 0, 1 0, 1, 0 p 1 − p 1 0 p q 0 1 1 プレイヤー1の最適反応 p 1 − p q 1 − q q 1 − q 3 2 プレイヤー3の が最適反応 r = 0 1 2 プレイヤー2の最適反応
15.
以上より, ナッシュ均衡は3つ: , ((p,1 −
p), (q,1 − q), (r,1 − r)) = ((0,1), (1,0), (1,0)), ((1,0), (0,1), (0,1)) (( 3 4 , 1 4) , (0, 1), ( 1 2 , 1 2)) 3人ゲームのナッシュ均衡 3が純戦略c1 1\2 b1 b2 a1 0, 1, 1 0, 0, 0 a2 2, 2, 2 1, 1, 3 3が純戦略c2 1\2 b1 b2 a1 0, 0, 0 1, 1, 1 a2 1, 0, 1 0, 1, 0 p 1 − p p 1 − p q 1 − q q 1 − q r 1 − r (a2, b1, c1) (a1, b2, c2)
16.
ゲーム理論 BASIC 演習69 3人ゲームの混合戦略ナッシュ均衡
Download now