ゲーム理論
「インセンティブ設計の理論」
安田洋祐 | 大阪大学大学院 経済学研究科
( yosuke.yasuda@gmail.com )
1 2017年度インセンティブ設計の理論
協調ゲーム
みんなと同じ行動を取るのはなぜか?
2017年度インセンティブ設計の理論2
講義の狙い
2017年度3
 同調行動(まわりに合わせた行動)について考えよう!
 例:エスカレーターの並び方
 大阪:右に並ぶ(左を空ける)
 東京:左に並ぶ(右を空ける)
 なぜ同調行動が起こるのか?
 どんなメリット・デメリットがあるのか?
 当事者目線に立つと世の中が見えてくる!
インセンティブ設計の理論
参考図書
2017年度4
第2章「なぜ人は行列に並ぶの
か?[ゲーム理論]」(安田洋祐)
インセンティブ設計の理論
暮らしの中の駆け引き
2017年度5
 経済学の考え方
 各人が本人にとって望ましい選択肢を選ぶ
 かっこ良く言うと → 「インセンティブに従う」
 ゲーム理論の考え方
 望ましい選択肢が相手の行動によって変わる!
 戦略的な駆け引きを分析する道具 = ゲーム理論
 同調行動
 まわりと同じ行動を取るのが各人にとって望ましい
 実際の例を見てみよう!
インセンティブ設計の理論
同調行動の例
2017年度6
1. 共同作業: どのパソコンを使うか?
2. デートの場所:どこに遊びに行くか?
3. いじめ問題:加担するかしないか?
4. SNS:どのサービスを使うか?
5. 行列:どの店に並ぶか?
インセンティブ設計の理論
コーディネーションゲーム:利得表
2017年度7
 共同作業のために新しいパソコンを購入する
 相手と異なるOSでは全く意味がないとする
 (Mac, Mac)の方が(Win, Win)よりも2人にとってベター
学生2
学生1
Windows Mac
Windows 1
1
0
0
Mac 0
0
2
2
インセンティブ設計の理論
コーディネーションゲーム:分析1
2017年度8
 相手(2)がWinを選んでくるなら
 自分(1)もWinを購入するのが最適: 1 > 0 なので
学生2
学生1
Windows Mac
Windows 1
1
0
0
Mac 0
0
2
2
インセンティブ設計の理論
コーディネーションゲーム:分析2
2017年度9
 相手(2)がMacを選んでくるなら
 自分(1)もMacを購入するのが最適: 2 > 0 なので
学生2
学生1
Windows Mac
Windows 1
1
0
0
Mac 0
0
2
2
インセンティブ設計の理論
コーディネーションゲーム:解説1
2017年度10
 最適な戦略(支配戦略)が存在しない!
 相手がMacなら自分もMac、相手がWinなら自分もWinが得
 最適な行動が相手の行動によって変化する!
 個人の合理性だけからでは問題を解くことができない
 意思決定理論・契約理論のようには問題が解けない
 「ナッシュ均衡」を求めよう!
 一見するとベストな結果(Mac, Mac)が選ばれそうだが…
 まずはナッシュ均衡の定義を見てみよう!
インセンティブ設計の理論
ナッシュ均衡の定義
2017年度11
 プレーヤーたちの選択した行動の組がナッシュ均衡
であるとき
1. (すべてのプレーヤーにとって)自分一人だけが行動を
変更しても利得を上げることができない
 安定的な状況をうまく描写できる
2. プレーヤー同士がお互いの行動を正しく予想してそれ
に対して最適な行動を選択し合っている
 合理的な結果の予測として優れている
 数学的には全く同じ定義でも多様な解釈ができる!
インセンティブ設計の理論
ナッシュ均衡の見つけ方:下線法1
2017年度12
 各自が選べる大きい方の利得に下線を引いて行くと…
 どちらの利得にも下線が引かれている => ナッシュ均衡
 それ以外の戦略の組み合わせ => ナッシュ均衡ではない
学生2
学生1
Windows Mac
Windows 1
1
0
0
Mac 0
0
2
2
インセンティブ設計の理論
ナッシュ均衡の見つけ方:下線法2
2017年度13
 各自が選べる大きい方の利得に下線を引いて行くと…
 どちらの利得にも下線が引かれている => ナッシュ均衡
 それ以外の戦略の組み合わせ => ナッシュ均衡ではない
学生2
学生1
Windows Mac
Windows 1
1
0
0
Mac 0
0
2
2
インセンティブ設計の理論
コーディネーションゲーム:解説2
2017年度14
 このゲームには2つナッシュ均衡がある!
 (Mac, Mac)と(Win, Win)のどちらもナッシュ均衡
 コーディネーションゲームのように
 (一般に)ナッシュ均衡は複数存在する場合がある
 プレイヤー全員にとってあるナッシュ均衡よりも別のナッシュ
均衡の方が望ましい場合もある
 良い均衡(Mac, Mac)ではなく悪い均衡(Win, Win)が選
ばれてしまう危険性がある
 「コーディネーションの失敗」と呼ばれる
 選ばれなかった選択肢・商品は市場から消えて行くことも…
インセンティブ設計の理論
神取ミクロ(図6.1)
2017年度インセンティブ設計の理論15
キー配列もコーディネーションの失敗!?
2017年度16 インセンティブ設計の理論
男女の争い:利得表
2017年度17
 妻(プレイヤー1)と夫(プレイヤー2)が休みの日にどこに
遊びに行くかをそれぞれ決定
 別々の場所に行くのは2人にとって最悪
 妻は遊園地、夫は野球観戦の方が好き
夫
妻
遊園地 野球
遊園地 1
2
0
0
野球 0
0
2
1
インセンティブ設計の理論
男女の争い:下線法1
2017年度18
 夫が遊園地を選ぶなら
 妻も遊園地を選ぶのが最適: 2 > 0 なので
 相手の選択に対して最適な利得に下線を付けると…
夫
妻
遊園地 野球
遊園地 1
2
0
0
野球 0
0
2
1
インセンティブ設計の理論
男女の争い:下線法2
2017年度19
 夫が遊園地を選ぶなら
 妻も遊園地を選ぶのが最適: 2 > 0 なので
 相手の選択に対して最適な利得に下線を付けると…
夫
妻
遊園地 野球
遊園地 1
2
0
0
野球 0
0
2
1
インセンティブ設計の理論
男女の争い:解説
2017年度20
 このゲームにもナッシュ均衡が2つ!
 (遊園地、遊園地)と(野球、野球)のどちらもナッシュ均衡
 今回は “良い”(“悪い”)均衡は存在しない
 双方にとって「より望ましい均衡」というものがない!
 状況が対称的でどちらの均衡が実現しそうか分からない
 理論以外の要素 ーたとえば慣習や文化、規範などー に
よってどちらのナッシュ均衡が選ばれるかが決まる
 例)レディファースト → (遊園地、遊園地)
 例)男社会(?) → (野球、野球)
インセンティブ設計の理論
鹿狩りゲーム:利得表
2017年度21
 2人のハンターがどちらの獲物を狙うかを決める
 鹿は2人で協力しないと捕えることができない
 兎は自分1人でも必ず捕えることができる=安全な戦略
ハンター2
ハンター1
シカ ウサギ
シカ 3
3
2
0
ウサギ 0
2
2
2
インセンティブ設計の理論
鹿狩りゲーム:ナッシュ均衡
2017年度22
 2人のハンターがどちらの獲物を狙うかを決める
 鹿は2人で協力しないと捕えることができない
 兎は自分1人でも必ず捕えることができる=安全な戦略
ハンター2
ハンター1
シカ ウサギ
シカ 3
3
2
0
ウサギ 0
2
2
2
インセンティブ設計の理論
鹿狩りゲーム:解説
2017年度23
 このゲームには2つナッシュ均衡がある!
 (シカ、シカ)(ウサギ、ウサギ)のどちらもナッシュ均衡
 コーディネーションゲームの一種と考えられる
 どちらの均衡の方がもっともらしい?
 (シカ、シカ)は2人にとって望ましい効率的な均衡だが…
 (ウサギ、ウサギ)の方が実現しやすい可能性がある
 相手がランダムに戦略を選んでくる場合には
 「シカ」よりも「ウサギ」を選ぶ方が(期待)利得が高い!
 「ウサギ」=リスク支配戦略、(ウサギ、ウサギ)=リスク支配均衡
 この例のように、リスク支配均衡が効率的とは限らない…
インセンティブ設計の理論
鹿狩りゲームの応用1:銀行取り付け
2017年度24
 銀行が危ないという噂に対して預金者はどうするか
 実際は健全経営なので、急な引き出しがなければ破綻しない
 「引き出さない」→危険、「引き出す」→安全
 みんなが「引き出す」と健全な銀行が破綻してしまう…
預金者2
預金者1
引き出さない 引き出す
引き出さない 2
2
1
-10
引き出す -10
1
0
0
インセンティブ設計の理論
銀行取り付け:ナッシュ均衡
2017年度25
 銀行が危ないという噂に対して預金者はどうするか
 実際は健全経営なので、急な引き出しがなければ破綻しない
 「引き出さない」→危険、「引き出す」→安全
 みんなが「引き出す」と健全な銀行が破綻してしまう…
預金者2
預金者1
引き出さない 引き出す
引き出さない 2
2
1
-10
引き出す -10
1
0
0
インセンティブ設計の理論
銀行取り付け:預金保護制度がある場合
2017年度26
 銀行が破たんしても預金を保護すると…
 仮に破たんしても預金者は損することが無い
 「引き出さない」 → 危険なし、「引き出す」 → 意味がない
 (引き出さない、 引き出さない)が唯一のナッシュ均衡に!
預金者2
預金者1
引き出さない 引き出す
引き出さない 2
2
1
2
引き出す 2
1
1
1
インセンティブ設計の理論
預金保険制度の効果
2017年度27 インセンティブ設計の理論
鹿狩りゲームの応用2:イジメ問題
2017年度28
 クラスメートがいじめ問題に立ち向かえるか
 どちらの生徒にとっても、いじめが解決するのがベスト
 自分だけ「立ち向かう」といじめの標的になる危険がある
 みんなが安全に「見ないフリ」をするといじめは無くならない…
生徒2
生徒1
立ち向かう 見ないフリ
立ち向かう 2
2
0
-10
見ないフリ -10
0
0
0
インセンティブ設計の理論
イジメ問題:ナッシュ均衡
2017年度29
 クラスメートがいじめ問題に立ち向かえるか
 どちらの生徒にとっても、いじめが解決するのがベスト
 自分だけ「立ち向かう」といじめの標的になる危険がある
 みんなが安全に「見ないフリ」をするといじめは無くならない…
生徒2
生徒1
立ち向かう 見ないフリ
立ち向かう 2
2
0
-10
見ないフリ -10
0
0
0
インセンティブ設計の理論
SNS選択:ネットワーク外部性
2017年度30 インセンティブ設計の理論
利用者数が増えるにつれて
財・サービスの利便性が向上
↓
さらなる利用者増をもたらす!
<ポジティブ・フィードバック>
レストランの行列:社会的学習
2017年度31
 どちらのレストランを選ぶか?
 個々の客はお店に関する不確実な情報を受け取る
 自分の情報と混み具合を見てお店を決定!
 果たして美味しいお店に行列はできるのか?
おいしい
和食処
俺の
ザ・和食
インセンティブ設計の理論
おさらい:同調行動の例
2017年度32
1. 共同作業: どのパソコンを使うか?
 コーディネーション・ゲーム
2. デートの場所:どこに遊びに行くか?
 男女の争い
3. いじめ問題:加担するかしないか?
 鹿狩りゲーム
4. SNS:どのサービスを使うか?
 ネットワーク外部性
5. 行列:どの店に並ぶか?
 社会的学習の理論
インセンティブ設計の理論
コミットメント
結果にコミットして優位に立とう
2017年度インセンティブ設計の理論33
動学的なゲーム:参入ゲーム
2017年度34
 プレーヤーは2種類の企業
 既存企業と(潜在的な)参入企業
 まずはじめに参入企業がこの独占市場に「参入する」か「しな
い」かを決定する
 後者の場合ゲームはただちに終了
 参入企業は 0、既存企業は 4 の利得を得る
 前者の場合、既存企業が次の意思決定を行う
 参入が起こった場合に既存企業は「価格競争」するか「しな
い」かを決定する
 前者の場合、両企業はそれぞれ -1 の損失を被る
 後者の場合、両企業はそれぞれ 1 の利得を得る
インセンティブ設計の理論
「ゲームの木」による描写
2017年度35
 参入ゲームは以下のような「木」として表現できる
(0,4)
(-1,-1)
(1,1)
参入企業
独占企業
しない
参入する
価格競争
しない
インセンティブ設計の理論
利得表を書いて分析すると…
2017年度36
 どちらの企業も戦略は2つずつ
 参入企業が「しない」を選ぶと利得は確定する
独占企業
参入企業
価格競争 しない
参入する -1
-1
1
1
しない 4
0
4
0
インセンティブ設計の理論
もっともらしくないナッシュ均衡?
2017年度37
 ふたつのナッシュ均衡が存在する
 左下(しない、価格競争)はもっともらしい均衡か?
独占企業
参入企業
価格競争 しない
参入する -1
-1
1
1
しない 4
0
4
0
インセンティブ設計の理論
動学ゲーム分析で気を付けること
2017年度38
 時間を通じた動学ゲームにはナッシュ均衡が複数存在
する場合が多い → これ自体は問題ではないが…
 一部の均衡が信憑性のない「から脅し」に依存している
 ゲームを「後ろから解く」ことによって、信憑性のない均
衡をきちんと排除することができる!
 「バックワード・インダクション(後方帰納法)」と呼ぶ
 この考えを解概念としてフォーマルに一般化すると
 「部分ゲーム完全均衡」となる(本講義では省略)
インセンティブ設計の理論
バックワード・インダクション解
2017年度39
( ,4)
(-1, )
( , )
参入企業
独占企業
しない
参入
価格競争
しない
インセンティブ設計の理論
もし参入が起きてし
まった場合には、独
占企業は価格競争を
「しない」のが得!
逐次手番ゲームの例:Not 25
2017年度40
 2人のプレーヤーが交互に数字を数え上げていく
 各プレーヤーは1~3個の連続した数字を数える
 最後に25の数字を数えたプレーヤーが負け
 「Not XX」は一昔前に結構流行ったゲーム(のハズ)
 先手もしくは後手に必勝戦略(必勝法)はあるだろうか?
 あるとしたらそれはいったいどんな戦略か?
 ネタバレになってしまうので必勝法は講義で…
 もしも数字が他の数だったらどのように必勝法は変わる?
インセンティブ設計の理論
ツェルメロの定理と“必勝法”
2017年度41
 どのような動学的な2人ゲームにおいても
1. 結果が「勝ち」か「負け」しかなく
2. プレイヤーが交互に行動を選択し
3. 過去のプレーをすべて観察することができ
4. 偶然の要素による影響が全くなく
5. 必ず有限回の手番でゲームが終わる
のであれば、どちらかのプレイヤーに必ず必勝戦略がある
 【必勝戦略】 相手がどんなプレーをしてきても、必ず自分が
最終的に勝利できるような(動学的な)戦略
 上の条件を満たせば必勝法は必ず存在する!
 オセロ、チェス、将棋、囲碁には必ず必勝戦略がある!
インセンティブ設計の理論
ツェルメロの定理の注意点
2017年度42
 結果が「勝ち」「負け」「引き分け」の場合には…
1. 先手に必勝戦略がある
2. 後手に必勝戦略がある
3. どちらのプレーヤーにも「最低でも引き分けに持ち込むこと
ができる」ような戦略がある (例: 〇×ゲーム)
のいずれかが必ず成り立つ
 必勝戦略の求め方については何も教えてくれない
 複雑なゲームで必勝戦略を求めるのは現実的には不可能
 「必ず必勝法がある」ことと「必勝法が見つかる」は違う
 オセロ(8×8)ですら、まだ先手・後手必勝どちらかは不明
インセンティブ設計の理論
参入ゲーム:再考
2017年度43
 いったん参入が起これば価格競争は起こらない
 もし独占企業が事前に「価格競争」にコミットできたら…
(0,4)
(-1,-1)
(1,1)
参入企業
独占企業
しない
参入
価格競争
しない
インセンティブ設計の理論
参入ゲームとコミットメント
2017年度44
 事後的には(いったん参入が起こったら)最適な価格競
争「しない」を選ばないことにコミットすると…
(0,4)
(-1,-1)
(1,1)
参入企業
独占企業
しない
参入
価格競争
しない
インセンティブ設計の理論
銀行の破綻処理
2017年度45
 プレーヤーは銀行と政府
 はじめに銀行が動き、次に政府が動く動学ゲーム
 まず銀行が「乱脈経営」か「まじめ」な経営かを決定
 後者の場合ゲームはただちに終了
 銀行は 1、政府(国民)は 10 の利得を得る
 前者の場合、政府が次の意思決定を行う
 乱脈経営によって経営破綻の危機が起きると、政府は
「見放す」か「救済」するかを決定する
 前者の場合、両者はそれぞれ -1 の損失を被る
 後者の場合、両者はそれぞれ 2 の利得を得る
インセンティブ設計の理論
「ゲームの木」による描写
2017年度46
 「銀行の破綻処理」問題のゲームの木
(1,10)
(-1,-1)
(2,2)
銀行
政府
まじめ
乱脈経営
見放す
救済
インセンティブ設計の理論
バックワード・インダクション
2017年度47
 救済を予期して乱脈経営が無くならない…
(1,10)
(-1,-1)
(2,2)
銀行
政府
まじめ
乱脈経営
見放す
救済
インセンティブ設計の理論
コミットメント
2017年度48
 もし政府が救済しないことにコミットできると…
(1,10)
(-1,-1)
(2,2)
銀行
政府
まじめ
乱脈経営
見放す
救済
インセンティブ設計の理論
航空機の開発投資:国際貿易競争
2017年度49
 このゲームには2つの(非対称)ナッシュ均衡が存在
 B社にもしもコミットメント・パワーがあるとどうなるか?
 もちろん、「投資する」にコミットするのが最適!
 現実にはどのようなコミットメント装置が考えられるか?
A社 ╲ B社 投資する しない
投資する -5 -5 10 -2
しない -2 10 0 0
インセンティブ設計の理論
政府がゲームを変える:戦略的貿易政策
2017年度50
 もしも政府がB社への補助金にコミットできたら?
 B社が投資を行ったら、(結果によらず)5だけ補助金を出す
 このような戦略的通商政策は結果を改善できる
 B社にとって「投資する」のが支配戦略になる
 (投資する、しない)はもはやナッシュ均衡ではない!
A社 ╲ B社 投資する しない
投資する -5 0 10 -2
しない -2 15 0 0
インセンティブ設計の理論
コミットメントの具体例
2017年度51
 家電量販店などの「最低価格保証」
 他店よりも1円でも高い商品があれば値下げします
 事後的には最適ではない「価格競争」にコミットすることにより、
ライバル店の値下げを牽制する効果が期待できる!
 代理人(エージェント)へ交渉や仕事を依頼する
 代理人には条件を譲歩する権限が無い
 交渉の余地がないことをコミットすることができる
 ソフトウェアの「オープンソース」化
 市場を独占化しないことにコミットする
 ユーザーが安心してそのソフトを使えるように
インセンティブ設計の理論
現在バイアス:自分との闘い
2017年度インセンティブ設計の理論52
 目の前にある事柄を過大に評価してしまうバイアス
 時間非整合な意思決定に陥ってしまう…
 ダイエット中でも目の前のケーキを我慢できない
 夏休みの宿題にギリギリまで取り掛かれない
 お小遣いを月のはじめにすぐ使い切ってしまう
 (事前の)計画通りに行動するためには、(事後的な)欲
求を抑え込むだけの自己抑制が必要
 なかなか難しい かもしれないので…
→ 「結果にコミット」することで解決!
→ ナッジも有効!(年金加入など)
時間非整合な意思決定
2017年度インセンティブ設計の理論53
A) 今すぐに1万円もらう
B) 1カ月後に1万500円もらう
⇒ 現在バイアスが強い人はAを選ぶ
C) 1年後に1万円もらう
D) 1年1か月後に1万500円もらう
⇒ Aを選んだ人も多くはDを選ぶ
Dを選んだ人に1年経ってから最初の質問をすると…
現在バイアスを弱める工夫
2017年度インセンティブ設計の理論54
A) 今すぐに1万円もらう
B) 1カ月後に1万500円もらう
⇒ この聞き方だとAを選ぶ人が多い
C) 今すぐ1万円もらうけど、1カ月後は1円ももらえない
D) 今すぐには1円ももらえないけど、1カ月後は1万500円
もらう
⇒ 自制的なDを選ぶ人が増える!
繰り返しゲーム
人はなぜ協力するのか
2017年度インセンティブ設計の理論55
囚人のジレンマ:ストーリー
2017年度56
 AさんとBさんの2人がある犯罪容疑で逮捕された!
 有罪にするだけの証拠がなく、検事は自白が頼り(焦)
 そこで、次のような司法取引を容疑者に持ちかけた…
 2人とも自白すれば、A、Bともに懲役3年
 2人とも黙秘すれば、A、Bともに懲役1年
 Aが自白、Bが黙秘すれば、Aは釈放、Bは懲役5年
 Bが自白、Aが黙秘すれば、Bは釈放、Aは懲役5年
 まず、このゲームを表の形でまとめてみよう!
 プレイヤー、戦略、利得が一目で分かるようになる
インセンティブ設計の理論
囚人のジレンマ:利得表(/利得行列)
2017年度57
 ここでは、懲役の年数(×マイナス)を利得に設定
 (実は他の数字でも同じ「囚人のジレンマ」を表すことが可能)
B
A
黙秘 自白
黙秘 -1
-1
0
-5
自白 -5
0
-3
-3
インセンティブ設計の理論
囚人のジレンマ:利得表による分析(1)
2017年度58
 もしも相手(B)が黙秘を選んでいた場合には
 自分(A)は自白を選ぶ方が得: 0 > -1 なので
B
A
黙秘 自白
黙秘 -1
-1
0
-5
自白 -5
0
-3
-3
インセンティブ設計の理論
囚人のジレンマ:利得表による分析(2)
2017年度59
 もしも相手(B)が自白を選んでいた場合には
 自分(A)は自白を選ぶ方が得: -3 > -5 なので
B
A
黙秘 自白
黙秘 -1
-1
0
-5
自白 -5
0
-3
-3
インセンティブ設計の理論
囚人のジレンマ:利得表による分析(3)
2017年度60
 (黙秘、黙秘)が2人にとって望ましい結果に見えるが…
 実は相手の戦略によらず「自白」するのが各自の最適戦略!
 各人が合理的に選択する結果、(自白、自白)が実現!
 まさに、囚人の「ジレンマ」が起こってしまう…
B
A
黙秘 自白
黙秘 -1
-1
0
-5
自白 -5
0
-3
-3
インセンティブ設計の理論
囚人のジレンマ:注意点
2017年度61
 このゲームでは個々のプレーヤーが最適戦略を持つ
 【最適戦略(支配戦略)】 他のプレーヤーたちがどのような行
動を選択しても、自分がある特定の行動Aを選ぶことによって
利得が最大化されるとき、行動Aを「支配戦略」と呼ぶ。
 支配戦略の組み合わせは必ずナッシュ均衡になる!
 支配戦略が存在しないゲームもたくさんある
 各人の最適な意思決定 ≠ 全体にとっての効率性
 ナッシュ均衡が全体にとって望ましい結果(パレート効率的な
結果)をもたらすとは限らない!
 「アダム・スミスは間違っていた!」(映画『ビューティフル・マイ
ンド』のナッシュの台詞)を簡潔に体現している
インセンティブ設計の理論
囚人のジレンマの応用:価格競争
2017年度インセンティブ設計の理論62
【プレイヤー】 X社とY社が価格競争を行っている
【戦略】 価格を「据え置く」か「値下げ」の2つ
【利得】 利潤は次のように決まる
 両企業とも据え置きの場合にはともに 2 億円の利益
 両企業とも値下げの場に合はともに利益はゼロ
 X が値下げ、Y が現状価格だと
 X は 3 億円の利益、Y は 1 億円の損失
 Y が値下げ、X が現状価格だと
 Y は 3 億円の利益、X は 1 億円の損失
価格競争:利得表による分析
2017年度63
 (据え置き、据え置き)が2人にとって望ましい結果だが…
 実は相手の戦略によらず「値下げ」するのが各社の最適戦略!
 各社が合理的に選択する結果、(値下げ、値下げ)が実現!
 泥沼の「価格競争」から逃れることができない…
Y
X
据え置き 値下げ
据え置き 2
2
3
-1
値下げ -1
3
0
0
インセンティブ設計の理論
囚人のジレンマ:別の利得表
2017年度64
 それぞれのプレイヤーにとっての結果の望ましさ:
 (裏切、協力)>(協力、協力)>(裏切、裏切)>(協力、裏切)
プレイヤー2
プレイヤー1
協力 裏切り
協力 2
2
3
0
裏切り 0
3
1
1
インセンティブ設計の理論
囚人のジレンマの応用例
2017年度65
現象 プレイヤー 「協力」 「裏切り」
軍拡競争 国 軍縮 軍拡
国際貿易政策 国 関税引き下げ 税率据え置き
男女間の協力 カップル 相手に従う 相手に要求
公共財供給 地域住民 貢献/負担 ただ乗り
森林伐採 きこり 控えめに伐採 とれるだけ伐採
インセンティブ設計の理論
ゲームのルールが変わると…
2017年度66
 検事が司法取引を提示しなかったら、(黙秘、黙秘)が実現
 相手の戦略によらず「黙秘」するのが各自の最適戦略に
 検事が望んでいる結果=(自白、自白)は実現できない…
 司法取引によって初めて囚人の「ジレンマ」が起こる!
B
A
黙秘 自白
黙秘 -1
-1
-3
-3
自白 -3
-3
-3
-3
インセンティブ設計の理論
ゲーム理論を活用した制度設計
2017年度67
 人々に望ましい行動をとらせるためにゲームのルールを
変更するような実例はたくさんある!
 課徴金減免(リニエンシー)制度
 談合・カルテルを自己申告した企業に課徴金を減免
 インセンティブ契約
 業績に連動した人事制度や報酬体系
 マーケットデザイン
 オークション制度やマッチング・メカニズムへの実装
インセンティブ設計の理論
長期的関係
2017年度68
 以上の分析では、プレーヤーたちがゲームを一回だけプ
レーするという状況を扱ってきた
 現実には、同じ相手と同様のゲームを繰り返す場合がある
 繰り返しゲーム → 長期的関係を自然に描写できる
 囚人のジレンマで協力することができる場合がある!
 1回限りでは裏切るのが得 → 協調達成は不可能だった
 いったん裏切ると、協調関係が崩れて将来相手から協力して
もらえなくなる、という脅し(お仕置き)が有効に
 長期的な関係によって多様な結果が実現できるように
 契約を使っても同じ結果が実現できるかもしれないが…
インセンティブ設計の理論
長期的関係のメリット 契約のデメリット
2017年度69
契約は長期的関係と比べて以下の短所がある
 逸脱や裏切りを裁判所が見破ることは難しい
 そもそも「協力」の定義や意味合い自体が曖昧
 裏切り行為を当事者が立証するのはコストがかかる
 そもそも裁判所や契約を監督する第三者がいない場合
 例) 過去や途上国での経済活動、地球温暖化など
 短期的(近視眼的)な利益の追求と長期的な損失とのト
レードオフを分析する最善のツールが繰り返しゲーム!
インセンティブ設計の理論
繰り返しゲーム
2017年度70
 繰り返しゲームは同じプレーヤー達が同一のゲーム(「ステー
ジゲーム」と呼ぶ)をT回繰り返す
 Tが有限: 有限回繰り返しゲーム
 Tが無限: 無限回繰り返しゲーム
 プレーヤー達は過去のプレー(「歴史」と呼ぶ)をすべて観察
することができる
 「完全観測」(Perfect Monitoring)の仮定
 不完全観測のケースについては複雑なので扱わない…
 繰り返しゲーム全体の利得はどう定義するか
 有限回: ステージゲームの利得の和
 無限回: 将来利得の割引現在価値の和
インセンティブ設計の理論
2回繰り返し「囚人のジレンマ」
2017年度71
 2期目は実質的に通常の(1回だけの)囚人のジレンマ
 1期目にどうプレーしても、2期目の結果は(裏切り、裏切り)
 ゲームを後ろから解くと、毎期(裏切り、裏切り)が実現
 繰り返しても(協力、協力)は実現できない…
プレーヤー2
プレーヤー1
協力 裏切り
協力 2
2
3
-1
裏切り -1
3
0
0
インセンティブ設計の理論
有限回繰り返しゲーム
2017年度72
 動学ゲームの一種 → 後ろ(最終期)から解くべし!
1. 一番最後のステージゲームのナッシュ均衡を求める
2. その結果をもとに、最後から二番目のゲームを分析
3. 以下、順番に最初までさかのぼって全体のゲームの均衡
(これを「部分ゲーム完全均衡」と呼ぶ)を求める
 ステージゲームにナッシュ均衡が一つしかない場合
 毎期(それまでの歴史と関係なく)そのナッシュ均衡をプレーし
続けるのが、唯一の部分ゲーム完全均衡となる
 ステージゲームのナッシュ均衡が複数の場合
 様々な結果が均衡として実現できる → 詳しくは後述
インセンティブ設計の理論
世界の終わりが分かるとお金は使えない?
2017年度73
もしも世界がT期後に終わるとすると…
1. T期 → 次の期が無いので誰もお金を受け取らない
2. T-1期 → お金を受け取っても来期は絶対使えない
 実質的に今期が最終期 → 誰もお金を受け取らない
3. T-2期 → お金を受け取っても将来に使うことは無理
 やはり誰もお金を受け取ろうとしない
 以下、1期にさかのぼるまでこの議論は続く…
4. 世界の終わりが分かった瞬間に紙幣は紙くずに!?
インセンティブ設計の理論
有限回繰り返しゲームの罠
2017年度74
 Tはどんなに大きい数でも構わない
 いつかこの世界(人類の歴史)は終わる → Tは有限
 疑問) だとすると、今すぐお金が使えなくなるのでは?
 「有限の長さでゲームが終わる」のと「T期でゲームが終
わることが確実に分かっている」のは全く異なる状況
 ゲームを後ろから解くためには、プレーヤーたちがいつゲー
ムが終わるのかをお互いに正確に知っている必要がある
 知らない場合には、常に将来の可能性を考慮するはず!
 例) 今期裏切ったら、将来お仕置きされるかもしれない…
 実は「無限回繰り返しゲーム」として分析する方が適切
インセンティブ設計の理論
将来の価値を「割り引く」とは?
2017年度75
 無限回繰り返しゲームでは、将来の利得を「割り引く」
 来期の利得は、今期と比べて小さく(δ倍で)評価される
 この(1より小さい)δを「割引因子」(discount factor)と呼ぶ
 割引因子が大きい = 将来を重視(忍耐強い)
 割引因子が小さい = 現在を重視(刹那的?)
 さまざまな理由によって将来は割り引かれる
 利子の存在: 金銭リターンは利回りで調整して評価する
 主観的割引: 今すぐもらえる利得を将来の利得より重視する
 ゲーム終了リスク: ゲームが終わる危険性を考慮する
インセンティブ設計の理論
協力を達成するための条件
2017年度76
 次の形で定義される「トリガー戦略」を考える
 最初の期には(協力、協力)をプレーする
 過去に誰も裏切らない限り、(協力、協力)をプレーし続ける
 もしも誰かが裏切った場合には、次の期以降ずっと(その後に
何が起きようが)(裏切り、裏切り)をプレーし続ける
 協力を達成するためには、裏切りがもたらす将来の損失
が短期的な利益よりも大きくないといけない
3/12
1
1
...221...2223 22








インセンティブ設計の理論
無限回繰り返し「囚人のジレンマ」
2017年度77
 無限回の場合にはゲームに終わり(最終期)が無い
 うまくお仕置きの仕組みを作ると(協力、協力)が実現できる
 実は、これ以外の多様な行動パターンも実現できる
 これを「フォーク定理」と呼ぶ
プレーヤー2
プレーヤー1
協力 裏切り
協力 2
2
3
-1
裏切り -1
3
0
0
インセンティブ設計の理論
実現可能(?)な様々な行動パターン
2017年度インセンティブ設計の理論78
1. 奇数期は(協力、協力)、偶数期は(裏切り、裏切り)
2. 各期コインを投げて
 表が出たら(協力、裏切り)
 裏が出たら(裏切り、協力)
3. 最初のT期間は(裏切り、裏切り)、それ以降はずっと
(協力、協力)
4. 最初のT期間は(協力、協力)、それ以降はずっと(裏
切り、裏切り)
 (トリガー戦略を使って)部分ゲーム完全均衡で実現する
ための割引因子の範囲を求めてみよう!
トリガー戦略以外の“お仕置き”
2017年度インセンティブ設計の理論79
1. T期間(裏切り、裏切り)を続けて、それ以降は元の(協
力、協力)に戻る。もしも最初のT期内に逸脱があった
場合はまた最初からT期間(裏切り、裏切り)を続ける
2. 各期コインを投げて
 表が出たら(協力、裏切り)
 裏が出たら(裏切り、協力)
3. 最初に(協力、協力)をプレーして、2期目以降は前の
期に相手がとった戦略をプレーする
 「しっぺ返し(Tit for Tat)」戦略と呼ばれる
 部分ゲーム完全均衡でずっと(協力、協力)を実現する
ための割引因子の範囲を求めてみよう!
しっぺ返し戦略のインセンティブ条件
2017年度インセンティブ設計の理論80
 前期のプレーが(協力、裏切り)のとき
 しっぺ返し戦略に従い続けると
→ (裏切り、協力)、(協力、裏切り)、(裏切り、協力)…
 しっぺ返し戦略から(今期だけ)逸脱すると
→ (協力、協力)、(協力、協力)、(協力、協力)…
 前期のプレーが(協力、協力)のとき
 しっぺ返し戦略に従い続けると
→ (協力、協力)、(協力、協力)、(協力、協力)、…
 しっぺ返し戦略から(今期だけ)逸脱すると
→ (裏切り、協力)、(協力、裏切り)、(裏切り、協力)…
 両方の条件を同時に満たすことは不可能!
 「しっぺ返し」戦略は部分ゲーム完全均衡にならない
繰り返しゲームで実現しやすい行動
2017年度インセンティブ設計の理論81
 中途半端な協力よりも完全な協力の方が簡単!
 (協力、協力)を毎期続けるときに、必要な割引因子が最小に
 協力の度合いが下がると、逸脱せずに得られる期待利得も低
下する → (相対的に)逸脱するインセンティブが増大
 ユルいお仕置きよりも厳しいお仕置きの方が効果的!
 トリガー戦略が“協力”のために必要な割引因子を最小に
 一見するともっともらしい「しっぺ返し」戦略は実は…
 もしも不確実性が入った場合にはどうなるだろうか?
 相手の行動が不正確にしか観察できない
 一定の確率で自分の戦略を選び間違える
(ナッシュ回帰の)フォーク定理
2017年度82
 プレーヤーたちの割引因子が十分に大きい(将来をほと
んど割り引かない)とき、ステージゲームのナッシュ均衡
利得を(全員にとって)上回るすべての利得の組み合わ
せを、部分ゲーム完全均衡として達成することができる
 フォーク定理はトリガー戦略を使って証明できる
1. 目標とする利得を獲得できるような戦略をまずは計画する
2. この長期的な戦略から誰も逸脱しない限り、全員で計画に
従ってプレーを続ける
3. もしも誰かが逸脱した場合には、次の期以降ずっと(その
後に何が起きようが)ナッシュ均衡をプレーし続ける
インセンティブ設計の理論
フォーク定理のイメージ図
2017年度83
(2, 2)
(0, 0)
(-1, 3)
(3, -1)
実現可能な利得の集合
ナッシュ均衡
インセンティブ設計の理論
共有地の悲劇と共有地の統治
2017年度84
 一般に、共有資源(コモンズ)の管理は難しい
 各人に消費/利用し過ぎるインセンティブが発生
 例) 漁場の乱獲、森林破壊、環境汚染、温泉の枯渇
 「共有地の悲劇」(Tragedy of Commons)と呼ばれる
 伝統的な経済学による解決策
 私有化: 共有地を区切って私有化してしまう
 政府管理: 政府に直接管理を委ねて、利用料を適切に課す
 「共有地の統治」 by オストロム(2009年ノーベル賞)
 共有地を地元住民が(長期的関係を通じて)自分たちで統治
インセンティブ設計の理論

「ゲーム理論」講義スライド