Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

「ゲーム理論」講義スライド

9,376 views

Published on

2017年度に大阪大学で担当している講義
『インセンティブ設計の理論』
https://sites.google.com/site/yosukeyasuda2/home/lecture/incentive17
の「ゲーム理論」パート(全3回分)で使用した講義スライドです。扱っているトピックは以下です。
・みんなと同じ行動を取るのはなぜか ー 協調ゲーム
・結果にコミットして優位に立とう ー コミットメント
・人はなぜ協力するのか ー 繰り返しゲーム

Published in: Science
  • Hello! Get Your Professional Job-Winning Resume Here - Check our website! https://vk.cc/818RFv
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here

「ゲーム理論」講義スライド

  1. 1. ゲーム理論 「インセンティブ設計の理論」 安田洋祐 | 大阪大学大学院 経済学研究科 ( yosuke.yasuda@gmail.com ) 1 2017年度インセンティブ設計の理論
  2. 2. 協調ゲーム みんなと同じ行動を取るのはなぜか? 2017年度インセンティブ設計の理論2
  3. 3. 講義の狙い 2017年度3  同調行動(まわりに合わせた行動)について考えよう!  例:エスカレーターの並び方  大阪:右に並ぶ(左を空ける)  東京:左に並ぶ(右を空ける)  なぜ同調行動が起こるのか?  どんなメリット・デメリットがあるのか?  当事者目線に立つと世の中が見えてくる! インセンティブ設計の理論
  4. 4. 参考図書 2017年度4 第2章「なぜ人は行列に並ぶの か?[ゲーム理論]」(安田洋祐) インセンティブ設計の理論
  5. 5. 暮らしの中の駆け引き 2017年度5  経済学の考え方  各人が本人にとって望ましい選択肢を選ぶ  かっこ良く言うと → 「インセンティブに従う」  ゲーム理論の考え方  望ましい選択肢が相手の行動によって変わる!  戦略的な駆け引きを分析する道具 = ゲーム理論  同調行動  まわりと同じ行動を取るのが各人にとって望ましい  実際の例を見てみよう! インセンティブ設計の理論
  6. 6. 同調行動の例 2017年度6 1. 共同作業: どのパソコンを使うか? 2. デートの場所:どこに遊びに行くか? 3. いじめ問題:加担するかしないか? 4. SNS:どのサービスを使うか? 5. 行列:どの店に並ぶか? インセンティブ設計の理論
  7. 7. コーディネーションゲーム:利得表 2017年度7  共同作業のために新しいパソコンを購入する  相手と異なるOSでは全く意味がないとする  (Mac, Mac)の方が(Win, Win)よりも2人にとってベター 学生2 学生1 Windows Mac Windows 1 1 0 0 Mac 0 0 2 2 インセンティブ設計の理論
  8. 8. コーディネーションゲーム:分析1 2017年度8  相手(2)がWinを選んでくるなら  自分(1)もWinを購入するのが最適: 1 > 0 なので 学生2 学生1 Windows Mac Windows 1 1 0 0 Mac 0 0 2 2 インセンティブ設計の理論
  9. 9. コーディネーションゲーム:分析2 2017年度9  相手(2)がMacを選んでくるなら  自分(1)もMacを購入するのが最適: 2 > 0 なので 学生2 学生1 Windows Mac Windows 1 1 0 0 Mac 0 0 2 2 インセンティブ設計の理論
  10. 10. コーディネーションゲーム:解説1 2017年度10  最適な戦略(支配戦略)が存在しない!  相手がMacなら自分もMac、相手がWinなら自分もWinが得  最適な行動が相手の行動によって変化する!  個人の合理性だけからでは問題を解くことができない  意思決定理論・契約理論のようには問題が解けない  「ナッシュ均衡」を求めよう!  一見するとベストな結果(Mac, Mac)が選ばれそうだが…  まずはナッシュ均衡の定義を見てみよう! インセンティブ設計の理論
  11. 11. ナッシュ均衡の定義 2017年度11  プレーヤーたちの選択した行動の組がナッシュ均衡 であるとき 1. (すべてのプレーヤーにとって)自分一人だけが行動を 変更しても利得を上げることができない  安定的な状況をうまく描写できる 2. プレーヤー同士がお互いの行動を正しく予想してそれ に対して最適な行動を選択し合っている  合理的な結果の予測として優れている  数学的には全く同じ定義でも多様な解釈ができる! インセンティブ設計の理論
  12. 12. ナッシュ均衡の見つけ方:下線法1 2017年度12  各自が選べる大きい方の利得に下線を引いて行くと…  どちらの利得にも下線が引かれている => ナッシュ均衡  それ以外の戦略の組み合わせ => ナッシュ均衡ではない 学生2 学生1 Windows Mac Windows 1 1 0 0 Mac 0 0 2 2 インセンティブ設計の理論
  13. 13. ナッシュ均衡の見つけ方:下線法2 2017年度13  各自が選べる大きい方の利得に下線を引いて行くと…  どちらの利得にも下線が引かれている => ナッシュ均衡  それ以外の戦略の組み合わせ => ナッシュ均衡ではない 学生2 学生1 Windows Mac Windows 1 1 0 0 Mac 0 0 2 2 インセンティブ設計の理論
  14. 14. コーディネーションゲーム:解説2 2017年度14  このゲームには2つナッシュ均衡がある!  (Mac, Mac)と(Win, Win)のどちらもナッシュ均衡  コーディネーションゲームのように  (一般に)ナッシュ均衡は複数存在する場合がある  プレイヤー全員にとってあるナッシュ均衡よりも別のナッシュ 均衡の方が望ましい場合もある  良い均衡(Mac, Mac)ではなく悪い均衡(Win, Win)が選 ばれてしまう危険性がある  「コーディネーションの失敗」と呼ばれる  選ばれなかった選択肢・商品は市場から消えて行くことも… インセンティブ設計の理論
  15. 15. 神取ミクロ(図6.1) 2017年度インセンティブ設計の理論15
  16. 16. キー配列もコーディネーションの失敗!? 2017年度16 インセンティブ設計の理論
  17. 17. 男女の争い:利得表 2017年度17  妻(プレイヤー1)と夫(プレイヤー2)が休みの日にどこに 遊びに行くかをそれぞれ決定  別々の場所に行くのは2人にとって最悪  妻は遊園地、夫は野球観戦の方が好き 夫 妻 遊園地 野球 遊園地 1 2 0 0 野球 0 0 2 1 インセンティブ設計の理論
  18. 18. 男女の争い:下線法1 2017年度18  夫が遊園地を選ぶなら  妻も遊園地を選ぶのが最適: 2 > 0 なので  相手の選択に対して最適な利得に下線を付けると… 夫 妻 遊園地 野球 遊園地 1 2 0 0 野球 0 0 2 1 インセンティブ設計の理論
  19. 19. 男女の争い:下線法2 2017年度19  夫が遊園地を選ぶなら  妻も遊園地を選ぶのが最適: 2 > 0 なので  相手の選択に対して最適な利得に下線を付けると… 夫 妻 遊園地 野球 遊園地 1 2 0 0 野球 0 0 2 1 インセンティブ設計の理論
  20. 20. 男女の争い:解説 2017年度20  このゲームにもナッシュ均衡が2つ!  (遊園地、遊園地)と(野球、野球)のどちらもナッシュ均衡  今回は “良い”(“悪い”)均衡は存在しない  双方にとって「より望ましい均衡」というものがない!  状況が対称的でどちらの均衡が実現しそうか分からない  理論以外の要素 ーたとえば慣習や文化、規範などー に よってどちらのナッシュ均衡が選ばれるかが決まる  例)レディファースト → (遊園地、遊園地)  例)男社会(?) → (野球、野球) インセンティブ設計の理論
  21. 21. 鹿狩りゲーム:利得表 2017年度21  2人のハンターがどちらの獲物を狙うかを決める  鹿は2人で協力しないと捕えることができない  兎は自分1人でも必ず捕えることができる=安全な戦略 ハンター2 ハンター1 シカ ウサギ シカ 3 3 2 0 ウサギ 0 2 2 2 インセンティブ設計の理論
  22. 22. 鹿狩りゲーム:ナッシュ均衡 2017年度22  2人のハンターがどちらの獲物を狙うかを決める  鹿は2人で協力しないと捕えることができない  兎は自分1人でも必ず捕えることができる=安全な戦略 ハンター2 ハンター1 シカ ウサギ シカ 3 3 2 0 ウサギ 0 2 2 2 インセンティブ設計の理論
  23. 23. 鹿狩りゲーム:解説 2017年度23  このゲームには2つナッシュ均衡がある!  (シカ、シカ)(ウサギ、ウサギ)のどちらもナッシュ均衡  コーディネーションゲームの一種と考えられる  どちらの均衡の方がもっともらしい?  (シカ、シカ)は2人にとって望ましい効率的な均衡だが…  (ウサギ、ウサギ)の方が実現しやすい可能性がある  相手がランダムに戦略を選んでくる場合には  「シカ」よりも「ウサギ」を選ぶ方が(期待)利得が高い!  「ウサギ」=リスク支配戦略、(ウサギ、ウサギ)=リスク支配均衡  この例のように、リスク支配均衡が効率的とは限らない… インセンティブ設計の理論
  24. 24. 鹿狩りゲームの応用1:銀行取り付け 2017年度24  銀行が危ないという噂に対して預金者はどうするか  実際は健全経営なので、急な引き出しがなければ破綻しない  「引き出さない」→危険、「引き出す」→安全  みんなが「引き出す」と健全な銀行が破綻してしまう… 預金者2 預金者1 引き出さない 引き出す 引き出さない 2 2 1 -10 引き出す -10 1 0 0 インセンティブ設計の理論
  25. 25. 銀行取り付け:ナッシュ均衡 2017年度25  銀行が危ないという噂に対して預金者はどうするか  実際は健全経営なので、急な引き出しがなければ破綻しない  「引き出さない」→危険、「引き出す」→安全  みんなが「引き出す」と健全な銀行が破綻してしまう… 預金者2 預金者1 引き出さない 引き出す 引き出さない 2 2 1 -10 引き出す -10 1 0 0 インセンティブ設計の理論
  26. 26. 銀行取り付け:預金保護制度がある場合 2017年度26  銀行が破たんしても預金を保護すると…  仮に破たんしても預金者は損することが無い  「引き出さない」 → 危険なし、「引き出す」 → 意味がない  (引き出さない、 引き出さない)が唯一のナッシュ均衡に! 預金者2 預金者1 引き出さない 引き出す 引き出さない 2 2 1 2 引き出す 2 1 1 1 インセンティブ設計の理論
  27. 27. 預金保険制度の効果 2017年度27 インセンティブ設計の理論
  28. 28. 鹿狩りゲームの応用2:イジメ問題 2017年度28  クラスメートがいじめ問題に立ち向かえるか  どちらの生徒にとっても、いじめが解決するのがベスト  自分だけ「立ち向かう」といじめの標的になる危険がある  みんなが安全に「見ないフリ」をするといじめは無くならない… 生徒2 生徒1 立ち向かう 見ないフリ 立ち向かう 2 2 0 -10 見ないフリ -10 0 0 0 インセンティブ設計の理論
  29. 29. イジメ問題:ナッシュ均衡 2017年度29  クラスメートがいじめ問題に立ち向かえるか  どちらの生徒にとっても、いじめが解決するのがベスト  自分だけ「立ち向かう」といじめの標的になる危険がある  みんなが安全に「見ないフリ」をするといじめは無くならない… 生徒2 生徒1 立ち向かう 見ないフリ 立ち向かう 2 2 0 -10 見ないフリ -10 0 0 0 インセンティブ設計の理論
  30. 30. SNS選択:ネットワーク外部性 2017年度30 インセンティブ設計の理論 利用者数が増えるにつれて 財・サービスの利便性が向上 ↓ さらなる利用者増をもたらす! <ポジティブ・フィードバック>
  31. 31. レストランの行列:社会的学習 2017年度31  どちらのレストランを選ぶか?  個々の客はお店に関する不確実な情報を受け取る  自分の情報と混み具合を見てお店を決定!  果たして美味しいお店に行列はできるのか? おいしい 和食処 俺の ザ・和食 インセンティブ設計の理論
  32. 32. おさらい:同調行動の例 2017年度32 1. 共同作業: どのパソコンを使うか?  コーディネーション・ゲーム 2. デートの場所:どこに遊びに行くか?  男女の争い 3. いじめ問題:加担するかしないか?  鹿狩りゲーム 4. SNS:どのサービスを使うか?  ネットワーク外部性 5. 行列:どの店に並ぶか?  社会的学習の理論 インセンティブ設計の理論
  33. 33. コミットメント 結果にコミットして優位に立とう 2017年度インセンティブ設計の理論33
  34. 34. 動学的なゲーム:参入ゲーム 2017年度34  プレーヤーは2種類の企業  既存企業と(潜在的な)参入企業  まずはじめに参入企業がこの独占市場に「参入する」か「しな い」かを決定する  後者の場合ゲームはただちに終了  参入企業は 0、既存企業は 4 の利得を得る  前者の場合、既存企業が次の意思決定を行う  参入が起こった場合に既存企業は「価格競争」するか「しな い」かを決定する  前者の場合、両企業はそれぞれ -1 の損失を被る  後者の場合、両企業はそれぞれ 1 の利得を得る インセンティブ設計の理論
  35. 35. 「ゲームの木」による描写 2017年度35  参入ゲームは以下のような「木」として表現できる (0,4) (-1,-1) (1,1) 参入企業 独占企業 しない 参入する 価格競争 しない インセンティブ設計の理論
  36. 36. 利得表を書いて分析すると… 2017年度36  どちらの企業も戦略は2つずつ  参入企業が「しない」を選ぶと利得は確定する 独占企業 参入企業 価格競争 しない 参入する -1 -1 1 1 しない 4 0 4 0 インセンティブ設計の理論
  37. 37. もっともらしくないナッシュ均衡? 2017年度37  ふたつのナッシュ均衡が存在する  左下(しない、価格競争)はもっともらしい均衡か? 独占企業 参入企業 価格競争 しない 参入する -1 -1 1 1 しない 4 0 4 0 インセンティブ設計の理論
  38. 38. 動学ゲーム分析で気を付けること 2017年度38  時間を通じた動学ゲームにはナッシュ均衡が複数存在 する場合が多い → これ自体は問題ではないが…  一部の均衡が信憑性のない「から脅し」に依存している  ゲームを「後ろから解く」ことによって、信憑性のない均 衡をきちんと排除することができる!  「バックワード・インダクション(後方帰納法)」と呼ぶ  この考えを解概念としてフォーマルに一般化すると  「部分ゲーム完全均衡」となる(本講義では省略) インセンティブ設計の理論
  39. 39. バックワード・インダクション解 2017年度39 ( ,4) (-1, ) ( , ) 参入企業 独占企業 しない 参入 価格競争 しない インセンティブ設計の理論 もし参入が起きてし まった場合には、独 占企業は価格競争を 「しない」のが得!
  40. 40. 逐次手番ゲームの例:Not 25 2017年度40  2人のプレーヤーが交互に数字を数え上げていく  各プレーヤーは1~3個の連続した数字を数える  最後に25の数字を数えたプレーヤーが負け  「Not XX」は一昔前に結構流行ったゲーム(のハズ)  先手もしくは後手に必勝戦略(必勝法)はあるだろうか?  あるとしたらそれはいったいどんな戦略か?  ネタバレになってしまうので必勝法は講義で…  もしも数字が他の数だったらどのように必勝法は変わる? インセンティブ設計の理論
  41. 41. ツェルメロの定理と“必勝法” 2017年度41  どのような動学的な2人ゲームにおいても 1. 結果が「勝ち」か「負け」しかなく 2. プレイヤーが交互に行動を選択し 3. 過去のプレーをすべて観察することができ 4. 偶然の要素による影響が全くなく 5. 必ず有限回の手番でゲームが終わる のであれば、どちらかのプレイヤーに必ず必勝戦略がある  【必勝戦略】 相手がどんなプレーをしてきても、必ず自分が 最終的に勝利できるような(動学的な)戦略  上の条件を満たせば必勝法は必ず存在する!  オセロ、チェス、将棋、囲碁には必ず必勝戦略がある! インセンティブ設計の理論
  42. 42. ツェルメロの定理の注意点 2017年度42  結果が「勝ち」「負け」「引き分け」の場合には… 1. 先手に必勝戦略がある 2. 後手に必勝戦略がある 3. どちらのプレーヤーにも「最低でも引き分けに持ち込むこと ができる」ような戦略がある (例: 〇×ゲーム) のいずれかが必ず成り立つ  必勝戦略の求め方については何も教えてくれない  複雑なゲームで必勝戦略を求めるのは現実的には不可能  「必ず必勝法がある」ことと「必勝法が見つかる」は違う  オセロ(8×8)ですら、まだ先手・後手必勝どちらかは不明 インセンティブ設計の理論
  43. 43. 参入ゲーム:再考 2017年度43  いったん参入が起これば価格競争は起こらない  もし独占企業が事前に「価格競争」にコミットできたら… (0,4) (-1,-1) (1,1) 参入企業 独占企業 しない 参入 価格競争 しない インセンティブ設計の理論
  44. 44. 参入ゲームとコミットメント 2017年度44  事後的には(いったん参入が起こったら)最適な価格競 争「しない」を選ばないことにコミットすると… (0,4) (-1,-1) (1,1) 参入企業 独占企業 しない 参入 価格競争 しない インセンティブ設計の理論
  45. 45. 銀行の破綻処理 2017年度45  プレーヤーは銀行と政府  はじめに銀行が動き、次に政府が動く動学ゲーム  まず銀行が「乱脈経営」か「まじめ」な経営かを決定  後者の場合ゲームはただちに終了  銀行は 1、政府(国民)は 10 の利得を得る  前者の場合、政府が次の意思決定を行う  乱脈経営によって経営破綻の危機が起きると、政府は 「見放す」か「救済」するかを決定する  前者の場合、両者はそれぞれ -1 の損失を被る  後者の場合、両者はそれぞれ 2 の利得を得る インセンティブ設計の理論
  46. 46. 「ゲームの木」による描写 2017年度46  「銀行の破綻処理」問題のゲームの木 (1,10) (-1,-1) (2,2) 銀行 政府 まじめ 乱脈経営 見放す 救済 インセンティブ設計の理論
  47. 47. バックワード・インダクション 2017年度47  救済を予期して乱脈経営が無くならない… (1,10) (-1,-1) (2,2) 銀行 政府 まじめ 乱脈経営 見放す 救済 インセンティブ設計の理論
  48. 48. コミットメント 2017年度48  もし政府が救済しないことにコミットできると… (1,10) (-1,-1) (2,2) 銀行 政府 まじめ 乱脈経営 見放す 救済 インセンティブ設計の理論
  49. 49. 航空機の開発投資:国際貿易競争 2017年度49  このゲームには2つの(非対称)ナッシュ均衡が存在  B社にもしもコミットメント・パワーがあるとどうなるか?  もちろん、「投資する」にコミットするのが最適!  現実にはどのようなコミットメント装置が考えられるか? A社 ╲ B社 投資する しない 投資する -5 -5 10 -2 しない -2 10 0 0 インセンティブ設計の理論
  50. 50. 政府がゲームを変える:戦略的貿易政策 2017年度50  もしも政府がB社への補助金にコミットできたら?  B社が投資を行ったら、(結果によらず)5だけ補助金を出す  このような戦略的通商政策は結果を改善できる  B社にとって「投資する」のが支配戦略になる  (投資する、しない)はもはやナッシュ均衡ではない! A社 ╲ B社 投資する しない 投資する -5 0 10 -2 しない -2 15 0 0 インセンティブ設計の理論
  51. 51. コミットメントの具体例 2017年度51  家電量販店などの「最低価格保証」  他店よりも1円でも高い商品があれば値下げします  事後的には最適ではない「価格競争」にコミットすることにより、 ライバル店の値下げを牽制する効果が期待できる!  代理人(エージェント)へ交渉や仕事を依頼する  代理人には条件を譲歩する権限が無い  交渉の余地がないことをコミットすることができる  ソフトウェアの「オープンソース」化  市場を独占化しないことにコミットする  ユーザーが安心してそのソフトを使えるように インセンティブ設計の理論
  52. 52. 現在バイアス:自分との闘い 2017年度インセンティブ設計の理論52  目の前にある事柄を過大に評価してしまうバイアス  時間非整合な意思決定に陥ってしまう…  ダイエット中でも目の前のケーキを我慢できない  夏休みの宿題にギリギリまで取り掛かれない  お小遣いを月のはじめにすぐ使い切ってしまう  (事前の)計画通りに行動するためには、(事後的な)欲 求を抑え込むだけの自己抑制が必要  なかなか難しい かもしれないので… → 「結果にコミット」することで解決! → ナッジも有効!(年金加入など)
  53. 53. 時間非整合な意思決定 2017年度インセンティブ設計の理論53 A) 今すぐに1万円もらう B) 1カ月後に1万500円もらう ⇒ 現在バイアスが強い人はAを選ぶ C) 1年後に1万円もらう D) 1年1か月後に1万500円もらう ⇒ Aを選んだ人も多くはDを選ぶ Dを選んだ人に1年経ってから最初の質問をすると…
  54. 54. 現在バイアスを弱める工夫 2017年度インセンティブ設計の理論54 A) 今すぐに1万円もらう B) 1カ月後に1万500円もらう ⇒ この聞き方だとAを選ぶ人が多い C) 今すぐ1万円もらうけど、1カ月後は1円ももらえない D) 今すぐには1円ももらえないけど、1カ月後は1万500円 もらう ⇒ 自制的なDを選ぶ人が増える!
  55. 55. 繰り返しゲーム 人はなぜ協力するのか 2017年度インセンティブ設計の理論55
  56. 56. 囚人のジレンマ:ストーリー 2017年度56  AさんとBさんの2人がある犯罪容疑で逮捕された!  有罪にするだけの証拠がなく、検事は自白が頼り(焦)  そこで、次のような司法取引を容疑者に持ちかけた…  2人とも自白すれば、A、Bともに懲役3年  2人とも黙秘すれば、A、Bともに懲役1年  Aが自白、Bが黙秘すれば、Aは釈放、Bは懲役5年  Bが自白、Aが黙秘すれば、Bは釈放、Aは懲役5年  まず、このゲームを表の形でまとめてみよう!  プレイヤー、戦略、利得が一目で分かるようになる インセンティブ設計の理論
  57. 57. 囚人のジレンマ:利得表(/利得行列) 2017年度57  ここでは、懲役の年数(×マイナス)を利得に設定  (実は他の数字でも同じ「囚人のジレンマ」を表すことが可能) B A 黙秘 自白 黙秘 -1 -1 0 -5 自白 -5 0 -3 -3 インセンティブ設計の理論
  58. 58. 囚人のジレンマ:利得表による分析(1) 2017年度58  もしも相手(B)が黙秘を選んでいた場合には  自分(A)は自白を選ぶ方が得: 0 > -1 なので B A 黙秘 自白 黙秘 -1 -1 0 -5 自白 -5 0 -3 -3 インセンティブ設計の理論
  59. 59. 囚人のジレンマ:利得表による分析(2) 2017年度59  もしも相手(B)が自白を選んでいた場合には  自分(A)は自白を選ぶ方が得: -3 > -5 なので B A 黙秘 自白 黙秘 -1 -1 0 -5 自白 -5 0 -3 -3 インセンティブ設計の理論
  60. 60. 囚人のジレンマ:利得表による分析(3) 2017年度60  (黙秘、黙秘)が2人にとって望ましい結果に見えるが…  実は相手の戦略によらず「自白」するのが各自の最適戦略!  各人が合理的に選択する結果、(自白、自白)が実現!  まさに、囚人の「ジレンマ」が起こってしまう… B A 黙秘 自白 黙秘 -1 -1 0 -5 自白 -5 0 -3 -3 インセンティブ設計の理論
  61. 61. 囚人のジレンマ:注意点 2017年度61  このゲームでは個々のプレーヤーが最適戦略を持つ  【最適戦略(支配戦略)】 他のプレーヤーたちがどのような行 動を選択しても、自分がある特定の行動Aを選ぶことによって 利得が最大化されるとき、行動Aを「支配戦略」と呼ぶ。  支配戦略の組み合わせは必ずナッシュ均衡になる!  支配戦略が存在しないゲームもたくさんある  各人の最適な意思決定 ≠ 全体にとっての効率性  ナッシュ均衡が全体にとって望ましい結果(パレート効率的な 結果)をもたらすとは限らない!  「アダム・スミスは間違っていた!」(映画『ビューティフル・マイ ンド』のナッシュの台詞)を簡潔に体現している インセンティブ設計の理論
  62. 62. 囚人のジレンマの応用:価格競争 2017年度インセンティブ設計の理論62 【プレイヤー】 X社とY社が価格競争を行っている 【戦略】 価格を「据え置く」か「値下げ」の2つ 【利得】 利潤は次のように決まる  両企業とも据え置きの場合にはともに 2 億円の利益  両企業とも値下げの場に合はともに利益はゼロ  X が値下げ、Y が現状価格だと  X は 3 億円の利益、Y は 1 億円の損失  Y が値下げ、X が現状価格だと  Y は 3 億円の利益、X は 1 億円の損失
  63. 63. 価格競争:利得表による分析 2017年度63  (据え置き、据え置き)が2人にとって望ましい結果だが…  実は相手の戦略によらず「値下げ」するのが各社の最適戦略!  各社が合理的に選択する結果、(値下げ、値下げ)が実現!  泥沼の「価格競争」から逃れることができない… Y X 据え置き 値下げ 据え置き 2 2 3 -1 値下げ -1 3 0 0 インセンティブ設計の理論
  64. 64. 囚人のジレンマ:別の利得表 2017年度64  それぞれのプレイヤーにとっての結果の望ましさ:  (裏切、協力)>(協力、協力)>(裏切、裏切)>(協力、裏切) プレイヤー2 プレイヤー1 協力 裏切り 協力 2 2 3 0 裏切り 0 3 1 1 インセンティブ設計の理論
  65. 65. 囚人のジレンマの応用例 2017年度65 現象 プレイヤー 「協力」 「裏切り」 軍拡競争 国 軍縮 軍拡 国際貿易政策 国 関税引き下げ 税率据え置き 男女間の協力 カップル 相手に従う 相手に要求 公共財供給 地域住民 貢献/負担 ただ乗り 森林伐採 きこり 控えめに伐採 とれるだけ伐採 インセンティブ設計の理論
  66. 66. ゲームのルールが変わると… 2017年度66  検事が司法取引を提示しなかったら、(黙秘、黙秘)が実現  相手の戦略によらず「黙秘」するのが各自の最適戦略に  検事が望んでいる結果=(自白、自白)は実現できない…  司法取引によって初めて囚人の「ジレンマ」が起こる! B A 黙秘 自白 黙秘 -1 -1 -3 -3 自白 -3 -3 -3 -3 インセンティブ設計の理論
  67. 67. ゲーム理論を活用した制度設計 2017年度67  人々に望ましい行動をとらせるためにゲームのルールを 変更するような実例はたくさんある!  課徴金減免(リニエンシー)制度  談合・カルテルを自己申告した企業に課徴金を減免  インセンティブ契約  業績に連動した人事制度や報酬体系  マーケットデザイン  オークション制度やマッチング・メカニズムへの実装 インセンティブ設計の理論
  68. 68. 長期的関係 2017年度68  以上の分析では、プレーヤーたちがゲームを一回だけプ レーするという状況を扱ってきた  現実には、同じ相手と同様のゲームを繰り返す場合がある  繰り返しゲーム → 長期的関係を自然に描写できる  囚人のジレンマで協力することができる場合がある!  1回限りでは裏切るのが得 → 協調達成は不可能だった  いったん裏切ると、協調関係が崩れて将来相手から協力して もらえなくなる、という脅し(お仕置き)が有効に  長期的な関係によって多様な結果が実現できるように  契約を使っても同じ結果が実現できるかもしれないが… インセンティブ設計の理論
  69. 69. 長期的関係のメリット 契約のデメリット 2017年度69 契約は長期的関係と比べて以下の短所がある  逸脱や裏切りを裁判所が見破ることは難しい  そもそも「協力」の定義や意味合い自体が曖昧  裏切り行為を当事者が立証するのはコストがかかる  そもそも裁判所や契約を監督する第三者がいない場合  例) 過去や途上国での経済活動、地球温暖化など  短期的(近視眼的)な利益の追求と長期的な損失とのト レードオフを分析する最善のツールが繰り返しゲーム! インセンティブ設計の理論
  70. 70. 繰り返しゲーム 2017年度70  繰り返しゲームは同じプレーヤー達が同一のゲーム(「ステー ジゲーム」と呼ぶ)をT回繰り返す  Tが有限: 有限回繰り返しゲーム  Tが無限: 無限回繰り返しゲーム  プレーヤー達は過去のプレー(「歴史」と呼ぶ)をすべて観察 することができる  「完全観測」(Perfect Monitoring)の仮定  不完全観測のケースについては複雑なので扱わない…  繰り返しゲーム全体の利得はどう定義するか  有限回: ステージゲームの利得の和  無限回: 将来利得の割引現在価値の和 インセンティブ設計の理論
  71. 71. 2回繰り返し「囚人のジレンマ」 2017年度71  2期目は実質的に通常の(1回だけの)囚人のジレンマ  1期目にどうプレーしても、2期目の結果は(裏切り、裏切り)  ゲームを後ろから解くと、毎期(裏切り、裏切り)が実現  繰り返しても(協力、協力)は実現できない… プレーヤー2 プレーヤー1 協力 裏切り 協力 2 2 3 -1 裏切り -1 3 0 0 インセンティブ設計の理論
  72. 72. 有限回繰り返しゲーム 2017年度72  動学ゲームの一種 → 後ろ(最終期)から解くべし! 1. 一番最後のステージゲームのナッシュ均衡を求める 2. その結果をもとに、最後から二番目のゲームを分析 3. 以下、順番に最初までさかのぼって全体のゲームの均衡 (これを「部分ゲーム完全均衡」と呼ぶ)を求める  ステージゲームにナッシュ均衡が一つしかない場合  毎期(それまでの歴史と関係なく)そのナッシュ均衡をプレーし 続けるのが、唯一の部分ゲーム完全均衡となる  ステージゲームのナッシュ均衡が複数の場合  様々な結果が均衡として実現できる → 詳しくは後述 インセンティブ設計の理論
  73. 73. 世界の終わりが分かるとお金は使えない? 2017年度73 もしも世界がT期後に終わるとすると… 1. T期 → 次の期が無いので誰もお金を受け取らない 2. T-1期 → お金を受け取っても来期は絶対使えない  実質的に今期が最終期 → 誰もお金を受け取らない 3. T-2期 → お金を受け取っても将来に使うことは無理  やはり誰もお金を受け取ろうとしない  以下、1期にさかのぼるまでこの議論は続く… 4. 世界の終わりが分かった瞬間に紙幣は紙くずに!? インセンティブ設計の理論
  74. 74. 有限回繰り返しゲームの罠 2017年度74  Tはどんなに大きい数でも構わない  いつかこの世界(人類の歴史)は終わる → Tは有限  疑問) だとすると、今すぐお金が使えなくなるのでは?  「有限の長さでゲームが終わる」のと「T期でゲームが終 わることが確実に分かっている」のは全く異なる状況  ゲームを後ろから解くためには、プレーヤーたちがいつゲー ムが終わるのかをお互いに正確に知っている必要がある  知らない場合には、常に将来の可能性を考慮するはず!  例) 今期裏切ったら、将来お仕置きされるかもしれない…  実は「無限回繰り返しゲーム」として分析する方が適切 インセンティブ設計の理論
  75. 75. 将来の価値を「割り引く」とは? 2017年度75  無限回繰り返しゲームでは、将来の利得を「割り引く」  来期の利得は、今期と比べて小さく(δ倍で)評価される  この(1より小さい)δを「割引因子」(discount factor)と呼ぶ  割引因子が大きい = 将来を重視(忍耐強い)  割引因子が小さい = 現在を重視(刹那的?)  さまざまな理由によって将来は割り引かれる  利子の存在: 金銭リターンは利回りで調整して評価する  主観的割引: 今すぐもらえる利得を将来の利得より重視する  ゲーム終了リスク: ゲームが終わる危険性を考慮する インセンティブ設計の理論
  76. 76. 協力を達成するための条件 2017年度76  次の形で定義される「トリガー戦略」を考える  最初の期には(協力、協力)をプレーする  過去に誰も裏切らない限り、(協力、協力)をプレーし続ける  もしも誰かが裏切った場合には、次の期以降ずっと(その後に 何が起きようが)(裏切り、裏切り)をプレーし続ける  協力を達成するためには、裏切りがもたらす将来の損失 が短期的な利益よりも大きくないといけない 3/12 1 1 ...221...2223 22         インセンティブ設計の理論
  77. 77. 無限回繰り返し「囚人のジレンマ」 2017年度77  無限回の場合にはゲームに終わり(最終期)が無い  うまくお仕置きの仕組みを作ると(協力、協力)が実現できる  実は、これ以外の多様な行動パターンも実現できる  これを「フォーク定理」と呼ぶ プレーヤー2 プレーヤー1 協力 裏切り 協力 2 2 3 -1 裏切り -1 3 0 0 インセンティブ設計の理論
  78. 78. 実現可能(?)な様々な行動パターン 2017年度インセンティブ設計の理論78 1. 奇数期は(協力、協力)、偶数期は(裏切り、裏切り) 2. 各期コインを投げて  表が出たら(協力、裏切り)  裏が出たら(裏切り、協力) 3. 最初のT期間は(裏切り、裏切り)、それ以降はずっと (協力、協力) 4. 最初のT期間は(協力、協力)、それ以降はずっと(裏 切り、裏切り)  (トリガー戦略を使って)部分ゲーム完全均衡で実現する ための割引因子の範囲を求めてみよう!
  79. 79. トリガー戦略以外の“お仕置き” 2017年度インセンティブ設計の理論79 1. T期間(裏切り、裏切り)を続けて、それ以降は元の(協 力、協力)に戻る。もしも最初のT期内に逸脱があった 場合はまた最初からT期間(裏切り、裏切り)を続ける 2. 各期コインを投げて  表が出たら(協力、裏切り)  裏が出たら(裏切り、協力) 3. 最初に(協力、協力)をプレーして、2期目以降は前の 期に相手がとった戦略をプレーする  「しっぺ返し(Tit for Tat)」戦略と呼ばれる  部分ゲーム完全均衡でずっと(協力、協力)を実現する ための割引因子の範囲を求めてみよう!
  80. 80. しっぺ返し戦略のインセンティブ条件 2017年度インセンティブ設計の理論80  前期のプレーが(協力、裏切り)のとき  しっぺ返し戦略に従い続けると → (裏切り、協力)、(協力、裏切り)、(裏切り、協力)…  しっぺ返し戦略から(今期だけ)逸脱すると → (協力、協力)、(協力、協力)、(協力、協力)…  前期のプレーが(協力、協力)のとき  しっぺ返し戦略に従い続けると → (協力、協力)、(協力、協力)、(協力、協力)、…  しっぺ返し戦略から(今期だけ)逸脱すると → (裏切り、協力)、(協力、裏切り)、(裏切り、協力)…  両方の条件を同時に満たすことは不可能!  「しっぺ返し」戦略は部分ゲーム完全均衡にならない
  81. 81. 繰り返しゲームで実現しやすい行動 2017年度インセンティブ設計の理論81  中途半端な協力よりも完全な協力の方が簡単!  (協力、協力)を毎期続けるときに、必要な割引因子が最小に  協力の度合いが下がると、逸脱せずに得られる期待利得も低 下する → (相対的に)逸脱するインセンティブが増大  ユルいお仕置きよりも厳しいお仕置きの方が効果的!  トリガー戦略が“協力”のために必要な割引因子を最小に  一見するともっともらしい「しっぺ返し」戦略は実は…  もしも不確実性が入った場合にはどうなるだろうか?  相手の行動が不正確にしか観察できない  一定の確率で自分の戦略を選び間違える
  82. 82. (ナッシュ回帰の)フォーク定理 2017年度82  プレーヤーたちの割引因子が十分に大きい(将来をほと んど割り引かない)とき、ステージゲームのナッシュ均衡 利得を(全員にとって)上回るすべての利得の組み合わ せを、部分ゲーム完全均衡として達成することができる  フォーク定理はトリガー戦略を使って証明できる 1. 目標とする利得を獲得できるような戦略をまずは計画する 2. この長期的な戦略から誰も逸脱しない限り、全員で計画に 従ってプレーを続ける 3. もしも誰かが逸脱した場合には、次の期以降ずっと(その 後に何が起きようが)ナッシュ均衡をプレーし続ける インセンティブ設計の理論
  83. 83. フォーク定理のイメージ図 2017年度83 (2, 2) (0, 0) (-1, 3) (3, -1) 実現可能な利得の集合 ナッシュ均衡 インセンティブ設計の理論
  84. 84. 共有地の悲劇と共有地の統治 2017年度84  一般に、共有資源(コモンズ)の管理は難しい  各人に消費/利用し過ぎるインセンティブが発生  例) 漁場の乱獲、森林破壊、環境汚染、温泉の枯渇  「共有地の悲劇」(Tragedy of Commons)と呼ばれる  伝統的な経済学による解決策  私有化: 共有地を区切って私有化してしまう  政府管理: 政府に直接管理を委ねて、利用料を適切に課す  「共有地の統治」 by オストロム(2009年ノーベル賞)  共有地を地元住民が(長期的関係を通じて)自分たちで統治 インセンティブ設計の理論

×