Successfully reported this slideshow.
Your SlideShare is downloading. ×

Christoph Adami & Arend Hintze "Thermodynamics of evolutionary games" 進化ゲームの熱力学

Ad

Thermodynamics of evolutionary games
進化ゲームの熱力学
Author: Christoph Adami & Arend Hintze
sun_ek2
雑誌会 Journal club
1

Ad

著者
Christoph Adami
ミシガン州立大学 教授
Arend Hintze
ダーラナ大学 教授
(Adami研の元ポスドク)
2
引用元 https://mmg.natsci.msu.edu/people/faculty/adami...

Ad

掲載雑誌
• Physical Review E…統計・非線形・生物・ソフトマター物理学関係の論文
が掲載されている学術雑誌。
• Physical Reviewはアメリカ物理学会が発行する学術雑誌。Wikipediaによ
ると、物理学系の雑誌...

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Check these out next

1 of 63 Ad
1 of 63 Ad
Advertisement

Christoph Adami & Arend Hintze "Thermodynamics of evolutionary games" 進化ゲームの熱力学

  1. 1. Thermodynamics of evolutionary games 進化ゲームの熱力学 Author: Christoph Adami & Arend Hintze sun_ek2 雑誌会 Journal club 1
  2. 2. 著者 Christoph Adami ミシガン州立大学 教授 Arend Hintze ダーラナ大学 教授 (Adami研の元ポスドク) 2 引用元 https://mmg.natsci.msu.edu/people/faculty/adami-christoph-c/ 引用元 https://www.researchgate.net/profile/Arend-Hintze
  3. 3. 掲載雑誌 • Physical Review E…統計・非線形・生物・ソフトマター物理学関係の論文 が掲載されている学術雑誌。 • Physical Reviewはアメリカ物理学会が発行する学術雑誌。Wikipediaによ ると、物理学系の雑誌で最も権威があるらしい。Physical Reviewには、A ~E、Lettersなど色々な種類がある。 3 引用元 https://journals.aps.org/pre/abstract/10.1103/PhysRevE.97.062136
  4. 4. 導入 「協力」は、生命の進化を語る上で重要な要素。 • 進化というのは、短期的な利益に作用する。つまり自然選択は「今現 在・近未来の適応度」に従って行われる。 →協力的な個体が集まる集団で「裏切り」を行うと、コストを支払わずに 協力的な個体から利益を搾取することができる。裏切者の適応度が高くな る(協力のジレンマ)。 • 協力的なシステムを構築した方が将来的に個体の適応度が上昇するかも しれないが、現時点では「裏切者」の適応度の方が高い。自然選択は 「今現在・近未来の適応度」に従って行われるので、協力的な系は淘汰 されるだろう。 →しかし、自然界には協力的な系が数多くみられる。 4
  5. 5. 導入 なぜ、自然界では協力的な系が維持されているのか? • 数学や計算機によるシミュレーションを用いた研究が行われてきた。 →色々な条件下で協力が維持されることが分かってきた。 • 数学を用いた研究の場合、閉形式解(加減乗除、初等関数の合成関数で 表される解)を得ることで、進化ダイナミクスを詳しく知ることができ る。 →しかし、そのような解を得るのは難しい。 5
  6. 6. 目的・手法 ●目的:いくつかの進化ゲーム(囚人のジレンマ、罰なし・罰ありの公共 財ゲーム)上で繰り広げられる協力と裏切りのダイナミクスを記述する閉 形式解を求める。 →進化ゲームを支配しているパラメータをどこまで動かしたら集団の性質 が「協力」から「裏切り」へ、「裏切り」から「協力」へ遷移するのか? 「協力」と「裏切り」(集団の性質)の「臨界点」はどこ? ●手法:Ising模型(イジングモデル)を使って、進化ゲームを「解析的」 に研究する。 [先行研究など] • SzabóとHauert…Ising模型に見られる数学的な手法を用い、「シミュレー ション」によって、進化ゲームを研究した。 • SzabóとBorsos…進化ゲームとIsingモデルの関係性をレビュー論文で言及 した。 6
  7. 7. Ising模型(イジングモデル) ●Ising模型(イジングモデル)…(量子)統計力学・量子力学・量子情報 の本などで出てくるモデル。二つの配位状態をとる格子点から構成され、 最隣接する格子点のみの相互作用を考慮する(Wikipediaより)。 • 二つの配位状態…上向きと下向きのスピン。 • 格子点…原子。 • 相互作用…スピン相互作用。 …という設定のもと、Ising模型は磁性体の 理論モデルとしてよく使われる。 ●量子アニーリング型の量子コンピュータ … Ising模型のようなもの(格子:導線、スピンを持つ原子:閉回路、スピ ン間相互作用:導線に流れる電流で制御)を構築し、それを使って、計算 を行っている。 →D-Wave Systemsが世界で初めて商用の量子アニーリング型の量子コン ピュータを開発し、現在販売中。 7
  8. 8. 理論に入る前に • 真面目に理論の説明をすると途方もない時間がかかってしまうので、こ の発表では、かなり省略します。 • 理論の細かい話は、スライドでちゃんとやっているので、興味がある人 は、後で各々、確認してください。 • 一応、このスライドに載せてある数式は全て説明できるので、細かめの 質問があれば、後で個別にしてください。 8 • このスライドに出てくる数式や理論展開は、量子 情報でよく見られるものです。そのため、量子情 報の本を読むと、このスライドはスラスラと理解 できると思います。 • おすすめの本は、 佐川 弘幸・吉田 宣章 「量子情報理論」
  9. 9. 本論文でやっていること 進化ゲームを一次元Ising模型に落とし込んで、協力と裏切りの臨界点を記 述する閉形式解を求める。 1. 上向きのスピンを協力者、下向きのスピンを裏切者とする。 2. 進化ゲームの利得行列をエネルギーと見なす。 3. 進化ゲームの問題設定に合うハミルトニアン(エネルギー演算子)を 構築する。 4. 「ヘルムホルツの自由エネルギーが最小になる=進化ゲームが平衡状 態になる」と考える。 5. 進化ゲームが平衡状態にあるときのスピンの期待値を求める。 →スピンの期待値は、どの程度、集団が協力・裏切りの性質を持っている か表している。1に近づくほど、協力の性質を持っていて、-1に近づくほ ど、裏切りの性質を持っている。 →スピンの期待値が0になる点が協力と裏切りの臨界点。 9
  10. 10. 概要 囚人のジレンマ • AとBが共同で犯罪を犯し、警察に逮捕され、取り調べが行われた。 →囚人Aにとって最善の選択肢はどれ? 【囚人Aの利得行列】 • 囚人Aにとって、囚人Bが犯人だと供述するのは最適な戦略。囚人Bがど のような行動を取ろうが、刑は軽くなる。囚人Bも同様に、囚人Aが犯人 だと供述するのは最適な戦略。 • 囚人A、Bの双方にとって最適に戦略は、お互いに黙秘すること。囚人た ちは、それぞれ自身の利得が大きくなる戦略を選んだが、結果的にそれ は最適ではなかった。 →囚人のジレンマ 10 黙秘 囚人Aが犯人だと供述 黙秘 禁固刑1年 禁固刑10年 囚人Bが犯人だと供述 釈放 禁固刑7年 囚人Bの行動
  11. 11. ハミルトニアン構築 囚人のジレンマ • 利得行列を書き換える。 ※b > c > 0. b > r. 0 > -c. 11 黙秘 囚人Aが犯人だと供述 黙秘 禁固刑1年 禁固刑10年 囚人Bが犯人だと供述 釈放 禁固刑7年 囚人Bの行動 協力 裏切り 協力 r (=b-c) -c 裏切り b 0 𝑃 = 𝑟 𝑐 𝑏 0
  12. 12. ハミルトニアン構築 囚人のジレンマ • 変換した利得行列からハミルトニアンを構築する。 • 論文には、「ハミルトニアンを定義するには、利得行列の最大値から各 成分を引いたものをエネルギーとしなければいけないが、スピンの期待 値を算出するときにそれらは式からキャンセルアウトされるので、別に 利得行列をそのままハミルトニアンに使ってもいい」と書かれていたが、 それだと上手くいかない。 • 「利得が高い戦略の方が採用されやすい」という問題を「エネルギーが 低い状態の方が取りやすい」というモデルで解くので、利得行列の符号 を反転する必要がある。 • 別に最大値から引く必要性はないので、それは行わない。 12
  13. 13. ハミルトニアン構築 囚人のジレンマ 【ゲーム問題設定】 1. i番目の個体は、i+1番目の個体と協力するか、裏切るかを選ぶ。 2. これをi+1番目とi+2番目、i+2番目とi+3番目…という具合に続ける。n番 目の個体は1番目の個体と協力するか、裏切るかを選ぶ。 3. 利得行列をもとにして構築したハミルトニアンを進化ゲームの状態に 作用させると、ゲーム全体のエネルギーを求めることができる。 ※先の理由により、論文では 𝑷 = 𝑬だが、このスライドでは𝑷 = −𝑬。 13 一次元のIsing模型 進化ゲームの利得行列 𝑷 = 𝑟 −𝑐 𝑏 0 進化ゲームのエネルギー行列 𝑬 = −𝑟 𝑐 −𝑏 0 i 協力 E=-r i+1 協力 E=-c i+2 裏切り E=-b
  14. 14. ハミルトニアン構築 囚人のジレンマ • i番目の個体が協力している状態、裏切っている状態を次のようにおく。 協力 𝑖 = 0 𝑖 = 1 0 𝑖 . 裏切り 𝑖 = 1 𝑖 = 0 1 𝑖 . 協力 𝑖 † = 0 𝑖 = 1 0 𝑖. 裏切り 𝑖 † = 1 𝑖 = 0 1 𝑖. • ハミルトニアンは、 𝐻 = 𝑖=1 𝑁 𝑚,𝑛=0 1 𝑬𝑚,𝑛 𝑚 𝑖 𝑚 𝑖 ⊗ 𝑛 𝑖+1 𝑛 𝑖+1 • 例えば、i番目の個体が協力していて、i+1番目の個体が裏切っている状 態 0 𝑖 ⊗ 1 𝑖+1のエネルギーは、 𝐻 0 𝑖 ⊗ 1 𝑖+1 = 𝑚,𝑛=0 1 𝐸𝑚,𝑛 𝑚 𝑖 𝑚 𝑖 0 𝑖 ⊗ 𝑛 𝑖+1 𝑛 𝑖+1 1 𝑖 𝐸0,1 0 𝑖 0 𝑖 0 𝑖 ⊗ 1 𝑖+1 1 𝑖+1 1 𝑖 = 𝐸0,1 0 𝑖 ⊗ 1 𝑖+1 𝐻 0 𝑖 ⊗ 1 𝑖+1 = c 0 𝑖 ⊗ 1 𝑖+1 • 0 𝑖 ⊗ 1 𝑖+1にハミルトニアンを作用させると、無事に固有値cが得られ る。他の状態も同様。 14
  15. 15. 分配関数の導出 囚人のジレンマ • カノニカルアンサンブルからランダムにサンプリングを行い、エネル ギー𝐸αの状態αを得ることができる確率は、 𝑝α = 𝑒−β𝐸α 𝑍 . 𝑍 = 𝑥 𝑒−β𝐸𝑥 • ここで、進化ゲームのある状態𝑥を以下のようにおく。 𝑚は0(協力)、 もしくは、1(裏切り)をとる。 𝑥 = 𝑚 ⊗𝑛 = 𝑚 1 ⊗ 𝑚 2 ⊗ ⋯ ⊗ 𝑚 𝑛−1 ⊗ 𝑚 𝑛 • 進化ゲームもカノニカルアンサンブルからのサンプリングと同様に考え ることができる。 𝑝α = α 𝑒−β𝐻 α 𝑍 𝑍 = 𝑥 𝑒−β𝐸𝑥 = 𝑥 𝑥 𝑒−β𝐻 𝑥 = 𝑇𝑟 𝑒−β𝐻 15
  16. 16. 分配関数の導出 囚人のジレンマ • 式(3),(4),(8)とは違う方法で、分配関数を求める。 • 下向きのスピンの1つが反転すると、反転したスピンの右・左隣のスピ ンの向きに関係なく、エネルギーが𝑏 − 𝑐減少する。 • スピン反転による影響は、右隣・反転したスピンにしか及ばない。 16 エネルギー: 0 エネルギー: -(b-c) エネルギーがb-c減少 エネルギー: -(b-c) エネルギー: -2(b-c) エネルギーがb-c減少 エネルギー: -(b-c) エネルギー: -2(b-c) エネルギーがb-c減少 エネルギーがb-c減少 エネルギー: -2(b-c) エネルギー: -3(b-c)
  17. 17. 分配関数の導出 囚人のジレンマ • 上向きのスピンが1つ増えるたびにスピンの配置に依存せず、エネルギーが 𝑏 − 𝑐減少するので、N個の下向きのスピンのうち、k個のスピンが反転する と、エネルギーは0から−𝑘 𝑏 − 𝑐 となる。 • N個の下向きのスピンのうち、k個のスピンが反転している状態 𝑥 は、𝑁𝐶𝑘個 あるので、分配関数は、以下のようになる。 𝑍 = 𝑘=0 𝑁 𝑁𝐶𝑘𝑒kβ 𝑏−𝑐 = 𝑘=0 𝑁 𝑁𝐶𝑘 𝑒β𝑟 𝑘 = 1 + 𝑒β𝑟 𝑁 • 論文では、利得行列をそのまま使っているのに対し、このスライドでは利得 行列の符号を反転させたものを使っているので、eの肩の符号は反対だが、 それ以外は論文で示されている分配関数と同じものが得られた。 17
  18. 18. 𝑥 𝑥 𝐽𝑧𝑒−β𝐻 𝑥 の導出 囚人のジレンマ • i番目の状態にパウリ行列σ𝑍 𝑖 を作用させると、スピンの向きが固有値として 出てくる。 σ𝑍 𝑖 𝑚 𝑖 = 𝑚 𝑚 𝑖 𝑚 = ±1 • 集団全体のスピンは、以下の演算子を使えば、求められる。 𝐽𝑧 = 𝑖=0 𝑁 σ𝑍 𝑖 • 進化ゲームが平衡状態に落ち着いたときの集団全体のスピンの期待値は、 𝐽𝑧 β = 1 Z 𝑥 𝑥 𝐽𝑧𝑒−β𝐻 𝑥 • 分配関数Zは先ほど求めたので、式(9) とは違う方法で、残り 𝑥 𝑥 𝐽𝑧𝑒−β𝐻 𝑥 を求める。 18
  19. 19. 𝑥 𝑥 𝐽𝑧𝑒−β𝐻 𝑥 の導出 囚人のジレンマ • 集団全体のスピンの向きを求める演算子𝐽𝑧は、以下のように書き表すこ とができる。 𝐽𝑧 = 𝑖=0 𝑁 0 𝑖 0 𝑖 − 1 𝑖 1 𝑖 • 簡単のため、 0 𝑖 0 𝑖と 1 𝑖 1 𝑖を分けて考える。また、𝐽𝑧と𝑒−β𝐻の交換関 係は、 𝐽𝑧, 𝑒−β𝐻 = 0なので、 𝑥 𝑥 𝐽𝑧𝑒−β𝐻 𝑥 = 𝑥 𝑥 𝑖=0 𝑁 𝑒−β𝐻 0 𝑖 0 𝑖 𝑥 − 𝑥 𝑥 𝑖=0 𝑁 𝑒−β𝐻 1 𝑖 1 𝑖 𝑥 19
  20. 20. 𝑥 𝑥 𝐽𝑧𝑒−β𝐻 𝑥 の導出 囚人のジレンマ • N個の下向きのスピンのうち、k個のスピンが反転している状態 𝑥 は、 𝑁𝐶𝑘個ある。そして、ある 𝑥 に 𝑖=0 𝑁 0 𝑖 0 𝑖を左から作用させると、k個 の状態が得られる。つまり、 𝑥,𝑘 𝑖=0 𝑁 0 𝑖 0 𝑖 𝑥 の項の数は、 k × 𝑁𝐶𝑘個 • 状態 𝑥 のエネルギーは、前のスライドで説明した通り、 −krなので、 𝑥 𝑥 𝑖=0 𝑁 𝑒−β𝐻 0 𝑖 0 𝑖 𝑥 = 𝑘=0 𝑁 𝑘 𝑁𝐶𝑘 𝑒β𝑟 𝑘 • ここで、 1 + 𝑥 𝑁 を𝑥で微分する。 1 + 𝑥 𝑁 = 𝑘=0 𝑁 𝑁𝐶𝑘𝑥𝑘 𝑁 1 + 𝑥 𝑁−1 = 𝑘=0 𝑁 𝑘 𝑁𝐶𝑘𝑥𝑘−1 20
  21. 21. 𝑥 𝑥 𝐽𝑧𝑒−β𝐻 𝑥 の導出 囚人のジレンマ • 両辺を𝑥倍し、 𝑥に𝑒β𝑟を代入すると、 𝑁𝑥 1 + 𝑥 𝑁−1 = 𝑘=0 𝑁 𝑘 𝑁𝐶𝑘𝑥𝑘 𝑁𝑒β𝑟 1 + 𝑒β𝑟 𝑁−1 = 𝑘=0 𝑁 𝑘 𝑁𝐶𝑘 𝑒β𝑟 𝑘 𝑥 𝑥 𝑖=0 𝑁 𝑒−β𝐻 0 𝑖 0 𝑖 𝑥 = 𝑁𝑒β𝑟 1 + 𝑒β𝑟 𝑁−1 21
  22. 22. 𝑥 𝑥 𝐽𝑧𝑒−β𝐻 𝑥 の導出 囚人のジレンマ • N個の下向きのスピンのうち、k個のスピンが反転している状態 𝑥 は、 𝑁𝐶𝑘個ある。そして、ある 𝑥 に 𝑖=0 𝑁 1 𝑖 1 𝑖を左から作用させると、k個 の状態が得られる。つまり、 𝑥,𝑘 𝑖=0 𝑁 1 𝑖 1 𝑖 𝑥 の項の数は、 𝑁 − k × 𝑁𝐶𝑘個 • 状態 𝑥 のエネルギーは、前のスライドで説明した通り、 −krなので、 𝑥 𝑥 𝑖=0 𝑁 𝑒−β𝐻 1 𝑖 1 𝑖 𝑥 = 𝑘=0 𝑁 𝑁 − k 𝑁𝐶𝑘 𝑒β𝑟 𝑘 = 𝑁 1 + 𝑒β𝑟 𝑁 − 𝑁𝑒β𝑟 1 + 𝑒β𝑟 𝑁−1 = 𝑁 1 + 𝑒β𝑟 𝑁−1 • よって、 𝑥 𝑥 𝐽𝑧𝑒−β𝐻 𝑥 = 𝑁𝑒β𝑟 1 + 𝑒β𝑟 𝑁−1 − 𝑁 1 + 𝑒β𝑟 𝑁−1 = 𝑁 𝑒β𝑟 − 1 1 + 𝑒β𝑟 𝑁−1 22
  23. 23. 集団の協力の度合いを導出 囚人のジレンマ • 集団全体のスピンの期待値(協力の度合い)は、 𝐽𝑧 β = 1 Z 𝑥 𝑥 𝐽𝑧𝑒−β𝐻 𝑥 = 𝑁 𝑒β𝑟 − 1 1 + 𝑒β𝑟 𝑁−1 1 + 𝑒β𝑟 𝑁 𝐽𝑧 β = 𝑁 𝑒β𝑟 − 1 1 + 𝑒β𝑟 = 𝑁 𝑒 β𝑟 2 − 𝑒− β𝑟 2 𝑒 β𝑟 2 + 𝑒− β𝑟 2 𝐽𝑧 β = 𝑁 tanh β𝑟 2 …論文だと、 𝐽𝑧 β = −𝑁 tanh β𝑟 2 になっている。論文では利得行列をハ ミルトニアンに使っていたが、このスライドでは利得行列の符号を反転し て(利得が高い⇒エネルギーが低い)、ハミルトニアンの構築を行った。 どちらが正しい?:𝑁 tanh β𝑟 2 ? − 𝑁 tanh β𝑟 2 ? 23
  24. 24. 論文の結果の検証 囚人のジレンマ • 論文で導出された 𝐽𝑧 β = −𝑁 tanh β𝑟 2 のグラフを描くと左図(FIG. 1) のようになる。縦軸が 𝐽𝑧 βとなっているが、正しくは 𝐽𝑧 β N。 • 本論文FIG. 1のキャプションで引用されていた文献のFig. 1は右図。二次 元格子上で進化ゲーム(囚人のジレンマ)のシミュレーションを行った 結果。縦軸は、本論文FIG. 1の 𝐽𝑧 βに対応している。 24 ↓Ref. [14] Fig. 1 Ref. [14] C. Hauert and G. Szabó, Game theory and physics, Am. J. Phys. 73, 405 (2005).
  25. 25. 論文の結果の検証 囚人のジレンマ • 左図は、rが大きくなるほど、 𝐽𝑧 β(正しくは 𝐽𝑧 β N)の値が-1に近づい ている。 →rが大きくなるほど、集団内で裏切りを行う個体の割合が増える。 • 右図は、rが大きくなるほど、協力者の頻度が下がり、裏切者の頻度が上 がっている。 →一見、両者の結果は一致しているようだが…。 25 ↓Ref. [14] Fig. 1 Ref. [14] C. Hauert and G. Szabó, Game theory and physics, Am. J. Phys. 73, 405 (2005). 裏切者 協力者
  26. 26. 論文の結果の検証 囚人のジレンマ • 左図の𝑟は、r = 𝑏 − 𝑐と定義されているが、右図の𝑟は、 r = 𝑐 𝑏−𝑐 と定義 されている。 →左図のrと右図のrは、 𝑏と𝑐の変化に「真逆」の応答を示す。 • そのため、両者のグラフは同じことを言っているように見えるが、実は 左のFIG. 1と左図が引用した論文のFig. 1は、真逆のことを言っている。 26 ↓Ref. [14] Fig. 1 Ref. [14] C. Hauert and G. Szabó, Game theory and physics, Am. J. Phys. 73, 405 (2005). 裏切者 協力者
  27. 27. 論文の結果の検証 囚人のジレンマ 1. 左図は1次元の進化ゲームの閉形式解のグラフで、右図は2次元の進化 ゲームのシミュレーション結果のグラフ。両者は次元が違う。 →次元が変わると結果が真逆になるとは、この問題設定では考えにくい。 2. この後に本論文で出てくる公共財ゲームの閉形式解は、+ tanh 𝑥 とい う形をしている。 →公共財ゲームは、囚人のジレンマを一般化した進化ゲーム。そのため、 公共財ゲームの閉形式解と囚人のジレンマの閉形式解の符号が逆になると は考えにくい。 3. 裏切りは、Nash均衡なので、集団内の個体が自由に相互作用できて、 空間的な制約がない場合、集団は裏切者だらけになる。これは引用さ れていた”Game theory and physics”でも述べられている。 →格子上での進化ゲームといった個体に空間的な制約が課せられた条件で は、協力者も生き延びることができると、同じく引用論文に述べられてい た。 27
  28. 28. 論文の結果の検証 囚人のジレンマ 4. Ising模型を用いた進化ダイナミクスは、系全体の自由エネルギーを最小化 させるように個々のスピンの向きが変化する。 → 𝑏 → ∞, 𝑐 → 0とすると r → ∞となる。こうなると、明らかに協力という選択 を採用した方が、圧倒的に系全体のエネルギーは小さくなる。つまり、 r → ∞の極限において、 𝐽𝑧 β → 1になるべき。 • これらの理由により、本論文で定義されたr = 𝑏 − 𝑐 が大きくなると、 𝐽𝑧 β (正しくは 𝐽𝑧 β N)は-1ではなく、1に近づかなくてはいけない。 →これを満たすのは、 𝐽𝑧 β = −𝑁 tanh β𝑟 2 ではなく、 𝐽𝑧 β = 𝑁 tanh β𝑟 2 28
  29. 29. 概要 公共財ゲーム • 先ほどと同様に一次元の進化ゲーム。i番目の個体は、i-1番目の個体と i+1番目の個体、そして自身の状態に従って、利得を獲得する。 • i番目の個体が協力者の場合、その利得は、 Π𝐶 = 𝑟 𝑘 + 1 𝑁𝐶 + 1 − 1 →先ほど𝑟は、 𝑟 = 𝑏 − 𝑐と定義されていたが、ここでは𝑟 = 𝑏だと思う。 𝑐 にあたる部分がΠ𝐶の最後の1。𝑁𝐶は、両隣にいる協力者の数。両隣とも協 力者の場合、𝑁𝐶 = 2となる。 𝑘 + 1はグループの大きさ。今回の場合、両 隣+自分の3人グループを考えているので、 𝑘 + 1 = 3。 • i番目の個体が裏切者の場合、その利得は、 ΠD = 𝑟 𝑘 + 1 𝑁𝐶 →Π𝐶の 𝑁𝐶 + 1 は、自身を含めた近隣の協力者の数を表している。i番目の 個体が裏切者の場合、自身を含めた近隣の協力者の数は𝑁𝐶。裏切者は、協 力のコストを支払わなくてもよいので、Π𝐶とは違い、1を引かれない。先 ほどと同様に、 𝑘 + 1 = 3。 29
  30. 30. 概要 公共財ゲーム • i番目が協力者である場合と、裏切者の裏切者である場合の利得行列は、 𝜫𝑪 = 𝑟 − 1 2 3 𝑟 − 1 2 3 𝑟 − 1 1 3 𝑟 − 1 𝜫𝑫 = 2 3 𝑟 1 3 𝑟 1 3 𝑟 0 →1行目、2行目はi-1番目が協力者、裏切者である場合の利得。1列目、2列 目はi+1番目が協力者、裏切者である場合の利得。例えば、1行2列目は、i-1 番目が協力者でi+1番目が裏切者だった場合にi番目の個体が得られる利得。 30
  31. 31. ハミルトニアン構築 公共財ゲーム • 行列要素の最大値からそれぞれの成分を引くことにより、利得行列から エネルギー行列を求める。 𝑬 𝟎 = 0 1 3 𝑟 1 3 𝑟 2 3 𝑟 𝑬 𝟏 = 1 3 𝑟 − 1 2 3 𝑟 − 1 2 3 𝑟 − 1 𝑟 − 1 • ハミルトニアンは、 𝐻 = 𝑖=1 𝑁 𝑚,𝑛,𝑙=0 1 𝑬𝑚,𝑛 𝑙 𝑚 𝑖−1 𝑚 𝑖−1 ⊗ 𝑙 𝑖 𝑙 𝑖 ⊗ 𝑛 𝑖+1 𝑛 𝑖+1 * 𝑖 = Nの次は𝑖 = 1となる。 • i番目の協力者が裏切者になると、状態がどうであれ、i-1番目、i+1番目 のエネルギーは、 1 3 𝑟だけ増加する。一方で、i番目のエネルギーは、 1 3 𝑟 − 1だけ増加する。つまり、裏切者が1人増えると系のエネルギーは、𝑟 − 1 だけ増加する。 31
  32. 32. 分配関数の導出 公共財ゲーム • 分配関数𝑍 、 𝑥 𝑥 𝐽𝑧𝑒−β𝐻 𝑥 は、囚人のジレンマの時と同じように考え れば導出することができる。ただし、囚人のジレンマとは違い、N個の 上向きのスピンから考える( 0 ⊗Nはエネルギーが0なので、ここを起点 にすると計算が楽になる)。 • N個の上向きのスピンのうち、k個のスピンが反転している状態 𝑥 は、 𝑁𝐶𝑘個あるので、分配関数は、以下のようになる。 𝑍 = 𝑘=0 𝑁 𝑁𝐶𝑘𝑒−kβ 𝑟−1 = 𝑘=0 𝑁 𝑁𝐶𝑘 𝑒−β 𝑟−1 𝑘 = 1 + 𝑒−β 𝑟−1 𝑁 • 𝑥 𝑥 𝐽𝑧𝑒−β𝐻 𝑥 は、2つに分解することができる。 𝑥 𝑥 𝐽𝑧𝑒−β𝐻 𝑥 = 𝑥 𝑥 𝑖=0 𝑁 𝑒−β𝐻 0 𝑖 0 𝑖 𝑥 − 𝑥 𝑥 𝑖=0 𝑁 𝑒−β𝐻 1 𝑖 1 𝑖 𝑥 32
  33. 33. 分配関数の導出 公共財ゲーム • N個の上向きのスピンのうち、k個のスピンが反転している状態 𝑥 は、 𝑁𝐶𝑘個ある。そして、ある 𝑥 に 𝑖=0 𝑁 1 𝑖 1 𝑖を左から作用させると、k個 の状態が得られる。つまり、 𝑥,𝑘 𝑖=0 𝑁 1 𝑖 1 𝑖 𝑥 の項の数は、 k × 𝑁𝐶𝑘個 • 状態 𝑥 のエネルギーは、前のスライドで説明した通り、 k r − 1 なので、 𝑥 𝑥 𝑖=0 𝑁 𝑒−β𝐻 0 𝑖 0 𝑖 𝑥 = 𝑘=0 𝑁 𝑘 𝑁𝐶𝑘 𝑒−β r−1 𝑘 • 𝑁𝑥 1 + 𝑥 𝑁−1 = 𝑘=0 𝑁 𝑘 𝑁𝐶𝑘𝑥𝑘 の𝑥に𝑒−β r−1 を代入すると、 𝑥 𝑥 𝑖=0 𝑁 𝑒−β𝐻 0 𝑖 0 𝑖 𝑥 = 𝑁𝑒−β r−1 1 + 𝑒−β r−1 𝑁−1 33
  34. 34. 分配関数の導出 公共財ゲーム • N個の上向きのスピンのうち、k個のスピンが反転している状態 𝑥 は、𝑁𝐶𝑘個あ る。そして、ある 𝑥 に 𝑖=0 𝑁 0 𝑖 0 𝑖 を左から作用させると、k個の状態が得られる。 つまり、 𝑥,𝑘 𝑖=0 𝑁 0 𝑖 0 𝑖 𝑥 の項の数は、 𝑁 − k × 𝑁𝐶𝑘個 • 状態 𝑥 のエネルギーは、前のスライドで説明した通り、 k r − 1 なので、 𝑥 𝑥 𝑖=0 𝑁 𝑒−β𝐻 0 𝑖 0 𝑖 𝑥 = 𝑘=0 𝑁 𝑁 − k 𝑁𝐶𝑘 𝑒−β r−1 𝑘 = 𝑁 1 + 𝑒−β r−1 𝑁 − 𝑁𝑒−β r−1 1 + 𝑒−β r−1 𝑁 = 𝑁 1 + 𝑒−β r−1 𝑁−1 • よって、 𝑥 𝑥 𝐽𝑧𝑒−β𝐻 𝑥 = 𝑁 1 + 𝑒−β r−1 𝑁−1 − 𝑁𝑒−β r−1 1 + 𝑒−β r−1 𝑁−1 = 𝑁 1 − 𝑒−β r−1 1 + 𝑒−β r−1 𝑁−1 34
  35. 35. 集団の協力の度合いを導出 公共財ゲーム • 集団全体のスピンの期待値(協力の度合い)は、 𝐽𝑧 β = 1 Z 𝑥 𝑥 𝐽𝑧𝑒−β𝐻 𝑥 = 𝑁 1 − 𝑒−β r−1 1 + 𝑒−β r−1 𝑁−1 1 + 𝑒−β 𝑟−1 𝑁 𝐽𝑧 β = 𝑁 1 − 𝑒−β r−1 1 + 𝑒−β 𝑟−1 = 𝑁 𝑒 β r−1 2 − 𝑒 −β r−1 2 𝑒 β r−1 2 + 𝑒 −β r−1 2 𝐽𝑧 β = 𝑁 tanh β r − 1 2 • この式より、協力と裏切りの臨界点は、 r = 1であることが分かる。rが1 より大きくなれば、集団に協力者が増え、rが1より小さくなれば、集団 に裏切者が増える。 →しかし、これはシミュレーションの結果と一致しない。 35
  36. 36. 集団の協力の度合いを導出 公共財ゲーム • なぜ、シミュレーションと一致しないのか? →Ising模型上の進化ゲームは、集団全体の自由エネルギーを最小化するよ うに変化していく。つまり集団全体の適応度が上昇するように進化してい く。 →しかし、実際のダーウィン進化は集団全体の適応度を上昇させるのでは なく、個々の適応度を上昇させる。 • モデルの改良を行う。 →集団全体のエネルギーを考えるのではなく、i-1番目とi+1番目の状態に よって、 i番目の個体が受け取るエネルギーだけに注目する(大域的な視 点から局所的な視点へ)。 36
  37. 37. 分配関数の再導出 公共財ゲーム • 今までの分配関数𝑍 = 𝑥 𝑥 𝑒−β𝐻 𝑥 を次のように書き替える。 𝑍 = 𝑚,𝑛,𝑙=0 1 𝑚 𝑖−1 𝑙 𝑖 𝑛 𝑖+1𝑒−β𝐻 𝑚 𝑖−1 𝑙 𝑖 𝑛 𝑖+1 = 𝑚,𝑛=0 1 𝑚 𝑖−1 𝑛 𝑖+1𝑒−β𝑬𝑚,𝑛 0 𝑚 𝑖−1 𝑚 𝑖−1⊗ 𝑛 𝑖+1 𝑛 𝑖+1 𝑚 𝑖−1 𝑛 𝑖+1 + 𝑚,𝑛=0 1 𝑚 𝑖−1 𝑛 𝑖+1𝑒−β𝑬𝑚,𝑛 1 𝑚 𝑖−1 𝑚 𝑖−1⊗ 𝑛 𝑖+1 𝑛 𝑖+1 𝑚 𝑖−1 𝑛 𝑖+1 = 𝑒−β𝑬0,0 0 + 𝑒−β𝑬0,1 0 + 𝑒−β𝑬1,0 0 + 𝑒−β𝑬1,1 0 + 𝑒−β𝑬0,0 1 + 𝑒−β𝑬0,1 1 + 𝑒−β𝑬1,0 1 + 𝑒−β𝑬1,1 1 = 𝑒−β𝑬0,0 0 + 𝑒−β𝑬0,1 0 + 𝑒−β𝑬1,0 0 + 𝑒−β𝑬1,1 0 + 𝑒−β 𝑟 3−1 𝑒−β𝑬0,0 0 + 𝑒−β𝑬0,1 0 + 𝑒−β𝑬1,0 0 + 𝑒−β𝑬1,1 0 = 1 + 𝑒−β 𝑟 3−1 𝑒0 + 𝑒 −β 3 + 𝑒 −β 3 + 𝑒 −2β 3 = 1 + 𝑒−β 𝑟 3−1 1 + 𝑒 −β 3 2 37
  38. 38. 分配関数の再導出 公共財ゲーム 𝑥 𝑥 𝐽𝑧𝑒−β𝐻 𝑥 = 𝑥 𝑥 𝑖=0 𝑁 𝑒−β𝐻 0 𝑖 0 𝑖 𝑥 − 𝑥 𝑥 𝑖=0 𝑁 𝑒−β𝐻 1 𝑖 1 𝑖 𝑥 = 𝑚,𝑛,𝑙=0 1 𝑚 𝑖−1 𝑙 𝑖 𝑛 𝑖+1𝑒−β𝐻 0 𝑖 0 𝑖 𝑚 𝑖−1 𝑙 𝑖 𝑛 𝑖+1 − 𝑚,𝑛,𝑙=0 1 𝑚 𝑖−1 𝑙 𝑖 𝑛 𝑖+1𝑒−β𝐻 1 𝑖 1 𝑖 𝑚 𝑖−1 𝑙 𝑖 𝑛 𝑖+1 = 𝑚,𝑛=0 1 𝑚 𝑖−1 𝑛 𝑖+1𝑒−β𝑬𝑚,𝑛 0 𝑚 𝑖−1 𝑚 𝑖−1⊗ 𝑛 𝑖+1 𝑛 𝑖+1 𝑚 𝑖−1 𝑛 𝑖+1 − 𝑚,𝑛=0 1 𝑚 𝑖−1 𝑛 𝑖+1𝑒−β𝑬𝑚,𝑛 1 𝑚 𝑖−1 𝑚 𝑖−1⊗ 𝑛 𝑖+1 𝑛 𝑖+1 𝑚 𝑖−1 𝑛 𝑖+1 • この式は、第二項の符号以外、分配関数𝑍と同じなので、 𝑥 𝑥 𝐽𝑧𝑒−β𝐻 𝑥 = 1 − 𝑒−β 𝑟 3−1 1 + 𝑒 −β 3 2 38
  39. 39. 集団の協力の度合いを導出 公共財ゲーム 𝐽𝑧 β = 1 Z 𝑥 𝑥 𝐽𝑧𝑒−β𝐻 𝑥 = 1 − 𝑒−β 𝑟 3−1 1 + 𝑒 −β 3 2 1 + 𝑒−β 𝑟 3−1 1 + 𝑒 −β 3 2 = 1 − 𝑒−β 𝑟 3−1 1 + 𝑒−β 𝑟 3−1 = 𝑒 β 2 𝑟 3−1 − 𝑒 −β 2 𝑟 3−1 𝑒 β 2 𝑟 3−1 + 𝑒 −β 2 𝑟 3−1 = tanh β 2 r 3 − 1 • 集団全体の取り得る状態すべてを加味した大域的な見方をすると、 𝐽𝑧 β = 𝑁 tanh β r − 1 2 • 近傍の個体によって注目する個体のエネルギーがどうなるかだけに着目 した局所的な見方をすると、 𝐽𝑧 β = tanh β 2 r 3 − 1 39
  40. 40. シミュレーション 公共財ゲーム 1. 1024個の個体を円形状に配置する。個体が協力者か裏切者かはランダムになってい る。 2. 1つの個体がランダムに選ばれ、その個体の利得が計算される。 3. 選ばれた個体が協力者だった場合、その個体が裏切者だった場合に得られる利得も 計算する。逆の場合も同様。 4. 以下の式で表される確率に従って、その個体は戦略を変える。ω𝑦は、現時点で得 られた利得、ωxはもし戦略が違っていたら得られていた利得。 βは選択の強さを制 御する係数。 𝑝 x ← 𝑦 = 1 1 + 𝑒−β ω𝑥−ω𝑦 5. これを200万回、繰り返す。 6. 集団がどれだけ協力・裏切りの性質を持っているかを表す指標𝑀を以下のように定 義し、シミュレーションの結果を使い、𝑀を算出する(P𝐶、P𝐷は、協力者、裏切者 の割合)。 𝑀 = P𝐶 − P𝐷 *論文には、𝑀 = P𝐶−P𝐷 P𝐶+P𝐷 と定義されていたが、P𝐶 + P𝐷 = 1なので、分母は要らないような気がする。 40
  41. 41. 閉形式解とシミュレーションの比較 公共財ゲーム • シミュレーションのグラフは、100回、独立でプログラムを走らせた結 果を平均した値をプロットしている。 • Ising模型における逆温度βは、進化ゲームにおける選択の強さを制御す る係数として、解釈されている。 • シミュレーションの挙動を理論的に算出された閉形式解でかなり精密に 記述することができている。 41 理論的に算出された閉形式解 シミュレーション
  42. 42. 罰の導入 公共財ゲーム • 先ほどの結果から、 r > 3であれば、集団に協力者が維持される。3とい う数字は、グループの大きさ(両隣+自分)。 →協力によって得られる利得の係数r(シナジー係数)がグループサイズ よりも大きければ、協力が維持される。 • 自然界で、このような高いシナジー係数が出現するとは考えにくい。 →逆に先ほどの結果は、自然界で、協力的な系が誕生しないことを暗示し ている。 • 協力を促進する手段の1つに「罰」がある。 →裏切者に「罰」を与える仕組みを加えた公共財ゲームの閉形式解の構築、 シミュレーションを行ってみる。 「罰」があると、協力と裏切りの臨界点が低くなるのか? 42
  43. 43. 概要 罰あり公共財ゲーム 先ほどの公共財ゲームを拡張し、選択できる戦略を2つから4つに増やす。 1. 協力者(C)…他の個体と協力する。裏切者・背徳者に罰は与えない。 2. 裏切者(D)…他の個体と協力しない。協力者・道徳者の協力の搾取を 行う。裏切者・背徳者に罰は与えない。 3. 道徳者(M)…他の個体と協力する。裏切者・背徳者に罰は与える。 4. 背徳者(I)…他の個体と協力しない。協力者・道徳者の協力の搾取を 行う。裏切者・背徳者に罰は与える(協力者・道徳者は搾取対象なの で攻撃は行わない。他の裏切者・背徳者は搾取の邪魔になるので攻撃 を行う)。 43 協力者(C) 裏切者(D) 道徳者(M) 背徳者(I) 協力 ○ × ○ × 罰を与える × × ○ ○
  44. 44. 概要 罰あり公共財ゲーム • i番目の個体が協力者(C)の場合、その利得は、 Π𝐶 = 𝑟 𝑘 + 1 𝑁𝐶 + 𝑁𝑀 + 1 − 1 →罰なしの利得とほぼ同じ。𝑁𝑀は道徳者の数。協力による利得は、両隣の 協力者・道徳者・自分(協力者)からもたらされる。 𝑘 + 1 = 3。 • i番目の個体が裏切者(D)の場合、その利得は、 ΠD = 𝑟 𝑘 + 1 𝑁𝐶 + 𝑁𝑀 − ε 𝑁𝑀 + 𝑁𝐼 2 →罰なしの利得とほぼ同じ。協力による利得は、両隣の協力者・道徳者か らもたらされる。両隣の道徳者・背徳者の数(𝑁𝑀と𝑁𝐼)に応じて、罰が 与えられる(利得が下がる)。𝑘 + 1 = 3。 44
  45. 45. 概要 罰あり公共財ゲーム • i番目の個体が道徳者(M)の場合、その利得は、 ΠM = Π𝐶 − γ 𝑁D + 𝑁𝐼 2 →協力者の利得とほぼ同じ。協力者と道徳者の違いは、裏切者・背徳者に 罰を与えるかどうか。道徳者は、両隣の裏切者・背徳者の数(𝑁Dと𝑁𝐼)に 応じて、コストを支払い、それらを罰する。 • i番目の個体が背徳者(I)の場合、その利得は、 Π𝐼 = Π𝐷 − γ 𝑁D + 𝑁𝐼 2 →協力者の利得とほぼ同じ。道徳者と同じく、裏切者・背徳者に罰を与え るコストを支払わなくてはならないので、その分だけ、利得が下がる。 45
  46. 46. 概要 罰あり公共財ゲーム • i番目の個体が協力者(C)の場合、その利得は、Π𝐶 = 𝑟 3 𝑁𝐶 + 𝑁𝑀 + 1 − 1なので、利得行列は、 𝜫𝑪 = 𝑟 − 1 2 3 𝑟 − 1 2 3 𝑟 − 1 1 3 𝑟 − 1 𝑟 − 1 2 3 𝑟 − 1 2 3 𝑟 − 1 1 3 𝑟 − 1 𝑟 − 1 2 3 𝑟 − 1 2 3 𝑟 − 1 1 3 𝑟 − 1 𝑟 − 1 2 3 𝑟 − 1 2 3 𝑟 − 1 1 3 𝑟 − 1 →1、2、3、4行目は、i-1番目の個体が協力者、裏切者、道徳者、背徳者 だった場合の利得。1、2、3、4列目は、i+1番目の個体が協力者、裏切者、 道徳者、背徳者だった場合の利得。 46
  47. 47. ハミルトニアン構築 罰あり公共財ゲーム • i番目の個体が協力者(C)の場合、そのエネルギー行列𝐹 𝐶 は、 𝐹 𝐶 = 0 𝑟 3 𝑟 3 2𝑟 3 0 𝑟 3 𝑟 3 2𝑟 3 0 𝑟 3 𝑟 3 2𝑟 3 0 𝑟 3 𝑟 3 2𝑟 3 = 𝐸 𝐶 𝐸 𝐶 𝐸 𝐶 𝐸 𝐶 • i番目の個体が裏切者(D)の場合、そのエネルギー行列𝐹 𝐷 は、 𝐹 𝐷 = 𝐸 𝐶 𝐸 𝐶 𝐸 𝐶 𝐸 𝐶 + 𝑟 3 − 1 𝑟 3 − 1 𝑟 3 − 1 𝑟 3 − 1 + 0 ε 2 ε 2 ε →自身が協力しないので、エネルギーが 𝑟 3 上昇。協力のコストが不要なの でエネルギーが1減少。罰が与えられるので、第三項分だけエネルギーが 上昇。 47
  48. 48. ハミルトニアン構築 罰あり公共財ゲーム • i番目の個体が道徳者(M)の場合、そのエネルギー行列𝐹 𝑀 は、 𝐹 𝑀 = 𝐸 𝐶 𝐸 𝐶 𝐸 𝐶 𝐸 𝐶 + 0 γ 2 γ 2 γ →裏切者・背徳者に与える罰にかかるコストによって、第二項分だけエネルギーが 上昇。 • i番目の個体が裏切者(D)の場合、そのエネルギー行列𝐹 𝐷 は、 𝐹 𝐷 = 𝐸 𝐶 𝐸 𝐶 𝐸 𝐶 𝐸 𝐶 + 𝑟 3 − 1 𝑟 3 − 1 𝑟 3 − 1 𝑟 3 − 1 + 0 ε 2 ε 2 ε + 0 γ 2 γ 2 γ →自身が協力しないので、エネルギーが 𝑟 3 上昇。協力のコストが不要なのでエネル ギーが1減少。罰が与えられるので、第三項分だけエネルギーが上昇。裏切者・背 徳者に与える罰にかかるコストによって、第四項分だけエネルギーが上昇。 48
  49. 49. 分配関数の導出 罰あり公共財ゲーム • 分配関数Zは、それぞれの分配関数の和で表される。 Z = 𝑍𝐶 + 𝑍𝐷 + 𝑍𝑀 + 𝑍𝐼 • 前回から分配関数Zは系全体が取り得る全ての状態を加味するのではな く、i-1番目、i番目、i+1番目が取り得る全ての状態だけを加味すること にした(そちらの方がより進化モデルとしてふさわしい)。 →i番目が協力者だった場合、分配関数𝑍𝐶は、エネルギー行列𝐹 𝐶 の要素の 指数をとり、足し合わせれば求めることができる。その他も同様。 𝑍𝐶 = 4 𝑒0 + 2𝑒−β 𝑟 3 + 𝑒−β 2𝑟 3 = 4 1 + 𝑒−β 𝑟 3 2 𝑍𝐷 = 𝑒0 + 2𝑒−β 𝑟 3 + 𝑒−β 2𝑟 3 𝑒 −β 𝑟 3−1 𝑒0 + 2𝑒−β ε 2 + 𝑒−βε = 𝑒 −β 𝑟 3−1 1 + 𝑒−β 𝑟 3 2 1 + 𝑒−β ε 2 2 49
  50. 50. 分配関数の導出 罰あり公共財ゲーム 𝑍𝑀 = 𝑒0 + 2𝑒−β 𝑟 3 + 𝑒−β 2𝑟 3 𝑒0 + 2𝑒−β γ 2 + 𝑒−βγ = 1 + 𝑒−β 𝑟 3 2 1 + 𝑒−β γ 2 2 𝑍𝐼 = 𝑒0 + 2𝑒−β 𝑟 3 + 𝑒−β 2𝑟 3 𝑒 −β 𝑟 3−1 𝑒0 + 2𝑒−β ε+γ 2 + 𝑒−β ε+γ ε = 𝑒 −β 𝑟 3 −1 1 + 𝑒−β 𝑟 3 2 1 + 𝑒−β ε+γ 2 2 • 論文では、 𝑍𝑀 = 4 1 + 𝑒 −β 𝑟 3+ γ 2 2 式 38 𝑍𝐼 = 𝑒 −β 𝑟 3 −1 1 + 𝑒 −β 𝑟 3 + γ 2 2 1 + 𝑒−β ε 3 2 式 39 となっているが、違うと思う。 50
  51. 51. 論文の分配関数の検証 罰あり公共財ゲーム 【式 38 が間違っていることを確認する方法】 𝐹 𝐷 = 𝐸 𝐶 𝐸 𝐶 𝐸 𝐶 𝐸 𝐶 + 𝑟 3 − 1 𝑟 3 − 1 𝑟 3 − 1 𝑟 3 − 1 + 0 ε 2 ε 2 ε 式 32 𝑍𝐷 = 𝑒 −β 𝑟 3 −1 1 + 𝑒−β 𝑟 3 2 1 + 𝑒−β ε 2 2 式 37 • 𝐹 𝐷 の2つ目の行列を取り除いたものを𝐹𝑚𝑜𝑑 𝐷 とすると、 𝐹𝑚𝑜𝑑 𝐷 = 𝐸 𝐶 𝐸 𝐶 𝐸 𝐶 𝐸 𝐶 + 0 ε 2 ε 2 ε 式 32_𝑚𝑜𝑑 𝑍𝐷_𝑚𝑜𝑑 = 1 + 𝑒−β 𝑟 3 2 1 + 𝑒−β ε 2 2 式 37_𝑚𝑜𝑑 →𝐹𝑚𝑜𝑑 𝐷 は、𝐹 M と全く同じ形をしている。 51
  52. 52. 論文の分配関数の検証 罰あり公共財ゲーム 𝐹𝑚𝑜𝑑 𝐷 = 𝐸 𝐶 𝐸 𝐶 𝐸 𝐶 𝐸 𝐶 + 0 ε 2 ε 2 ε 𝐹 𝑀 = 𝐸 𝐶 𝐸 𝐶 𝐸 𝐶 𝐸 𝐶 + 0 γ 2 γ 2 γ 𝑍𝐷_𝑚𝑜𝑑 = 1 + 𝑒−β 𝑟 3 2 1 + 𝑒−β ε 2 2 式 37_𝑚𝑜𝑑 𝑍𝑀 = 4 1 + 𝑒 −β 𝑟 3 + γ 2 2 式 38 • ε = γのとき、𝑍𝐷_𝑚𝑜𝑑 = 𝑍𝑀になるべきであるが、どう考えても等号は成 立しない。 【式 39 が間違っていることを確認する方法】 式 34 から 𝑟 3 − 1を取り除き、ε = 0とすると、式 33 と式 34 が一致する ので、その操作を式 39 に施し、式 38 と比べれば、両者は一致する。し かし、式 38 は間違っているので、間違っている式と一致する式 39 も間 違っている。 52
  53. 53. 論文の結果の検証 罰あり公共財ゲーム • 論文には、 𝐽𝑧 β = 1 − cosh2 β ε 4 𝑒 −β 𝑟 3+ ε 2−1 1 + cosh2 β ε 4 𝑒 −β 𝑟 3+ ε 2−1 式 40 と記載されており、この式は罰を与えるコストγに依存しないと書かれて あった。 →恐らく、式 40 も間違っていると思う。 53
  54. 54. 論文の結果の検証 罰あり公共財ゲーム 【式 40 が間違っていることを確認する方法】 • 道徳者(M)、背徳者(I)の利得は、 ΠM = Π𝐶 − γ 𝑁D + 𝑁𝐼 2 Π𝐼 = Π𝐷 − γ 𝑁D + 𝑁𝐼 2 • γ → ∞とすると、ΠM → −∞、または ΠM = 0、Π𝐼 → −∞、または Π𝐼 = 0 となる。シミュレーションの初期状態はランダムなので、ΠM → −∞、 Π𝐼 → −∞になる可能性が高い。 54
  55. 55. 論文の結果の検証 罰あり公共財ゲーム • 戦略を変更する確率は𝑝 x ← 𝑦 = 1 1+𝑒−β ω𝑥−ω𝑦 なので、 ΠM → −∞、Π𝐼 → −∞の場合、 𝑝 Mまたは𝐼 ← 𝐶または𝐷 → 0. 𝑝 Mまたは𝐼 ← 𝐶または𝐷 → 1. →道徳者(M)、背徳者(I)が速攻で淘汰される可能性は高い(比較され る戦略xは 1 3 で選ばれるので、M→I、I→Mは十分に起こり得る)。 • 道徳者(M)、背徳者(I)がシミュレーションの初期段階で淘汰される と、結果は前回の罰なし公共財ゲームと同じものになる。しかし、 γの 値が小さければ、結果は罰なし公共財ゲームと違うものになる(論文の FIG. 6より)。 →罰あり公共財ゲームの結果は、コストγに依存すると思われる。そのた め、コストγが含まれていない式 40 は間違いだと思う。 本スライドの最後に関連する話を載せているので見てください。 55
  56. 56. 閉形式解とシミュレーションの比較 罰あり公共財ゲーム • 一応、閉形式解とシミュレーション結果のグラフを載せておく。 • 閉形式解とシミュレーションの結果が同じであることを主張している。 • 罰があると、臨界点が罰なしのr = 3よりも小さくなる。つまり、協力に よって得られる利得が少なくても罰の制度があれば、協力が維持される。 →左の閉形式解は間違っていると思うが、きちんと導出した式も同じような結 果になりそうな気がする。 本スライドの最後に関連する話を載せているので見てください。 56 理論的に算出された閉形式解 シミュレーション
  57. 57. 考察 • 進化ゲーム理論は、生物の意思決定に関わる多くの要素を明らかにし、 それら意思決定の結果を導き出すことに成功した数学的な枠組み。 →実際の自然界では、予測できない環境ノイズの下、意思決定を行わなけ ればならない。こういったノイズが力学に与える影響を取り扱うのに最も 適した学問の1つが物理学。 →今まで、統計物理学を利用した研究が数多く行われてきた。 →スピン系の熱力学とゲーム理論の類似性は、30年以上も前に指摘されて はいたが、この分野を進化ゲーム理論に応用する協調的な取り組みはまだ 見られていなかった。 • 集団のエネルギーを最小化させるようにハミルトニアンを構築すると、 r = 1で協力と裏切りの遷移が起こった。 →集団単位で自然選択が行われた場合、このような結果になることが予想 される。 57
  58. 58. 考察 • Sherrington-Kirkpatrick型のスピングラスに関する論文で得られた解と今 回の解が類似している。 → 公共財ゲームにおける罰の制度は、自発的に磁化する系と相互作用する 局所磁場と同じようなはたらきを持っている。 • Ising模型における不純物を「協力・裏切りのどちらも行わない戦略(棄 権)」を取っている個体と見なすことができる。 →このようなモデルを考えれば、「棄権」を含む進化のダイナミクスが分 かるかも。 • 今回の結果を高次元に拡張することは難しい。 →磁場を持つ2次元モデルは、閉形式解が存在しない3次元モデルと関連性 があるので、こちらも解が存在しない。 • 進化ゲームとスピン系の熱力学の間の類似性がよりしっかり理解されれ ば、Ising模型の研究で得られた豊富な知見を進化ゲーム理論に応用でき るかもしれない。 58
  59. 59. 本論文の間違いを指摘している論文 終始、本論文の間違いを指摘し、新たな提案手法で問題を解いている。 →この論文も微妙な気がする。 59 引用元 https://aip.scitation.org/doi/abs/10.1063/1.5085076
  60. 60. 本論文の間違いを指摘している論文 この論文の新たな提案手法は、本論文と数学的に等価な気がする。 • 本論文: 𝐽𝑧 β = 1 Z 𝑥 𝑥 𝐽𝑧𝑒−β𝐻 𝑥 • 新たな論文: 𝐽𝑧 β = − 𝑑𝐹 𝑑ℎ → 1 Z 𝑥 𝑥 𝐽𝑧𝑒−β𝐻 𝑥 = − 𝑑𝐹 𝑑ℎ なので、両者に差はない。 …新たな論文では、Nash均衡点がずれないように変数変換し、問題を解い ていたので、本論文よりは複雑。 60
  61. 61. 本論文の間違いを指摘している論文 • 新たな論文では、本論文の手法で問題を解き、出てくる答えの矛盾点を 指摘し、自分たちの提案手法の説明をするという流れになっているが、 本論文の手法の再現がきちんとできていないと思う。 →きちんと再現できれば、矛盾は生じないと思う。 • そもそも、新たな論文と本論文の手法は、数学的に等価だと思うので、 新たな論文が本論文の手法を間違っていると言えば、自動的に新たな論 文の手法も間違っているということになる。 →このスライドでも指摘してきた通り、本論文の矛盾は主に計算間違いか ら発生しているものだと思う。 61
  62. 62. 本論文の間違いを指摘している論文 • このスライドでは、本論文の罰あり公共財ゲームの閉形式解は間違って いるのではないかと述べた。そして、新たな論文も本論文は間違ってい ると述べており、彼らは新たな手法で閉形式解を求めていた。 • 本論文は3人ゲームを考えていたが、新たな論文では2人間の罰あり公共 財ゲームを考えている。また、本論文の𝑟は𝑘𝑐に、協力のコスト1は𝑐と なっている。そして、 𝑘𝑐 − 𝑐を新たな論文では𝑟とおいている。また、 戦略の数は4つではなく、2つ。そして、裏切者であれば周りがどのよう な戦略を取っていたとしても、罰𝑝を受ける(一定の値𝑝 が裏切者の利得 から引かれる)。 …といった違いがある。 →細かい点は違うが、本質的には同じ。 62
  63. 63. 本論文の間違いを指摘している論文 • 新たな論文の罰なし公共財ゲームの閉形式解は、 𝑀 = tanh β 2r − 𝑐 4 • 新たな論文の罰あり公共財ゲームの閉形式解は、 𝑀 = tanh β 2r − 𝑐 + 2𝑝 4 • 𝑀は秩序変数(スピンの期待値)。罰𝑝を導入することによって、協力 によるメリットrが小さくてもtanhの引数が正になり、 𝑀も正になる。 →罰という制度を導入することで、一般的に協力によるメリットが大きく ない自然界でも協力が淘汰されずに維持される。 本論文で示したかったことが示せている。 63

×