事前申告を取り入れた マむノリティゲヌム 
北海道倧孊 工孊郚 情報工孊科4幎 
耇雑系工孊講座 調和系工孊研究宀 
神戞 芳文
耇雑系 個々の自埋的振る舞いで系党䜓の振る舞いが決定 
株匏垂堎 利己的な戊略を持぀個人が倚数集たり系党䜓が構成される 
背景 
少数掟に属した個人が利埗を埗るゲヌムであり株匏垂堎などを単玔にモデル化したもの 
マむノリティゲヌム 
買い 
売り 
報酬 
少数掟 
䞀斉に行動 倚数掟
事前情報を含んだマむノリティゲヌムの提案 
事前情報が行動に䞎える圱響の分析 
耇雑系の偎面をも぀株匏垂堎をモデル化したマむノリティゲヌムを甚いお 
事前情報が戊略の異なる耇数の利己的゚ヌゞェントの行動に䞎える圱響を解析する 
目的 
珟実にはうわさ予想などの事前情報も考えお行動する 
マむノリティゲヌムに関する先行研究 
•StandardMGの研究(C-.Zhang 1997) 
•人工垂堎のシンプルなモデルずしおのマむノリティゲヌム 
•進化的アルゎリズムは人工垂堎にふさわしいか[和泉 2004] 
•゚ヌゞェントの孊習に「進化的アルゎリズム」を甚いた研究 
埓来のMGでぱヌゞェントの行動はゲヌムの履歎だけで決定
行動決定テヌブルを甚いたマルチ゚ヌゞェントモデル 
A 
A 
P1 
A 
B 
P2 
B 
A 
P3 
B 
B 
P4 
t-1 
t-2 
蚘憶長 m=2 の堎合 
t 
行動決定テヌブル 
A 
・・・ 
B 
B 
A 
 
t-1 
t-2 
t 
t-3 
1 
過去のゲヌムの履歎 
各゚ヌゞェントの行動でゲヌムをする 
確率α 
確率1-α 
P3 ← P3 
倉曎なし 
報酬 
行動決定テヌブルの曎新 
少数掟 
R 
倉曎なし 
倚数掟 
無し 
少数掟だった行動 
報酬の獲埗行動決定テヌブルの曎新 
再びゲヌムをする 
[和泉, et al., 04]
行動決定テヌブルを甚いたモデルの特性 
A 
A 
P1 
A 
B 
P2 
B 
A 
P3 
B 
B 
P4 
党゚ヌゞェントが同じ履歎に基づく 
必ずテヌブルの同じ行を䜿う 
少数掟 
倚数掟 
゚ヌゞェント数 
倚数掟の゚ヌゞェントのうち 
確率αでP3の行動を反転 
少数掟倚数掟   
α0.5の堎合 
に収束する 
このモデルを拡匵するこずで事前情報を考慮したマむノリティゲヌムを構築する
事前情報を甚いたモデルの拡匵 
任意で 
事前申告 
行動決定 
報酬行動決定 
テヌブルの倉曎 
履歎 
事前申告=行動 
申告゚ヌゞェント 
情報利甚゚ヌゞェント 
履歎 + 申告の集蚈結果 
行動 
履歎 
行動 
・事前申告はする 
・集蚈結果は䜿甚しない 
・事前申告をしない 
・集蚈結果を䜿甚する 
事前情報を甚いたマむノリティゲヌムの流れ 
集蚈結果の少数掟を 
党゚ヌゞェントに通知 
A 
A 
P1 
A 
B 
P2 
B 
A 
P3 
B 
B 
P4 
A 
A 
A 
P1 
A 
B 
P2 
B 
A 
P3 
B 
B 
P4 
B 
A 
A 
P5 
A 
B 
P6 
B 
A 
P7 
B 
B 
P8 
申告の集蚈結果 
申告゚ヌゞェントず情報利甚゚ヌゞェントの個䜓数を倉化させお実隓を行う
実隓結果 
申告゚ヌゞェントに察しお情報利甚゚ヌゞェントが少な いずきは事前申告結果を䜿っお確実に少数掟に入れる 
互いの平均利埗が逆転 
申告゚ヌゞェント100 
情報利甚゚ヌゞェント 
詊行回数5000 
申告゚ヌゞェントの人数が少ないず 申告゚ヌゞェントの方が高い利埗を 埗られおいる 
申告゚ヌゞェント1 
情報利甚゚ヌゞェント00 
申告゚ヌゞェント 
情報利甚゚ヌゞェント 
意倖にも・・・
申告゚ヌゞェント 
人 
7人 
3人 
行動 
行動 
考察 
申告゚ヌゞェントは過去の履歎だけから行動を決定 
申告゚ヌゞェントが少数のずき有利な理由
考察 
申告゚ヌゞェントが少数のずき有利な理由 
申告゚ヌゞェント 人 
情報利甚゚ヌゞェントはの割合で分かれる 
7人 
3人 
行動 
行動 
31人 
60人 
申告゚ヌゞェントの 事前申告結果が情 報利甚゚ヌゞェント の行動に圱響 
少数掟 
情報利甚゚ヌゞェント 
人 
党䜓の倧郚分を占める堎合どちらが少数掟になるかは情報利甚゚ヌゞェントに䟝存する
考察 
7人 
3人 
行動 
行動 
31人 
60人 
少数掟 
゚ヌゞェントが少数のずき有利な理由 
申告゚ヌゞェントは50%皋床の確率で報酬を埗られる 
申告゚ヌゞェント 
人 
情報利甚゚ヌゞェント 
人 
申告゚ヌゞェントの 事前申告結果が情 報利甚゚ヌゞェント の行動に圱響
事前申告・申告集蚈結果を甚いた孊習 
申告゚ヌゞェントず情報利甚゚ヌゞェントが共存した堎合の 
マむノリティゲヌムに぀いお解析できた 
孊習を甚いた申告・情報利甚゚ヌゞェントを蚭蚈し 
その振る舞いに぀いお実隓を行う
事前申告・申告集蚈結果を甚いた孊習 
状態  
行動  
テヌブルQ1 
過去m回の履歎 
事前申告 
テヌブルQ2 
過去m回の履歎 
ゲヌムの行動 
テヌブルQ3 
申告集蚈結果 
過去m回の履歎 
ゲヌムの行動 
3぀のQテヌブルず確率βを孊習させる 
任意で 事前申告 
行動決定 
報酬行動決定 
テヌブルの倉曎 
事前情報を甚いたマむノリティゲヌムの流れ 
集蚈結果の少数掟を 
党゚ヌゞェントに通知 
テヌブルQ1によっお 
事前申告を決定する 
事前情報を 
利甚しない堎合はテヌブルQ2 利甚する堎合はテヌブルQ3 
によっお行動を決定する 
確率βで 
事前情報を利甚
テヌブルずβの孊習方法 
Q孊習利甚した行動䟡倀関数を曎新 
( , ) ( , ) [ max ( , ) ( , )] 1 t 1 t 1 t t 
a 
t t t t t Q s a Q s a  reward  Q s a Q s a    α  
行動䟡倀関数 
申告集蚈結果の利甚率β 
   
 
 
 
if 
if 
    
    
0.05 
0.05 
 
 
 
申告集蚈結果を 利甚しお成功 or 利甚しないで倱敗 
申告集蚈結果を 利甚しお倱敗 or 利甚しないで成功 
Q孊習の孊習率 
割匕率 
実隓蚭定 
実隓蚭定 
α0.1 
γ0.0 
βの初期倀=1.0
実隓結果 
0.5 
0.3 
0.7 
ステップ t 
申告集蚈結果の利甚率β 
集蚈結果を利甚した 
゚ヌゞェントの勝率 
集蚈結果を利甚しない 
゚ヌゞェントの勝率 
初期段階では申告集蚈結果を利甚しない方が勝率が高くβが枛少 
情報利甚゚ヌゞェントず 
申告゚ヌゞェントは負の盞関だった 
集蚈結果を利甚する堎合ずしない堎合の 
勝率には負の盞関盞関係数-0.43)がある 
実隓結果の状況が圱響しおいるず思われる 
実隓結果では・・・
結論 
•行動決定テヌブルによる既存のマむノリティゲヌムを、事前申 告を取り入れたマむノリティゲヌムに拡匵・分析 
•事前申告の利甚者が高い利埗を獲埗できるずは限らない 
•申告゚ヌゞェントの勝率ず情報利甚゚ヌゞェントの勝利には負 の盞関が芳察された 
 Work 
事前申告が持぀情報量や信憑性の分析

godo b

  • 1.
    事前申告を取り入れた マむノリティゲヌム 北海道倧孊工孊郚 情報工孊科4幎 耇雑系工孊講座 調和系工孊研究宀 神戞 芳文
  • 2.
    耇雑系 個々の自埋的振る舞いで系党䜓の振る舞いが決定 株匏垂堎利己的な戊略を持぀個人が倚数集たり系党䜓が構成される 背景 少数掟に属した個人が利埗を埗るゲヌムであり株匏垂堎などを単玔にモデル化したもの マむノリティゲヌム 買い 売り 報酬 少数掟 䞀斉に行動 倚数掟
  • 3.
    事前情報を含んだマむノリティゲヌムの提案 事前情報が行動に䞎える圱響の分析 耇雑系の偎面をも぀株匏垂堎をモデル化したマむノリティゲヌムを甚いお 事前情報が戊略の異なる耇数の利己的゚ヌゞェントの行動に䞎える圱響を解析する 目的 珟実にはうわさ予想などの事前情報も考えお行動する マむノリティゲヌムに関する先行研究 •StandardMGの研究(C-.Zhang 1997) •人工垂堎のシンプルなモデルずしおのマむノリティゲヌム •進化的アルゎリズムは人工垂堎にふさわしいか[和泉 2004] •゚ヌゞェントの孊習に「進化的アルゎリズム」を甚いた研究 埓来のMGでぱヌゞェントの行動はゲヌムの履歎だけで決定
  • 4.
    行動決定テヌブルを甚いたマルチ゚ヌゞェントモデル A A P1 A B P2 B A P3 B B P4 t-1 t-2 蚘憶長 m=2 の堎合 t 行動決定テヌブル A ・・・ B B A  t-1 t-2 t t-3 1 過去のゲヌムの履歎 各゚ヌゞェントの行動でゲヌムをする 確率α 確率1-α P3 ← P3 倉曎なし 報酬 行動決定テヌブルの曎新 少数掟 R 倉曎なし 倚数掟 無し 少数掟だった行動 報酬の獲埗行動決定テヌブルの曎新 再びゲヌムをする [和泉, et al., 04]
  • 5.
    行動決定テヌブルを甚いたモデルの特性 A A P1 A B P2 B A P3 B B P4 党゚ヌゞェントが同じ履歎に基づく 必ずテヌブルの同じ行を䜿う 少数掟 倚数掟 ゚ヌゞェント数 倚数掟の゚ヌゞェントのうち 確率αでP3の行動を反転 少数掟倚数掟   α0.5の堎合 に収束する このモデルを拡匵するこずで事前情報を考慮したマむノリティゲヌムを構築する
  • 6.
    事前情報を甚いたモデルの拡匵 任意で 事前申告 行動決定 報酬行動決定 テヌブルの倉曎 履歎 事前申告=行動 申告゚ヌゞェント 情報利甚゚ヌゞェント 履歎 + 申告の集蚈結果 行動 履歎 行動 ・事前申告はする ・集蚈結果は䜿甚しない ・事前申告をしない ・集蚈結果を䜿甚する 事前情報を甚いたマむノリティゲヌムの流れ 集蚈結果の少数掟を 党゚ヌゞェントに通知 A A P1 A B P2 B A P3 B B P4 A A A P1 A B P2 B A P3 B B P4 B A A P5 A B P6 B A P7 B B P8 申告の集蚈結果 申告゚ヌゞェントず情報利甚゚ヌゞェントの個䜓数を倉化させお実隓を行う
  • 7.
    実隓結果 申告゚ヌゞェントに察しお情報利甚゚ヌゞェントが少な いずきは事前申告結果を䜿っお確実に少数掟に入れる 互いの平均利埗が逆転 申告゚ヌゞェント100 情報利甚゚ヌゞェント 詊行回数5000 申告゚ヌゞェントの人数が少ないず 申告゚ヌゞェントの方が高い利埗を 埗られおいる 申告゚ヌゞェント1 情報利甚゚ヌゞェント00 申告゚ヌゞェント 情報利甚゚ヌゞェント 意倖にも・・・
  • 8.
    申告゚ヌゞェント 人 7人 3人 行動 行動 考察 申告゚ヌゞェントは過去の履歎だけから行動を決定 申告゚ヌゞェントが少数のずき有利な理由
  • 9.
    考察 申告゚ヌゞェントが少数のずき有利な理由 申告゚ヌゞェント人 情報利甚゚ヌゞェントはの割合で分かれる 7人 3人 行動 行動 31人 60人 申告゚ヌゞェントの 事前申告結果が情 報利甚゚ヌゞェント の行動に圱響 少数掟 情報利甚゚ヌゞェント 人 党䜓の倧郚分を占める堎合どちらが少数掟になるかは情報利甚゚ヌゞェントに䟝存する
  • 10.
    考察 7人 3人 行動 行動 31人 60人 少数掟 ゚ヌゞェントが少数のずき有利な理由 申告゚ヌゞェントは50%皋床の確率で報酬を埗られる 申告゚ヌゞェント 人 情報利甚゚ヌゞェント 人 申告゚ヌゞェントの 事前申告結果が情 報利甚゚ヌゞェント の行動に圱響
  • 11.
  • 12.
    事前申告・申告集蚈結果を甚いた孊習 状態  行動  テヌブルQ1 過去m回の履歎 事前申告 テヌブルQ2 過去m回の履歎 ゲヌムの行動 テヌブルQ3 申告集蚈結果 過去m回の履歎 ゲヌムの行動 3぀のQテヌブルず確率βを孊習させる 任意で 事前申告 行動決定 報酬行動決定 テヌブルの倉曎 事前情報を甚いたマむノリティゲヌムの流れ 集蚈結果の少数掟を 党゚ヌゞェントに通知 テヌブルQ1によっお 事前申告を決定する 事前情報を 利甚しない堎合はテヌブルQ2 利甚する堎合はテヌブルQ3 によっお行動を決定する 確率βで 事前情報を利甚
  • 13.
    テヌブルずβの孊習方法 Q孊習利甚した行動䟡倀関数を曎新 (, ) ( , ) [ max ( , ) ( , )] 1 t 1 t 1 t t a t t t t t Q s a Q s a  reward  Q s a Q s a    α  行動䟡倀関数 申告集蚈結果の利甚率β       if if         0.05 0.05    申告集蚈結果を 利甚しお成功 or 利甚しないで倱敗 申告集蚈結果を 利甚しお倱敗 or 利甚しないで成功 Q孊習の孊習率 割匕率 実隓蚭定 実隓蚭定 α0.1 γ0.0 βの初期倀=1.0
  • 14.
    実隓結果 0.5 0.3 0.7 ステップ t 申告集蚈結果の利甚率β 集蚈結果を利甚した ゚ヌゞェントの勝率 集蚈結果を利甚しない ゚ヌゞェントの勝率 初期段階では申告集蚈結果を利甚しない方が勝率が高くβが枛少 情報利甚゚ヌゞェントず 申告゚ヌゞェントは負の盞関だった 集蚈結果を利甚する堎合ずしない堎合の 勝率には負の盞関盞関係数-0.43)がある 実隓結果の状況が圱響しおいるず思われる 実隓結果では・・・
  • 15.
    結論 •行動決定テヌブルによる既存のマむノリティゲヌムを、事前申 告を取り入れたマむノリティゲヌムに拡匵・分析 •事前申告の利甚者が高い利埗を獲埗できるずは限らない •申告゚ヌゞェントの勝率ず情報利甚゚ヌゞェントの勝利には負 の盞関が芳察された  Work 事前申告が持぀情報量や信憑性の分析