SlideShare a Scribd company logo
1 of 15
Download to read offline
事前申告を取り入れた
 マイノリティゲーム
北海道大学 工学部 情報工学科4年
複雑系工学講座 調和系工学研究室
      神戸 芳文
背景
   複雑系   個々の自律的振る舞いで系全体の振る舞いが決定

  株式市場   利己的な戦略を持つ個人が多数集まり,系全体が構成される

 マイノリティゲーム
少数派に属した個人が利得を得るゲームであり,株式市場などを単純にモデル化したもの


                     買い


             一斉に行動          多数派


                     売り
                                  報酬

                          少数派
目的
 マイノリティゲームに関する先行研究
   •StandardMGの研究(C-.Zhang 1997)
      •人工市場のシンプルなモデルとしてのマイノリティゲーム
   •進化的アルゴリズムは人工市場にふさわしいか[和泉 2004]
      •エージェントの学習に「進化的アルゴリズム」を用いた研究


従来のMGではエージェントの行動はゲームの履歴だけで決定

  現実にはうわさ,予想などの事前情報も考えて行動する


     事前情報を含んだマイノリティゲームの提案
       事前情報が行動に与える影響の分析

複雑系の側面をもつ株式市場をモデル化したマイノリティゲームを用いて,
事前情報が戦略の異なる複数の利己的エージェントの行動に与える影響を解析する
行動決定テーブルを用いたマルチエージェントモデル
                                                   [和泉, et al., 04]
          少数派だった行動
                      1          t-3   t-2   t-1      t

        過去のゲームの履歴    A ・・・ B           B     A       ?
                          各エージェントの行動でゲームをする

記憶長 m=2 の場合
                          報酬の獲得,行動決定テーブルの更新
  t-2    t-1   t
                            報酬 行動決定テーブルの更新
  A      A     P1
                     少数派     R               変更なし
  A      B     P2    多数派 無し            確率α            P3 ← P3
  B      A     P3                      確率1-α          変更なし
  B      B     P4
 行動決定テーブル                        再びゲームをする
行動決定テーブルを用いたモデルの特性

     A      A     P1
     A      B     P2     全エージェントが同じ履歴に基づく
     B      A     P3         必ずテーブルの同じ行を使う
     B      B     P4


                             多数派のエージェントのうち
                             確率αでP3の行動を反転
  エージェント数




                               α=0.5の場合
                               少数派:多数派 = 1:2
                                          に収束する
            少数派        多数派

このモデルを拡張することで,事前情報を考慮したマイノリティゲームを構築する
事前情報を用いたモデルの拡張
  事前情報を用いたマイノリティゲームの流れ

    任意で      集計結果の少数派を              報酬&行動決定
                            行動決定
   事前申告      全エージェントに通知             テーブルの変更


申告エージェント                                A   A   P1
                履歴        事前申告=行動       A   B   P2
・事前申告はする
                                        B   A   P3
・集計結果は使用しない                             B   B   P4

                                        履歴      行動
                          申告の集計結果       A   A   P1
情報利用エージェント
                                        A   B   P2
・事前申告をしない                           A
                                        B   A   P3
                                        B   B   P4
・集計結果を使用する
             履歴 +                       A   A   P5
                             行動         A   B   P6
             申告の集計結果                B
                                        B   A   P7
                                        B   B   P8

 申告エージェントと情報利用エージェントの個体数を変化させて実験を行う
実験結果1
                                試行回数:5000
申告エージェントに対して情報利用エージェントが少な
いときは事前申告結果を使って確実に少数派に入れる


互いの平均利得が逆転


意外にも・・・                      情報利用エージェント
申告エージェントの人数が少ないと,
申告エージェントの方が高い利得を
得られている

                            申告エージェント




          申告エージェント:1        申告エージェント:100
          情報利用エージェント:100    情報利用エージェント:1
考察1
         申告エージェントが少数のとき有利な理由


      申告エージェント
        (10人)


行動A
        7人


行動B
        3人



         申告エージェントは過去の履歴だけから行動を決定
考察1
        申告エージェントが少数のとき有利な理由


      申告エージェント             情報利用エージェント
        (10人)  申告エージェントの      (91人)
               事前申告結果が情
               報利用エージェント
行動A
        7人     の行動に影響         31人       少数派


行動B                           60人
        3人



        情報利用エージェントは,1:2の割合で分かれる
全体の大部分を占める場合どちらが少数派になるかは情報利用エージェントに依存する
考察1
         エージェントAが少数のとき有利な理由


      申告エージェント             情報利用エージェント
        (10人)  申告エージェントの      (91人)
               事前申告結果が情
               報利用エージェント
行動A
        7人     の行動に影響         31人       少数派


行動B                           60人
        3人



       申告エージェントは50%程度の確率で報酬を得られる
事前申告・申告集計結果を用いた学習

申告エージェントと情報利用エージェントが共存した場合の
マイノリティゲームについて解析できた.



学習を用いた申告・情報利用エージェントを設計し,
その振る舞いについて実験を行う.
事前申告・申告集計結果を用いた学習
  事前情報を用いたマイノリティゲームの流れ

   任意で    集計結果の少数派を               報酬&行動決定
                         行動決定
  事前申告    全エージェントに通知              テーブルの変更



                            利用しない場合はテーブルQ2
テーブルQ1によって 確率βで     事前情報を
                            利用する場合はテーブルQ3
事前申告を決定する 事前情報を利用
                    によって行動を決定する


                状態 s             行動 a
    テーブルQ1    過去m回の履歴           事前申告
    テーブルQ2    過去m回の履歴           ゲームの行動
              申告集計結果&
    テーブルQ3                      ゲームの行動
              過去m回の履歴

         3つのQテーブルと確率βを学習させる
Qテーブルとβの学習方法
   行動価値関数               Q学習:利用した行動価値関数を更新

Q( st , at )  Q( st , at ) α reward ta1   max Q( st 1 , at 1 )  Q( st , at )]
                              [

実験設定           Q学習の学習率 α=0.1
               割引率     γ=0.0


   申告集計結果の利用率β


     0.05   if          申告集計結果を 利用して成功 or 利用しないで失敗
 
     0.05   if          申告集計結果を 利用して失敗 or 利用しないで成功


実験設定           βの初期値=1.0
実験結果2
      初期段階では申告集計結果を利用しない方が勝率が高く,βが減少

0.7                        実験結果1では・・・

         申告集計結果の利用率β

         集計結果を利用した
         エージェントの勝率


0.5
                            情報利用エージェントと
                            申告エージェントは負の相関だった

        集計結果を利用しない
        エージェントの勝率
                         集計結果を利用する場合としない場合の
0.3                     勝率には負の相関(相関係数-0.43)がある
                       (実験結果1の状況が影響していると思われる)
            ステップ t
結論
• 行動決定テーブルによる既存のマイノリティゲームを、事前申
  告を取り入れたマイノリティゲームに拡張・分析
• 事前申告の利用者が,高い利得を獲得できるとは限らない
• 申告エージェントの勝率と,情報利用エージェントの勝利には負
  の相関が観察された


 Future Work

   事前申告が持つ情報量や信憑性の分析

More Related Content

Viewers also liked (20)

kita m
kita mkita m
kita m
 
mori m
mori mmori m
mori m
 
imakawa m
imakawa mimakawa m
imakawa m
 
minagawa m
minagawa mminagawa m
minagawa m
 
fuchunyu m
fuchunyu mfuchunyu m
fuchunyu m
 
hamada m
hamada mhamada m
hamada m
 
senda m
senda msenda m
senda m
 
kanehira m
kanehira mkanehira m
kanehira m
 
sasaki m
sasaki msasaki m
sasaki m
 
taguti b
taguti btaguti b
taguti b
 
iba m
iba miba m
iba m
 
itou m
itou mitou m
itou m
 
onodera b
onodera bonodera b
onodera b
 
kadota b
kadota bkadota b
kadota b
 
tadano b
tadano btadano b
tadano b
 
nagata b
nagata bnagata b
nagata b
 
hosokawa b
hosokawa bhosokawa b
hosokawa b
 
ono b
ono bono b
ono b
 
tanimura m
tanimura mtanimura m
tanimura m
 
iimura m
iimura miimura m
iimura m
 

More from harmonylab

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也harmonylab
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究harmonylab
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...harmonylab
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究harmonylab
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究harmonylab
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...harmonylab
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backboneharmonylab
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Modelsharmonylab
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimationharmonylab
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Modelsharmonylab
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimationharmonylab
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Modelsharmonylab
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究harmonylab
 
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究harmonylab
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究harmonylab
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究harmonylab
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究harmonylab
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究harmonylab
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...harmonylab
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究harmonylab
 

More from harmonylab (20)

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Models
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
 
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
 

Ppt godo g

  • 1. 事前申告を取り入れた マイノリティゲーム 北海道大学 工学部 情報工学科4年 複雑系工学講座 調和系工学研究室 神戸 芳文
  • 2. 背景 複雑系 個々の自律的振る舞いで系全体の振る舞いが決定 株式市場 利己的な戦略を持つ個人が多数集まり,系全体が構成される マイノリティゲーム 少数派に属した個人が利得を得るゲームであり,株式市場などを単純にモデル化したもの 買い 一斉に行動 多数派 売り 報酬 少数派
  • 3. 目的 マイノリティゲームに関する先行研究 •StandardMGの研究(C-.Zhang 1997) •人工市場のシンプルなモデルとしてのマイノリティゲーム •進化的アルゴリズムは人工市場にふさわしいか[和泉 2004] •エージェントの学習に「進化的アルゴリズム」を用いた研究 従来のMGではエージェントの行動はゲームの履歴だけで決定 現実にはうわさ,予想などの事前情報も考えて行動する 事前情報を含んだマイノリティゲームの提案 事前情報が行動に与える影響の分析 複雑系の側面をもつ株式市場をモデル化したマイノリティゲームを用いて, 事前情報が戦略の異なる複数の利己的エージェントの行動に与える影響を解析する
  • 4. 行動決定テーブルを用いたマルチエージェントモデル [和泉, et al., 04] 少数派だった行動 1 t-3 t-2 t-1 t 過去のゲームの履歴 A ・・・ B B A ? 各エージェントの行動でゲームをする 記憶長 m=2 の場合 報酬の獲得,行動決定テーブルの更新 t-2 t-1 t 報酬 行動決定テーブルの更新 A A P1 少数派 R 変更なし A B P2 多数派 無し 確率α P3 ← P3 B A P3 確率1-α 変更なし B B P4 行動決定テーブル 再びゲームをする
  • 5. 行動決定テーブルを用いたモデルの特性 A A P1 A B P2 全エージェントが同じ履歴に基づく B A P3 必ずテーブルの同じ行を使う B B P4 多数派のエージェントのうち 確率αでP3の行動を反転 エージェント数 α=0.5の場合 少数派:多数派 = 1:2 に収束する 少数派 多数派 このモデルを拡張することで,事前情報を考慮したマイノリティゲームを構築する
  • 6. 事前情報を用いたモデルの拡張 事前情報を用いたマイノリティゲームの流れ 任意で 集計結果の少数派を 報酬&行動決定 行動決定 事前申告 全エージェントに通知 テーブルの変更 申告エージェント A A P1 履歴 事前申告=行動 A B P2 ・事前申告はする B A P3 ・集計結果は使用しない B B P4 履歴 行動 申告の集計結果 A A P1 情報利用エージェント A B P2 ・事前申告をしない A B A P3 B B P4 ・集計結果を使用する 履歴 + A A P5 行動 A B P6 申告の集計結果 B B A P7 B B P8 申告エージェントと情報利用エージェントの個体数を変化させて実験を行う
  • 7. 実験結果1 試行回数:5000 申告エージェントに対して情報利用エージェントが少な いときは事前申告結果を使って確実に少数派に入れる 互いの平均利得が逆転 意外にも・・・ 情報利用エージェント 申告エージェントの人数が少ないと, 申告エージェントの方が高い利得を 得られている 申告エージェント 申告エージェント:1 申告エージェント:100 情報利用エージェント:100 情報利用エージェント:1
  • 8. 考察1 申告エージェントが少数のとき有利な理由 申告エージェント (10人) 行動A 7人 行動B 3人 申告エージェントは過去の履歴だけから行動を決定
  • 9. 考察1 申告エージェントが少数のとき有利な理由 申告エージェント 情報利用エージェント (10人) 申告エージェントの (91人) 事前申告結果が情 報利用エージェント 行動A 7人 の行動に影響 31人 少数派 行動B 60人 3人 情報利用エージェントは,1:2の割合で分かれる 全体の大部分を占める場合どちらが少数派になるかは情報利用エージェントに依存する
  • 10. 考察1 エージェントAが少数のとき有利な理由 申告エージェント 情報利用エージェント (10人) 申告エージェントの (91人) 事前申告結果が情 報利用エージェント 行動A 7人 の行動に影響 31人 少数派 行動B 60人 3人 申告エージェントは50%程度の確率で報酬を得られる
  • 12. 事前申告・申告集計結果を用いた学習 事前情報を用いたマイノリティゲームの流れ 任意で 集計結果の少数派を 報酬&行動決定 行動決定 事前申告 全エージェントに通知 テーブルの変更 利用しない場合はテーブルQ2 テーブルQ1によって 確率βで 事前情報を 利用する場合はテーブルQ3 事前申告を決定する 事前情報を利用 によって行動を決定する 状態 s 行動 a テーブルQ1 過去m回の履歴 事前申告 テーブルQ2 過去m回の履歴 ゲームの行動 申告集計結果& テーブルQ3 ゲームの行動 過去m回の履歴 3つのQテーブルと確率βを学習させる
  • 13. Qテーブルとβの学習方法 行動価値関数 Q学習:利用した行動価値関数を更新 Q( st , at )  Q( st , at ) α reward ta1   max Q( st 1 , at 1 )  Q( st , at )] [ 実験設定 Q学習の学習率 α=0.1 割引率 γ=0.0 申告集計結果の利用率β   0.05   if 申告集計結果を 利用して成功 or 利用しないで失敗     0.05   if 申告集計結果を 利用して失敗 or 利用しないで成功 実験設定 βの初期値=1.0
  • 14. 実験結果2 初期段階では申告集計結果を利用しない方が勝率が高く,βが減少 0.7 実験結果1では・・・ 申告集計結果の利用率β 集計結果を利用した エージェントの勝率 0.5 情報利用エージェントと 申告エージェントは負の相関だった 集計結果を利用しない エージェントの勝率 集計結果を利用する場合としない場合の 0.3 勝率には負の相関(相関係数-0.43)がある (実験結果1の状況が影響していると思われる) ステップ t
  • 15. 結論 • 行動決定テーブルによる既存のマイノリティゲームを、事前申 告を取り入れたマイノリティゲームに拡張・分析 • 事前申告の利用者が,高い利得を獲得できるとは限らない • 申告エージェントの勝率と,情報利用エージェントの勝利には負 の相関が観察された Future Work 事前申告が持つ情報量や信憑性の分析