Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

hamada m

591 views

Published on

  • Be the first to comment

  • Be the first to like this

hamada m

  1. 1. ゲーム環境におけるタグ情報の利用と 戦略進化に関する研究 システム情報工学専攻 複雑系工学講座 調和系工学分野 濱田 貴広
  2. 2. はじめに タグ チープトーク タグ シグナリング コスト送信内容 ゲーム理論における,事前コミュニケーション シグナリング プレイヤがある行動を選択することによって自分のタイプを 顕示しようとする行為 → コストをかけることで戦略的効果の発揮 チープトーク コストのかからないシグナリング 有 無 無 意図的 意図的 非意図的 ・誰からも可視な外見上の特徴 ・プレイヤの行動と明示的な相関はない ・意図的な変更不可 ・コストゼロ
  3. 3. 関連研究 [Riole 97] [Alkemade et. al. 00] [Axtell et. al. 00] IPDゲームで,類似したタグを持つプレイヤを相手として 選択することによる協調関係の形成 相手選択に使用 行動選択に使用 タグで特徴付けられるプレイヤ集団の行動に対する期待を形成し, それをもとに行動選択する. 要求ゲームにおける規範の形成,平等規範の安定性 チキンゲームにおける,タグの複雑化,集団サイズの利得への影響 [Hoffmann 01]
  4. 4. 目的 ゲーム環境において,タグ情報を利用するプレイヤとそうでないプ レイヤが混在する集団では,タグ情報がどのくらい意味のあるも のになるのかを考察する プレイヤはタグを識別して行動することを前提 タグで特徴づけられるプレイヤ集団をひとまとめに考えて, 次回以降の相手の行動を予測する. ステレオタイプ化
  5. 5. モデルとゲーム )}{,}{,( NiiNii fSNG  },{ DCSi  プレイヤ集合 行動選択 利得関数 }2,1{N ゲーム タグ C D C 4,4 1,3 D 3,1 2,2 C D C 3,3 2,4 D 4,2 1,1 C D C 3,3 1,4 D 4,1 2,2 チキンゲーム 囚人のジレンマゲーム 鹿狩りゲーム 鹿狩りゲーム チキンゲーム 囚人のジレンマゲーム 支配戦略が存在しない ナッシュ均衡の対称性 リスク支配な戦略がない 支配戦略が存在しない ナッシュ均衡の非対称性 支配戦略が存在するが パレート最適ではない 2人非協力ゲーム・1 shot - game 2 21: RSSfi  }1,...,1,0{  tTti ・・・ プレイヤに唯一で意図的な変更不可
  6. 6. プレイヤのタイプと戦略 入力 行動履歴 出力 行動提示 タグ <出力> D C 1 1 2 行動m(記憶長) C D C C 0 1 D Dt-1 … 各タグをもつプレイヤに対する履歴 m=2 … タグで特徴付けられた 集団全体に対する履歴 ステレオタイプ化した戦略表現 <入力> tm 2 戦略遺伝子列長 : それぞれのタグを持つプレイヤに対する戦略 0 D C D C D D D D ・・・ D C D C 1 t-1 i. Type D : Tag Distinguish ii. Type N : Noise Input タグが特定の集団に対応付いている タグが特定の集団に対応付いていない xランダムに決定 t )( Tt  )( Tx
  7. 7. 戦略進化のプロセス GAでプレイヤの戦略を適応的に更新する 適応度 ⇒ 平均利得 ルーレット選択 二点交叉 ( 同タイプ,同タグの相手とのみ ) 突然変異 ( 戦略遺伝子列,タイプ,タグ ) P(player数) M(ゲーム回数) T(タグの種類の数) m(記憶長) GAの世代数 交叉率 タグ変異率 戦略タイプ変異率 突然変異率 試行回数 100 平均 40 設定による 2 10000 0.5 0.01 0.01 0.001 ( per bit ) 20
  8. 8. 入力情報の影響の定量化    Xx xpxpXHH )(log)()( 2    YyXx yxpyxpYXH , 2 )|(log),()|( )|()(),( YXHXHYXIItag  },{ DCXx  },...,1{ tYy  行動の不確実性 タグ入力の情報量 行動 タグ )(xp 各行動の選択割合 プレイヤの行動に対して,タグ情報がどのくらい影響を与えているのかを定量化
  9. 9. 実験 Type D のプレイヤのみの集団 Type D と Type N のプレイヤの混合集団 tagI と平均利得の関係 tagI と平均利得の関係Type Dのプレイヤ集団の Type Dと Type N のプレイヤ集団の平均利得の比較
  10. 10. T = 1 Type Dのみの集団 2 2.2 2.4 2.6 2.8 3 3.2 3.4 3.6 3.8 4 0 0.02 0.04 0.06 0.08 0.1 0.12 tagI 平 均 利 得 T = 1, 2, 3, 4, 5, 6, 7. 初期状態 : 各タグを持つプレイヤ数はほぼ同数 鹿狩りゲーム チキンゲーム 囚人のジレンマゲーム 鹿狩りゲームにおいてタグの情報量と平均利得に正の相関がある それぞれの設定における全世代,全試行の平均をプロット
  11. 11. Type D + Type N の混合集団 2 2.2 2.4 2.6 2.8 3 3.2 3.4 3.6 3.8 4 0 0.02 0.04 0.06 0.08 0.1 0.12 tagI タ イ プ D の プ レ イ ヤ ー の 平 均 利 得 T = 2, 3, 4, 5. 初期状態 : type D とtype N のプレイヤは同数 各タグを持つプレイヤ数もほぼ同数 鹿狩りゲーム チキンゲーム 囚人のジレンマゲーム それぞれの設定における全世代,全試行の平均をプロット 鹿狩りゲームにおいてタグの情報量と平均利得に正の相関がある
  12. 12. Type D + Type N の混合集団 0 1 2 3 4 2 3 4 5 0 1 2 3 4 2 3 4 5 0 1 2 3 4 2 3 4 5 鹿狩りゲームにおいてのみType Dの平均利得が高い T = 2, 3, 4, 5. 初期状態 : type D とtype N のプレイヤは同数 各タグを持つプレイヤ数はほぼ同数 それぞれの設定における全世代,全試行の平均 各 タ イ プ の プ レ イ ヤ ー の 平 均 利 得 TT T 鹿狩りゲーム チキンゲーム 囚人のジレンマゲーム 各 タ イ プ の プ レ イ ヤ ー の 平 均 利 得 各 タ イ プ の プ レ イ ヤ ー の 平 均 利 得 type Nのプレイヤの平均利得 type Dのプレイヤの平均利得
  13. 13. 考察 Type Dのプレイヤのみの集団では,タグの情報量と平均利得に 正の相関があるので,特に鹿狩りゲームではタグ情報は意味 が ある Type DとType Nのプレイヤの混合集団では, 鹿狩りゲームで,Type Dのプレイヤにおいてタグの情報量と 平均利得に正の相関があり,かつ平均利得に関して, Type D がType Nを上回ったので,タグ情報は意味がある ・・・タグ情報に意味を持つのはゲームの性質による
  14. 14. まとめ タグ情報を利用するプレイヤ間のゲームを扱った タグ情報を利用しないプレイヤが混在する状況では,ゲー ムによっては,進化の過程でタグ情報に対する行動の期待が 実現されにくくなり,ジレンマ型のゲームにおいては,タグ情 報は意味を持たなくなる タグ情報を特定の集団に対応付けて行動選択するプレイヤ 集団では,タグ情報は意味がある

×