1. 対称性推論によるポリシーの自己組織化と
強化学習への応用
Self-Organization of Policy by Symmetric Reasoning and
Application of Reinforcement Learning
東京電機大学大学院理工学研究科 情報学専攻
10RMJ30 甲野 佑
48. Loosely Symmetric model
・モンテカルロ法へ応用
大用庫智, 高橋達二 (2010) “因果帰納と意思決定を結ぶ緩い対称モデル”,
日本認知科学会 第 27 回大会発表論文集, 799–800.
・教師あり学習へ応用
神谷匠, 高橋達二(2011) “緩い対称性による語彙学習バイアスの発現”,
日本認知科学会 第 28 回大会発表論文集, 542–548.
・強化学習へ限定的に応用
Uragami D., Takahashi T., Alsubeheen H., Sekiguchi A. and Matsuo Y. (2011),
“The Efficacy of Symmetric Cognitive Biases in Robotic Motion Learning”.
Proceedings of the IEEE ICMA2011 August 7–10, Beijing, China, pp. 410–415.
49. Loosely Symmetric model
・モンテカルロ法へ応用
大用庫智, 高橋達二 (2010) “因果帰納と意思決定を結ぶ緩い対称モデル”,
日本認知科学会 第 27 回大会発表論文集, 799–800.
・教師あり学習へ応用
神谷匠, 高橋達二(2011) “緩い対称性による語彙学習バイアスの発現”,
日本認知科学会 第 28 回大会発表論文集, 542–548.
・強化学習へ限定的に応用
Uragami D., Takahashi T., Alsubeheen H., Sekiguchi A. and Matsuo Y. (2011),
“The Efficacy of Symmetric Cognitive Biases in Robotic Motion Learning”.
Proceedings of the IEEE ICMA2011 August 7–10, Beijing, China, pp. 410–415.
いずれも有用であるという結果
82. 主な参考文献
• Hattori M., Oaksford M. (2007) “Adaptive non-interventional heuristics for covariation detection in causal induction:
Model comparison and rational analysis”, Cognitive Science, 31, 5, 765–814.
• 篠原修二, 田口亮, 桂田浩一, 新田恒雄(2007) “因果性に基づく信念形成モデルとN 本腕バンディット問題への適用”,
人工知能学会論文誌, 22, 1, 58–68.
• Takahashi T., Nakano M., Shinohara S. (2010) “Cognitive symmetry: Illogical but rational biases”, Symmetry: Culture
and Science , 21, 1–3, 275–294 .
• 大用庫知識, 甲野佑, 高橋達二(2011), “非定常N 本腕バンディット問題に対する人間の認知バイアスの適用”, 2011 年
度人工知能学会全国大会2011 年度人工知能学会全国大会(第25 回) 予稿集, 1P2-12in.
• Tatsuji Takahashi,Kuratomo Oyo, Shuji Shinohara:“ A Loosely Symmetric Model ofCognition ”, Lecture Notes in
Computer Science, No. 5778, Springer, pp. 234–241(2011).
• Uragami D., Takahashi T., Alsubeheen H., Sekiguchi A. and Matsuo Y. (2011), “The Efficacy of Symmetric Cognitive
Biases in Robotic Motion Learning”. Proceedings of the IEEE ICMA2011 August 7–10, Beijing, China, pp. 410–415.
• 日本認知心理学会(監修), 楠見孝(編).『現代の認知心理学第3 巻思考と言語』, 2–29. 北大路書房. 2010 年7 月刊行.
• Takahashi T., Oyo K., Shinohara S. (2011) “A Loosely Symmetric Model of Cognition”,Lecture Notes in Computer
Science, 5778, 234–241.
• Takahashi, T., Nakano, M., Shinohara, S. (2010) “Cognitive symmetry: Illogical but rational biases,” Symmetry:
Culture and Science , Vol. 21, No. 1-3, pp. 275–294.
• Hattori,M. & Oaksford,M. (2007) Adaptive non-interval heuristics for covariation detection in causal induction: Model
comparison and rational analysis. Cognitive Science, 31,765-814.
• Sutton, R. S., Barto, A. G. (2000) 強化学習. 森北出版. (三上, 皆川訳)
• Sutton, R. S. (1996) Generalization in Reinforcement Learning: Successful Examples Using Sparse Coarse Coding,
Advances in Neural Information Processing Systems 8, pp. 1038-1044, MIT Press, 1996.