18. 【AlphaGoにおけるCNN(SL Policy network)の構成】
• 入力は48チャネル(黒石/白石の位置、石の生き死に・・・)
• 中間層は13層構成
• 3,000万の盤面データをベースに50GPUで3.4億ステップ、3週間にわたり
学習を続けた結果、プロの指し手を57.0%の精度で予想することができる
ようになった。(Mastering the game of Go with deep neural networks
and tree search)
アルファー碁の畳み込みニューラルネット(CNN)