58. 57
視覚情報処理と工学
ネオコグニトロ
K. Fukushima, Neocognitron: A self-organizing neural network model for a mechanism of pattern recognition
unaffected by shift in position, Biological Cybernetics, vol. 36, pp. 193-202, 1980
また、cnnをもちいず、画像認識を行っている例もあります。Building High-level Features Using Large Scale Unsupervised Learning
2012にgoogleが「人間が教えずとも、コンピュータが自発的に猫を認識できるようになった」と発表し話題になりました。
その時に同時に発表された画像がこの猫の画像です。この猫の画像は人間が猫としてコンピュータに教えたものではなく、ランダムに大量の画像を
与えた際に、コンピュータが自発的に学習した画像だそうです。
この実験では、YouTubeにアップロードされている動画から、ランダムに取り出した200x200ピクセルサイズの画像を1000万枚用意し、それを1,000台のコンピュータで3日間かけて学習を行ったという、めちゃめちゃマシンパワー命、みたいな研究なんですが
(3%前後の画像に人間の顔が含まれていた。猫が含まれる画像もたくさんあった)。
ニューラルネットワークの最初の層の入力は各画素(200x200=40,000)のRGBの値で、9つの階層を構築した。・1000台のコンピュータで3日間かけて学習を行った。
ニューロンが最も強く反応する画像を作り出した」・その結果、人間の顔、猫の顔、人間の体の写真に反応するニューロンができた
CNNを学習後の畳み込みフイルタの重みが左の図になります
Deep belief net使用して、ラベル付けしていない生画像を教師なしで学習
各階層ごとに