SNSを活用したキムワイプの画像認識10. 機械学習概論
そもそも機械学習とは?
Wikipedia 「機械学習」
機械学習(きかいがくしゅう、(英: machine learning)とは、人間が持つ学習に
あたる仕組みを機械(特にコンピュータ)で実現する技術・手法の総称である。
教師あり学習
データと「正解」の対から未知のデータについても予測を立てる(分類,回帰)
教師なし学習
「正解」が与えられない.データの構造を解析する(クラスター分析,主成分分析,……)
強化学習
試行錯誤の選択に対する環境の応答から「正解」を探索する.(ゲームAI他 最適化問題)
12. 機械学習概論
教師あり学習
y = 1.5097x - 0.009
R² = 0.9888
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
-1.5 -1 -0.5 0 0.5 1 1.5
13. 機械学習概論
教師あり学習
y = 0.1558x + 0.0096
R² = 0.2142
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
-1.2 -0.7 -0.2 0.3 0.8
14. 機械学習概論
教師あり学習
y = 1.0217x3 + 0.0053x2 - 0.5157x + 0.0068
R² = 0.9586
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
-1.2 -0.7 -0.2 0.3 0.8
15. 機械学習概論
汎化性能
-1
-0.5
0
0.5
1
1.5
2
-1.2 -0.7 -0.2 0.3 0.8 1.3 1.8
-1
-0.5
0
0.5
1
1.5
2
-1.2 -0.7 -0.2 0.3 0.8 1.3 1.8
y = 0.3907x6 - 0.0986x5 - 0.5054x4
+ 1.1382x3 + 0.1468x2 - 0.5421x + 0.0033
R² = 0.9619
y = 1.0217x3 + 0.0053x2 - 0.5157x + 0.0068
R² = 0.9586
16. 使用手法
入力データ:画像データ-ラベルの組
説明変数 Xi ∈ R12288 (i=1, …, 416+426)
画像を64x64に変形,64x64x3=12288 のテーブルデータとして入力
目的変数 yi ∈ {0, 1}
「キムワイプっぽい」or「キムワイプっぽくない」を手作業でラベル付け
X1
X2
XN
︙
予測器
y1
y2
yN
︙
y1
y2
yN
︙
比較→精度
29. 考察
ラベリングの最適化
現在は「キムワイプっぽさ」は個人の主観で決定
0-1ではなく入力データの時点で「キムワイプっぽさ」を数値化したい
アンケートの利用
画像に対してキムワイプっぽいか否かの2択投票
→「キムワイプっぽい」の割合を入力データとする
Twitterのアンケート機能?
欠点:
Twitterは画像とアンケートを共存させられない
サンプル数(~数100)を集めるのはかなり大変
30. 参考
Sebastian Raschka, 福島 真太朗 訳 (2015)
『Python機械学習プログラミング 達人データサイエンティストによる
理論と実践』 株式会社クイープ
崎下雄稀 (2019) 卒業研究報告書
C. D. Hieu, C. N. Viet, L. P. Tien, T. N. Anh, K. Terakura, T. Miyake and H. Kino,
(2018) "Important descriptors and descriptor groups of Curie temperatures of
rare-earth transition-metal binary alloys," JPSJ News and Comments, vol. 15, no.
10, 2018.
Editor's Notes JR115系 第二次新潟色 通称「キムワイプ」