More Related Content
Similar to データ解析5 単回帰分析 (20)
More from Hirotaka Hachiya
More from Hirotaka Hachiya (16)
データ解析5 単回帰分析
- 3. 機械学習手法の種類
9
問題(データの条件など)と目的に合わせて適切な
機械学習方法を選択する必要がある
問題 定義 代表的な方法 応用例
教師あり学習 入力と出力のデータに基づき、
入力を出力に変換する関数を
学習
SVM, 回帰、決定木、
ランダムフォーレス
トなど
スパム分類、顔検出、一
般物体認識、将棋局面
の評価など
教師なし学習 入力のみの事例に基づき、
入力の特性 (パターン、構造)
を学習
PCA, LDA、HMMなど データの可視化
(クラスタリング、次元圧
縮)
半教師学習 入力のうち部分的に付与された
出力の事例に基づき
入力を出力に変換する関数を
学習
transductiveSVM,
Laplacian SVMなど
画像、音声、Webログな
どの大量データで、コス
トの問題で一部のデータ
のみしか出力(答え)が
付与されていない場合
強化学習 入力と、出力に対する報酬
(評価)のデータに基づき、
入力を出力に変換する関数を
学習
Q-learning、policy
iteration, policy
gradient
ロボット制御、Web広告
選択、マーケティング
- 6. 単回帰問題の定式化
入力(説明変数)𝑥𝑥:実数値スカラー
出力(目的変数)𝑦𝑦:実数値スカラー
学習データ:
単回帰モデル:回帰直線
学習するモデルのパラメータ:
12
𝐷𝐷𝑡𝑡𝑡𝑡 = 𝑥𝑥1
, 𝑦𝑦1
, 𝑥𝑥2
, 𝑦𝑦2
, … , 𝑥𝑥 𝑁𝑁
, 𝑦𝑦 𝑁𝑁
= 𝑥𝑥𝑖𝑖
, 𝑦𝑦𝑖𝑖
𝑖𝑖=1
𝑁𝑁
𝑤𝑤:傾き
𝑏𝑏: 𝑦𝑦の切片
�𝑓𝑓𝑤𝑤,𝑏𝑏 𝑥𝑥 = 𝑤𝑤𝑤𝑤 + 𝑏𝑏
𝑥𝑥
𝑦𝑦
𝑜𝑜
i番目に観測された学習データ
𝑥𝑥𝑖𝑖, 𝑦𝑦𝑖𝑖
�𝑓𝑓𝑤𝑤,𝑏𝑏 𝑥𝑥
- 9. 最小二乗法
16
二乗誤差和による損失関数:
最適化問題:
制約条件なしの最適化問題
偏微分を用いて最適解を求めることができる
𝐸𝐸 𝑤𝑤, 𝑏𝑏 = �
𝑖𝑖=1
𝑁𝑁
𝑦𝑦𝑖𝑖 − �𝑓𝑓𝑤𝑤,𝑏𝑏 𝑥𝑥𝑖𝑖
2
𝑥𝑥
𝑦𝑦
𝑜𝑜
誤差𝜀𝜀𝑖𝑖
�𝑓𝑓𝑤𝑤,𝑏𝑏 𝑥𝑥
𝑥𝑥𝑖𝑖
𝑦𝑦𝑖𝑖
�𝑓𝑓𝑤𝑤,𝑏𝑏 𝑥𝑥𝑖𝑖
目的関数(Objective function)
min
𝑤𝑤,𝑏𝑏
𝐸𝐸 𝑤𝑤, 𝑏𝑏
𝜀𝜀𝑖𝑖
- 10. 二乗誤差和による損失関数を展開
𝑤𝑤について偏微分し0とおく
𝑏𝑏について偏微分し0とおく
①と②から
最小二乗法によるパラメータ最適化
17
𝐸𝐸 𝑤𝑤, 𝑏𝑏 = ∑𝑖𝑖=1
𝑁𝑁
𝑦𝑦𝑖𝑖
− �𝑓𝑓𝑤𝑤,𝑏𝑏 𝑥𝑥𝑖𝑖
2
= ∑𝑖𝑖=1
𝑁𝑁
𝑦𝑦𝑖𝑖2
− 2𝑦𝑦𝑖𝑖
𝑤𝑤𝑥𝑥𝑖𝑖
+ 𝑏𝑏 + 𝑤𝑤𝑥𝑥𝑖𝑖
+ 𝑏𝑏
2
𝜕𝜕𝐸𝐸(𝑤𝑤,𝑏𝑏)
𝜕𝜕𝑤𝑤
= ∑𝑖𝑖=1
𝑁𝑁
−2𝑦𝑦𝑖𝑖 𝑥𝑥𝑖𝑖 + 2 𝑤𝑤𝑥𝑥𝑖𝑖 + 𝑏𝑏 𝑥𝑥𝑖𝑖 = − ∑𝑖𝑖=1
𝑁𝑁
𝑦𝑦𝑖𝑖 𝑥𝑥𝑖𝑖+ ∑𝑖𝑖=1
𝑁𝑁
𝑤𝑤𝑥𝑥𝑖𝑖2
+ ∑𝑖𝑖=1
𝑁𝑁
𝑏𝑏𝑥𝑥𝑖𝑖 = 0
�𝑓𝑓𝑤𝑤,𝑏𝑏 𝑥𝑥 = 𝑤𝑤𝑤𝑤 + 𝑏𝑏
𝜕𝜕𝐸𝐸(𝑤𝑤,𝑏𝑏)
𝜕𝜕𝑏𝑏
= ∑𝑖𝑖=1
𝑁𝑁
−2𝑦𝑦𝑖𝑖
+ 2 𝑤𝑤𝑥𝑥𝑖𝑖
+ 𝑏𝑏 = − ∑𝑖𝑖=1
𝑁𝑁
𝑦𝑦𝑖𝑖
+ ∑𝑖𝑖=1
𝑁𝑁
𝑤𝑤𝑥𝑥𝑖𝑖
+ 𝑁𝑁𝑁𝑁 = 0
―①
―②
𝑤𝑤 ∑𝑖𝑖=1
𝑁𝑁
𝑥𝑥𝑖𝑖2
+ 𝑏𝑏 ∑𝑖𝑖=1
𝑁𝑁
𝑥𝑥𝑖𝑖 = ∑𝑖𝑖=1
𝑁𝑁
𝑦𝑦𝑖𝑖 𝑥𝑥𝑖𝑖
𝑤𝑤 ∑𝑖𝑖=1
𝑁𝑁
𝑥𝑥𝑖𝑖 + 𝑏𝑏𝑏𝑏 = ∑𝑖𝑖=1
𝑁𝑁
𝑦𝑦𝑖𝑖
2元1次連立方程式
∑𝑖𝑖=1
𝑁𝑁
𝑏𝑏 = 𝑁𝑁
- 13. 最小二乗法のまとめ
学習データ: 𝐷𝐷𝑡𝑡𝑡𝑡 = 𝑥𝑥𝑖𝑖, 𝑦𝑦𝑖𝑖
𝑖𝑖=1
𝑁𝑁
単回帰モデル:回帰直線 �𝑓𝑓𝑤𝑤,𝑏𝑏 𝑥𝑥 = 𝑤𝑤𝑤𝑤 + 𝑏𝑏
𝑦𝑦成分の誤差の二乗誤差和の最小化により、学習データの𝑦𝑦成分
の平均の点を通る直線 �𝑓𝑓𝑤𝑤∗,𝑏𝑏∗ 𝑥𝑥 を獲得
最適な傾き𝑤𝑤∗と切片𝑏𝑏∗は、学習データの分散と共分散で求まる
23
i番目に観測された学習データ
𝑥𝑥𝑖𝑖
, 𝑦𝑦𝑖𝑖
�𝑓𝑓𝑤𝑤∗,𝑏𝑏∗ 𝑥𝑥
𝑥𝑥
𝑦𝑦
𝑜𝑜
𝐸𝐸 𝑤𝑤, 𝑏𝑏 = ∑𝑖𝑖=1
𝑁𝑁
𝑦𝑦𝑖𝑖 − �𝑓𝑓𝑤𝑤,𝑏𝑏 𝑥𝑥𝑖𝑖
2
𝑤𝑤∗, 𝑏𝑏∗ = argmin
𝑤𝑤,𝑏𝑏
𝐸𝐸 𝑤𝑤, 𝑏𝑏
𝑏𝑏∗ = �𝑦𝑦 −
S𝒙𝒙𝒙𝒙
S𝒙𝒙𝒙𝒙
̅𝑥𝑥= �𝑦𝑦 − 𝑤𝑤∗ ̅𝑥𝑥𝑤𝑤∗ =
S𝒙𝒙𝒙𝒙
S𝒙𝒙𝒙𝒙
- 14. 最小二乗法の解釈と問題点
24
学習データの𝑦𝑦成分との誤差𝜀𝜀𝑖𝑖の二乗和を最小化
誤差𝜀𝜀𝑖𝑖の二乗は、誤差𝜀𝜀𝑖𝑖を1辺とする面積に対応
最小二乗法:面積和を最小にするように傾きと切片を最適化
したがって、最小二乗法は、外れ値(データの中心から大き
く外れたノイズ)の影響を受けやすい問題がある
min
𝑤𝑤,𝑏𝑏
∑𝑖𝑖=1
𝑁𝑁
𝑦𝑦𝑖𝑖 − �𝑓𝑓𝑤𝑤,𝑏𝑏 𝑥𝑥𝑖𝑖
2
= min
𝑤𝑤,𝑏𝑏
∑𝑖𝑖=1
𝑁𝑁
𝜀𝜀𝑖𝑖2
誤差𝜀𝜀𝑖𝑖の大きさが二乗で影響する
例えば、𝜀𝜀𝑖𝑖
= 1の点と、 𝜀𝜀 𝑘𝑘
= 10の点が
ある場合、 𝜀𝜀 𝑘𝑘
は𝜀𝜀𝑖𝑖
の100倍の影響力を持つ𝑥𝑥𝑖𝑖
, 𝑦𝑦𝑖𝑖
𝑥𝑥
𝑦𝑦
𝑜𝑜
𝑥𝑥 𝑘𝑘
, 𝑦𝑦 𝑘𝑘 𝑥𝑥 𝑗𝑗
, 𝑦𝑦 𝑗𝑗
𝜀𝜀 𝑘𝑘 𝜀𝜀𝑖𝑖
𝜀𝜀 𝑘𝑘2 𝜀𝜀𝑖𝑖2𝜀𝜀 𝑗𝑗
𝜀𝜀 𝑗𝑗2