SlideShare a Scribd company logo
PRML 上巻勉強会
第1章 序論

東京大学大学院 工学系研究科
技術経営戦略学専攻 ウェブ工学研究室

大澤 昇平
ohsawa@weblab.t.u-tokyo.ac.jp
ADGENDA

•はじめに
•1.1 多項式フィッティング
•1.2 確率論
•1.3 モデル選択

1
ADGENDA

•はじめに
•1.1 多項式フィッティング
•1.2 確率論
•1.3 モデル選択

2
はじめに
データに潜むパターンを見つけ出すと言う問題は根源的なものであり、その歴史は深い
•

天体観測を契機とする古典力学の誕生

•

原子スペクトルの規則性の発見を契機とする量子科学の誕生

パターン認識=計算機アルゴリズムを通して、データの規則性を発見すること
•

人間が規則性を決定する方法もある
• しかし、このアプローチはルール数の増大によってすぐに破綻する

3
•

機械学習のアプローチを採用すれば、はるかに良い結果が得られる

•

N 個の手書き数字の大きな集合を使って、モデルのパラメータを適応的に調整

4
パターン認識の例

手書き文字認識
多項式曲線フィッティング
•

限られたデータ点から、それを生成した元の関数を予測したい。

予測式(ここではM次多項式を想定)
二乗和誤差関数
•

データと予測関数の間の誤差を最小にする。
過学習
しかし、実際はそんなに単純じゃない。変数が増えると、予測関数はデータに含まれるノイズに強く影響される。
過学習
モデルが過学習するかを知るには、訓練時のデータとは別なデータを使って誤差を評価すれば良い。
テスト誤差は大き
い!

訓練誤差は最も小さ
いが・・・

二乗平均平方根(RMS)誤差
過学習
予測関数の係数を見ると、過学習のケースでは値が大きくなっている。
過学習をすると係数
は大きくなる。
データセットのサイズの影響
データセットのサイズが増加するにしたがい、過学習の度合いは是正されていく。
正規化: 過学習を防ぐ方法

大きな係数値にペナルティを与える
正規化係数
•

正規化係数を大きくしすぎると、真値へのフィット具合も抑制される
正規化係数
•

vs

全ページでの事例を、RMS誤差を使って定量的に議論

正規化係数が小さす
ぎると、過学習

テスト誤差を最小化
する正規化係数
多項式の係数
•

正規化係数が大きすぎると、係数が小さくなりすぎる
ADGENDA

•はじめに
•1.1 多項式フィッティング
•1.2 確率論
•1.3 モデル選択

16
確率論
40%

60%

赤い箱
青い箱

りんご
オレンジ
結合確率
周辺確率
条件付き確率
加法定理
𝐿

𝑝 𝑋 = 𝑥𝑖 =

𝑝(𝑋 = 𝑥 𝑖 , 𝑌 = 𝑦 𝑗 )
𝑗=1
乗法定理
𝑝 𝑋 = 𝑥 𝑖, 𝑌 = 𝑦𝑗

𝑛 𝑖𝑗
𝑛 𝑖𝑗 𝑐 𝑖
=
=
∙ = 𝑝 𝑌 = 𝑦 𝑗 𝑋 = 𝑥 𝑖 𝑝(𝑋 = 𝑥 𝑖 )
𝑁
𝑐𝑖 𝑁
確率の基本法則

加法定理
乗法定理
ベイズの定理
尤度

事前確率

事後確率

正規化係数

事後確率  尤度 × 事前確率
連続確率分布
累積確率
確率密度関数

xがある区間内に入る確率

累積確率分布は、値が特定の値以下になる
確率で与えられる。

確率分布の条件
分布の変換

変換関数

ヤコビアン
期待値
関数の期待値(離散)

条件付き確率(離散)

近似期待値(離散、連続)

関数の期待値(連続)
分散、共分散

分散(期待値からのずれの期待値)

共分散(一変量)

共分散(多変量)
ガウス分布
ガウス分布の定義式

ガウス分布のグラフ
確率分布の条件式を満たす
ガウス分布の平均、分散

ガウス分布の期待値

ガウス分布の二次モーメント(二乗の期待値)

ガウス分布の分散
多変量ガウス分布
多変量ガウス分布の定義式

多変量ガウス分布の等高線
ガウス分布のパラメータ推定
•

ある点列から、ガウス分布がどの分布から生成されたものなのかを推定する

尤度関数
最尤推定
• 対数尤度を最小化するようなパラメータμ、σを求める→最尤推定(ML)

平均の最尤推定値

分散の最尤推定値
と

の性質

• 平均の最尤推定値の期待値は、
平均の真値と等しい

• しかし、分散の最尤推定値の期待値は、
真値よりも低く見積もられてしまう!

• 不偏分散:期待値を補正する
曲線フィッティング再訪
• 1.1 で見た曲線フィッティングを、確率論の観点から再考してみる
最尤推定

• 尤度関数

• 対数尤度

二乗和誤差

を最小化することで、

• 分散の推定

を決定する
予測分布
MAP推定:ベイズへの道

• 事前分布

• 予測誤差

• 正規化最小二乗誤差

Determine

by minimizing regularized sum-of-squares error,

.
ベイズ曲線フィッティング

• 新たな点xに関する目標値tを、p(t|x,w)をwに対して周辺化するこ
とによって求める。

• 予測平均

• 分散行列

• 予測分散

• 基底
ベイズ予測分布
ADGENDA

•はじめに
•1.1 多項式フィッティング
•1.2 確率論
•1.3 モデル選択

41
モデル選択
•

これまで、正規化係数や次元数など、モデルの超パラメータを調整する方
法については説明してこなかった

•

実際には、下図に示す交差検定をすることで求める

訓練データ

検定データ

More Related Content

What's hot

PRML読書会#2,#3資料
PRML読書会#2,#3資料PRML読書会#2,#3資料
PRML読書会#2,#3資料
Hiromasa Ohashi
 
PRML勉強会第3回 2章前半 2013/11/28
PRML勉強会第3回 2章前半 2013/11/28PRML勉強会第3回 2章前半 2013/11/28
PRML勉強会第3回 2章前半 2013/11/28
kurotaki_weblab
 
Prml 1.2,4 5,1.3|輪講資料1120
Prml 1.2,4 5,1.3|輪講資料1120Prml 1.2,4 5,1.3|輪講資料1120
Prml 1.2,4 5,1.3|輪講資料1120
Hayato K
 
PRML読書会#4資料+補足
PRML読書会#4資料+補足PRML読書会#4資料+補足
PRML読書会#4資料+補足
Hiromasa Ohashi
 

What's hot (20)

PRML輪読#2
PRML輪読#2PRML輪読#2
PRML輪読#2
 
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
 
負の二項分布について
負の二項分布について負の二項分布について
負の二項分布について
 
PRML読書会#2,#3資料
PRML読書会#2,#3資料PRML読書会#2,#3資料
PRML読書会#2,#3資料
 
PRML勉強会第3回 2章前半 2013/11/28
PRML勉強会第3回 2章前半 2013/11/28PRML勉強会第3回 2章前半 2013/11/28
PRML勉強会第3回 2章前半 2013/11/28
 
変分ベイズ法の説明
変分ベイズ法の説明変分ベイズ法の説明
変分ベイズ法の説明
 
PRML2.1 2.2
PRML2.1 2.2PRML2.1 2.2
PRML2.1 2.2
 
Prml 1.2,4 5,1.3|輪講資料1120
Prml 1.2,4 5,1.3|輪講資料1120Prml 1.2,4 5,1.3|輪講資料1120
Prml 1.2,4 5,1.3|輪講資料1120
 
PRML読書会#4資料+補足
PRML読書会#4資料+補足PRML読書会#4資料+補足
PRML読書会#4資料+補足
 
マルコフ連鎖モンテカルロ法
マルコフ連鎖モンテカルロ法マルコフ連鎖モンテカルロ法
マルコフ連鎖モンテカルロ法
 
PRML 上 2.3.6 ~ 2.5.2
PRML 上 2.3.6 ~ 2.5.2PRML 上 2.3.6 ~ 2.5.2
PRML 上 2.3.6 ~ 2.5.2
 
3分でわかる多項分布とディリクレ分布
3分でわかる多項分布とディリクレ分布3分でわかる多項分布とディリクレ分布
3分でわかる多項分布とディリクレ分布
 
Prml 2.3
Prml 2.3Prml 2.3
Prml 2.3
 
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
 
PRML11章
PRML11章PRML11章
PRML11章
 
MCMC法
MCMC法MCMC法
MCMC法
 
DeepLearning 輪読会 第1章 はじめに
DeepLearning 輪読会 第1章 はじめにDeepLearning 輪読会 第1章 はじめに
DeepLearning 輪読会 第1章 はじめに
 
PRML輪読#3
PRML輪読#3PRML輪読#3
PRML輪読#3
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介
 
階層モデルの分散パラメータの事前分布について
階層モデルの分散パラメータの事前分布について階層モデルの分散パラメータの事前分布について
階層モデルの分散パラメータの事前分布について
 

Viewers also liked

手書き数字文書の認識 (JOI夏期セミナー2016)
手書き数字文書の認識 (JOI夏期セミナー2016)手書き数字文書の認識 (JOI夏期セミナー2016)
手書き数字文書の認識 (JOI夏期セミナー2016)
onkohdondo
 
2014/5/29 東大相澤山崎研勉強会:パターン認識とニューラルネットワーク,Deep Learningまで
2014/5/29 東大相澤山崎研勉強会:パターン認識とニューラルネットワーク,Deep Learningまで2014/5/29 東大相澤山崎研勉強会:パターン認識とニューラルネットワーク,Deep Learningまで
2014/5/29 東大相澤山崎研勉強会:パターン認識とニューラルネットワーク,Deep Learningまで
Hokuto Kagaya
 
【勉強会】自己組織化マップ(SOM)
【勉強会】自己組織化マップ(SOM)【勉強会】自己組織化マップ(SOM)
【勉強会】自己組織化マップ(SOM)
Jun Harada
 
パターン認識と機械学習入門
パターン認識と機械学習入門パターン認識と機械学習入門
パターン認識と機械学習入門
Momoko Hayamizu
 

Viewers also liked (6)

手書き数字文書の認識 (JOI夏期セミナー2016)
手書き数字文書の認識 (JOI夏期セミナー2016)手書き数字文書の認識 (JOI夏期セミナー2016)
手書き数字文書の認識 (JOI夏期セミナー2016)
 
続・わかりやすいパターン認識_3章
続・わかりやすいパターン認識_3章続・わかりやすいパターン認識_3章
続・わかりやすいパターン認識_3章
 
2014/5/29 東大相澤山崎研勉強会:パターン認識とニューラルネットワーク,Deep Learningまで
2014/5/29 東大相澤山崎研勉強会:パターン認識とニューラルネットワーク,Deep Learningまで2014/5/29 東大相澤山崎研勉強会:パターン認識とニューラルネットワーク,Deep Learningまで
2014/5/29 東大相澤山崎研勉強会:パターン認識とニューラルネットワーク,Deep Learningまで
 
【勉強会】自己組織化マップ(SOM)
【勉強会】自己組織化マップ(SOM)【勉強会】自己組織化マップ(SOM)
【勉強会】自己組織化マップ(SOM)
 
5分で分かる自己組織化マップ
5分で分かる自己組織化マップ5分で分かる自己組織化マップ
5分で分かる自己組織化マップ
 
パターン認識と機械学習入門
パターン認識と機械学習入門パターン認識と機械学習入門
パターン認識と機械学習入門
 

More from Ohsawa Goodfellow

Learning Deep Architectures for AI (第 3 回 Deep Learning 勉強会資料; 松尾)
Learning Deep Architectures for AI (第 3 回 Deep Learning 勉強会資料; 松尾)Learning Deep Architectures for AI (第 3 回 Deep Learning 勉強会資料; 松尾)
Learning Deep Architectures for AI (第 3 回 Deep Learning 勉強会資料; 松尾)
Ohsawa Goodfellow
 
第9章 ネットワーク上の他の確率過程
第9章 ネットワーク上の他の確率過程第9章 ネットワーク上の他の確率過程
第9章 ネットワーク上の他の確率過程
Ohsawa Goodfellow
 
XLWrapについてのご紹介
XLWrapについてのご紹介XLWrapについてのご紹介
XLWrapについてのご紹介
Ohsawa Goodfellow
 
XLWrapについてのご紹介
XLWrapについてのご紹介XLWrapについてのご紹介
XLWrapについてのご紹介
Ohsawa Goodfellow
 

More from Ohsawa Goodfellow (11)

Open-ended Learning in Symmetric Zero-sum Games @ ICML19
Open-ended Learning in Symmetric Zero-sum Games @ ICML19 Open-ended Learning in Symmetric Zero-sum Games @ ICML19
Open-ended Learning in Symmetric Zero-sum Games @ ICML19
 
Natural Language Processing (Almost) from Scratch(第 6 回 Deep Learning 勉強会資料; 榊)
Natural Language Processing (Almost) from Scratch(第 6 回 Deep Learning 勉強会資料; 榊)Natural Language Processing (Almost) from Scratch(第 6 回 Deep Learning 勉強会資料; 榊)
Natural Language Processing (Almost) from Scratch(第 6 回 Deep Learning 勉強会資料; 榊)
 
Deep Learning via Semi-Supervised Embedding (第 7 回 Deep Learning 勉強会資料; 大澤)
Deep Learning via Semi-Supervised Embedding (第 7 回 Deep Learning 勉強会資料; 大澤)Deep Learning via Semi-Supervised Embedding (第 7 回 Deep Learning 勉強会資料; 大澤)
Deep Learning via Semi-Supervised Embedding (第 7 回 Deep Learning 勉強会資料; 大澤)
 
Deep Auto-Encoder Neural Networks in Reiforcement Learnning (第 9 回 Deep Learn...
Deep Auto-Encoder Neural Networks in Reiforcement Learnning (第 9 回 Deep Learn...Deep Auto-Encoder Neural Networks in Reiforcement Learnning (第 9 回 Deep Learn...
Deep Auto-Encoder Neural Networks in Reiforcement Learnning (第 9 回 Deep Learn...
 
Semi-Supervised Autoencoders for Predicting Sentiment Distributions(第 5 回 De...
 Semi-Supervised Autoencoders for Predicting Sentiment Distributions(第 5 回 De... Semi-Supervised Autoencoders for Predicting Sentiment Distributions(第 5 回 De...
Semi-Supervised Autoencoders for Predicting Sentiment Distributions(第 5 回 De...
 
Learning Deep Architectures for AI (第 3 回 Deep Learning 勉強会資料; 松尾)
Learning Deep Architectures for AI (第 3 回 Deep Learning 勉強会資料; 松尾)Learning Deep Architectures for AI (第 3 回 Deep Learning 勉強会資料; 松尾)
Learning Deep Architectures for AI (第 3 回 Deep Learning 勉強会資料; 松尾)
 
Deep Learning 勉強会 (Chapter 7-12)
Deep Learning 勉強会 (Chapter 7-12)Deep Learning 勉強会 (Chapter 7-12)
Deep Learning 勉強会 (Chapter 7-12)
 
Deep learning勉強会20121214ochi
Deep learning勉強会20121214ochiDeep learning勉強会20121214ochi
Deep learning勉強会20121214ochi
 
第9章 ネットワーク上の他の確率過程
第9章 ネットワーク上の他の確率過程第9章 ネットワーク上の他の確率過程
第9章 ネットワーク上の他の確率過程
 
XLWrapについてのご紹介
XLWrapについてのご紹介XLWrapについてのご紹介
XLWrapについてのご紹介
 
XLWrapについてのご紹介
XLWrapについてのご紹介XLWrapについてのご紹介
XLWrapについてのご紹介
 

Recently uploaded

2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
ssuserbefd24
 

Recently uploaded (11)

5/22 第23回 Customer系エンジニア座談会のスライド 公開用 西口瑛一
5/22 第23回 Customer系エンジニア座談会のスライド 公開用 西口瑛一5/22 第23回 Customer系エンジニア座談会のスライド 公開用 西口瑛一
5/22 第23回 Customer系エンジニア座談会のスライド 公開用 西口瑛一
 
Intranet Development v1.0 (TSG LIVE! 12 LT )
Intranet Development v1.0 (TSG LIVE! 12 LT )Intranet Development v1.0 (TSG LIVE! 12 LT )
Intranet Development v1.0 (TSG LIVE! 12 LT )
 
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
 
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
 
20240523_IoTLT_vol111_kitazaki_v1___.pdf
20240523_IoTLT_vol111_kitazaki_v1___.pdf20240523_IoTLT_vol111_kitazaki_v1___.pdf
20240523_IoTLT_vol111_kitazaki_v1___.pdf
 
Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)
Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)
Amazon Cognitoで実装するパスキー (Security-JAWS【第33回】 勉強会)
 
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
 
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
2024年5月25日Serverless Meetup大阪 アプリケーションをどこで動かすべきなのか.pptx
 
論文紹介:Deep Occlusion-Aware Instance Segmentation With Overlapping BiLayers
論文紹介:Deep Occlusion-Aware Instance Segmentation With Overlapping BiLayers論文紹介:Deep Occlusion-Aware Instance Segmentation With Overlapping BiLayers
論文紹介:Deep Occlusion-Aware Instance Segmentation With Overlapping BiLayers
 
ロボットマニピュレーションの作業・動作計画 / rosjp_planning_for_robotic_manipulation_20240521
ロボットマニピュレーションの作業・動作計画 / rosjp_planning_for_robotic_manipulation_20240521ロボットマニピュレーションの作業・動作計画 / rosjp_planning_for_robotic_manipulation_20240521
ロボットマニピュレーションの作業・動作計画 / rosjp_planning_for_robotic_manipulation_20240521
 
論文紹介:ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
論文紹介:ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation論文紹介:ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
論文紹介:ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 

PRML上巻勉強会 at 東京大学 資料 第1章前半