SlideShare a Scribd company logo
1 of 23
はじパタ勉強会
第7章 パーセプトロン型学習規則
曽和 修平
パーセプトロン
入力
1
x1
x2
xd
w0
w1
w2
wd
出力
望みの出力となるように各重み(wi)を調節
パーセプトロンの学習規則
• 学習データxiを入力した時の出力値について
・正しければ
・正しくなければ
• 片方のクラスの符号を反転させた時、分類が正しけれ
ばf(x) ≧ 0となり、誤っていればf(x) < 0となる
・f(xi) ≧ 0なら
・f(xi) < 0なら
ηは学習の収束速度を決めるパラメータ
η = 1の場合を固定増分誤り訂正法と呼ぶ
学習の難しさの尺度
• テストデータにノイズが含まれていると,ノイズのないデータで学
習した識別関数はノイズ分だけ誤り易くなる
• マージンhを取る事によってノイズに強くする
i番目の学習におけるwiの変更量⊿wiは符号反転を行った学習デ
学習の難しさの尺度(2)
• ある識別関数に対して取れるマージンの大きさは
クラス間マージンρ(w)の半分
従って最大マージンDmaxは最大クラスマージンを用いて
パーセプトロンの収束定理
• 2クラスの学習データが線形分離可能であればパーセプ
トロンの学習規則は有限回の学習で収束する
(証明)
・マージンhは次元毎にαの大きさをとるとする h=αd
・学習総数
・係数ベクトル
・解ベクトルはw*とする
誤りを起こす学習データのみの系列を考える
(Miはデータxiが学習で使用された回数)
パーセプトロンの収束定理(2)
解ベクトルw*とwの内積を計算すると
(式7.4 より)
ここから、解ベクトルw*と係数ベクトルwの内積は学習回数
Mに比例して増加していくことがわかる
つまり、係数ベクトルwは解ベクトルw*に近づいていく
パーセプトロンの収束定理(3)
||w||の上限を求めるために,各学習データの長さが||xi||^2≦d
を満たしていると仮定し、係数ベクトルの変更量を求める
(仮定より) (学習が行われたのでw^Tx_i≦h=αdであるから)
これより、M回学習した係数ベクトルは
に抑えられる
パーセプトロンの収束定理(3)
wとw*の方向余弦の2乗は
となるので
より
と を用いて
=>
となる。これをMについて解くと
従って、学習回数Mには上限があるので学習は収束する.
T
T
多層パーセプトロン
• 1層のパーセプトロンでは線形分離できず正しく識別でき
ないようなデータに対して,多層にすることで線形分離可能
にする
入力層 隠れ層
出力層
多層パーセプトロン(2)
係数ベクトルとの内積演算は図7.9の学習回路で実現することが
n番目学習データの入力は
多層パーセプトロン(3)
n番目学習データが入力されるとVjには
の入力が入り
出力関数g(u)を介して が出力される
隠れ素子の出力関数が線形であれば,多層回路を構成しても
等価的に1層の回路で表現できてしまうので、g(u)は非線形
でなければならない。
よく使用される非線形出力関数はシグモイド関数
多層パーセプトロン(4)
出力素子ok(k=1…K)への入力は
で与えられ、その出力は で与えられる
は出力素子用の(非)線型出力関数である.
ソフトマックス関数を用いて確率的な解釈を与える場合も
ある
シグモイド関数は1つの出力素子の値のみに依存しているが
ソフトマックス関数は全ての出力素子の値と関係している.
誤差逆伝播法の学習規則
最小2乗誤差の最小化を最急降下法によって行う
n番目の学習データによる誤差の評価関数は
となる.
学習データ全体では
誤差逆伝播法の学習規則(2)
E(w)を評価関数として用いるバッチアルゴリズムでは学習
データ全体を用いて結合係数の修正量を計算し更新するこ
とを1エポックと言う
τエポック目の修正量は、合成関数の微分法を用いて
誤差信号
出力関数がシグモイド関数の場合、微分すると出力値が0と1に近い部分で0に
なり学習が進まなくなる場合があることに注意.
誤差逆伝播法の学習規則(3)
入力素子xiから隠れ素子Vjへの結合係数wjiの評価関数は出力素子wkj
の場合と同じだが、wjiで微分する為、合成関数の微分を2度行う必
要がある
誤差逆伝播法の学習規則(4)
隠れ素子jの誤差信号を
で定義すれば
と表現できる
このアルゴリズムが誤差逆伝播法
確率降下法では
となる
誤差逆伝搬法の学習特性
・初期値依存性
局所最小値がたくさんあり、大域的な最適解を得るのが
難しい。
どのような局所最適解にいきつくかは初期値に依存する
・隠れ素子の数
隠れ素子の数を増やしすぎると、学習データのノイズ
成分にも適合してしまい、汎化誤差が増加する(過学習)
最適な隠れ素子の数はホールドアウト法や交差確認法
などで求める必要がある
過学習と正則化
・過学習の原因は隠れ素子の数が多くなる事だけではない
・学習が進み、結合係数が大きくなりシグモイド関数の非線
形領域に入り、非線形性が強くなると過学習が生じやすい
・早期終了規則
・正則化
交差確認法などで汎化誤差を推定し、汎化誤差が上昇する
手前で学習を終わらせる方法
誤差逆伝搬法が提案された当初に使われていた
学習が進んでも結合係数の大きさを抑える方法
最近ではこちらがよく用いられる
過学習と正則化(2)
・正則化
評価関数に結合係数の増加が大きくなる事にたいするペナ
ルティ項を追加する
この正則化を荷重減衰ペナルティという
λは正則化の大きさを決める正則化パラメータ
過学習と正則化(3)
正則化項を加えた時の学習規則は
wkjが重みに負帰還をかける形になって,結合係数が大きくなる
事が抑えられる
学習回路の尤度
活性化関数をソフトマックス関数にし、出力に確率的解釈
を与える場合、評価関数は
で与えられる.この場合は最尤推定法より結合係数の更新式
を得ることができる
出力okをK個の無関係な確率とみなす場合はベルヌーイ試行
と解釈できる
学習回路の尤度
負の対数尤度は交差エントロピー型誤差関数
出力素子の学習は
出力関数がシグモイド関数の場合は
なので
となり,出力関数の微分が消え,2乗誤差基準のように非線形部分で
学習が進まなくなるということがないという利点がある

More Related Content

What's hot

はじめてのパターン認識 第8章 サポートベクトルマシン
はじめてのパターン認識 第8章 サポートベクトルマシンはじめてのパターン認識 第8章 サポートベクトルマシン
はじめてのパターン認識 第8章 サポートベクトルマシン
Motoya Wakiyama
 
わかりやすいパターン認識_2章
わかりやすいパターン認識_2章わかりやすいパターン認識_2章
わかりやすいパターン認識_2章
weda654
 
はじめてのパターン認識輪読会 10章後半
はじめてのパターン認識輪読会 10章後半はじめてのパターン認識輪読会 10章後半
はじめてのパターン認識輪読会 10章後半
koba cky
 
数式を使わずイメージで理解するEMアルゴリズム
数式を使わずイメージで理解するEMアルゴリズム数式を使わずイメージで理解するEMアルゴリズム
数式を使わずイメージで理解するEMアルゴリズム
裕樹 奥田
 
今さら聞けないカーネル法とサポートベクターマシン
今さら聞けないカーネル法とサポートベクターマシン今さら聞けないカーネル法とサポートベクターマシン
今さら聞けないカーネル法とサポートベクターマシン
Shinya Shimizu
 
はじめてのパターン認識4章後編
はじめてのパターン認識4章後編はじめてのパターン認識4章後編
はじめてのパターン認識4章後編
Tanaka Hidenori
 

What's hot (20)

はじめてのパターン認識 第8章 サポートベクトルマシン
はじめてのパターン認識 第8章 サポートベクトルマシンはじめてのパターン認識 第8章 サポートベクトルマシン
はじめてのパターン認識 第8章 サポートベクトルマシン
 
わかりやすいパターン認識_2章
わかりやすいパターン認識_2章わかりやすいパターン認識_2章
わかりやすいパターン認識_2章
 
スペクトラル・クラスタリング
スペクトラル・クラスタリングスペクトラル・クラスタリング
スペクトラル・クラスタリング
 
はじパタ 10章 クラスタリング 前半
はじパタ 10章 クラスタリング 前半はじパタ 10章 クラスタリング 前半
はじパタ 10章 クラスタリング 前半
 
One Class SVMを用いた異常値検知
One Class SVMを用いた異常値検知One Class SVMを用いた異常値検知
One Class SVMを用いた異常値検知
 
はじめてのパターン認識輪読会 10章後半
はじめてのパターン認識輪読会 10章後半はじめてのパターン認識輪読会 10章後半
はじめてのパターン認識輪読会 10章後半
 
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
 
異常検知と変化検知 9章 部分空間法による変化点検知
異常検知と変化検知 9章 部分空間法による変化点検知異常検知と変化検知 9章 部分空間法による変化点検知
異常検知と変化検知 9章 部分空間法による変化点検知
 
非制約最小二乗密度比推定法 uLSIF を用いた外れ値検出
非制約最小二乗密度比推定法 uLSIF を用いた外れ値検出非制約最小二乗密度比推定法 uLSIF を用いた外れ値検出
非制約最小二乗密度比推定法 uLSIF を用いた外れ値検出
 
数式を使わずイメージで理解するEMアルゴリズム
数式を使わずイメージで理解するEMアルゴリズム数式を使わずイメージで理解するEMアルゴリズム
数式を使わずイメージで理解するEMアルゴリズム
 
【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習
 
今さら聞けないカーネル法とサポートベクターマシン
今さら聞けないカーネル法とサポートベクターマシン今さら聞けないカーネル法とサポートベクターマシン
今さら聞けないカーネル法とサポートベクターマシン
 
Semi supervised, weakly-supervised, unsupervised, and active learning
Semi supervised, weakly-supervised, unsupervised, and active learningSemi supervised, weakly-supervised, unsupervised, and active learning
Semi supervised, weakly-supervised, unsupervised, and active learning
 
最近のDeep Learning (NLP) 界隈におけるAttention事情
最近のDeep Learning (NLP) 界隈におけるAttention事情最近のDeep Learning (NLP) 界隈におけるAttention事情
最近のDeep Learning (NLP) 界隈におけるAttention事情
 
時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?
 
はじめてのパターン認識4章後編
はじめてのパターン認識4章後編はじめてのパターン認識4章後編
はじめてのパターン認識4章後編
 
能動学習セミナー
能動学習セミナー能動学習セミナー
能動学習セミナー
 
はじめてのパターン認識 第1章
はじめてのパターン認識 第1章はじめてのパターン認識 第1章
はじめてのパターン認識 第1章
 
異常検知と変化検知 7章方向データの異常検知
異常検知と変化検知 7章方向データの異常検知異常検知と変化検知 7章方向データの異常検知
異常検知と変化検知 7章方向データの異常検知
 
【解説】 一般逆行列
【解説】 一般逆行列【解説】 一般逆行列
【解説】 一般逆行列
 

Viewers also liked

Rooks Approach to Leadership
Rooks Approach to LeadershipRooks Approach to Leadership
Rooks Approach to Leadership
Pete Rooks
 
PF Strategic Leadershp Introductory pages (1)
PF  Strategic Leadershp Introductory pages (1)PF  Strategic Leadershp Introductory pages (1)
PF Strategic Leadershp Introductory pages (1)
John Terhune
 
ROZA Sports Catalogue 2015-2016
ROZA Sports Catalogue 2015-2016ROZA Sports Catalogue 2015-2016
ROZA Sports Catalogue 2015-2016
Sheikh Sultan
 

Viewers also liked (20)

Structural engineering part 1
Structural engineering part 1Structural engineering part 1
Structural engineering part 1
 
Prezentare romania
Prezentare romaniaPrezentare romania
Prezentare romania
 
Rooks Approach to Leadership
Rooks Approach to LeadershipRooks Approach to Leadership
Rooks Approach to Leadership
 
Carlos Joaquín: Competitividad turística, base del desarrollo
Carlos Joaquín: Competitividad turística, base del desarrolloCarlos Joaquín: Competitividad turística, base del desarrollo
Carlos Joaquín: Competitividad turística, base del desarrollo
 
Godrej sky
Godrej skyGodrej sky
Godrej sky
 
Cojocaru adriana cristina,grupa 8218,imapa
Cojocaru adriana cristina,grupa 8218,imapaCojocaru adriana cristina,grupa 8218,imapa
Cojocaru adriana cristina,grupa 8218,imapa
 
PF Strategic Leadershp Introductory pages (1)
PF  Strategic Leadershp Introductory pages (1)PF  Strategic Leadershp Introductory pages (1)
PF Strategic Leadershp Introductory pages (1)
 
How to be a better manager
How to be a better managerHow to be a better manager
How to be a better manager
 
Runwal My City...My Desire Prelaunched In Dombivali
Runwal My City...My Desire Prelaunched In DombivaliRunwal My City...My Desire Prelaunched In Dombivali
Runwal My City...My Desire Prelaunched In Dombivali
 
Shasta college bikeability study
Shasta college bikeability studyShasta college bikeability study
Shasta college bikeability study
 
Suc Manh Cua Su Doan Ket
Suc Manh Cua Su Doan KetSuc Manh Cua Su Doan Ket
Suc Manh Cua Su Doan Ket
 
North east india paradise unexplored
North east india paradise unexploredNorth east india paradise unexplored
North east india paradise unexplored
 
pres06-main
pres06-mainpres06-main
pres06-main
 
Bear creek sampling program
Bear creek sampling programBear creek sampling program
Bear creek sampling program
 
Water engineering
Water engineeringWater engineering
Water engineering
 
ваге миасник
ваге миасникваге миасник
ваге миасник
 
ROZA Sports Catalogue 2015-2016
ROZA Sports Catalogue 2015-2016ROZA Sports Catalogue 2015-2016
ROZA Sports Catalogue 2015-2016
 
Photoshoot 2
Photoshoot 2Photoshoot 2
Photoshoot 2
 
Muktzeh slide set 1
Muktzeh slide set 1Muktzeh slide set 1
Muktzeh slide set 1
 
M4_A1_Weber_Jennifer
M4_A1_Weber_JenniferM4_A1_Weber_Jennifer
M4_A1_Weber_Jennifer
 

パーセプトロン型学習規則