Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
YT
Uploaded by
Yusuke TAMAI
1,982 views
WBICによる混合正規分布の分離と抽出
WBICを混合正規分布に適用し、BICとの性能比較を行った。合わせて、正規分布する信号の分離に対する応用可能性を検討した。
Data & Analytics
◦
Read more
4
Save
Share
Embed
Embed presentation
1
/ 19
2
/ 19
3
/ 19
4
/ 19
5
/ 19
6
/ 19
7
/ 19
8
/ 19
9
/ 19
10
/ 19
11
/ 19
12
/ 19
13
/ 19
14
/ 19
15
/ 19
16
/ 19
17
/ 19
18
/ 19
19
/ 19
More Related Content
PPTX
ベイズファクターとモデル選択
by
kazutantan
PDF
MCMCサンプルの使い方 ~見る・決める・探す・発生させる~
by
. .
PDF
階層ベイズとWAIC
by
Hiroshi Shimizu
PDF
グラフィカルモデル入門
by
Kawamoto_Kazuhiko
PDF
Stan超初心者入門
by
Hiroshi Shimizu
PPTX
5分でわかるベイズ確率
by
hoxo_m
PDF
心理学におけるベイズ統計の流行を整理する
by
Hiroshi Shimizu
PPTX
ブートストラップ法とその周辺とR
by
Daisuke Yoneoka
ベイズファクターとモデル選択
by
kazutantan
MCMCサンプルの使い方 ~見る・決める・探す・発生させる~
by
. .
階層ベイズとWAIC
by
Hiroshi Shimizu
グラフィカルモデル入門
by
Kawamoto_Kazuhiko
Stan超初心者入門
by
Hiroshi Shimizu
5分でわかるベイズ確率
by
hoxo_m
心理学におけるベイズ統計の流行を整理する
by
Hiroshi Shimizu
ブートストラップ法とその周辺とR
by
Daisuke Yoneoka
What's hot
PDF
最適輸送の計算アルゴリズムの研究動向
by
ohken
PPTX
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
by
Shushi Namba
PDF
階層ベイズによるワンToワンマーケティング入門
by
shima o
PDF
Stanでガウス過程
by
Hiroshi Shimizu
PPTX
心理学者のためのGlmm・階層ベイズ
by
Hiroshi Shimizu
PDF
これからの仮説検証・モデル評価
by
daiki hojo
PDF
統計的因果推論への招待 -因果構造探索を中心に-
by
Shiga University, RIKEN
PDF
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング
by
mlm_kansai
PDF
機械学習による統計的実験計画(ベイズ最適化を中心に)
by
Kota Matsui
PDF
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
by
Ken'ichi Matsui
PDF
Stanの便利な事後処理関数
by
daiki hojo
PDF
マーク付き点過程
by
Yoshiaki Sakakura
PDF
pymcとpystanでベイズ推定してみた話
by
Classi.corp
PPTX
ベイズ統計モデリングと心理学
by
Shushi Namba
PDF
サポートベクターマシン(SVM)の数学をみんなに説明したいだけの会
by
Kenyu Uehara
PDF
グラフィカル Lasso を用いた異常検知
by
Yuya Takashina
PDF
ベイズ統計入門
by
Miyoshi Yuya
PDF
2 4.devianceと尤度比検定
by
logics-of-blue
PDF
PCAの最終形態GPLVMの解説
by
弘毅 露崎
PDF
正準相関分析
by
Akisato Kimura
最適輸送の計算アルゴリズムの研究動向
by
ohken
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
by
Shushi Namba
階層ベイズによるワンToワンマーケティング入門
by
shima o
Stanでガウス過程
by
Hiroshi Shimizu
心理学者のためのGlmm・階層ベイズ
by
Hiroshi Shimizu
これからの仮説検証・モデル評価
by
daiki hojo
統計的因果推論への招待 -因果構造探索を中心に-
by
Shiga University, RIKEN
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング
by
mlm_kansai
機械学習による統計的実験計画(ベイズ最適化を中心に)
by
Kota Matsui
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
by
Ken'ichi Matsui
Stanの便利な事後処理関数
by
daiki hojo
マーク付き点過程
by
Yoshiaki Sakakura
pymcとpystanでベイズ推定してみた話
by
Classi.corp
ベイズ統計モデリングと心理学
by
Shushi Namba
サポートベクターマシン(SVM)の数学をみんなに説明したいだけの会
by
Kenyu Uehara
グラフィカル Lasso を用いた異常検知
by
Yuya Takashina
ベイズ統計入門
by
Miyoshi Yuya
2 4.devianceと尤度比検定
by
logics-of-blue
PCAの最終形態GPLVMの解説
by
弘毅 露崎
正準相関分析
by
Akisato Kimura
WBICによる混合正規分布の分離と抽出
1.
WBICによる混合正規信号の 分離と抽出 @TYM_circle10 2018/03/20 1
2.
概要 ■ 混合正規分布に従うデータから、元の分布を精密に抽出すること を目指し実験を行った ■ 重畳した正規分布から作成したデータに対し、クラスタ(重畳分布) 数をBICとWBICでそれぞれ推定した ■
推定されたクラスタ数に基づいて混合正規分布モデルを構築し、 変分ベイズ(ADVI)およびMCMC(NUTS)によりパラメータを推定し た BICではクラスタ数を少なく見積もったのに対し、WBICでは正確 なクラスタ数を推定できた その後のパラメータ推定には課題が残った 2
3.
1. 問題 3
4.
問題 ■ 正規分布に従う信号源があり、複数の信号源からの値が重畳した状況を 考える – 観測されるデータは、混合正規分布から生成されると仮定できる
より複雑な分布・モデルはlater work ■ クラスタ数の決定(モデル選択)→ パラメータ推定 の手順を踏む – 論文に載せられる解析手順を踏む – クラスタ数決定:一致性のある情報量規準(BIC, WBIC)による選択 – パラメータ推定:VB(ADVI), MCMC(NUTS) 4
5.
使用したデータ ■ クラスタ数K=3の混合正規分布を考える 𝑦 ~ 1 3 𝒩
10, 1.52 + 𝒩 15, 1.02 + 𝒩 17, 1.02 ■ このGMMの各コンポーネントから、N=100点ずつのデータを生成する 5
6.
使用したデータ ■ 実際に生成されたデータ(ヒストグラム) – クラスタ数が
K≧2 らしいことはわかる – 右側の釣鐘型から重畳を判別するのは困難(2≦K≦5 ?) 6
7.
使用したデータ ■ 実際に生成されたデータ(ヒストグラム) – クラスタ数が
K≧2 らしいことはわかる – 右側の釣鐘型から重畳を判別するのは困難(2≦K≦5 ?) 7
8.
2. 手法 8
9.
BICの算出 ■ mclustによる計算結果をそのまま使用 – 各クラスタの分散が異なるモデルを使用(modelNames=“V”) –
検算として、flexmixによる推定値からもBICを計算(問題無かったため、以後登場しない) 自動でクラスタが削除される仕様のため、引数にminprior=0を追加 9
10.
WBICの算出 - (1)Stan ■
stanによりWBICを計算した。 – target記法により、逆温度 1/ log 𝑛 の事後分布からサンプリングを実行 – generated quantitiesブロックにて、事後分布の下での対数尤度値を取得 – stanスクリプトの外(Rスクリプト内で)WBICの算出を行う 10
11.
WBICの算出 - (2)R
[or Python] ■ WBICの定義式:逆温度βの事後分布 𝑝 𝛽(𝑤|𝒀) に対して、 𝔼 𝛽 𝑛𝐿 𝑛 = − 𝑝 𝛽 𝑤 𝒀 log 𝑛 𝑝 𝑌𝑛 𝑤 𝑑𝑤 ■ Stan内で取得したのは、「各データ点𝑌𝑛での対数尤度log 𝑝 𝑌𝑛 𝑤 」を、 逆 温度1/ log 𝑛 の事後分布に従いサンプリングしたもの したがって、 1. 全データについて足し合わせ、𝑛𝐿 𝑛 𝑤 = log 𝑛 𝑝 𝑌𝑛 𝑤 を得る 2. MCMCサンプルに関して平均を取り、𝔼1/ log 𝑛 [𝑛𝐿 𝑛(𝑤)] を近似する ことでWBICの値が算出できる 11
12.
3. 結果 12
13.
モデル選択 ■ 算出されたBICとWBICの値 BICではクラスタ数K=2と誤推定に陥る
一方WBICでは、真のモデルK=3を当てることができた 13
14.
パラメータ推定(ADVI) ■ 真のモデル(K=3)でADVIによるパラメータ推定を試行すると… クラスタ数が削減されている 変分ベイズ(ADVI)では3つのクラスタを取得できない。
モデル選択なしでは、K=3であったことすら特定不可能 MCMC(NUTS)による推定に切り替える 14
15.
パラメータ推定(NUTS) ■ VBに変えてNUTSで推定 – chain=4,
iter=10000, warmup=8000 – EAPを採用すると 0.29𝒩 9.74, 1.622 + 0.25𝒩 13.70, 1.822 + 0.47𝒩(17.36,1.602) 15
16.
抽出されたクラスタ ■ 真のモデル(分布) 𝒩 10.0,
1.502 , 𝒩 15.00, 1.002 , 𝒩 17.00, 1.002 ■ 復元されたクラスタ(正規分布) 𝒩 9.74, 1.622 , 𝒩 13.70, 1.822 , 𝒩(17.36,1.602 ) 16
17.
補足.WBICの検算 17
18.
WBICの検算 ■ 前述の結果では、BICとWBICの値が乖離していた[p.13] – 同じ量(自由エネルギー)を近似しているはず –
モデルの特異性によりBICが乖離した orWBICの計算ミス ■ クラスタ間を離したデータ(N=300)で再実験 𝑦 ~ 1 3 𝒩 1, 1.52 + 𝒩 15, 1.02 + 𝒩 27, 1.02 ■ BIC&WBIC値 – 概ね一致した値 – 前述の値のズレは モデルの特異性由来 18
19.
気になる点…K=2でのRhat ■ WBIC計算時、Rhat>1.1となるパラメータ数をカウントした ⇨ K=2の時のみ、Rhat>1.1となるパラメータが存在した ■
iterやburn-inを増やしても解決しない ■ また複数回実行しても、K≧3は全てRhat<1.1であった – モデルの表現能力不足により、収束点が存在しない? 自然なものなのか、解決策があるものかは分からず 19