SlideShare a Scribd company logo
卒業論文(2010年度)



実現不可能な
パラメトリックモデル族に対する
累積対数損失の漸近評価


           指導 松嶋 敏泰 教授
           1W070524-3 宮 希望
NO.1
1-①.研究背景
                 データ圧縮
              (ユニバーサル符号化)

 パターン認識                     時系列解析
                  例)画像データ
                    の伝送        例)株価の予測
     例)指紋認証




              統計的予測問題

 与えられたデータを用いて未知のデータを予測する

課題   真のデータと予測値との誤差を小さくするような
     予測法の構成
                       損失
NO.2
1-②.研究背景   全てのデータに対して
           損失を最小にすることはできない

損失を平均的に小さくするような予測法として・・・

     ベイズ決定理論に基づく予測

有限個のデータに対して                  ベイズ最適性
損失が平均的に最小となることを保証

                    現実的にデータ数を大量に
                    入手できる場面は多い
 大量のデータに対して予測を行った
 場合どこまで小さくなるのか?

      損失の漸近的なふるまいを調べる必要がある
NO.3
2-①.準備

    確率構造の仮定              予測における事前知識
                                            データ
真の分布
 (未知)


                     :パラメータを持つ確率分布の集合(モデル族)
事                     →パラメトリックモデル族
前
知       :   次元パラメータの集合          例) (平均,分散)をパラメータ
識                                   にもつ正規分布
            :パラメータの事前分布(確率分布)      (平均,分散)もある確率
                                    分布に従う


     ・実現可能:真の分布がモデル族に含まれる
条
件
     ・実現不可能:真の分布がモデル族に含まれない
NO.4
2-②.準備
 損失の定義       確率分布間の対数損失

    予測の良さを              データ間で
    測る評価基準         損失   損失を測らない


 ・リスク


                    損失を真の分布で平均


 ・ベイズリスク                リスクを事前
                        分布で平均


ベイズ最適な予測     ベイズリスクを最小とする予測
NO.5
2-③.準備

 損失の分類          予測問題に応じて
                2種類の損失を考える

・累積損失           を逐次的に予測する場合

 事前知識                 ・・・
                ・・・
                                   毎回の損失を
     予測   予測    ・・・         予測
                                   足し合わせる

・1時点の損失         を得た下で             を予測する場合

  事前知識
           予測
    +                            次の1時点だ
                                 けを考える
NO.6
3-①.研究目的

ベイズ最適な予測        ベイズリスク最小という意味で最適
                        損失が平均的に最小
ベイズ最適な予測をした場合,漸近的に・・・
  ・リスクの値はどうなるのか?最小値は?

  ・最小値があるとしたら、どの程度の速さで近づくのか?

   リスクの漸近評価が必要

  ・実現可能か不可能か?

  ・累積損失か1時点の損失か?


  これらの評価基準・条件に注目してリスクを漸近評価
NO.7
3-②.研究目的
本研究の位置づけ
       モデル族       実現可能                  実現不可能
        の条件   (真の分布がモデル族             (真の分布がモデル族
 評価           に含まれる)                 に含まれない)
  基準

  累積対数損失      [Clarke&Barron,1990]        本研究


  1時点の対数損失      [Watanabe,2010]       [Watanabe,2010]


本研究の目的

    真の分布がモデル族に含まれない場合の
    累積対数損失におけるリスクの漸近評価
NO.8
4-①.従来研究

実現可能・累積対数損失におけるリスクの評価
                            (Clarke&Barron,1990)
 条件      ・パラメータ集合のコンパクト性
         ・対数尤度・事前分布の微分可能性
                             指数型分布族
                              ならOK
 結果        累積対数損失におけるリスク


パラメータ数

                                 収束の速さ



  データ1個あたりの平均損失は            で0に近づく
NO.9
4-②.従来研究

実現不可能・1時点の対数損失におけるリスクの評価
                                  (Watanabe,2010)
 条件      Clarke&Barronの条件

               +
         ・       に最も近い          がただ一つ存在
         ・事後確率最大推定量         の   への一致性と
          漸近正規性
 結果                                実現可能な
         1時点の対数損失におけるリスク           場合の結果
                                   も含んでいる



パラメータ数
NO.10
5-①.本研究

実現不可能・累積対数損失におけるリスクの評価

 条件      Clarke&Barronの条件

               +
         ・       に最も近い          がただ一つ存在
         ・最尤推定量      の      への一致性
 結果          累積対数損失におけるリスク           ダイバー
                                     ジェンス

パラメータ数


          データ1個あたりの平均損失は            で
          ダイバージェンスに近づく
NO.11
5-②.本研究
 証明のポイント
証明最大の壁は・・・
  まともに計算するのが困難な積分を評価する必要があること




 積分計算を回避するために・・・
    (最尤推定量の周りでの)テーラー展開等を用いる

                     Clarke&Barronと
                     ほぼ同様の手法
 展開によって出てくる項(主要項以外)は・・・
    最尤推定量の一致性(条件)で定数項に帰着
NO.12
5-③.本研究
 シミュレーション(本研究の結果の確認)
  真の分布:カイ二乗分布(自由度5)            データ数
  モデル族:指数分布                      と
  事前分布:ガンマ分布(自然共役)        データ1個当たりの平均損失
                              の関係を検証


            1
           0.8
  データ1個                         約0.19
   当たりの 0.6
  平均損失
           0.4
  (単位:nat)
           0.2
            0
                                実現可能な場
                 121
                 145
                 169
                 193
                 217
                 241
                 265
                 289
                 313
                 337
                 361
                 385
                 409
                 433
                 457
                 481
                   1
                  25


                  97
                  49
                  73




                  データ数          合とは違って
                                0に収束しない

  ダイバージェンスの値は約0.186(パラメータ0.2)
NO.13
6.まとめ

 ・実現不可能な場合の累積対数損失における
  リスクを漸近評価した

 ・実現可能な場合と異なり、ダイバージェンス
  に収束することが分かった

 ・収束の速度は同じであった

 ・結果をシミュレーションによって確認した
NO.14
A-①.付録

対数損失の定義
             逐次損失の和
 ・累積対数損失

              (      は決定関数)


 ・1時点の対数損失




                  1時点のデータを
                  発生させる真の
                  分布で平均
NO.15
A-②.付録

ベイズ決定関数     ベイズリスクを最小とする決定関数
                   最適な決定関数

 ・累積対数損失を考える場合        対数尤度をパラメータの
                      事前分布で平均




                      対数尤度をパラメータの
 ・1時点の対数損失を考える場合      事後分布で平均
NO.16
A-③.付録

 ダイバージェンスについて




         異なる2つの確率分布間の距離のようなもの




         真の分布に最も近い確率モデルのパラメータ
NO.17
A-④.付録

Clarke&Barronの証明の概要

実現可能であるから               となる
真のパラメータが存在する


リスク             に対して         の計算が困難




             を真のパラメータの周りでテーラー展開

              漸近的に     期待値
主要項      +    0になる項           結果へ
NO.18
A-⑤.付録

本研究の証明の概要
     Clarke&Barronと同様         の計算が困難
                                        定数
         テーラー展開で回避




                   テーラー展開
                   ( のまわりで)


 主要項       +      その他の項



                  定数項             結果へ

More Related Content

Similar to ma99992010id512

[PRML] パターン認識と機械学習(第1章:序論)
[PRML] パターン認識と機械学習(第1章:序論)[PRML] パターン認識と機械学習(第1章:序論)
[PRML] パターン認識と機械学習(第1章:序論)
Ryosuke Sasaki
 
The 86th National Convention of IPSJ (Student Encouragement Award))
The 86th National Convention of IPSJ (Student Encouragement Award))The 86th National Convention of IPSJ (Student Encouragement Award))
The 86th National Convention of IPSJ (Student Encouragement Award))
yoshidakids7
 
PRML Chapter 14
PRML Chapter 14PRML Chapter 14
PRML Chapter 14
Masahito Ohue
 
DNNの曖昧性に関する研究動向
DNNの曖昧性に関する研究動向DNNの曖昧性に関する研究動向
DNNの曖昧性に関する研究動向
Naoki Matsunaga
 
An introduction to statistical learning 4 logistic regression manu
An introduction to statistical learning 4 logistic regression manuAn introduction to statistical learning 4 logistic regression manu
An introduction to statistical learning 4 logistic regression manu
Hideyuki Takahashi
 
みどりぼん9章前半
みどりぼん9章前半みどりぼん9章前半
みどりぼん9章前半Akifumi Eguchi
 
研究説明(学部生向け)
研究説明(学部生向け)研究説明(学部生向け)
研究説明(学部生向け)
yoshida takayuki
 
ベイズ入門
ベイズ入門ベイズ入門
ベイズ入門
Zansa
 
第4回スキル養成講座 講義スライド
第4回スキル養成講座 講義スライド第4回スキル養成講座 講義スライド
第4回スキル養成講座 講義スライド
keiodig
 
効果測定入門 Rによる傾向スコア解析
効果測定入門  Rによる傾向スコア解析効果測定入門  Rによる傾向スコア解析
効果測定入門 Rによる傾向スコア解析
aa_aa_aa
 
修士論文発表:「非負値行列分解における漸近的Bayes汎化誤差」
修士論文発表:「非負値行列分解における漸近的Bayes汎化誤差」修士論文発表:「非負値行列分解における漸近的Bayes汎化誤差」
修士論文発表:「非負値行列分解における漸近的Bayes汎化誤差」
Naoki Hayashi
 
Prml3 4
Prml3 4Prml3 4
Prml3 4
K5_sem
 
Prml3 4
Prml3 4Prml3 4
Prml3 4
K5_sem
 
Darm3(samplesize)
Darm3(samplesize)Darm3(samplesize)
Darm3(samplesize)
Yoshitake Takebayashi
 
DARM勉強会第3回 (missing data analysis)
DARM勉強会第3回 (missing data analysis)DARM勉強会第3回 (missing data analysis)
DARM勉強会第3回 (missing data analysis)
Masaru Tokuoka
 
20160713 srws第六回@メタ・アナリシス前半
20160713 srws第六回@メタ・アナリシス前半20160713 srws第六回@メタ・アナリシス前半
20160713 srws第六回@メタ・アナリシス前半
SR WS
 
事業継続性と運用弾力性に配慮したクラウドリファレンスアーキテクチャチュートリアルV1.0 final
事業継続性と運用弾力性に配慮したクラウドリファレンスアーキテクチャチュートリアルV1.0 final事業継続性と運用弾力性に配慮したクラウドリファレンスアーキテクチャチュートリアルV1.0 final
事業継続性と運用弾力性に配慮したクラウドリファレンスアーキテクチャチュートリアルV1.0 final
Daisuke Kawada
 

Similar to ma99992010id512 (20)

ma99992011id513
ma99992011id513ma99992011id513
ma99992011id513
 
[PRML] パターン認識と機械学習(第1章:序論)
[PRML] パターン認識と機械学習(第1章:序論)[PRML] パターン認識と機械学習(第1章:序論)
[PRML] パターン認識と機械学習(第1章:序論)
 
The 86th National Convention of IPSJ (Student Encouragement Award))
The 86th National Convention of IPSJ (Student Encouragement Award))The 86th National Convention of IPSJ (Student Encouragement Award))
The 86th National Convention of IPSJ (Student Encouragement Award))
 
PRML Chapter 14
PRML Chapter 14PRML Chapter 14
PRML Chapter 14
 
DNNの曖昧性に関する研究動向
DNNの曖昧性に関する研究動向DNNの曖昧性に関する研究動向
DNNの曖昧性に関する研究動向
 
An introduction to statistical learning 4 logistic regression manu
An introduction to statistical learning 4 logistic regression manuAn introduction to statistical learning 4 logistic regression manu
An introduction to statistical learning 4 logistic regression manu
 
みどりぼん9章前半
みどりぼん9章前半みどりぼん9章前半
みどりぼん9章前半
 
研究説明(学部生向け)
研究説明(学部生向け)研究説明(学部生向け)
研究説明(学部生向け)
 
ベイズ入門
ベイズ入門ベイズ入門
ベイズ入門
 
第4回スキル養成講座 講義スライド
第4回スキル養成講座 講義スライド第4回スキル養成講座 講義スライド
第4回スキル養成講座 講義スライド
 
効果測定入門 Rによる傾向スコア解析
効果測定入門  Rによる傾向スコア解析効果測定入門  Rによる傾向スコア解析
効果測定入門 Rによる傾向スコア解析
 
修士論文発表:「非負値行列分解における漸近的Bayes汎化誤差」
修士論文発表:「非負値行列分解における漸近的Bayes汎化誤差」修士論文発表:「非負値行列分解における漸近的Bayes汎化誤差」
修士論文発表:「非負値行列分解における漸近的Bayes汎化誤差」
 
Prml3 4
Prml3 4Prml3 4
Prml3 4
 
Prml3 4
Prml3 4Prml3 4
Prml3 4
 
判別分析
判別分析判別分析
判別分析
 
Maeshori missing
Maeshori missingMaeshori missing
Maeshori missing
 
Darm3(samplesize)
Darm3(samplesize)Darm3(samplesize)
Darm3(samplesize)
 
DARM勉強会第3回 (missing data analysis)
DARM勉強会第3回 (missing data analysis)DARM勉強会第3回 (missing data analysis)
DARM勉強会第3回 (missing data analysis)
 
20160713 srws第六回@メタ・アナリシス前半
20160713 srws第六回@メタ・アナリシス前半20160713 srws第六回@メタ・アナリシス前半
20160713 srws第六回@メタ・アナリシス前半
 
事業継続性と運用弾力性に配慮したクラウドリファレンスアーキテクチャチュートリアルV1.0 final
事業継続性と運用弾力性に配慮したクラウドリファレンスアーキテクチャチュートリアルV1.0 final事業継続性と運用弾力性に配慮したクラウドリファレンスアーキテクチャチュートリアルV1.0 final
事業継続性と運用弾力性に配慮したクラウドリファレンスアーキテクチャチュートリアルV1.0 final
 

More from matsushimalab (18)

ma99992012id537
ma99992012id537ma99992012id537
ma99992012id537
 
ma12012id536
ma12012id536ma12012id536
ma12012id536
 
ma112011id535
ma112011id535ma112011id535
ma112011id535
 
ma99992011id509
ma99992011id509ma99992011id509
ma99992011id509
 
ma99992011id508
ma99992011id508ma99992011id508
ma99992011id508
 
ma99992010id464
ma99992010id464ma99992010id464
ma99992010id464
 
ma112010id450
ma112010id450ma112010id450
ma112010id450
 
ma112009id434
ma112009id434ma112009id434
ma112009id434
 
ma52009id420
ma52009id420ma52009id420
ma52009id420
 
ma52009id419
ma52009id419ma52009id419
ma52009id419
 
ma112007id414
ma112007id414ma112007id414
ma112007id414
 
ma112007id413
ma112007id413ma112007id413
ma112007id413
 
ma22006id411
ma22006id411ma22006id411
ma22006id411
 
ma112006id337
ma112006id337ma112006id337
ma112006id337
 
ma92007id395
ma92007id395ma92007id395
ma92007id395
 
ma52005id336
ma52005id336ma52005id336
ma52005id336
 
ma52006id386
ma52006id386ma52006id386
ma52006id386
 
ma99992006id365
ma99992006id365ma99992006id365
ma99992006id365
 

ma99992010id512

  • 2. NO.1 1-①.研究背景 データ圧縮 (ユニバーサル符号化) パターン認識 時系列解析 例)画像データ の伝送 例)株価の予測 例)指紋認証 統計的予測問題 与えられたデータを用いて未知のデータを予測する 課題 真のデータと予測値との誤差を小さくするような 予測法の構成 損失
  • 3. NO.2 1-②.研究背景 全てのデータに対して 損失を最小にすることはできない 損失を平均的に小さくするような予測法として・・・ ベイズ決定理論に基づく予測 有限個のデータに対して ベイズ最適性 損失が平均的に最小となることを保証 現実的にデータ数を大量に 入手できる場面は多い 大量のデータに対して予測を行った 場合どこまで小さくなるのか? 損失の漸近的なふるまいを調べる必要がある
  • 4. NO.3 2-①.準備 確率構造の仮定 予測における事前知識 データ 真の分布 (未知) :パラメータを持つ確率分布の集合(モデル族) 事 →パラメトリックモデル族 前 知 : 次元パラメータの集合 例) (平均,分散)をパラメータ 識 にもつ正規分布 :パラメータの事前分布(確率分布) (平均,分散)もある確率 分布に従う ・実現可能:真の分布がモデル族に含まれる 条 件 ・実現不可能:真の分布がモデル族に含まれない
  • 5. NO.4 2-②.準備 損失の定義 確率分布間の対数損失 予測の良さを データ間で 測る評価基準 損失 損失を測らない ・リスク 損失を真の分布で平均 ・ベイズリスク リスクを事前 分布で平均 ベイズ最適な予測 ベイズリスクを最小とする予測
  • 6. NO.5 2-③.準備 損失の分類 予測問題に応じて 2種類の損失を考える ・累積損失 を逐次的に予測する場合 事前知識 ・・・ ・・・ 毎回の損失を 予測 予測 ・・・ 予測 足し合わせる ・1時点の損失 を得た下で を予測する場合 事前知識 予測 + 次の1時点だ けを考える
  • 7. NO.6 3-①.研究目的 ベイズ最適な予測 ベイズリスク最小という意味で最適 損失が平均的に最小 ベイズ最適な予測をした場合,漸近的に・・・ ・リスクの値はどうなるのか?最小値は? ・最小値があるとしたら、どの程度の速さで近づくのか? リスクの漸近評価が必要 ・実現可能か不可能か? ・累積損失か1時点の損失か? これらの評価基準・条件に注目してリスクを漸近評価
  • 8. NO.7 3-②.研究目的 本研究の位置づけ モデル族 実現可能 実現不可能 の条件 (真の分布がモデル族 (真の分布がモデル族 評価 に含まれる) に含まれない) 基準 累積対数損失 [Clarke&Barron,1990] 本研究 1時点の対数損失 [Watanabe,2010] [Watanabe,2010] 本研究の目的 真の分布がモデル族に含まれない場合の 累積対数損失におけるリスクの漸近評価
  • 9. NO.8 4-①.従来研究 実現可能・累積対数損失におけるリスクの評価 (Clarke&Barron,1990) 条件 ・パラメータ集合のコンパクト性 ・対数尤度・事前分布の微分可能性 指数型分布族 ならOK 結果 累積対数損失におけるリスク パラメータ数 収束の速さ データ1個あたりの平均損失は で0に近づく
  • 10. NO.9 4-②.従来研究 実現不可能・1時点の対数損失におけるリスクの評価 (Watanabe,2010) 条件 Clarke&Barronの条件 + ・ に最も近い がただ一つ存在 ・事後確率最大推定量 の への一致性と 漸近正規性 結果 実現可能な 1時点の対数損失におけるリスク 場合の結果 も含んでいる パラメータ数
  • 11. NO.10 5-①.本研究 実現不可能・累積対数損失におけるリスクの評価 条件 Clarke&Barronの条件 + ・ に最も近い がただ一つ存在 ・最尤推定量 の への一致性 結果 累積対数損失におけるリスク ダイバー ジェンス パラメータ数 データ1個あたりの平均損失は で ダイバージェンスに近づく
  • 12. NO.11 5-②.本研究 証明のポイント 証明最大の壁は・・・ まともに計算するのが困難な積分を評価する必要があること 積分計算を回避するために・・・ (最尤推定量の周りでの)テーラー展開等を用いる Clarke&Barronと ほぼ同様の手法 展開によって出てくる項(主要項以外)は・・・ 最尤推定量の一致性(条件)で定数項に帰着
  • 13. NO.12 5-③.本研究 シミュレーション(本研究の結果の確認) 真の分布:カイ二乗分布(自由度5) データ数 モデル族:指数分布 と 事前分布:ガンマ分布(自然共役) データ1個当たりの平均損失 の関係を検証 1 0.8 データ1個 約0.19 当たりの 0.6 平均損失 0.4 (単位:nat) 0.2 0 実現可能な場 121 145 169 193 217 241 265 289 313 337 361 385 409 433 457 481 1 25 97 49 73 データ数 合とは違って 0に収束しない ダイバージェンスの値は約0.186(パラメータ0.2)
  • 14. NO.13 6.まとめ ・実現不可能な場合の累積対数損失における リスクを漸近評価した ・実現可能な場合と異なり、ダイバージェンス に収束することが分かった ・収束の速度は同じであった ・結果をシミュレーションによって確認した
  • 15. NO.14 A-①.付録 対数損失の定義 逐次損失の和 ・累積対数損失 ( は決定関数) ・1時点の対数損失 1時点のデータを 発生させる真の 分布で平均
  • 16. NO.15 A-②.付録 ベイズ決定関数 ベイズリスクを最小とする決定関数 最適な決定関数 ・累積対数損失を考える場合 対数尤度をパラメータの 事前分布で平均 対数尤度をパラメータの ・1時点の対数損失を考える場合 事後分布で平均
  • 17. NO.16 A-③.付録 ダイバージェンスについて 異なる2つの確率分布間の距離のようなもの 真の分布に最も近い確率モデルのパラメータ
  • 18. NO.17 A-④.付録 Clarke&Barronの証明の概要 実現可能であるから となる 真のパラメータが存在する リスク に対して の計算が困難 を真のパラメータの周りでテーラー展開 漸近的に 期待値 主要項 + 0になる項 結果へ
  • 19. NO.18 A-⑤.付録 本研究の証明の概要 Clarke&Barronと同様 の計算が困難 定数 テーラー展開で回避 テーラー展開 ( のまわりで) 主要項 + その他の項 定数項 結果へ