ma99992010id512

卒業論文(2010年度)

実現不可能な
パラメトリックモデル族に対する
累積対数損失の漸近評価

指導松嶋敏泰教授
１W070524-3 宮希望

NO.1
1-①.研究背景
データ圧縮
(ユニバーサル符号化)

パターン認識時系列解析
例)画像データ
の伝送例)株価の予測
例)指紋認証

統計的予測問題

与えられたデータを用いて未知のデータを予測する

課題真のデータと予測値との誤差を小さくするような
予測法の構成
損失

NO.2
1-②.研究背景全てのデータに対して
損失を最小にすることはできない

損失を平均的に小さくするような予測法として・・・

ベイズ決定理論に基づく予測

有限個のデータに対してベイズ最適性
損失が平均的に最小となることを保証

現実的にデータ数を大量に
入手できる場面は多い
大量のデータに対して予測を行った
場合どこまで小さくなるのか？

損失の漸近的なふるまいを調べる必要がある

NO.3
2-①.準備

確率構造の仮定予測における事前知識
データ
真の分布
(未知)

：パラメータを持つ確率分布の集合(モデル族)
事 →パラメトリックモデル族
前
知：次元パラメータの集合例) (平均,分散)をパラメータ
識にもつ正規分布
：パラメータの事前分布(確率分布) (平均,分散)もある確率
分布に従う

・実現可能：真の分布がモデル族に含まれる
条
件
・実現不可能：真の分布がモデル族に含まれない

NO.4
2-②.準備
損失の定義確率分布間の対数損失

予測の良さをデータ間で
測る評価基準損失損失を測らない

・リスク

損失を真の分布で平均

・ベイズリスクリスクを事前
分布で平均

ベイズ最適な予測ベイズリスクを最小とする予測

NO.5
2-③.準備

損失の分類予測問題に応じて
2種類の損失を考える

・累積損失を逐次的に予測する場合

事前知識・・・
・・・
毎回の損失を
予測予測・・・予測
足し合わせる

・1時点の損失を得た下でを予測する場合

事前知識
予測
＋次の1時点だ
けを考える

NO.6
3-①.研究目的

ベイズ最適な予測ベイズリスク最小という意味で最適
損失が平均的に最小
ベイズ最適な予測をした場合,漸近的に・・・
・リスクの値はどうなるのか？最小値は？

・最小値があるとしたら、どの程度の速さで近づくのか？

リスクの漸近評価が必要

・実現可能か不可能か？

・累積損失か1時点の損失か？

これらの評価基準・条件に注目してリスクを漸近評価

NO.7
3-②.研究目的
本研究の位置づけ
モデル族実現可能実現不可能
の条件 (真の分布がモデル族 (真の分布がモデル族
評価に含まれる) に含まれない)
基準

累積対数損失 [Clarke&Barron,1990] 本研究

1時点の対数損失 [Watanabe,2010] [Watanabe,2010]

本研究の目的

真の分布がモデル族に含まれない場合の
累積対数損失におけるリスクの漸近評価

NO.8
4-①.従来研究

実現可能・累積対数損失におけるリスクの評価
(Clarke&Barron,1990)
条件・パラメータ集合のコンパクト性
・対数尤度・事前分布の微分可能性
指数型分布族
ならOK
結果累積対数損失におけるリスク

パラメータ数

収束の速さ

データ1個あたりの平均損失はで0に近づく

NO.9
4-②.従来研究

実現不可能・1時点の対数損失におけるリスクの評価
(Watanabe,2010)
条件 Clarke&Barronの条件

＋
・に最も近いがただ一つ存在
・事後確率最大推定量のへの一致性と
漸近正規性
結果実現可能な
1時点の対数損失におけるリスク場合の結果
も含んでいる

パラメータ数

NO.10
5-①.本研究

実現不可能・累積対数損失におけるリスクの評価

条件 Clarke&Barronの条件

＋
・に最も近いがただ一つ存在
・最尤推定量のへの一致性
結果累積対数損失におけるリスクダイバー
ジェンス

パラメータ数

データ1個あたりの平均損失はで
ダイバージェンスに近づく

NO.11
5-②.本研究
証明のポイント
証明最大の壁は・・・
まともに計算するのが困難な積分を評価する必要があること

積分計算を回避するために・・・
(最尤推定量の周りでの)テーラー展開等を用いる

Clarke&Barronと
ほぼ同様の手法
展開によって出てくる項(主要項以外)は・・・
最尤推定量の一致性(条件)で定数項に帰着

NO.12
5-③．本研究
シミュレーション(本研究の結果の確認)
真の分布：カイ二乗分布(自由度5) データ数
モデル族：指数分布と
事前分布：ガンマ分布(自然共役) データ1個当たりの平均損失
の関係を検証

1
0.8
データ1個約0.19
当たりの 0.6
平均損失
0.4
(単位:nat)
0.2
0
実現可能な場
121
145
169
193
217
241
265
289
313
337
361
385
409
433
457
481
1
25

97
49
73

データ数合とは違って
0に収束しない

ダイバージェンスの値は約0.186(パラメータ0.2)

NO.13
6.まとめ

・実現不可能な場合の累積対数損失における
リスクを漸近評価した

・実現可能な場合と異なり、ダイバージェンス
に収束することが分かった

・収束の速度は同じであった

・結果をシミュレーションによって確認した

NO.14
A-①.付録

対数損失の定義
逐次損失の和
・累積対数損失

（は決定関数）

・1時点の対数損失

1時点のデータを
発生させる真の
分布で平均

NO.15
A-②.付録

ベイズ決定関数ベイズリスクを最小とする決定関数
最適な決定関数

・累積対数損失を考える場合対数尤度をパラメータの
事前分布で平均

対数尤度をパラメータの
・1時点の対数損失を考える場合事後分布で平均

NO.16
A-③.付録

ダイバージェンスについて

異なる2つの確率分布間の距離のようなもの

真の分布に最も近い確率モデルのパラメータ

NO.17
A-④.付録

Clarke&Barronの証明の概要

実現可能であるからとなる
真のパラメータが存在する

リスクに対しての計算が困難

を真のパラメータの周りでテーラー展開

漸近的に期待値
主要項＋ 0になる項結果へ

NO.18
A-⑤.付録

本研究の証明の概要
Clarke&Barronと同様の計算が困難
定数
テーラー展開で回避

テーラー展開
( のまわりで)

主要項＋その他の項

定数項結果へ

ma99992010id512

Recommended

Recommended

More Related Content

Similar to ma99992010id512

Similar to ma99992010id512 (20)

More from matsushimalab

More from matsushimalab (18)

ma99992010id512