変数選択におけるAICの利用：理論と実装

変数選択における AIC の利用：理論と実装 sstat3 October 22, 2011

内容 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

データマイニングプロセスにおける変数選択の位置付け SEMMA (Sample, Explore, Modify, Model , and Assess) http://www.dataprix.net/en/blogs/respinosamilla/theory-data-mining 1 データの抽出 5 モデルの評価 4 モデルのあてはめ 3 データの加工 2 データの探索

データマイニングプロセスにおける変数選択の位置付け（続き） CRISP-DM (Cross-Industry Standard Process for Data Mining) http://www.dataprix.net/en/blogs/respinosamilla/theory-data-mining 1 ビジネスの理解 6 展開／共有 5 評価 4 モデリング 3 データの準備 2 データの理解

データマイニングプロセスにおける変数選択の位置付け（続き） KDD (Knowledge Discovery in Databases) Process Fayyad, U., Piatetsky-Shapiro, G., & Smyth, P. (1996). The KDD Process for Extracting Useful Knowledge from Volumes of Data. Communications of the ACM, 39(11) , 27-34.

問題：変数選択 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

クロス集計表 ,[object Object],[object Object],＊仮想データ説明変数 I 2 ターゲット変数 I 1 I 1 と I 2 のクロス集計表

クロス集計表と独立性の検定 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

伝統的な独立性の検定の欠点 ,[object Object],[object Object],[object Object],[object Object],[object Object]

クロス集計表に基づいた説明変数の評価のための AIC の導出 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

モデルの AIC とは何か？ ,[object Object],[object Object],[object Object],[object Object],[object Object]

クロス集計表の確率分布 ,[object Object],[object Object]

クロス集計表の従属モデル ,[object Object],[object Object],[object Object],[object Object]

クロス集計表の独立モデル ,[object Object],[object Object],[object Object],[object Object]

従属モデルと独立モデル i 1 = 1 2 i 2 = 1 2 3 4

クロス集計表の従属モデルと独立モデルの AIC の比較 ,[object Object],[object Object]

AIC と  2 の関係（参考） ,[object Object],[object Object],[object Object]

説明変数の予測力とは？ ,[object Object],[object Object],[object Object],[object Object],[object Object]

クロス集計表の条件付き確率分布 ,[object Object],[object Object],p ( i 2 ) を含まない部分

クロス集計表の条件付きモデル ,[object Object],[object Object],[object Object],[object Object]

説明変数に予測力があるモデルとないモデル i 1 = 1 2 i 2 = 1 2 3 4 i 1 = 1 2 ＊「よく尋ねられる質問について答えられる」人を博学と呼んでよいだろうか？　その人が博学であるといのは、「尋ねられるどんな質問にも答えられる」ことである。　「その質問がよく尋ねられるか」という環境的な要因は、彼の博学さとは直接関係ない。

異なる説明変数のクロス集計表に対する AIC の比較 ,[object Object],[object Object],[object Object]

異なる説明変数のクロス集計表に対する AIC の比較（続き） ,[object Object],[object Object]

まとめ ,[object Object],[object Object],[object Object],[object Object]

実務上の注意点 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

実務上の注意点（続き） ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

報告例 ,[object Object],[object Object],[object Object],[object Object],Note: AIC は変数の関係性の高さの指標です。値がマイナスであれば関係性があり、値が低いほど関係性が高いことを示します。＊仮想データ図表 1 説明変数の予測力図表 2-1 説明変数のターゲット傾向（業種）

報告例（続き） ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

実装： MewDap 出力：クロス集計表ごとの AIC 出力：伝統的な  2 検定入力：クロス集計表を縦に並べる

実装： MewDap （続き） ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

クロス集計表に出会ったら、 AIC をお試しください。

参考文献 ,[object Object],[object Object],[object Object],[object Object]

Thank you AIC はもっと流行っていいと思う

Appendix ： Kullback-Leibler 情報量から AIC まで ,[object Object],[object Object],[object Object],[object Object]

Kullback-Leibler 情報量 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Kullback-Leibler 情報量（続き） ,[object Object],[object Object],[object Object],[object Object]

Kullback-Leibler 情報量（続き）真の分布モデル分布 p 1 p i q 1 q i 0 1 n 1 n i n 観測データ n 回観測度数         1 0   0 1     n 1 / n n i / n 観測分布   状態 1 i  

平均対数尤度 ,[object Object],[object Object],[object Object],[object Object],[object Object]

最尤モデル ,[object Object],[object Object],[object Object]

期待平均対数尤度と AIC ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

変数選択におけるAICの利用：理論と実装

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

変数選択におけるAICの利用：理論と実装