データマイニングや機械学習をやるときによく問題となる「リーケージ」を防ぐ方法について論じた論文「Leakage in Data Mining: Formulation, Detecting, and Avoidance」(Kaufman, Shachar, et al., ACM Transactions on Knowledge Discovery from Data (TKDD) 6.4 (2012): 1-21.)を解説します。
主な内容は以下のとおりです。
・過去に起きたリーケージの事例の紹介
・リーケージを防ぐための2つの考え方
・リーケージの発見
・リーケージの修正
データマイニングや機械学習をやるときによく問題となる「リーケージ」を防ぐ方法について論じた論文「Leakage in Data Mining: Formulation, Detecting, and Avoidance」(Kaufman, Shachar, et al., ACM Transactions on Knowledge Discovery from Data (TKDD) 6.4 (2012): 1-21.)を解説します。
主な内容は以下のとおりです。
・過去に起きたリーケージの事例の紹介
・リーケージを防ぐための2つの考え方
・リーケージの発見
・リーケージの修正
Deep learningを使った生成モデルの中でも、VAEとその拡張であるCVAE、IWAE、ADGMの導出と理論の話。
ADGMについては、論文がラベルありについての導出がメインなので、ラベルなしの場合のグラフィカルモデルを作って定式化し導出過程を説明。
VAEは実装できるけどどういう理論でできてるかわからないとか、どうやって拡張するか、ADGMの実装をどうすればいいかわからない人向け。
最高の統計ソフトウェアはどれか? "What’s the Best Statistical Software? A Comparison of R, Py...ケンタ タナカ
"What’s the Best Statistical Software? A Comparison of R, Python, SAS, SPSS and STATA" https://www.inwt-statistics.com/read-blog/comparison-of-r-python-sas-spss-and-stata.html の抄訳です。
Deep learningを使った生成モデルの中でも、VAEとその拡張であるCVAE、IWAE、ADGMの導出と理論の話。
ADGMについては、論文がラベルありについての導出がメインなので、ラベルなしの場合のグラフィカルモデルを作って定式化し導出過程を説明。
VAEは実装できるけどどういう理論でできてるかわからないとか、どうやって拡張するか、ADGMの実装をどうすればいいかわからない人向け。
最高の統計ソフトウェアはどれか? "What’s the Best Statistical Software? A Comparison of R, Py...ケンタ タナカ
"What’s the Best Statistical Software? A Comparison of R, Python, SAS, SPSS and STATA" https://www.inwt-statistics.com/read-blog/comparison-of-r-python-sas-spss-and-stata.html の抄訳です。