SlideShare a Scribd company logo
1 of 34
Download to read offline
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
.
......
21 世紀の手法対決
@motivic
第 33 回 R 勉強会@東京
2013 年 8 月 31 日
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
目次
...1 はじめに
自己紹介
...2 21 世紀の手法対決
20 世紀の独立性を見つける方法の限界
21 世紀の相関:MIC
21 世紀の検定:HSIC test
いざ勝負!
...3 参考
参考文献
参考 HP
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
自己紹介
twitter ID:@motivic
職業:研究室に住む妖精
研究分野



代数統計 (代数幾何)
情報幾何
トポロジカルデータ解析



を用いた



医療統計
疫学
因果推論



統計ゆるふわ勢
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
はじめに
注意
本日の話では交絡(擬似相関)は避けられていると仮定
ただし、本日の議論を交絡がある場合に拡張することも可能
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
変数の独立性
.
変数同士が U 字型の関連を持つ場合の独立性検定
..
......
U 字型の相関係数はかなり小さい
普通の独立性検定をすると、独立と判定される
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
線形から非線形へ
.
従来法
..
......
Pearson の相関係数は線形的な関係を見るもの
順位相関係数は単調的な関係を見るもの
非線形な関係を見るためには離散化する必要があった
しかし離散化に恣意性が入る
 
.
線形から非線形へ
..
...... 非線形の関係をうまく捉える方法が出てきた!
 
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
21 世紀の相関:MIC(Maximal Information Coefficient)
21世紀の相関係数:MIC
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
21 世紀の相関:MIC(Maximal Information Coefficient)
 
.
21 世紀の相関:MIC(Reshef et al, 2011)
..
......
2011 年に Science 誌に 21 世紀の相関係数なんて呼ばれるも
のが出てきた
これを使えば非線形な関連も捉えられる
アイデアとしては、従来の離散化には恣意性があったので、
ありうる全ての離散化をして計算すればいいじゃん、という
レベルを上げて物理で殴ればいい的な考え
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
21 世紀の相関:MIC(Maximal Information Coefficient)
 
.
MIC(Maximal Information Coefficient) の計算
..
......
x × y < n0.6
を満たす全ての x × y の離散化を考える
各分割で正規化した相互情報量が高い分割点を網羅的に探索
全分割の中で正規化した相互情報量が最大のものを選ぶ
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
21 世紀の相関:MIC(Maximal Information Coefficient)
 
.
MIC(Maximal Information Coefficient) の計算
..
......
x × y < n0.6
を満たす全ての x × y の離散化を考える
各分割で正規化した相互情報量が高い分割点を網羅的に探索
全分割の中で正規化した相互情報量が最大のものを選ぶ
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
21 世紀の相関:MIC(Maximal Information Coefficient)
 
.
MIC(Maximal Information Coefficient) の計算
..
......
x × y < n0.6
を満たす全ての x × y の離散化を考える
各分割で正規化した相互情報量が高い分割点を網羅的に探索
全分割の中で正規化した相互情報量が最大のものを選ぶ
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
21 世紀の相関:MIC(Maximal Information Coefficient)
 
.
MIC(Maximal Information Coefficient) の計算
..
......
x × y < n0.6
を満たす全ての x × y の離散化を考える
各分割で正規化した相互情報量が高い分割点を網羅的に探索
全分割の中で正規化した相互情報量が最大のものを選ぶ
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
21 世紀の相関:MIC(Maximal Information Coefficient)
 
.
MIC(Maximal Information Coefficient) の計算
..
......
x × y < n0.6
を満たす全ての x × y の離散化を考える
各分割で正規化した相互情報量が高い分割点を網羅的に探索
全分割の中で正規化した相互情報量が最大のものを選ぶ
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
21 世紀の相関:MIC(Maximal Information Coefficient)
 
.
MIC(Maximal Information Coefficient) の計算
..
......
x × y < n0.6
を満たす全ての x × y の離散化を考える
各分割で正規化した相互情報量が高い分割点を網羅的に探索
全分割の中で正規化した相互情報量が最大のものを選ぶ
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
21 世紀の相関:MIC(Maximal Information Coefficient)
.
R で MIC を計算するパッケージ
..
......
minerva というパッケージで MIC が計算できる。
cars データ (車の速さと停止距離のデータ) で MIC を計算してみ
ると、
>library(minerva)
>mine(cars)$MIC[1,2]
[1] 0.666265
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
HSIC(Hilbert-Schmidt Independence Criterion) test
21世紀の検定:HSIC test
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
HSIC(Hilbert-Schmidt Independence Criterion) test
みんな大好き!
再生核ヒルベルト空間!
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
HSIC(Hilbert-Schmidt Independence Criterion) test
.
再生核ヒルベルト空間を用いた独立性検定
..
......
再生核ヒルベルト空間を用いたノンパラメトリックな独立性
検定 (HSIC test, Hilbert-Schmidt Independence Criterion test)
なんてものもある (Gretton et al, 2005, 2010)
これを使っても非線形な関連を見つけられる
アイデアとしては、データを再生核ヒルベルト空間に移し
て、その中で関係性を見るというハイソなやり方
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
HSIC(Hilbert-Schmidt Independence Criterion) test
x
x
i
j
k( , )
k( , )
xi
jx
Hx
ガウスカーネル kG(x, y) = exp
(
−
1
2σ2
||x − y||2
)
ラプラスカーネル kL (x, y) = exp

−β
n∑
i=1
|xi − yi|

   など
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
HSIC(Hilbert-Schmidt Independence Criterion) test
x
x
i
j
k( , )
k( , )
xi
jx
Hx
y
y
i
j
k( , )
k( , )
yi
jy
Hy
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
HSIC(Hilbert-Schmidt Independence Criterion) test
x
x
i
j
k( , )
k( , )
xi
jx
Hx
y
y
i
j
k( , )
k( , )
yi
jy
Hy
Σyx
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
HSIC(Hilbert-Schmidt Independence Criterion) test
.
定理
..
......
< ΣYX f, g >HY
= E[f(X)g(Y)] − E[f(X)]E[g(Y)]
を満たす ΣYX が一意的に存在する。
HYX := ∥ΣYX ∥2
HS
 
としたとき(∥ · ∥HS は Hilbert-Schmidt ノルム)、カーネルが特性
的であれば、
X ⊥⊥ Y ⇔ HYX = 0  
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
HSIC(Hilbert-Schmidt Independence Criterion) test
.
R での計算
..
......
実装は Rcpp でしています
Rcpp については第 29 回 R 勉強会@東京の大仏様の資料がお
ススメ!
http://www.slideshare.net/teramonagi/tokyor-rcpp-16709700
具体的なコードの公開は HSIC を応用した論文を書くまでお
待ちを
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
MIC vs HSIC
2つの手法の勝負!
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
MIC vs HSIC
 
U 字型の関連を持つものにノイズを加えたもの
この関連をどれだけ捉えられるかの検出力で比較する
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
MIC vs HSIC
 
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
MIC vs HSIC
 
線形の関連を持つものにノイズを加えたもの
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
MIC vs HSIC
 
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
MIC vs HSIC
 
指数型の関連を持つものにノイズを加えたもの
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
MIC vs HSIC
 
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
MIC vs HSIC
.
まとめ
..
......
MIC は U 字型の関係ではそこそこ良いが、線形的や単調な関
係に対してはノイズが入ると検出力がかなり落ちる
HSIC は非線形の関係も捉えつつ、線形的や単調的な場合も
従来法並みの検出力がある
 
.
判定
..
...... HSICの勝ち!
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
GMIC vs MIC vs HSIC
.
GMIC について
..
......
今週 GMIC という MIC の検出力の低さを改善させた論文のプ
レプリントで出てました
論文を読んでみたところ検出力は
HSIC >>> GMIC > MIC
となりそうなので、やっぱり HSIC がスゴイ
 
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
参考文献
Reshef, D. N., Reshef, Y. A., Finucane, H. K., Grossman, S. R.,
McVean, G., Turnbaugh, P. J., Lander, E. S., Mitzenmacher, M.,
Sabeti, P.C.(2011). Detecting Novel Associations in Large Data
Sets, Science 334 (6062), 1518-1524
Gretton, A., Bousquet, O., Smola, A., and Schoelkopf, B.(2005).
Measuring Statistical Dependence with Hilbert-Schmidt Norms, MPI
for Biological Cybernetics (140)
Gretton, A. and Gyorfi, L.(2010) Consistent Nonparametric Tests of
Independence, Journal of Machine Learning Research, 11 ,
pp.1391–1423
@motivic 21 世紀の手法対決
.
はじめに
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 世紀の手法対決
. .
参考
参考 HP
MIC について
Take a Risk:林岳彦の研究メモ − 2013-04-26
”相関”の話&そのついでに”21 世紀の相関 (MIC)”の話
http://d.hatena.ne.jp/takehiko-i-hayashi/20130426/1366948560
HSIC について
統数研の福水先生の HP にある色々な資料
http://www.ism.ac.jp/˜ fukumizu/
@motivic 21 世紀の手法対決

More Related Content

What's hot

[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic DatasetsDeep Learning JP
 
最適輸送入門
最適輸送入門最適輸送入門
最適輸送入門joisino
 
Active Learning 入門
Active Learning 入門Active Learning 入門
Active Learning 入門Shuyo Nakatani
 
Nagoya.R #12 非線形の相関関係を検出する指標の算出
Nagoya.R #12 非線形の相関関係を検出する指標の算出Nagoya.R #12 非線形の相関関係を検出する指標の算出
Nagoya.R #12 非線形の相関関係を検出する指標の算出Yusaku Kawaguchi
 
変数同士の関連_MIC
変数同士の関連_MIC変数同士の関連_MIC
変数同士の関連_MICShushi Namba
 
機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明Satoshi Hara
 
[DL輪読会]When Does Label Smoothing Help?
[DL輪読会]When Does Label Smoothing Help?[DL輪読会]When Does Label Smoothing Help?
[DL輪読会]When Does Label Smoothing Help?Deep Learning JP
 
時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?Fumihiko Takahashi
 
【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法Deep Learning JP
 
画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイcvpaper. challenge
 
Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換
Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換
Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換Koichi Hamada
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介Naoki Hayashi
 
Bayesian Neural Networks : Survey
Bayesian Neural Networks : SurveyBayesian Neural Networks : Survey
Bayesian Neural Networks : Surveytmtm otm
 
グラフィカルモデル入門
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門Kawamoto_Kazuhiko
 
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII
 
機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門hoxo_m
 
トピックモデルの基礎と応用
トピックモデルの基礎と応用トピックモデルの基礎と応用
トピックモデルの基礎と応用Tomonari Masada
 
『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会takehikoihayashi
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心takehikoihayashi
 
変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)Takao Yamanaka
 

What's hot (20)

[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
 
最適輸送入門
最適輸送入門最適輸送入門
最適輸送入門
 
Active Learning 入門
Active Learning 入門Active Learning 入門
Active Learning 入門
 
Nagoya.R #12 非線形の相関関係を検出する指標の算出
Nagoya.R #12 非線形の相関関係を検出する指標の算出Nagoya.R #12 非線形の相関関係を検出する指標の算出
Nagoya.R #12 非線形の相関関係を検出する指標の算出
 
変数同士の関連_MIC
変数同士の関連_MIC変数同士の関連_MIC
変数同士の関連_MIC
 
機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明
 
[DL輪読会]When Does Label Smoothing Help?
[DL輪読会]When Does Label Smoothing Help?[DL輪読会]When Does Label Smoothing Help?
[DL輪読会]When Does Label Smoothing Help?
 
時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?
 
【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法【DL輪読会】時系列予測 Transfomers の精度向上手法
【DL輪読会】時系列予測 Transfomers の精度向上手法
 
画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ
 
Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換
Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換
Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介
 
Bayesian Neural Networks : Survey
Bayesian Neural Networks : SurveyBayesian Neural Networks : Survey
Bayesian Neural Networks : Survey
 
グラフィカルモデル入門
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門
 
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
 
機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門
 
トピックモデルの基礎と応用
トピックモデルの基礎と応用トピックモデルの基礎と応用
トピックモデルの基礎と応用
 
『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心
 
変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)
 

Recently uploaded

【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成Hiroshi Tomioka
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 

Recently uploaded (9)

【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 

21世紀の手法対決 (MIC vs HSIC)

  • 1. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 . ...... 21 世紀の手法対決 @motivic 第 33 回 R 勉強会@東京 2013 年 8 月 31 日 @motivic 21 世紀の手法対決
  • 2. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 目次 ...1 はじめに 自己紹介 ...2 21 世紀の手法対決 20 世紀の独立性を見つける方法の限界 21 世紀の相関:MIC 21 世紀の検定:HSIC test いざ勝負! ...3 参考 参考文献 参考 HP @motivic 21 世紀の手法対決
  • 3. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 自己紹介 twitter ID:@motivic 職業:研究室に住む妖精 研究分野    代数統計 (代数幾何) 情報幾何 トポロジカルデータ解析    を用いた    医療統計 疫学 因果推論    統計ゆるふわ勢 @motivic 21 世紀の手法対決
  • 4. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 はじめに 注意 本日の話では交絡(擬似相関)は避けられていると仮定 ただし、本日の議論を交絡がある場合に拡張することも可能 @motivic 21 世紀の手法対決
  • 5. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 変数の独立性 . 変数同士が U 字型の関連を持つ場合の独立性検定 .. ...... U 字型の相関係数はかなり小さい 普通の独立性検定をすると、独立と判定される @motivic 21 世紀の手法対決
  • 6. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 線形から非線形へ . 従来法 .. ...... Pearson の相関係数は線形的な関係を見るもの 順位相関係数は単調的な関係を見るもの 非線形な関係を見るためには離散化する必要があった しかし離散化に恣意性が入る   . 線形から非線形へ .. ...... 非線形の関係をうまく捉える方法が出てきた!   @motivic 21 世紀の手法対決
  • 7. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 21 世紀の相関:MIC(Maximal Information Coefficient) 21世紀の相関係数:MIC @motivic 21 世紀の手法対決
  • 8. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 21 世紀の相関:MIC(Maximal Information Coefficient)   . 21 世紀の相関:MIC(Reshef et al, 2011) .. ...... 2011 年に Science 誌に 21 世紀の相関係数なんて呼ばれるも のが出てきた これを使えば非線形な関連も捉えられる アイデアとしては、従来の離散化には恣意性があったので、 ありうる全ての離散化をして計算すればいいじゃん、という レベルを上げて物理で殴ればいい的な考え @motivic 21 世紀の手法対決
  • 9. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 21 世紀の相関:MIC(Maximal Information Coefficient)   . MIC(Maximal Information Coefficient) の計算 .. ...... x × y < n0.6 を満たす全ての x × y の離散化を考える 各分割で正規化した相互情報量が高い分割点を網羅的に探索 全分割の中で正規化した相互情報量が最大のものを選ぶ @motivic 21 世紀の手法対決
  • 10. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 21 世紀の相関:MIC(Maximal Information Coefficient)   . MIC(Maximal Information Coefficient) の計算 .. ...... x × y < n0.6 を満たす全ての x × y の離散化を考える 各分割で正規化した相互情報量が高い分割点を網羅的に探索 全分割の中で正規化した相互情報量が最大のものを選ぶ @motivic 21 世紀の手法対決
  • 11. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 21 世紀の相関:MIC(Maximal Information Coefficient)   . MIC(Maximal Information Coefficient) の計算 .. ...... x × y < n0.6 を満たす全ての x × y の離散化を考える 各分割で正規化した相互情報量が高い分割点を網羅的に探索 全分割の中で正規化した相互情報量が最大のものを選ぶ @motivic 21 世紀の手法対決
  • 12. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 21 世紀の相関:MIC(Maximal Information Coefficient)   . MIC(Maximal Information Coefficient) の計算 .. ...... x × y < n0.6 を満たす全ての x × y の離散化を考える 各分割で正規化した相互情報量が高い分割点を網羅的に探索 全分割の中で正規化した相互情報量が最大のものを選ぶ @motivic 21 世紀の手法対決
  • 13. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 21 世紀の相関:MIC(Maximal Information Coefficient)   . MIC(Maximal Information Coefficient) の計算 .. ...... x × y < n0.6 を満たす全ての x × y の離散化を考える 各分割で正規化した相互情報量が高い分割点を網羅的に探索 全分割の中で正規化した相互情報量が最大のものを選ぶ @motivic 21 世紀の手法対決
  • 14. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 21 世紀の相関:MIC(Maximal Information Coefficient)   . MIC(Maximal Information Coefficient) の計算 .. ...... x × y < n0.6 を満たす全ての x × y の離散化を考える 各分割で正規化した相互情報量が高い分割点を網羅的に探索 全分割の中で正規化した相互情報量が最大のものを選ぶ @motivic 21 世紀の手法対決
  • 15. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 21 世紀の相関:MIC(Maximal Information Coefficient) . R で MIC を計算するパッケージ .. ...... minerva というパッケージで MIC が計算できる。 cars データ (車の速さと停止距離のデータ) で MIC を計算してみ ると、 >library(minerva) >mine(cars)$MIC[1,2] [1] 0.666265 @motivic 21 世紀の手法対決
  • 16. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 HSIC(Hilbert-Schmidt Independence Criterion) test 21世紀の検定:HSIC test @motivic 21 世紀の手法対決
  • 17. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 HSIC(Hilbert-Schmidt Independence Criterion) test みんな大好き! 再生核ヒルベルト空間! @motivic 21 世紀の手法対決
  • 18. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 HSIC(Hilbert-Schmidt Independence Criterion) test . 再生核ヒルベルト空間を用いた独立性検定 .. ...... 再生核ヒルベルト空間を用いたノンパラメトリックな独立性 検定 (HSIC test, Hilbert-Schmidt Independence Criterion test) なんてものもある (Gretton et al, 2005, 2010) これを使っても非線形な関連を見つけられる アイデアとしては、データを再生核ヒルベルト空間に移し て、その中で関係性を見るというハイソなやり方 @motivic 21 世紀の手法対決
  • 19. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 HSIC(Hilbert-Schmidt Independence Criterion) test x x i j k( , ) k( , ) xi jx Hx ガウスカーネル kG(x, y) = exp ( − 1 2σ2 ||x − y||2 ) ラプラスカーネル kL (x, y) = exp  −β n∑ i=1 |xi − yi|     など @motivic 21 世紀の手法対決
  • 20. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 HSIC(Hilbert-Schmidt Independence Criterion) test x x i j k( , ) k( , ) xi jx Hx y y i j k( , ) k( , ) yi jy Hy @motivic 21 世紀の手法対決
  • 21. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 HSIC(Hilbert-Schmidt Independence Criterion) test x x i j k( , ) k( , ) xi jx Hx y y i j k( , ) k( , ) yi jy Hy Σyx @motivic 21 世紀の手法対決
  • 22. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 HSIC(Hilbert-Schmidt Independence Criterion) test . 定理 .. ...... < ΣYX f, g >HY = E[f(X)g(Y)] − E[f(X)]E[g(Y)] を満たす ΣYX が一意的に存在する。 HYX := ∥ΣYX ∥2 HS   としたとき(∥ · ∥HS は Hilbert-Schmidt ノルム)、カーネルが特性 的であれば、 X ⊥⊥ Y ⇔ HYX = 0   @motivic 21 世紀の手法対決
  • 23. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 HSIC(Hilbert-Schmidt Independence Criterion) test . R での計算 .. ...... 実装は Rcpp でしています Rcpp については第 29 回 R 勉強会@東京の大仏様の資料がお ススメ! http://www.slideshare.net/teramonagi/tokyor-rcpp-16709700 具体的なコードの公開は HSIC を応用した論文を書くまでお 待ちを @motivic 21 世紀の手法対決
  • 24. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 MIC vs HSIC 2つの手法の勝負! @motivic 21 世紀の手法対決
  • 25. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 MIC vs HSIC   U 字型の関連を持つものにノイズを加えたもの この関連をどれだけ捉えられるかの検出力で比較する @motivic 21 世紀の手法対決
  • 26. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 MIC vs HSIC   @motivic 21 世紀の手法対決
  • 27. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 MIC vs HSIC   線形の関連を持つものにノイズを加えたもの @motivic 21 世紀の手法対決
  • 28. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 MIC vs HSIC   @motivic 21 世紀の手法対決
  • 29. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 MIC vs HSIC   指数型の関連を持つものにノイズを加えたもの @motivic 21 世紀の手法対決
  • 30. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 MIC vs HSIC   @motivic 21 世紀の手法対決
  • 31. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 MIC vs HSIC . まとめ .. ...... MIC は U 字型の関係ではそこそこ良いが、線形的や単調な関 係に対してはノイズが入ると検出力がかなり落ちる HSIC は非線形の関係も捉えつつ、線形的や単調的な場合も 従来法並みの検出力がある   . 判定 .. ...... HSICの勝ち! @motivic 21 世紀の手法対決
  • 32. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 GMIC vs MIC vs HSIC . GMIC について .. ...... 今週 GMIC という MIC の検出力の低さを改善させた論文のプ レプリントで出てました 論文を読んでみたところ検出力は HSIC >>> GMIC > MIC となりそうなので、やっぱり HSIC がスゴイ   @motivic 21 世紀の手法対決
  • 33. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 参考文献 Reshef, D. N., Reshef, Y. A., Finucane, H. K., Grossman, S. R., McVean, G., Turnbaugh, P. J., Lander, E. S., Mitzenmacher, M., Sabeti, P.C.(2011). Detecting Novel Associations in Large Data Sets, Science 334 (6062), 1518-1524 Gretton, A., Bousquet, O., Smola, A., and Schoelkopf, B.(2005). Measuring Statistical Dependence with Hilbert-Schmidt Norms, MPI for Biological Cybernetics (140) Gretton, A. and Gyorfi, L.(2010) Consistent Nonparametric Tests of Independence, Journal of Machine Learning Research, 11 , pp.1391–1423 @motivic 21 世紀の手法対決
  • 34. . はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 世紀の手法対決 . . 参考 参考 HP MIC について Take a Risk:林岳彦の研究メモ − 2013-04-26 ”相関”の話&そのついでに”21 世紀の相関 (MIC)”の話 http://d.hatena.ne.jp/takehiko-i-hayashi/20130426/1366948560 HSIC について 統数研の福水先生の HP にある色々な資料 http://www.ism.ac.jp/˜ fukumizu/ @motivic 21 世紀の手法対決