Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Nagoya.R #12 非線形の相関関係を検出する指標の算出

3,717 views

Published on

Nagoya.R #12 「非線形の相関関係を検出する指標の算出」にて使用した投影スライドです。

Published in: Education
  • Be the first to comment

Nagoya.R #12 非線形の相関関係を検出する指標の算出

  1. 1. 非線形の相関関係を 検出する指標の算出
  2. 2. 川口勇作 y.kawaguchi@nagoya-u.jp Nagoya.R #12 於:名古屋大学 2014/12/6
  3. 3. メニュー 1.はじめに 2.MIC 3.minervaパッケージ
  4. 4. はじめに •相関 1.二つのものが密接にかかわり合い、一 方が変化すれば他方も変化するような 関係 2.数学で、一方が増加すると、他方が増 加または減少する、二つの変量の関係 (デジタル大辞泉より)
  5. 5. はじめに •相関 –一つの値が大きくなるにつれてもう一 方の値が大きく/小さくなる関係 •気温とアイスの売上 •カロリー摂取量と体重 •TOEICスコアと年収 –線形の関係
  6. 6. 101520253035 20406080100120140 気温 アイスの売上
  7. 7. はじめに •けど… –常に線形の関係ばかりじゃない –非線形の関係 •年齢と身長 –若いうちは伸びる、年をとると縮む •スポーツにおける緊張と成績 –緊張し過ぎ・リラックスし過ぎだと成績は悪い –程よく緊張しているのが良い »逆U字の関係
  8. 8. 51015 246810 緊張 成績
  9. 9. はじめに •ピアソンの積率相関係数 –線形の関係を想定 –非線形の関係はうまく検出できない –さっきの緊張と成績の例:r = -.01
  10. 10. http://ja.wikipedia.org/wiki/%E7%9B%B8%E9%96%A2%E4%BF%82%E6%95%B0#mediaviewer/File:Correlation_examples2.svg
  11. 11. はじめに •現実のデータは線形ばかりではない •世の中には確かに非線形の関係も存在す る •線形だけでは現実は見れない •非線形の相関も見れる指標を…
  12. 12. MICとは •最大情報係数(Maximal Information Coefficient, MIC) –Reshef et al. (2011) が考案 –Science誌の解説文にて「21世紀の相 関」と呼ばれた –非線形の相関関係も検出できる指標
  13. 13. MIC •MIC –R2に準ずる値 –計算方法 •相互情報量が最大になるようにグリッドを 引いて計算 •詳細は原著論文にて
  14. 14. MIC 原著論文より
  15. 15. MIC 原著論文より
  16. 16. MIC http://lectures.molgen.mpg.de/algsysbio12/MINEPresentation.pdf
  17. 17. minervaパッケージ •MICを計算するためのパッケージ •「mine」という関数で計算します •使い方 mine(x, y) –これだけ –cor関数と基本的に同じ使い方
  18. 18. minervaパッケージ •mine関数を実行すると、MIC以外に も値がいくつか出てくる –MAS –MEV –MCN –MICR2 –なんかいっぱい出たー
  19. 19. minervaパッケージ •大事なものだけ –MAS •単調性の指標 –MICR2 •MICとピアソンの積率相関係数の2乗の差 •非線形性の指標
  20. 20. minervaパッケージ •ちなみにさっきの データなら… •r = -.01 •MIC = 0.892 (r に換算すると およそ .90!) 51015 246810 緊張 成績
  21. 21. MICは万能か? •否 –関係性の強さはわかるが、値がどう変 わるかまではMICの数値だけではわから ない •散布図やLoessによる平滑化曲線などと併 用して、関係をみることが重要 –ビッグデータが前提 •小規模なデータには不適切かも?
  22. 22. 参考資料 Reshef, D. N., Reshef, Y. A., Finucane, H. K., Grossman, S. R., McVean, G., Turnbaugh, P. J., Lander, E. S., Mitzenmacher, M., & Sabeti, P. C. (2011). Detecting novel associations in large data sets. Science, 334, 1518– 1524. “相関”の話&そのついでに“21世紀の相関(MIC)”の話(ややマニア向 け)‐ Take a Risk:林岳彦の研究メモ: http://takehiko-i- hayashi.hatenablog.com/entry/20130426/1366948560#fn5 非線形もOKな相関係数:MIC‐Logics of Blue:http://logics-of- blue.com/%E9%9D%9E%E7%B7%9A%E5%BD%A2%E3%82%82ok%E3%81%AA%E7%9B%B8%E9%96%A2%E4%BF%82%E6%95%B0%EF% BC%9Amic/

×