SlideShare a Scribd company logo
1 of 28
Download to read offline
自己紹介 
•なまえ:TORUIMAI 
•ついったー:@MOTIVIC_ 
•しごと:株式会社ALBERT主任研究員 
•きょうみ:因果推論、代数統計、情報幾何、トポロジカルデータ解析 
•今週LTしたDEEPLEARNINGの性能評価が思った以上に好評だった
分割表の検定ってありますよね
例えばABテストで広告の効果があったかを検証 
商品A 
買った 
買ってない 
広告表示なし 
3 
1000 
広告表示あり 
7 
1100
カイ二乗検定で良いんでしょ?
カイ二乗検定で良いんでしょ? 
このメッセージが出なければOKってものでもない
•分割表がスパースな場合 
•行和や列和が均等でなく偏りがある場合 
には漸近分布を用いる検定は良くない 
(例えばHABERMAN(1988,JASA)など)
FISHER‘S EXACT TESTは?
FISHER‘S EXACT TESTは? 
サンプルサイズや分割表のサイズが 
大きいと計算がつらたん
漸近分布が使えずサンプルサイズが大きい場合はどうするの?
漸近分布が使えずサンプルサイズが大きい場合はどうするの? 
皆大好きMCMC!
•2元分割表であれば簡単にMCMCでP値の計算が可能 
•3元以上の分割表は? 
•“マルコフ基底”を見つけるのが難しい 
•簡単に見つける方法はないか?
代数統計 
使えばいいよ
代数統計 
使えばいいよ 
一度だけなら
色んなソフトを使って 何とか計算できた
でも次第に 
代数統計のこと 
しか考えられなく 
なります
もっと楽に 
代数統計を 
使いたい!
Rで 
代数統計を
C++ 
MCMC 
マルコフ 基底
マルコフ基底 
MCMC
3元分割表での例
Rで代数統計が 
できるようになった
2014/08/30アクセス 
組織の陰謀により消されました
またいつかRで 
代数統計を 
使いたい!
参考文献 
•JST CREST 日比チーム(編)(2011).グレブナー道場.共立出版. 
•S.AOKI,H.HARA,ANDA.TAKEMURA(2012).MARKOV BASES IN ALGEBRAIC STATISTICS, SPRINGER. 
•S. J.HABERMAN(1988). A WARNING ON THE USE OF CHI-SQUARED STATISTICS WITH FREQUENCY TABLES WITH SMALL EXPECTED CELL COUNTS. JOURNAL OF THEAMERICAN STATISTICAL ASSOCIATION, 83, 555–560.
代数統計とか興味あるなら 
ALBERTで一緒に働かない?

More Related Content

Viewers also liked

Dummiesパッケージ
DummiesパッケージDummiesパッケージ
Dummiesパッケージweda654
 
Mxnetで回帰 #TokyoR 53th
Mxnetで回帰 #TokyoR 53thMxnetで回帰 #TokyoR 53th
Mxnetで回帰 #TokyoR 53thAkifumi Eguchi
 
R入門(dplyrでデータ加工)-TokyoR42
R入門(dplyrでデータ加工)-TokyoR42R入門(dplyrでデータ加工)-TokyoR42
R入門(dplyrでデータ加工)-TokyoR42Atsushi Hayakawa
 
20140625 rでのデータ分析(仮) for_tokyor
20140625 rでのデータ分析(仮) for_tokyor20140625 rでのデータ分析(仮) for_tokyor
20140625 rでのデータ分析(仮) for_tokyorTakashi Kitano
 
データサイエンティスト必見!M-1グランプリ
データサイエンティスト必見!M-1グランプリデータサイエンティスト必見!M-1グランプリ
データサイエンティスト必見!M-1グランプリSatoshi Kitajima
 
R を起動するその前に
R を起動するその前にR を起動するその前に
R を起動するその前にKosei ABE
 
条件付き確率場の推論と学習
条件付き確率場の推論と学習条件付き確率場の推論と学習
条件付き確率場の推論と学習Masaki Saito
 
マルコフ連鎖モンテカルロ法入門-1
マルコフ連鎖モンテカルロ法入門-1マルコフ連鎖モンテカルロ法入門-1
マルコフ連鎖モンテカルロ法入門-1Nagi Teramo
 
最強のハードディスクはどれだ?
最強のハードディスクはどれだ?最強のハードディスクはどれだ?
最強のハードディスクはどれだ?Atsushi Hayakawa
 
ggplot2再入門(2015年バージョン)
ggplot2再入門(2015年バージョン)ggplot2再入門(2015年バージョン)
ggplot2再入門(2015年バージョン)yutannihilation
 
Tokyor42 ggplot2
Tokyor42 ggplot2Tokyor42 ggplot2
Tokyor42 ggplot2Yohei Sato
 
Tokyor42_r_datamining_18
Tokyor42_r_datamining_18Tokyor42_r_datamining_18
Tokyor42_r_datamining_18Yohei Sato
 
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -Yohei Sato
 
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法Nagi Teramo
 
アンサンブル学習
アンサンブル学習アンサンブル学習
アンサンブル学習Hidekazu Tanaka
 

Viewers also liked (20)

Dummiesパッケージ
DummiesパッケージDummiesパッケージ
Dummiesパッケージ
 
Mxnetで回帰 #TokyoR 53th
Mxnetで回帰 #TokyoR 53thMxnetで回帰 #TokyoR 53th
Mxnetで回帰 #TokyoR 53th
 
R入門(dplyrでデータ加工)-TokyoR42
R入門(dplyrでデータ加工)-TokyoR42R入門(dplyrでデータ加工)-TokyoR42
R入門(dplyrでデータ加工)-TokyoR42
 
20140625 rでのデータ分析(仮) for_tokyor
20140625 rでのデータ分析(仮) for_tokyor20140625 rでのデータ分析(仮) for_tokyor
20140625 rでのデータ分析(仮) for_tokyor
 
データサイエンティスト必見!M-1グランプリ
データサイエンティスト必見!M-1グランプリデータサイエンティスト必見!M-1グランプリ
データサイエンティスト必見!M-1グランプリ
 
R を起動するその前に
R を起動するその前にR を起動するその前に
R を起動するその前に
 
条件付き確率場の推論と学習
条件付き確率場の推論と学習条件付き確率場の推論と学習
条件付き確率場の推論と学習
 
TokyoR42_around_chaining
TokyoR42_around_chainingTokyoR42_around_chaining
TokyoR42_around_chaining
 
マルコフ連鎖モンテカルロ法入門-1
マルコフ連鎖モンテカルロ法入門-1マルコフ連鎖モンテカルロ法入門-1
マルコフ連鎖モンテカルロ法入門-1
 
最強のハードディスクはどれだ?
最強のハードディスクはどれだ?最強のハードディスクはどれだ?
最強のハードディスクはどれだ?
 
ggplot2再入門(2015年バージョン)
ggplot2再入門(2015年バージョン)ggplot2再入門(2015年バージョン)
ggplot2再入門(2015年バージョン)
 
Tokyor42 ggplot2
Tokyor42 ggplot2Tokyor42 ggplot2
Tokyor42 ggplot2
 
Tokyor42_r_datamining_18
Tokyor42_r_datamining_18Tokyor42_r_datamining_18
Tokyor42_r_datamining_18
 
Tokyo r33 beginner
Tokyo r33 beginnerTokyo r33 beginner
Tokyo r33 beginner
 
Tokyo r30 anova
Tokyo r30 anovaTokyo r30 anova
Tokyo r30 anova
 
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
 
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
 
Tokyo r30 beginner
Tokyo r30 beginnerTokyo r30 beginner
Tokyo r30 beginner
 
アンサンブル学習
アンサンブル学習アンサンブル学習
アンサンブル学習
 
はじめての「R」
はじめての「R」はじめての「R」
はじめての「R」
 

Rで代数統計 TokyoR #42 LT