SlideShare a Scribd company logo
1 of 22
Download to read offline
Rで架空データの発生
第2回 (2015.5.23)
広島大学大学院教育学研究科
平川 真
Hijiyama.R
自己紹介
・@hirakawamakoto
・社会心理学界隈で活動しています
・通常枠です
2
モチベーション
・授業で使う架空データをつくる
・架空データを分析して、統計手法のお勉強をする
e.g., 中心極限定理を実際に確認してみる
「統計モデル=データ生成器」ということの理解を進める
3
母集団分布を指定し乱数を発生
rnorm関数: 正規分布に従う乱数を発生
4
平均と標準偏差を指定
個数を指定
t検定用データをつくってみる
5
t検定用データをつくってみる
6
もうだいたいいける
e.g., 交互作用が出るデータがほしいです
a1b1 mean=1.5
a1b2 mean=2.2
a2b1 mean=5.0
a2b2 mean=1.2
みたいにして発生させればOK
7
5
4
3
2
1
a1 a2
b1
b2
危険率のお勉強
Type I error: 帰無仮説が真のときに、それを棄却する誤り
危険率: Type I errorを起こす確率
慣例的に有意水準を5%に設定し、統計的仮説検定を行う
⇒ 危険率は5%
本当にそうなるの?
ためしてみる!
8
危険率のお勉強
9
t検定のお勉強(1)
t検定の前提
1. 無作為抽出が行われていること
2. 母集団の分布が正規分布であること
3. 母集団の分散が等質であること
前提が満たされない場合、帰無分布がt分布となるとは限らない
⇒ 危険率が5%を超えてしまうかも
10
t検定のお勉強(1)
分散の等質性の前提を破ってみた
11
Welchの検定でやると
任意の母相関係数をもつデータ
x, e1, e2がそれぞれ分散の等しい母集団から独立に抽出された場合
でつくられた2変数(y1, y2)の母相関(ρ)は となる
⇒ とすれば、母相関がρとなる2変数をつくれる
12
任意の母相関係数をもつデータ
13
t検定のお勉強(2)
対応のあるt検定だと検出力が上がる
⇒ X1とx2の相関 (r) が高くなると、t値は大きくなる
14
← 対応なし
← 対応あり
t検定のお勉強(2)
15
対応なし 対応あり
t検定のお勉強(2)
16
対応なし 対応あり
データフレームの作成
data.frame関数を使って、オブジェクトを結合
17
データフレームの書き出し
write.csv関数
18
おまけ:mvrnorm関数
任意の相関行列をもつ多変量データを発生させたい
MASSパッケージのmvrnorm関数
19
← 発生させたい相関行列の指定
↑
各変数の平均値を指定
おまけ:mvrnorm関数
20
おまけ:mvrnorm関数
21
おまけ:mvrnorm関数
多母集団同時分析用のデータセットも間単に
22

More Related Content

What's hot

ベイズファクターとモデル選択
ベイズファクターとモデル選択ベイズファクターとモデル選択
ベイズファクターとモデル選択kazutantan
 
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定Akira Masuda
 
(実験心理学徒だけど)一般化線形混合モデルを使ってみた
(実験心理学徒だけど)一般化線形混合モデルを使ってみた(実験心理学徒だけど)一般化線形混合モデルを使ってみた
(実験心理学徒だけど)一般化線形混合モデルを使ってみたTakashi Yamane
 
階層モデルの分散パラメータの事前分布について
階層モデルの分散パラメータの事前分布について階層モデルの分散パラメータの事前分布について
階層モデルの分散パラメータの事前分布についてhoxo_m
 
星野「調査観察データの統計科学」第3章
星野「調査観察データの統計科学」第3章星野「調査観察データの統計科学」第3章
星野「調査観察データの統計科学」第3章Shuyo Nakatani
 
Stanの便利な事後処理関数
Stanの便利な事後処理関数Stanの便利な事後処理関数
Stanの便利な事後処理関数daiki hojo
 
心理学者のためのGlmm・階層ベイズ
心理学者のためのGlmm・階層ベイズ心理学者のためのGlmm・階層ベイズ
心理学者のためのGlmm・階層ベイズHiroshi Shimizu
 
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ
Rで因子分析 商用ソフトで実行できない因子分析のあれこれRで因子分析 商用ソフトで実行できない因子分析のあれこれ
Rで因子分析 商用ソフトで実行できない因子分析のあれこれHiroshi Shimizu
 
『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会takehikoihayashi
 
R Study Tokyo03
R Study Tokyo03R Study Tokyo03
R Study Tokyo03Yohei Sato
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介Naoki Hayashi
 
負の二項分布について
負の二項分布について負の二項分布について
負の二項分布についてHiroshi Shimizu
 
ノンパラベイズ入門の入門
ノンパラベイズ入門の入門ノンパラベイズ入門の入門
ノンパラベイズ入門の入門Shuyo Nakatani
 
マルチレベルモデル講習会 理論編
マルチレベルモデル講習会 理論編マルチレベルモデル講習会 理論編
マルチレベルモデル講習会 理論編Hiroshi Shimizu
 
星野「調査観察データの統計科学」第1&2章
星野「調査観察データの統計科学」第1&2章星野「調査観察データの統計科学」第1&2章
星野「調査観察データの統計科学」第1&2章Shuyo Nakatani
 
臨床疫学研究における傾向スコア分析の使い⽅ 〜観察研究における治療効果研究〜
臨床疫学研究における傾向スコア分析の使い⽅ 〜観察研究における治療効果研究〜臨床疫学研究における傾向スコア分析の使い⽅ 〜観察研究における治療効果研究〜
臨床疫学研究における傾向スコア分析の使い⽅ 〜観察研究における治療効果研究〜Yasuyuki Okumura
 
pymcとpystanでベイズ推定してみた話
pymcとpystanでベイズ推定してみた話pymcとpystanでベイズ推定してみた話
pymcとpystanでベイズ推定してみた話Classi.corp
 
MCMCサンプルの使い方 ~見る・決める・探す・発生させる~
MCMCサンプルの使い方 ~見る・決める・探す・発生させる~MCMCサンプルの使い方 ~見る・決める・探す・発生させる~
MCMCサンプルの使い方 ~見る・決める・探す・発生させる~. .
 

What's hot (20)

ベイズファクターとモデル選択
ベイズファクターとモデル選択ベイズファクターとモデル選択
ベイズファクターとモデル選択
 
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
 
(実験心理学徒だけど)一般化線形混合モデルを使ってみた
(実験心理学徒だけど)一般化線形混合モデルを使ってみた(実験心理学徒だけど)一般化線形混合モデルを使ってみた
(実験心理学徒だけど)一般化線形混合モデルを使ってみた
 
階層モデルの分散パラメータの事前分布について
階層モデルの分散パラメータの事前分布について階層モデルの分散パラメータの事前分布について
階層モデルの分散パラメータの事前分布について
 
星野「調査観察データの統計科学」第3章
星野「調査観察データの統計科学」第3章星野「調査観察データの統計科学」第3章
星野「調査観察データの統計科学」第3章
 
Stanの便利な事後処理関数
Stanの便利な事後処理関数Stanの便利な事後処理関数
Stanの便利な事後処理関数
 
心理学者のためのGlmm・階層ベイズ
心理学者のためのGlmm・階層ベイズ心理学者のためのGlmm・階層ベイズ
心理学者のためのGlmm・階層ベイズ
 
階層ベイズとWAIC
階層ベイズとWAIC階層ベイズとWAIC
階層ベイズとWAIC
 
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ
Rで因子分析 商用ソフトで実行できない因子分析のあれこれRで因子分析 商用ソフトで実行できない因子分析のあれこれ
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ
 
『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会
 
R Study Tokyo03
R Study Tokyo03R Study Tokyo03
R Study Tokyo03
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介
 
負の二項分布について
負の二項分布について負の二項分布について
負の二項分布について
 
ノンパラベイズ入門の入門
ノンパラベイズ入門の入門ノンパラベイズ入門の入門
ノンパラベイズ入門の入門
 
マルチレベルモデル講習会 理論編
マルチレベルモデル講習会 理論編マルチレベルモデル講習会 理論編
マルチレベルモデル講習会 理論編
 
星野「調査観察データの統計科学」第1&2章
星野「調査観察データの統計科学」第1&2章星野「調査観察データの統計科学」第1&2章
星野「調査観察データの統計科学」第1&2章
 
臨床疫学研究における傾向スコア分析の使い⽅ 〜観察研究における治療効果研究〜
臨床疫学研究における傾向スコア分析の使い⽅ 〜観察研究における治療効果研究〜臨床疫学研究における傾向スコア分析の使い⽅ 〜観察研究における治療効果研究〜
臨床疫学研究における傾向スコア分析の使い⽅ 〜観察研究における治療効果研究〜
 
pymcとpystanでベイズ推定してみた話
pymcとpystanでベイズ推定してみた話pymcとpystanでベイズ推定してみた話
pymcとpystanでベイズ推定してみた話
 
MCMCサンプルの使い方 ~見る・決める・探す・発生させる~
MCMCサンプルの使い方 ~見る・決める・探す・発生させる~MCMCサンプルの使い方 ~見る・決める・探す・発生させる~
MCMCサンプルの使い方 ~見る・決める・探す・発生させる~
 
潜在クラス分析
潜在クラス分析潜在クラス分析
潜在クラス分析
 

Similar to Rで架空データの発生

StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章Shushi Namba
 
推定と標本抽出
推定と標本抽出推定と標本抽出
推定と標本抽出山津 貴之
 
理科教育学研究のための統計分析入門
理科教育学研究のための統計分析入門理科教育学研究のための統計分析入門
理科教育学研究のための統計分析入門Hiroshi Unzai
 
データ入力が終わってから分析前にすること
データ入力が終わってから分析前にすることデータ入力が終わってから分析前にすること
データ入力が終わってから分析前にすることMasaru Tokuoka
 
(道具としての)データサイエンティストのつかい方
(道具としての)データサイエンティストのつかい方(道具としての)データサイエンティストのつかい方
(道具としての)データサイエンティストのつかい方Shohei Hido
 
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)Hiroshi Shimizu
 
機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual Talks機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual TalksYuya Unno
 
Rm20140507 4key
Rm20140507 4keyRm20140507 4key
Rm20140507 4keyyouwatari
 
第76回TokyoR
第76回TokyoR第76回TokyoR
第76回TokyoRShoKato2
 
Tokyo r #37 Rubin's Rule
Tokyo r #37 Rubin's RuleTokyo r #37 Rubin's Rule
Tokyo r #37 Rubin's RuleHiroki Matsui
 
データ解析のための統計モデリング入門3章後半
データ解析のための統計モデリング入門3章後半データ解析のための統計モデリング入門3章後半
データ解析のための統計モデリング入門3章後半Shinya Akiba
 
データを整理するための基礎知識
データを整理するための基礎知識データを整理するための基礎知識
データを整理するための基礎知識Gen Fujita
 
dplyr と purrrを用いたデータハンドリング
dplyr と purrrを用いたデータハンドリングdplyr と purrrを用いたデータハンドリング
dplyr と purrrを用いたデータハンドリングSomatori Keita
 
分析をモデルの観点から考えてみる
分析をモデルの観点から考えてみる分析をモデルの観点から考えてみる
分析をモデルの観点から考えてみるkazutantan
 
How to study stat for freshmans
How to study stat for freshmansHow to study stat for freshmans
How to study stat for freshmansAk Ok
 
Yamadai.R チュートリアルセッション
Yamadai.R チュートリアルセッションYamadai.R チュートリアルセッション
Yamadai.R チュートリアルセッション考司 小杉
 
統計の基礎を楽しく学ぼうー箱ひげ図編ー
統計の基礎を楽しく学ぼうー箱ひげ図編ー統計の基礎を楽しく学ぼうー箱ひげ図編ー
統計の基礎を楽しく学ぼうー箱ひげ図編ーYutaka Terasawa
 

Similar to Rで架空データの発生 (20)

StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
 
推定と標本抽出
推定と標本抽出推定と標本抽出
推定と標本抽出
 
理科教育学研究のための統計分析入門
理科教育学研究のための統計分析入門理科教育学研究のための統計分析入門
理科教育学研究のための統計分析入門
 
データ入力が終わってから分析前にすること
データ入力が終わってから分析前にすることデータ入力が終わってから分析前にすること
データ入力が終わってから分析前にすること
 
Regression2
Regression2Regression2
Regression2
 
(道具としての)データサイエンティストのつかい方
(道具としての)データサイエンティストのつかい方(道具としての)データサイエンティストのつかい方
(道具としての)データサイエンティストのつかい方
 
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
 
コース導入講義(荒木)
コース導入講義(荒木)コース導入講義(荒木)
コース導入講義(荒木)
 
Toukei4
Toukei4Toukei4
Toukei4
 
機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual Talks機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual Talks
 
Rm20140507 4key
Rm20140507 4keyRm20140507 4key
Rm20140507 4key
 
第76回TokyoR
第76回TokyoR第76回TokyoR
第76回TokyoR
 
Tokyo r #37 Rubin's Rule
Tokyo r #37 Rubin's RuleTokyo r #37 Rubin's Rule
Tokyo r #37 Rubin's Rule
 
データ解析のための統計モデリング入門3章後半
データ解析のための統計モデリング入門3章後半データ解析のための統計モデリング入門3章後半
データ解析のための統計モデリング入門3章後半
 
データを整理するための基礎知識
データを整理するための基礎知識データを整理するための基礎知識
データを整理するための基礎知識
 
dplyr と purrrを用いたデータハンドリング
dplyr と purrrを用いたデータハンドリングdplyr と purrrを用いたデータハンドリング
dplyr と purrrを用いたデータハンドリング
 
分析をモデルの観点から考えてみる
分析をモデルの観点から考えてみる分析をモデルの観点から考えてみる
分析をモデルの観点から考えてみる
 
How to study stat for freshmans
How to study stat for freshmansHow to study stat for freshmans
How to study stat for freshmans
 
Yamadai.R チュートリアルセッション
Yamadai.R チュートリアルセッションYamadai.R チュートリアルセッション
Yamadai.R チュートリアルセッション
 
統計の基礎を楽しく学ぼうー箱ひげ図編ー
統計の基礎を楽しく学ぼうー箱ひげ図編ー統計の基礎を楽しく学ぼうー箱ひげ図編ー
統計の基礎を楽しく学ぼうー箱ひげ図編ー
 

More from Makoto Hirakawa

今日は何回やればいいのか―状態空間モデルで最大挙上重量を推定し、挙上回数を決める―
今日は何回やればいいのか―状態空間モデルで最大挙上重量を推定し、挙上回数を決める―今日は何回やればいいのか―状態空間モデルで最大挙上重量を推定し、挙上回数を決める―
今日は何回やればいいのか―状態空間モデルで最大挙上重量を推定し、挙上回数を決める―Makoto Hirakawa
 
いいからベイズ推定してみる
いいからベイズ推定してみるいいからベイズ推定してみる
いいからベイズ推定してみるMakoto Hirakawa
 
重回帰分析で交互作用効果
重回帰分析で交互作用効果重回帰分析で交互作用効果
重回帰分析で交互作用効果Makoto Hirakawa
 
重回帰分析で交互作用効果
重回帰分析で交互作用効果重回帰分析で交互作用効果
重回帰分析で交互作用効果Makoto Hirakawa
 

More from Makoto Hirakawa (6)

今日は何回やればいいのか―状態空間モデルで最大挙上重量を推定し、挙上回数を決める―
今日は何回やればいいのか―状態空間モデルで最大挙上重量を推定し、挙上回数を決める―今日は何回やればいいのか―状態空間モデルで最大挙上重量を推定し、挙上回数を決める―
今日は何回やればいいのか―状態空間モデルで最大挙上重量を推定し、挙上回数を決める―
 
Osaka.stan#2 chap5-1
Osaka.stan#2 chap5-1Osaka.stan#2 chap5-1
Osaka.stan#2 chap5-1
 
いいからベイズ推定してみる
いいからベイズ推定してみるいいからベイズ推定してみる
いいからベイズ推定してみる
 
ベータ分布
ベータ分布ベータ分布
ベータ分布
 
重回帰分析で交互作用効果
重回帰分析で交互作用効果重回帰分析で交互作用効果
重回帰分析で交互作用効果
 
重回帰分析で交互作用効果
重回帰分析で交互作用効果重回帰分析で交互作用効果
重回帰分析で交互作用効果
 

Rで架空データの発生