120813統計学勉強会
- 2. 抽出のランダム化
• 標本(試料)
– 標本は母集団を代表しなければならない
– 偏りのない抽出法:無作為(ランダム)抽出
標本
母集団
標本は母集団を代表するように
サンプリングする
2
- 3. 割り付けのランダム化
場所で分けるやり方
A B • 日当たり、地力、
B
A
A B 水はけなどの影
A
B 響が交絡し、区
B B
A
A 別できない
木をランダムに選ぶやり方
A
B B
B • 処理の影響以外
A
B
A を誤差として扱
A
B B える
A
A
3
- 5. 位置のランダム化
低
• チャンバーの中の温 高
度は場所によって違 高
うので、上下、左右、
前後をランダムに配
置する。 低
※たとえばの話です
5
- 7. 乱数の作り方
• 乱数表を使う
→ Amazonに乱数表売ってません><
• サイコロを使う
→普通のサイコロは出目が偏ります><
• パソコンを使う
– Excelの場合
RAND関数:0以上1未満の乱数を発生させる
7
- 8. 乱数の作り方(Excel)
• RAND関数を使った乱数の作り方
– 0以上1未満で良い
• =RAND()
– 1~100までの範囲の整数でほしい
• =INT(RAND()*100 + 1)
• =RANDBETWEEN(1, 100)
(※RANDBETWEENには分析ツールアドイン必要)
– 1~100までの数字をランダムに並べたい
• RAND関数で乱数を100個作った後でRANK関数
8
- 9. 乱数の作り方(R)
• runif(発生させる乱数の個数)
– 0以上1未満の乱数を発生(一様乱数)
– 上限、下限の指定可能
• sample(ベクトル, 抽出数)
– 指定のベクトルからランダムにサンプリング
– 重複有りなし指定可能
• その他、正規分布など各種確率分布に
従った乱数生成も可能
9
- 10. ExcelとRの違い
• Excel(2003, 2007)
– Wichmann-Hill法
• 周期が6.9536×1012でやや短く、あまり推奨されない
• 参考 http://oku.edu.mie-u.ac.jp/~okumura/blog/node/2287
• まだOpenOffice Calcのがマシ
• R
– Mersennne-Twister法
• 周期が219937-1(=4.315×106001)で生成も高速
• 現状でこの手法を使わない理由は特にない
結論 論文書く時の統計処理にはExcelを使わない!
10