First part shows several methods to sample points from arbitrary distributions. Second part shows application to population genetics to infer population size and divergence time using obtained sequence data.
The document discusses the t distribution and F distribution. It provides graphs of their probability density functions and examples of simulating random values from each distribution. It also shows how to calculate a t-statistic and F-ratio from sample data and compares the results to the theoretical distributions.
15. 二項分布 (Binomial distribution)
• 1 回の試行 ( 実験 ) で A という事象が起きるか、
起
きないか
• A という事象が起きる確率が p 、
起きない確率が q=1-p
• この試行をn回行ったとき、 A が起きる回数を
X とする。
• X の分布を二項分布といい、
X ~ Bi(n, p)
と表す。
16. 二項分布 その2
• X の取り得る値 n回中の回数なので
0, 1, 2, …, n
• Pr(X=k) = A がn回中k回起きる確率
= nCk pk(1-p)n-k
• 分布関数
[ x]
F ( x) = Pr( X ≤ x) = ∑ pk
k =0
[ x]
∑ n C x p k (1 − p ) n − k
=
k =0
17. 二項分布 その3
pk = Pr( X = k )
• 二項分布 Bi(10,1/6)
Ck p k (1 − p ) n − k
=n
さいころを 10 回振っ
て、 1 の目が出る回数 1 1
Ck ( ) k (1 − )10− k
=10
X の分布 6 6
1.0
p3 = Pr( X = 3)
0.8
1 3 1 10−3
C3 ( ) (1 − )
=10
0.6
6 6
cdf
0.4
10 × 9 × 8 1 3 5 7
= ( ) ( )
0.2
3 × 2 ×1 6 6
0.0
0 2 4 6 8 10 0.1550454
=
x
22. 22
circ <- function(x)
sqrt(1 - x^2)
1.0
curve(circ, 0, 1)
lines(c(1, 0), c(0, 0))
lines(c(0, 0), c(1, 0))
0.8
> sim.pi(1000)
0.6
Type <Return> to start simulation :
y
788 of 1000 in the circle. 0.4
0.2
0.0
0.0 0.2 0.4 0.6 0.8 1.0
x
23. 条件付確率 (conditional prob.)
• 事象 A が起きたという条件の下で
事象 B が起きる確率を考える
• 例 女性で身長が170cm以上
B
Pr( A ∩ B )
Pr( B | A) =
Pr( A) A
Pr(身長 ≥ 170.0 かつ 女性)
Pr(身長 ≥ 170.0 | 女性) =
Pr(女性)
0.03976
= = 0.0082
0.485
24. 独立事象
• 条件付確率が条件に無関係のとき
2 つの事象は独立という
Pr( B | A) = Pr( B )
Pr( A ∩ B )
Pr( B | A) = = Pr( B )
Pr( A)
Pr( A ∩ B ) = Pr( A) Pr( B )
25. 条件付分布
• X=x という条件の下での Y の分布
G ( y | x) = Pr(Y < y | X = x)
Pr(Y < y and X = x)
=
Pr( X = x)
h ( x, y )
g ( y | x) =
f ( x)
h( x, y ) = f ( x ) g ( y | x )
g ( y ) f ( x | y )
=
26. 独立性
• 2 つの確率変数 X, Y が独立
分布関数
H ( x, y ) = Pr( X < x, Y < y )
Pr( X < x) Pr(Y < y )
=
F ( x)G ( y )
=
密度関数
h ( x, y ) = f ( x ) g ( y )
27. 期待値 (Expectation)
• データの平均(代表値、どんな値)
data : x1 , x2 , , xn
x1 + x2 + + xn
mean : x =
n
• 確率変数(分布)の期待値(どんな値)
取り得る値 : a1 , a2 , , ak
各値の確率 : p1 , p2 , , pk
平均 : E ( X ) = a1 p1 + a2 p2 + + ak pk
28. 確率分布 度数分布表
値 確率 階級 階級値 相対度数
a1 p1 a0~a1 m1 f1
a2 p2 a1~a2 m2 f2
ak pk ak-1~ak mk fk
合計 1.00 合計 1.00
E ( X ) = a1 p1 + a2 p2 + + ak pk
x = m1 f1 + m2 f 2 + + mk f k
29. 期待値と分散
X 確率変数
f ( x) Xの密度関数
離散型の場合は
Xの期待値(平均) 積分の代わりに
∞ 和 (Σ) を使う
E ( X ) = ∫ x f ( x)dx
−∞
∞
E (φ ( X )) = ∫ φ ( x) f ( x)dx
−∞
Xの分散
V ( X ) = E ( X − E ( X )) 2 φ ( x) = {x − E ( X )}2
∞
∫ {x − E ( X )}2 f ( x)dx
=
−∞
E ( X 2 ) − {E ( X )}2
=
30. 主な分布の期待と分散
X ~ Bi (n, p )
E ( X ) = np, V ( X ) = npq
X ~ Po(λ )
E ( X ) = λ , V ( X ) = λ
X ~ U ( a, b)
E ( X ) = (a + b) / 2, V ( X ) = (b − a ) / 12
2
X ~ N (µ ,σ ) 2
E ( X ) = µ , V ( X ) = σ 2