SlideShare a Scribd company logo
Introduction 確率 確率変数 次回予告
第 1 回 確率・統計の基礎勉強会
Hiroaki Tanaka
Augmented Human Communication Laboratory, Department of Information
Schience, Nara Institute of Science and Technology
November 8, 2016
1 / 42
Introduction 確率 確率変数 次回予告
1 Introduction
2 確率
3 確率変数
4 次回予告
2 / 42
Introduction 確率 確率変数 次回予告
はじめに
• スライドやその他の資料は
https://setten-qb.amebaownd.com/ においてあります
• Twitter: @setten QB
3 / 42
Introduction 確率 確率変数 次回予告
確率論と統計学
• 確率論は演繹的
• 統計学は帰納的
• 確率論の方が抽象的な議論をする事が多い
4 / 42
Introduction 確率 確率変数 次回予告
数理統計学の基礎内容
確率空間 全空間の測度が 1 となるような測度空間
確率変数・確率分布 PRML の 2・3 章で出てくる
確率分布の特性値 PRML の 2・3 章で出てくる
近似法則 n → ∞, d :fix の場合が基本的
統計的推測 使うだけなら難しくない
統計的検定 使うだけなら難しくない
6 / 42
Introduction 確率 確率変数 次回予告
この勉強会の到達目標
• 統計学の基礎を理解する
• PRML2・3 章の数式をだいたい追えるようにする
• 余裕とニーズがあれば,学習理論までやっても良いかも
7 / 42
Introduction 確率 確率変数 次回予告
この勉強会で扱う内容
確率空間 第 1 回
確率変数・確率分布 第 1 回
確率分布の特性値 第 2 回
近似法則 第 2 回
統計的推定 第 3 回
統計的検定 第 4 回
多変量分布を扱うために必要な線形代数 第 5 回?
8 / 42
Introduction 確率 確率変数 次回予告
1 Introduction
2 確率
3 確率変数
4 次回予告
9 / 42
Introduction 確率 確率変数 次回予告
基本事象と標本空間
• 未知な現象を理解するための実験や調査を試行と呼び,試行の
結果を基本事象と呼ぶ
• 得られるであろう結果(基本事象)全体を抽象的に標本空間と
呼ぶ
Example
サイコロを 1 回投げるという試行を考える.このとき,標本
空間は { 1 の目が出る, . . . , 2 の目が出る } になる.
10 / 42
Introduction 確率 確率変数 次回予告
σ 集合族
• 以下,標本空間を Ω で表す
• 確率は,Ω 上の特別な条件を満たす部分集合族上で定義される
σ-algebra
Ω の部分集合族 B が以下の条件を満たす時,B を Ω 上の σ
集合族という:
Ω ∈ B;
A ∈ B =⇒ Ac
∈ B;
A1, . . . , An, · · · ∈ B =⇒
∞∪
i=1
Ai ∈ B.
• 確率論では σ 集合族の要素を事象という
• Ω を全事象という
11 / 42
Introduction 確率 確率変数 次回予告
σ 集合族
• σ 集合族が満たす性質はたくさんあるが,詳細は略
• σ 集合族上で,確率は定義される
• Ω と B の対を (Ω, B) と書いて,可測空間 (measurable space)
と呼ぶ
12 / 42
Introduction 確率 確率変数 次回予告
確率測度
Probabilitstic Measure
B 上の実数値関数 P が
0 ≤ P(A) ≤ 1, ∀A ∈ B,
P(Ω) = 1,
Ai ∈ B(i = 1, . . . ), Ai ∩ Aj = ∅(i ̸= j) =⇒ P
( ∞∪
i=1
Ai
)
=
∞∑
i=1
P(Ai)
を満たすとき,P を (Ω, B) 上の確率測度 (probabilistic
measure) といい,P(A) を事象 A の確率という.
• Ω, B, P の 3 つ組 (Ω, B, P) を確率空間という.
13 / 42
Introduction 確率 確率変数 次回予告
確率測度
• こうやって確率を定義することにより,皆が知っているような
確率の性質 P(∅) = 0 や P(A) + P(Ac) = 1, for A ∈ B が成り
立つ
• その他にもたくさんの重要な性質があるが,詳細は略
14 / 42
Introduction 確率 確率変数 次回予告
15 / 42
Introduction 確率 確率変数 次回予告
そもそも測度って何?
• 集合の大きさを測る尺度 → 測度
• P(A1) で A1 の大きさを表す → 確率
• 確率空間を明らかにしていないと困ることがある
• どういう集合上に確率を入れるの? → σ 集合族
測度
R から実数 a, b を選び,区間 I = [a, b], a, b ∈ [0, 1] を構成
する.区間 I の “大きさ” について考える.
a b x
M
16 / 42
Introduction 確率 確率変数 次回予告
そもそも測度って何?
• 集合の大きさを測る尺度 → 測度
• P(A1) で A1 の大きさを表す → 確率
• 確率空間を明らかにしていないと困ることがある
• どういう集合上に確率を入れるの? → σ 集合族
測度
R から実数 a, b を選び,区間 I = [a, b], a, b ∈ [0, 1] を構成
する.区間 I の “大きさ” について考える.
a b x
M
ルベーグ測度 L([a, b])
b − a
16 / 42
Introduction 確率 確率変数 次回予告
条件付き確率
• 条件付き確率も測度空間 (Ω, B) 上で定義される
Conditional Probability
C ∈ B, P(C) > 0 のとき,
P(A|C) =
P(A ∩ C)
P(C)
, A ∈ B
を事象 C が与えられたときの A ∈ B の条件付き確率とい,
P( · |C) を C が与えられたときの条件付き確率測度という.
• 上記のように条件付き確率を定義すると,P( · |C) は (Ω, B)
上の確率測度になっている
17 / 42
Introduction 確率 確率変数 次回予告
条件付き確率
• よく使う全確率の公式
全確率の公式
∞∪
i=1
Ai = Ω, Ai ∩ Aj = ∅, P(Ai) > 0 とする.このとき,
A ∈ B について
P(A) =
∞∑
i=1
P(Ai)P(A|Ai)
が成り立つ.
18 / 42
Introduction 確率 確率変数 次回予告
1 Introduction
2 確率
3 確率変数
4 次回予告
19 / 42
Introduction 確率 確率変数 次回予告
ボレル集合族
• 確率空間 (Ω, B, P) を実数空間へ結びつけるもの
• 実数空間では,(Ω, B) が (R, B) に対応する
Borel algebra
全ての半開区間 (a, b] を含む最小の σ 集合族 B を R 上のボ
レル集合族という.
• B は (a, b] 以外にも様々な区間を含む
• { a } , (a, b), [a, b], [a, b), (a, ∞), (−∞, a] は全てボレル集合
20 / 42
Introduction 確率 確率変数 次回予告
確率変数
• 確率変数の厳密な定義をする
• 確率変数が,抽象的な確率空間と実数の確率空間を対応付ける
確率変数
X : Ω → R が (Ω, B) 上の確率変数
def
⇐⇒∀B ∈ B, { ω | X(ω) ∈ B } = X−1
(B) ∈ B.
• X を確率変数とするとき,多項式,log |X|, eX, sin X などは
全て確率変数となる
21 / 42
Introduction 確率 確率変数 次回予告
確率変数
𝐵1 ∈
𝐵2 ∈
𝑋−1(𝐵1)
𝑋−1(𝐵2)
Measurable function 𝑋
Measurable function 𝑋
Figure: 確率変数のイメージ
• どのような B ∈ B を選んでも,X−1(B) ∈ B 可測関数 X
22 / 42
Introduction 確率 確率変数 次回予告
分布関数
• (Ω, B) の実数空間版として (R, B) が導入された
• 残りの確率測度 P に対応するものとして,分布関数 F を導入
する
Distribution Function
F : R → R が
∀x ∈ R, F(x) = P(X ≤ x) = P ({ ω | X(ω) ≤ x })
によって F を定義するとき,F を X の累積分布関数 (cumu-
lative distribution function; cdf) という.
• P(X ≤ x) を X ≤ x となる確率と読み替える事ができる
23 / 42
Introduction 確率 確率変数 次回予告
分布関数による確率計算
確率計算
確率変数 X に対し,
P(a ≤ X ≤ b) = P
(
X−1
((a, b])
)
= FX(b) − FX(a)
24 / 42
Introduction 確率 確率変数 次回予告
ここまでのまとめ
• 確率は可測空間上で定義される実数値関数
• 確率変数 X が,確率空間と実数空間をつなぐ
• 確率変数は実は変数ではなく可測関数
• 実数空間では確率変数は変数のように扱っても差し支えない
25 / 42
Introduction 確率 確率変数 次回予告
確率変数のタイプ
Random Variable
Discrete type
X : (Ω, B, P) 上の r.v. とする.
X が D (Discrete) -type
def
⇐⇒∃E ⊂ R (高々加算な集合) s.t. P(X ∈ E) = 1
Continuous type
FX:X の分布関数とする.
X が C (Continuous) -type
def
⇐⇒∃fX : R → R+
(可測関数) s.t. FX (x) =
∫ x
−∞
fX (u) du, ∀x ∈ R
26 / 42
Introduction 確率 確率変数 次回予告
確率変数のタイプ
• 簡単に言うと . . .
D-type 取りうる値が離散値 (E ⊂ N, Z, Q)
C-type 取りうる値が連続値 (E ⊂ R)
27 / 42
Introduction 確率 確率変数 次回予告
離散型確率変数
• X の取りうる値が離散値のときは D-type
• E = { x1, . . . , xn, . . . } , p(xi) = P(X = xi) とすると,
∞∑
i=1
p(xi) = 1, F(x) =
∑
xi ≤ xp(xi)
が成り立つ.この p(·) のことを X の確率質量関数 (p.m.f.) と
呼ぶ
28 / 42
Introduction 確率 確率変数 次回予告
離散型確率変数とその分布の例
2 項分布 B(n, p)
• 0 ≤ p ≤ 1, i = 1, . . . , n
p(xi) = P(X = i) =
(
n
i
)
pi
(1 − p)n−i
• E = { 1, . . . , n } とすると,P(X ∈ E) = 1 が成り立つ
• 「表が出る確率 p のコインを n 回投げて,表が i 回でる確率を
表す」というフレーズで覚えれば良い
• n = 1 の場合,特にベルヌーイ分布と呼ばれる
29 / 42
Introduction 確率 確率変数 次回予告
離散型確率変数とその分布の例
ポアソン分布 Po(λ)
p(k) = P(X = k) =
λk
k!
exp(−λ)
• E = { 0, 1, . . . , } とすると P(X ∈ E) = 1 が成り立つ
• 稀に起こる事象の観測モデルなどによく使われる
30 / 42
Introduction 確率 確率変数 次回予告
連続型確率変数
• C-type r.v. の定義に出てくる fX を,X の確率密度関数
(p.d.f.) という
• fX(x) ≥ 0,
∫ ∞
−∞
f(u) du = 1,
d
dx
FX(x) = f(x) が成り
立つ
• 実際に確率計算をするときは,
P(a < x ≤ b) =F(b) − F(a)
=
∫ b
−∞
f(u) du −
∫ a
−∞
f(u) du
=
∫ b
a
f(u) du
とする
31 / 42
Introduction 確率 確率変数 次回予告
連続型確率変数とその分布
連続型確率変数の分布
一様分布 U(a, b)
fX(x) =



1
b − a
, x ∈ (a, b)
0, otherwise
正規分布 N
(
µ, σ2
)
fX (x) =
1
√
2πσ2
exp
[
−
(x − µ)2
2σ2
]
, −∞ < µ < ∞, σ > 0
32 / 42
Introduction 確率 確率変数 次回予告
正規分布
• 超重要
• c.d.f. が初等関数で陽に書けない
• X ∼ N
(
µ, σ2
)
のとき,Y = (x − µ)/σ ∼ N (0, 1)
• X ∼ N (0, 1) のとき,P(X ≥ 1.282) ≒ 0.10, P(X ≥
1.645) ≒ 0.05, P(X ≥ 2.326) ≒ 0.01 あたりは推定・検定で
頻出
33 / 42
Introduction 確率 確率変数 次回予告
確率変数の変換
Y = aX + b の分布
a, b ∈ R を用いて,C-type 確率変数 X の変換 Y = aX + b
を考える.このとき,Y の p.d.f. を求めよ.
FY (y) = P(Y ≤ y) = P(aX+b ≤ y) =



P
(
X ≤
y − b
a
)
, a ≥ 0
P
(
X >
y − b
a
)
, a < 0
であるから,
FY (y) =



FX
(
y − b
a
)
, a ≥ 0
1 − FX
(
y − b
a
)
, a < 0
34 / 42
Introduction 確率 確率変数 次回予告
確率変数の変換
したがって,
fY (y) =
d
dy
FY (y)
=



1
a
fX
(
y − b
a
)
, a ≥ 0
−
1
a
fX
(
y − b
a
)
, a < 0
=
1
|a|
fX
(
y − b
a
)
.
35 / 42
Introduction 確率 確率変数 次回予告
多次元分布
• これまでは 1 つの確率変数だけを考えていたが,これを多次元
確率変数ベクトルに拡張する
• X1, . . . , Xn を (Ω, B, P) 上の確率変数として,確率変数ベク
トル X = [X1, . . . , Xn] で定義する
• n 次元ボレル集合族も Bn =
∏n
i=1(ai, bi] で定義される
• PRML を読む上では,「確率変数がベクトルになった」という
程度の理解で問題ない (多分)
• 多次元分布も,1 次元の場合と同様に離散型と連続型に分けら
れる
36 / 42
Introduction 確率 確率変数 次回予告
同時累積分布関数
Joint Cumulative Distribution Function
X = [X1, . . . , Xn]:確率変数ベクトルとして,X の同時累
積分布関数 (j.c.d.f.) を
FX(x1, . . . , xn) = P (X1 ≤ x1, . . . , Xn ≤ xn)
で定義する.また,X の部分確率ベクトルの分布関数を周辺
分布関数 (m.d.f.) という.
37 / 42
Introduction 確率 確率変数 次回予告
多次元分布の計算
• C-type での j.c.d.f. の求め方を見ておく
• X := [X1, . . . , Xn]
• fX:X の j.p.d.f.
FX(x1, . . . , xn)
=
∫ xn
−∞
∫ xn−1
−∞
· · ·
∫ x1
−∞
fX(u1, . . . , un) du1du2 . . . dun,
fX(x1, . . . , xn) =
∂n
∂x1 · · · ∂xn
FX(x1, . . . , xn)
38 / 42
Introduction 確率 確率変数 次回予告
2 次元正規分布
2 次元正規分布
[X, Y ] の j.p.d.f. が
fXY (x, y) =
1
√
|det(2πΣ)|
exp
[
−
1
2
(z − µ)
′
Σ−1
(z − µ)
]
のとき,[X, Y ] は 2 次元正規分布に従うといい,[X, Y ] ∼
N (µ, Σ) で表す.ここで,−∞ < µX, µY < ∞, σX, σY >
0, |ρ| < 1 であり,
z =
[
x
y
]
, µ =
[
µX
µY
]
, Σ =
[
σ2
X ρσXσY
ρσXσY ρ2
Y
]
である.
• fX(x) =
∫
R
fXY (x, y) dy =
1
√
2πσX
exp
[
−
(x − µX)2
2σ2
X
]
39 / 42
Introduction 確率 確率変数 次回予告
1 Introduction
2 確率
3 確率変数
4 次回予告
40 / 42
Introduction 確率 確率変数 次回予告
次回予告
• 確率変数の独立性
• 確率分布の特性値 (期待値・共分散・相関係数・積率母関数)
• 近似法則
41 / 42
Introduction 確率 確率変数 次回予告
Reference
• 赤平昌文, 統計解析入門, 森北出版株式会社, 2007
• 内藤貫太, 数理統計学 II 講義ノート, 2014
42 / 42

More Related Content

What's hot

A summary on “On choosing and bounding probability metrics”
A summary on “On choosing and bounding probability metrics”A summary on “On choosing and bounding probability metrics”
A summary on “On choosing and bounding probability metrics”
Kota Matsui
 
「統計的学習理論」第1章
「統計的学習理論」第1章「統計的学習理論」第1章
「統計的学習理論」第1章
Kota Matsui
 
050 確率と確率分布
050 確率と確率分布050 確率と確率分布
050 確率と確率分布t2tarumi
 
Cvim chapter4-5-ken_hide
Cvim chapter4-5-ken_hideCvim chapter4-5-ken_hide
Cvim chapter4-5-ken_hide
kenhide
 
K040 確率分布とchi2分布
K040 確率分布とchi2分布K040 確率分布とchi2分布
K040 確率分布とchi2分布t2tarumi
 
幾何を使った統計のはなし
幾何を使った統計のはなし幾何を使った統計のはなし
幾何を使った統計のはなし
Toru Imai
 
Shunsuke Horii
Shunsuke HoriiShunsuke Horii
Shunsuke Horii
Suurist
 
20170422 数学カフェ Part1
20170422 数学カフェ Part120170422 数学カフェ Part1
20170422 数学カフェ Part1
Kenta Oono
 
2016年度秋学期 画像情報処理 第3回 フーリエ変換とサンプリング定理 (2016. 10. 13)
2016年度秋学期 画像情報処理 第3回 フーリエ変換とサンプリング定理 (2016. 10. 13)2016年度秋学期 画像情報処理 第3回 フーリエ変換とサンプリング定理 (2016. 10. 13)
2016年度秋学期 画像情報処理 第3回 フーリエ変換とサンプリング定理 (2016. 10. 13)
Akira Asano
 
詳説word2vec
詳説word2vec詳説word2vec
詳説word2vec
Haruka Oikawa
 
2013年度春学期 画像情報処理 第4回「離散フーリエ変換」
2013年度春学期 画像情報処理 第4回「離散フーリエ変換」2013年度春学期 画像情報処理 第4回「離散フーリエ変換」
2013年度春学期 画像情報処理 第4回「離散フーリエ変換」
Akira Asano
 
【論文紹介】Distributed Representations of Sentences and Documents
【論文紹介】Distributed Representations of Sentences and Documents【論文紹介】Distributed Representations of Sentences and Documents
【論文紹介】Distributed Representations of Sentences and Documents
Tomofumi Yoshida
 
2015年度春学期 画像情報処理 第12回 画像フィルタとフィルタ定理
2015年度春学期 画像情報処理 第12回 画像フィルタとフィルタ定理2015年度春学期 画像情報処理 第12回 画像フィルタとフィルタ定理
2015年度春学期 画像情報処理 第12回 画像フィルタとフィルタ定理
Akira Asano
 
指数分布とポアソン分布のいけない関係
指数分布とポアソン分布のいけない関係指数分布とポアソン分布のいけない関係
指数分布とポアソン分布のいけない関係
Nagi Teramo
 
Rで学ぶ逆変換(逆関数)法
Rで学ぶ逆変換(逆関数)法Rで学ぶ逆変換(逆関数)法
Rで学ぶ逆変換(逆関数)法
Nagi Teramo
 
社内勉強会-ナイーブベイジアンフィルタの実装
社内勉強会-ナイーブベイジアンフィルタの実装社内勉強会-ナイーブベイジアンフィルタの実装
社内勉強会-ナイーブベイジアンフィルタの実装
Kenta Onishi
 

What's hot (16)

A summary on “On choosing and bounding probability metrics”
A summary on “On choosing and bounding probability metrics”A summary on “On choosing and bounding probability metrics”
A summary on “On choosing and bounding probability metrics”
 
「統計的学習理論」第1章
「統計的学習理論」第1章「統計的学習理論」第1章
「統計的学習理論」第1章
 
050 確率と確率分布
050 確率と確率分布050 確率と確率分布
050 確率と確率分布
 
Cvim chapter4-5-ken_hide
Cvim chapter4-5-ken_hideCvim chapter4-5-ken_hide
Cvim chapter4-5-ken_hide
 
K040 確率分布とchi2分布
K040 確率分布とchi2分布K040 確率分布とchi2分布
K040 確率分布とchi2分布
 
幾何を使った統計のはなし
幾何を使った統計のはなし幾何を使った統計のはなし
幾何を使った統計のはなし
 
Shunsuke Horii
Shunsuke HoriiShunsuke Horii
Shunsuke Horii
 
20170422 数学カフェ Part1
20170422 数学カフェ Part120170422 数学カフェ Part1
20170422 数学カフェ Part1
 
2016年度秋学期 画像情報処理 第3回 フーリエ変換とサンプリング定理 (2016. 10. 13)
2016年度秋学期 画像情報処理 第3回 フーリエ変換とサンプリング定理 (2016. 10. 13)2016年度秋学期 画像情報処理 第3回 フーリエ変換とサンプリング定理 (2016. 10. 13)
2016年度秋学期 画像情報処理 第3回 フーリエ変換とサンプリング定理 (2016. 10. 13)
 
詳説word2vec
詳説word2vec詳説word2vec
詳説word2vec
 
2013年度春学期 画像情報処理 第4回「離散フーリエ変換」
2013年度春学期 画像情報処理 第4回「離散フーリエ変換」2013年度春学期 画像情報処理 第4回「離散フーリエ変換」
2013年度春学期 画像情報処理 第4回「離散フーリエ変換」
 
【論文紹介】Distributed Representations of Sentences and Documents
【論文紹介】Distributed Representations of Sentences and Documents【論文紹介】Distributed Representations of Sentences and Documents
【論文紹介】Distributed Representations of Sentences and Documents
 
2015年度春学期 画像情報処理 第12回 画像フィルタとフィルタ定理
2015年度春学期 画像情報処理 第12回 画像フィルタとフィルタ定理2015年度春学期 画像情報処理 第12回 画像フィルタとフィルタ定理
2015年度春学期 画像情報処理 第12回 画像フィルタとフィルタ定理
 
指数分布とポアソン分布のいけない関係
指数分布とポアソン分布のいけない関係指数分布とポアソン分布のいけない関係
指数分布とポアソン分布のいけない関係
 
Rで学ぶ逆変換(逆関数)法
Rで学ぶ逆変換(逆関数)法Rで学ぶ逆変換(逆関数)法
Rで学ぶ逆変換(逆関数)法
 
社内勉強会-ナイーブベイジアンフィルタの実装
社内勉強会-ナイーブベイジアンフィルタの実装社内勉強会-ナイーブベイジアンフィルタの実装
社内勉強会-ナイーブベイジアンフィルタの実装
 

Similar to 確率・統計の基礎勉強会 (1)

演習II.第1章 ベイズ推論の考え方 Part 1.講義ノート
演習II.第1章 ベイズ推論の考え方 Part 1.講義ノート演習II.第1章 ベイズ推論の考え方 Part 1.講義ノート
演習II.第1章 ベイズ推論の考え方 Part 1.講義ノート
Wataru Shito
 
wq-1. ポアソン分布、指数分布、アーラン分布
wq-1. ポアソン分布、指数分布、アーラン分布wq-1. ポアソン分布、指数分布、アーラン分布
wq-1. ポアソン分布、指数分布、アーラン分布
kunihikokaneko1
 
ベイズ統計入門
ベイズ統計入門ベイズ統計入門
ベイズ統計入門Miyoshi Yuya
 
Deep learning _linear_algebra___probablity___information
Deep learning _linear_algebra___probablity___informationDeep learning _linear_algebra___probablity___information
Deep learning _linear_algebra___probablity___information
takutori
 
統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333Issei Kurahashi
 
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
Deep Learning JP
 
Prml 1.3~1.6 ver3
Prml 1.3~1.6 ver3Prml 1.3~1.6 ver3
Prml 1.3~1.6 ver3
Toshihiko Iio
 
ユニバーサルなベイズ測度について
ユニバーサルなベイズ測度についてユニバーサルなベイズ測度について
ユニバーサルなベイズ測度について
Joe Suzuki
 
PRML 1.6 情報理論
PRML 1.6 情報理論PRML 1.6 情報理論
PRML 1.6 情報理論
sleepy_yoshi
 
基礎からのベイズ統計学 3章(3.1~3.3)
基礎からのベイズ統計学 3章(3.1~3.3)基礎からのベイズ統計学 3章(3.1~3.3)
基礎からのベイズ統計学 3章(3.1~3.3)
TeranishiKeisuke
 
若手研究者のための招待講演会
若手研究者のための招待講演会若手研究者のための招待講演会
若手研究者のための招待講演会Joe Suzuki
 
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
Taiji Suzuki
 
ベイズ統計学の概論的紹介-old
ベイズ統計学の概論的紹介-oldベイズ統計学の概論的紹介-old
ベイズ統計学の概論的紹介-old
Naoki Hayashi
 
MLaPP 2章 「確率」(前編)
MLaPP 2章 「確率」(前編)MLaPP 2章 「確率」(前編)
MLaPP 2章 「確率」(前編)
Shinichi Tamura
 
機械学習と深層学習の数理
機械学習と深層学習の数理機械学習と深層学習の数理
機械学習と深層学習の数理
Ryo Nakamura
 
LS for Reinforcement Learning
LS for Reinforcement LearningLS for Reinforcement Learning
LS for Reinforcement Learningimlschedules
 
Introduction to Locally Testable Codes and Related Topics (in Japanese)
Introduction to Locally Testable Codes and Related Topics (in Japanese)Introduction to Locally Testable Codes and Related Topics (in Japanese)
Introduction to Locally Testable Codes and Related Topics (in Japanese)
Nobutaka Shimizu
 
Stochastic Variational Inference
Stochastic Variational InferenceStochastic Variational Inference
Stochastic Variational Inference
Kaede Hayashi
 
第5回Zansa勉強会
第5回Zansa勉強会第5回Zansa勉強会
第5回Zansa勉強会
Zansa
 

Similar to 確率・統計の基礎勉強会 (1) (20)

演習II.第1章 ベイズ推論の考え方 Part 1.講義ノート
演習II.第1章 ベイズ推論の考え方 Part 1.講義ノート演習II.第1章 ベイズ推論の考え方 Part 1.講義ノート
演習II.第1章 ベイズ推論の考え方 Part 1.講義ノート
 
wq-1. ポアソン分布、指数分布、アーラン分布
wq-1. ポアソン分布、指数分布、アーラン分布wq-1. ポアソン分布、指数分布、アーラン分布
wq-1. ポアソン分布、指数分布、アーラン分布
 
ベイズ統計入門
ベイズ統計入門ベイズ統計入門
ベイズ統計入門
 
Deep learning _linear_algebra___probablity___information
Deep learning _linear_algebra___probablity___informationDeep learning _linear_algebra___probablity___information
Deep learning _linear_algebra___probablity___information
 
統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333
 
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
 
Prml 1.3~1.6 ver3
Prml 1.3~1.6 ver3Prml 1.3~1.6 ver3
Prml 1.3~1.6 ver3
 
ユニバーサルなベイズ測度について
ユニバーサルなベイズ測度についてユニバーサルなベイズ測度について
ユニバーサルなベイズ測度について
 
PRML 1.6 情報理論
PRML 1.6 情報理論PRML 1.6 情報理論
PRML 1.6 情報理論
 
基礎からのベイズ統計学 3章(3.1~3.3)
基礎からのベイズ統計学 3章(3.1~3.3)基礎からのベイズ統計学 3章(3.1~3.3)
基礎からのベイズ統計学 3章(3.1~3.3)
 
若手研究者のための招待講演会
若手研究者のための招待講演会若手研究者のための招待講演会
若手研究者のための招待講演会
 
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
 
ベイズ統計学の概論的紹介-old
ベイズ統計学の概論的紹介-oldベイズ統計学の概論的紹介-old
ベイズ統計学の概論的紹介-old
 
MLaPP 2章 「確率」(前編)
MLaPP 2章 「確率」(前編)MLaPP 2章 「確率」(前編)
MLaPP 2章 「確率」(前編)
 
第2回DARM勉強会
第2回DARM勉強会第2回DARM勉強会
第2回DARM勉強会
 
機械学習と深層学習の数理
機械学習と深層学習の数理機械学習と深層学習の数理
機械学習と深層学習の数理
 
LS for Reinforcement Learning
LS for Reinforcement LearningLS for Reinforcement Learning
LS for Reinforcement Learning
 
Introduction to Locally Testable Codes and Related Topics (in Japanese)
Introduction to Locally Testable Codes and Related Topics (in Japanese)Introduction to Locally Testable Codes and Related Topics (in Japanese)
Introduction to Locally Testable Codes and Related Topics (in Japanese)
 
Stochastic Variational Inference
Stochastic Variational InferenceStochastic Variational Inference
Stochastic Variational Inference
 
第5回Zansa勉強会
第5回Zansa勉強会第5回Zansa勉強会
第5回Zansa勉強会
 

確率・統計の基礎勉強会 (1)

  • 1. Introduction 確率 確率変数 次回予告 第 1 回 確率・統計の基礎勉強会 Hiroaki Tanaka Augmented Human Communication Laboratory, Department of Information Schience, Nara Institute of Science and Technology November 8, 2016 1 / 42
  • 2. Introduction 確率 確率変数 次回予告 1 Introduction 2 確率 3 確率変数 4 次回予告 2 / 42
  • 3. Introduction 確率 確率変数 次回予告 はじめに • スライドやその他の資料は https://setten-qb.amebaownd.com/ においてあります • Twitter: @setten QB 3 / 42
  • 4. Introduction 確率 確率変数 次回予告 確率論と統計学 • 確率論は演繹的 • 統計学は帰納的 • 確率論の方が抽象的な議論をする事が多い 4 / 42
  • 5.
  • 6. Introduction 確率 確率変数 次回予告 数理統計学の基礎内容 確率空間 全空間の測度が 1 となるような測度空間 確率変数・確率分布 PRML の 2・3 章で出てくる 確率分布の特性値 PRML の 2・3 章で出てくる 近似法則 n → ∞, d :fix の場合が基本的 統計的推測 使うだけなら難しくない 統計的検定 使うだけなら難しくない 6 / 42
  • 7. Introduction 確率 確率変数 次回予告 この勉強会の到達目標 • 統計学の基礎を理解する • PRML2・3 章の数式をだいたい追えるようにする • 余裕とニーズがあれば,学習理論までやっても良いかも 7 / 42
  • 8. Introduction 確率 確率変数 次回予告 この勉強会で扱う内容 確率空間 第 1 回 確率変数・確率分布 第 1 回 確率分布の特性値 第 2 回 近似法則 第 2 回 統計的推定 第 3 回 統計的検定 第 4 回 多変量分布を扱うために必要な線形代数 第 5 回? 8 / 42
  • 9. Introduction 確率 確率変数 次回予告 1 Introduction 2 確率 3 確率変数 4 次回予告 9 / 42
  • 10. Introduction 確率 確率変数 次回予告 基本事象と標本空間 • 未知な現象を理解するための実験や調査を試行と呼び,試行の 結果を基本事象と呼ぶ • 得られるであろう結果(基本事象)全体を抽象的に標本空間と 呼ぶ Example サイコロを 1 回投げるという試行を考える.このとき,標本 空間は { 1 の目が出る, . . . , 2 の目が出る } になる. 10 / 42
  • 11. Introduction 確率 確率変数 次回予告 σ 集合族 • 以下,標本空間を Ω で表す • 確率は,Ω 上の特別な条件を満たす部分集合族上で定義される σ-algebra Ω の部分集合族 B が以下の条件を満たす時,B を Ω 上の σ 集合族という: Ω ∈ B; A ∈ B =⇒ Ac ∈ B; A1, . . . , An, · · · ∈ B =⇒ ∞∪ i=1 Ai ∈ B. • 確率論では σ 集合族の要素を事象という • Ω を全事象という 11 / 42
  • 12. Introduction 確率 確率変数 次回予告 σ 集合族 • σ 集合族が満たす性質はたくさんあるが,詳細は略 • σ 集合族上で,確率は定義される • Ω と B の対を (Ω, B) と書いて,可測空間 (measurable space) と呼ぶ 12 / 42
  • 13. Introduction 確率 確率変数 次回予告 確率測度 Probabilitstic Measure B 上の実数値関数 P が 0 ≤ P(A) ≤ 1, ∀A ∈ B, P(Ω) = 1, Ai ∈ B(i = 1, . . . ), Ai ∩ Aj = ∅(i ̸= j) =⇒ P ( ∞∪ i=1 Ai ) = ∞∑ i=1 P(Ai) を満たすとき,P を (Ω, B) 上の確率測度 (probabilistic measure) といい,P(A) を事象 A の確率という. • Ω, B, P の 3 つ組 (Ω, B, P) を確率空間という. 13 / 42
  • 14. Introduction 確率 確率変数 次回予告 確率測度 • こうやって確率を定義することにより,皆が知っているような 確率の性質 P(∅) = 0 や P(A) + P(Ac) = 1, for A ∈ B が成り 立つ • その他にもたくさんの重要な性質があるが,詳細は略 14 / 42
  • 15. Introduction 確率 確率変数 次回予告 15 / 42
  • 16. Introduction 確率 確率変数 次回予告 そもそも測度って何? • 集合の大きさを測る尺度 → 測度 • P(A1) で A1 の大きさを表す → 確率 • 確率空間を明らかにしていないと困ることがある • どういう集合上に確率を入れるの? → σ 集合族 測度 R から実数 a, b を選び,区間 I = [a, b], a, b ∈ [0, 1] を構成 する.区間 I の “大きさ” について考える. a b x M 16 / 42
  • 17. Introduction 確率 確率変数 次回予告 そもそも測度って何? • 集合の大きさを測る尺度 → 測度 • P(A1) で A1 の大きさを表す → 確率 • 確率空間を明らかにしていないと困ることがある • どういう集合上に確率を入れるの? → σ 集合族 測度 R から実数 a, b を選び,区間 I = [a, b], a, b ∈ [0, 1] を構成 する.区間 I の “大きさ” について考える. a b x M ルベーグ測度 L([a, b]) b − a 16 / 42
  • 18. Introduction 確率 確率変数 次回予告 条件付き確率 • 条件付き確率も測度空間 (Ω, B) 上で定義される Conditional Probability C ∈ B, P(C) > 0 のとき, P(A|C) = P(A ∩ C) P(C) , A ∈ B を事象 C が与えられたときの A ∈ B の条件付き確率とい, P( · |C) を C が与えられたときの条件付き確率測度という. • 上記のように条件付き確率を定義すると,P( · |C) は (Ω, B) 上の確率測度になっている 17 / 42
  • 19. Introduction 確率 確率変数 次回予告 条件付き確率 • よく使う全確率の公式 全確率の公式 ∞∪ i=1 Ai = Ω, Ai ∩ Aj = ∅, P(Ai) > 0 とする.このとき, A ∈ B について P(A) = ∞∑ i=1 P(Ai)P(A|Ai) が成り立つ. 18 / 42
  • 20. Introduction 確率 確率変数 次回予告 1 Introduction 2 確率 3 確率変数 4 次回予告 19 / 42
  • 21. Introduction 確率 確率変数 次回予告 ボレル集合族 • 確率空間 (Ω, B, P) を実数空間へ結びつけるもの • 実数空間では,(Ω, B) が (R, B) に対応する Borel algebra 全ての半開区間 (a, b] を含む最小の σ 集合族 B を R 上のボ レル集合族という. • B は (a, b] 以外にも様々な区間を含む • { a } , (a, b), [a, b], [a, b), (a, ∞), (−∞, a] は全てボレル集合 20 / 42
  • 22. Introduction 確率 確率変数 次回予告 確率変数 • 確率変数の厳密な定義をする • 確率変数が,抽象的な確率空間と実数の確率空間を対応付ける 確率変数 X : Ω → R が (Ω, B) 上の確率変数 def ⇐⇒∀B ∈ B, { ω | X(ω) ∈ B } = X−1 (B) ∈ B. • X を確率変数とするとき,多項式,log |X|, eX, sin X などは 全て確率変数となる 21 / 42
  • 23. Introduction 確率 確率変数 次回予告 確率変数 𝐵1 ∈ 𝐵2 ∈ 𝑋−1(𝐵1) 𝑋−1(𝐵2) Measurable function 𝑋 Measurable function 𝑋 Figure: 確率変数のイメージ • どのような B ∈ B を選んでも,X−1(B) ∈ B 可測関数 X 22 / 42
  • 24. Introduction 確率 確率変数 次回予告 分布関数 • (Ω, B) の実数空間版として (R, B) が導入された • 残りの確率測度 P に対応するものとして,分布関数 F を導入 する Distribution Function F : R → R が ∀x ∈ R, F(x) = P(X ≤ x) = P ({ ω | X(ω) ≤ x }) によって F を定義するとき,F を X の累積分布関数 (cumu- lative distribution function; cdf) という. • P(X ≤ x) を X ≤ x となる確率と読み替える事ができる 23 / 42
  • 25. Introduction 確率 確率変数 次回予告 分布関数による確率計算 確率計算 確率変数 X に対し, P(a ≤ X ≤ b) = P ( X−1 ((a, b]) ) = FX(b) − FX(a) 24 / 42
  • 26. Introduction 確率 確率変数 次回予告 ここまでのまとめ • 確率は可測空間上で定義される実数値関数 • 確率変数 X が,確率空間と実数空間をつなぐ • 確率変数は実は変数ではなく可測関数 • 実数空間では確率変数は変数のように扱っても差し支えない 25 / 42
  • 27. Introduction 確率 確率変数 次回予告 確率変数のタイプ Random Variable Discrete type X : (Ω, B, P) 上の r.v. とする. X が D (Discrete) -type def ⇐⇒∃E ⊂ R (高々加算な集合) s.t. P(X ∈ E) = 1 Continuous type FX:X の分布関数とする. X が C (Continuous) -type def ⇐⇒∃fX : R → R+ (可測関数) s.t. FX (x) = ∫ x −∞ fX (u) du, ∀x ∈ R 26 / 42
  • 28. Introduction 確率 確率変数 次回予告 確率変数のタイプ • 簡単に言うと . . . D-type 取りうる値が離散値 (E ⊂ N, Z, Q) C-type 取りうる値が連続値 (E ⊂ R) 27 / 42
  • 29. Introduction 確率 確率変数 次回予告 離散型確率変数 • X の取りうる値が離散値のときは D-type • E = { x1, . . . , xn, . . . } , p(xi) = P(X = xi) とすると, ∞∑ i=1 p(xi) = 1, F(x) = ∑ xi ≤ xp(xi) が成り立つ.この p(·) のことを X の確率質量関数 (p.m.f.) と 呼ぶ 28 / 42
  • 30. Introduction 確率 確率変数 次回予告 離散型確率変数とその分布の例 2 項分布 B(n, p) • 0 ≤ p ≤ 1, i = 1, . . . , n p(xi) = P(X = i) = ( n i ) pi (1 − p)n−i • E = { 1, . . . , n } とすると,P(X ∈ E) = 1 が成り立つ • 「表が出る確率 p のコインを n 回投げて,表が i 回でる確率を 表す」というフレーズで覚えれば良い • n = 1 の場合,特にベルヌーイ分布と呼ばれる 29 / 42
  • 31. Introduction 確率 確率変数 次回予告 離散型確率変数とその分布の例 ポアソン分布 Po(λ) p(k) = P(X = k) = λk k! exp(−λ) • E = { 0, 1, . . . , } とすると P(X ∈ E) = 1 が成り立つ • 稀に起こる事象の観測モデルなどによく使われる 30 / 42
  • 32. Introduction 確率 確率変数 次回予告 連続型確率変数 • C-type r.v. の定義に出てくる fX を,X の確率密度関数 (p.d.f.) という • fX(x) ≥ 0, ∫ ∞ −∞ f(u) du = 1, d dx FX(x) = f(x) が成り 立つ • 実際に確率計算をするときは, P(a < x ≤ b) =F(b) − F(a) = ∫ b −∞ f(u) du − ∫ a −∞ f(u) du = ∫ b a f(u) du とする 31 / 42
  • 33. Introduction 確率 確率変数 次回予告 連続型確率変数とその分布 連続型確率変数の分布 一様分布 U(a, b) fX(x) =    1 b − a , x ∈ (a, b) 0, otherwise 正規分布 N ( µ, σ2 ) fX (x) = 1 √ 2πσ2 exp [ − (x − µ)2 2σ2 ] , −∞ < µ < ∞, σ > 0 32 / 42
  • 34. Introduction 確率 確率変数 次回予告 正規分布 • 超重要 • c.d.f. が初等関数で陽に書けない • X ∼ N ( µ, σ2 ) のとき,Y = (x − µ)/σ ∼ N (0, 1) • X ∼ N (0, 1) のとき,P(X ≥ 1.282) ≒ 0.10, P(X ≥ 1.645) ≒ 0.05, P(X ≥ 2.326) ≒ 0.01 あたりは推定・検定で 頻出 33 / 42
  • 35. Introduction 確率 確率変数 次回予告 確率変数の変換 Y = aX + b の分布 a, b ∈ R を用いて,C-type 確率変数 X の変換 Y = aX + b を考える.このとき,Y の p.d.f. を求めよ. FY (y) = P(Y ≤ y) = P(aX+b ≤ y) =    P ( X ≤ y − b a ) , a ≥ 0 P ( X > y − b a ) , a < 0 であるから, FY (y) =    FX ( y − b a ) , a ≥ 0 1 − FX ( y − b a ) , a < 0 34 / 42
  • 36. Introduction 確率 確率変数 次回予告 確率変数の変換 したがって, fY (y) = d dy FY (y) =    1 a fX ( y − b a ) , a ≥ 0 − 1 a fX ( y − b a ) , a < 0 = 1 |a| fX ( y − b a ) . 35 / 42
  • 37. Introduction 確率 確率変数 次回予告 多次元分布 • これまでは 1 つの確率変数だけを考えていたが,これを多次元 確率変数ベクトルに拡張する • X1, . . . , Xn を (Ω, B, P) 上の確率変数として,確率変数ベク トル X = [X1, . . . , Xn] で定義する • n 次元ボレル集合族も Bn = ∏n i=1(ai, bi] で定義される • PRML を読む上では,「確率変数がベクトルになった」という 程度の理解で問題ない (多分) • 多次元分布も,1 次元の場合と同様に離散型と連続型に分けら れる 36 / 42
  • 38. Introduction 確率 確率変数 次回予告 同時累積分布関数 Joint Cumulative Distribution Function X = [X1, . . . , Xn]:確率変数ベクトルとして,X の同時累 積分布関数 (j.c.d.f.) を FX(x1, . . . , xn) = P (X1 ≤ x1, . . . , Xn ≤ xn) で定義する.また,X の部分確率ベクトルの分布関数を周辺 分布関数 (m.d.f.) という. 37 / 42
  • 39. Introduction 確率 確率変数 次回予告 多次元分布の計算 • C-type での j.c.d.f. の求め方を見ておく • X := [X1, . . . , Xn] • fX:X の j.p.d.f. FX(x1, . . . , xn) = ∫ xn −∞ ∫ xn−1 −∞ · · · ∫ x1 −∞ fX(u1, . . . , un) du1du2 . . . dun, fX(x1, . . . , xn) = ∂n ∂x1 · · · ∂xn FX(x1, . . . , xn) 38 / 42
  • 40. Introduction 確率 確率変数 次回予告 2 次元正規分布 2 次元正規分布 [X, Y ] の j.p.d.f. が fXY (x, y) = 1 √ |det(2πΣ)| exp [ − 1 2 (z − µ) ′ Σ−1 (z − µ) ] のとき,[X, Y ] は 2 次元正規分布に従うといい,[X, Y ] ∼ N (µ, Σ) で表す.ここで,−∞ < µX, µY < ∞, σX, σY > 0, |ρ| < 1 であり, z = [ x y ] , µ = [ µX µY ] , Σ = [ σ2 X ρσXσY ρσXσY ρ2 Y ] である. • fX(x) = ∫ R fXY (x, y) dy = 1 √ 2πσX exp [ − (x − µX)2 2σ2 X ] 39 / 42
  • 41. Introduction 確率 確率変数 次回予告 1 Introduction 2 確率 3 確率変数 4 次回予告 40 / 42
  • 42. Introduction 確率 確率変数 次回予告 次回予告 • 確率変数の独立性 • 確率分布の特性値 (期待値・共分散・相関係数・積率母関数) • 近似法則 41 / 42
  • 43. Introduction 確率 確率変数 次回予告 Reference • 赤平昌文, 統計解析入門, 森北出版株式会社, 2007 • 内藤貫太, 数理統計学 II 講義ノート, 2014 42 / 42