定義1.12 (1) 可測空間
• Ω: 距離空間
• B: Ω の部分集合を要素とする σ-代数
• σ-代数(完全加法族):
① A1, A2 ∈ B ⇒ A1 ∩ A2 ∈ B (※不要)
② Ω ∈ B (※原⽂には無いがこちらを追加)
③ A ∈ B ⇒ Ac ∈ B (Ac は補集合)
④ A1, A2, A3, … ∈ B ⇒ ∪Ai ∈ B (可算個)
• (Ω, B) を可測空間と呼ぶ
10
定義1.12 (2) 確率空間
• 可測空間 (Ω, B)
• 確率測度 P
関数 P: B → [0, 1]
① P(Ω) = 1
② 交わりの無い A1, A2, A3, … ∈ B に対して
P(∪Ai) = ΣP(Ai)
• (Ω, B, P) を確率空間と呼ぶ
11
Remark 1.20 (2) (3)
• 同じ確率分布に従う2つの確率変数 X と Y
は同じ期待値を持つ
➡︎ E[X] の情報から E[Y] を予測できる
• 統計的学習理論において、学習誤差から
汎化誤差の期待値を推定することは重要
である
24
Remark 1.20 (4)
• チェビシェフの不等式 (※マルコフでは?)
• E[|X|] = C のとき任意の M > 0 に対して
C = E[|X|] ≧ E[|X|]{|X| > M}
≧ M E[1]{|X| > M} = M P(|X| > M)
➡︎ P(|X| > M) ≦ C / M
• 確率論では同様の導出がよく⾏われる
25
Remark 1.21
• よく知られている確率変数の収束の性質
① Xn が X に概収束または p次平均収束す
るとき、Xn は X に確率収束する
② Xn が X に確率収束するとき、Xn は X に
法則収束する (定義は5章)
③ ⼀般に、概収束は p次平均収束の必要条
件でも⼗分条件でもない
29