3. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ
予測とは?
x n := (x1 , · · · , xn ) ∈ {0, 1}n から、xn+1 ∈ {0, 1} を予測
.
x n のもとでの xn+1 の確率の推定値 Q(xn+1 |x n ) を構成
たとえば、 .
1 1
1 Q(xn+1 |x n ) = ( , )
2 2
.
n−c c
2 c を x n での xn+1 の頻度として、Q(xn+1 |x n ) = ( , )
n n
. n−c +1 c +1
3 Q(xn+1 |x n ) = ( , )
n+2 n+2
ねらい: 真の確率 P(xn+1 |x n ) に収束させたい
. Q(xn+1 |x n ) −→ P(xn+1 |x n ) (n → ∞)
[招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
3 / 30
4. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ
符号化・符号語・一意復号可能
A: 有限集合 (有限アルファベット)
φ : An → {0, 1}∗ 符号化
l : An → N+ が φ の長さ
n)
符号語 φ(x n ) ∈ {0, 1}l(x となるときの、x n → l(x n ) の対応
l が一意復号可能な符号化の長さ .
⇐⇒ l∑が瞬時復号可能な符号化の長さ
2−l(x ) ≤ 1
n
⇐⇒ .
x n ∈An
(→ Elements of Information Theory)
[招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
4 / 30
5. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ
エントロピー
P n : x n ∈ An の確率 (定常エルゴード)
1∑
H := lim −P(x n ) log P(x n ) (エントロピー)
n→∞ n n
x
Shannon-McMillan-Breiman の定理
1
確率 1 で、− log P n (x n ) → H (n → ∞)
n
証明 (独立のときのみ): P n (x n ) = P(x1 ) · · · P(xn )
.
1∑
n
1
− log P (x ) =
n n
− log P(xi ) → E [− log P(X )] = H
n n
i=1
.
(大数の強法則)
[招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
5 / 30
6. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ
ユニバーサルデータ圧縮
例: l(x n ) := ⌈− log P n (x n )⌉
∑
2−l(x
n
)
≤1
x n ∈An
l(x n )
→H
n
は、確率 P n が未知だと、長さ l を構成できない。
ユニバーサルデータ圧縮
P n が未知でも、l(x n ) := − log Q n (x n ) が上記 2 条件を満足
[招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
6 / 30
7. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ
例: Bayes 符号
2 進アルファベット A = {0, 1}、独立情報源、0 ≤ θ ≤ 1 として
∫
Q n (x n ) = w (θ)P(x n |θ)dθ
a, b > 0, c を x n ∈ An における xi = 1 の頻度として、
Γ(a + b) a−1
w (θ) = θ (1 − θ)b−1 , P(x n |θ) = θc (1 − θ)n−c
Γ(a)Γ(b)
Γ(a + b) Γ(c + a)Γ(n − c + b)
⇐⇒ Q(x n ) = ·
Γ(a)Γ(b) Γ(n + a + b)
a = b = 1/2 (Krichevsky-Trofimov) と Stirling の公式から、
1
− log Q n (x n ) → H
n
[招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
7 / 30
8. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ
ユニバーサル性
1
− log P n (x n ) → H
n
1
− log Q n (x n ) → H
n
Q n がユニバーサルな Bayes 測度
すべての P n について、
1 P n (x n )
log n n → 0
n Q (x )
有限アルファベット A = {0, 1, · · · , m − 1}
情報源が定常エルゴード
.
[招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
8 / 30
10. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ
未解決問題 1
ユニバーサルな賭けの存在
どのような定常エルゴードな (未知の)P n についても
1 1
log[2n Q n (x n )] → log[2n P n (x n )]
n n
(n → ∞) となるような計算可能な Q n は存在するか。 .
存在する:
P n を知らなくても、P n を知っている人と同程度に勝てる
(ユニバーサルデータ圧縮)
.
[招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
10 / 30
15. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ
未解決問題 3: ポートフォリオ (賭けの一般化)
(X0 , X1 ): 非負の値をとる確率変数の組
(0) (1) (0) (1)
bi = (bi , bi ), bi + bi = 1
(0) (0) (1) (1)
(bi , Xi ) := bi Xi + bi Xi
∏
bi : x i−1 に基づいて決めた戦略 =⇒ Sn := n (bi , Xi∏
ˆ ˆ
i=1
ˆ )
bi∗ = b : X n の分布に基づいた最適な戦略 =⇒ S ∗ := n ∗
i n i=1 (bi , Xi )
問題 3: ユニバーサルなポートフォリオの存在
どのような定常エルゴードな (未知の)X n の分布についても、
1 1 ∗
log Sn → log Sn
ˆ
n n
(n → ∞) となるような (b1 , · · · , bn ) は存在するか。
ˆ ˆ
存在する (→ Elements of Information Theory)
[招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
15 / 30
16. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ
ユニバーサルな予測の Bayes 的方法
(c0 , c1 ) := (n − c, c) (x n での (0, 1) の頻度)
Γ(a + b) Γ(c + a)Γ(n − c + b)
Q n (x n ) = ·
Γ(a)Γ(b) Γ(n + a + b)
Γ(x + 1) = xΓ(x), x > 0 より、a = b = 1/2 のとき
n−c +a c +a c0 + 1/2 c1 + 1/2
(Q(0|x n ), Q(1|x n )) = ( , )=( , )
n+a+b n+a+b n+1 n+1
一般には、A = {0, 1, · · · , m − 1} として、
c0 + 1/2 cm−1 + 1/2
(Q(0|x n ), · · · , Q(m − 1|x n )) = ( ,··· , )
n + m/2 n + m/2
独立でなく、定常エルゴードの場合に拡張することは可能
[招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
16 / 30
17. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ
ユニバーサルな Bayes 測度
確率変数が有限個の値をとる場合
∑
Q n (x n ) ≤ 1
x n ∈An
1 P n (x n )
log n n → 1
n Q (x )
一般の確率変数の場合
ユニバーサルな Bayes 測度は、どのようになるのか。
x n が連続の場合や、離散でも連続でもない場合は、
どのようにして、xn+1 を予測するのか
(簡単のため、独立な情報源のみを扱うが、拡張はいつでも可能)
.
[招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
17 / 30
.
18. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ
X が確率密度関数 f をもつとき (Ryabko の方法)
X : X の取りうる値
x n = x1 · · · xn ∈ X n
f を複数のヒストグラム f1 , f2 , · · · でそれぞれ近似
各ヒストグラム Aj を、X を細分化した区間の集合で表現。
f を近似した fj で、fj (x1 ) · · · fj (xn ) を計算。
.
A0 := {X }
Aj+1 が Aj の細分
.
例 1: A0 = {[0, 1)} のとき、下記はこの条件を満足する:
A1 = {[0, 1/2), [1/2, 1)}
A2 = {[0, 1/4), [1/4, 1/2), [1/2, 3/4), [3/4, 1)}
...
Aj = {[0, 2−(j−1) ), [2−(j−1) , 2 · 2−(j−1) ), · · · , [(2j−1 − 1)2−(j−1) , 1)}
...
[招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
18 / 30
19. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ
B: R の Borel 集合全体
λ : B → R (Lebesgue 測度, B ∋ a = [b, c) =⇒ λ(a) = c − b)
ヒストグラム Aj で、
X n ∋ (x1 , · · · , xn ) ∈ (a1 , · · · , an ) ∈ An のとき、
j
f n (x n ) := f (x ) · · · f (x ) = Pj (a1 ) · · · Pj (an )
j
j 1 j n
λ(a1 ) . . . λ(an )
n n Qjn (a1 , · · · , an )
g (x ) :=
j
λ(a1 ) · · · λ(an )
[招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
19 / 30
20. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ
∑
{ωj }∞ :
j=1 ωj = 1, ωj > 0,
∞
∑
n n
g (x ) := ωj gjn (x n )
j=1
{Aj } をどのような f についても、j → ∞ で
∫
h(f ) := −f (x) log f (x)dλ(x)
として、h(fj ) → h(f ) となるように選ぶと、
1 f n (x n )
log n n → 0
n g (x )
B. Ryabko. IEEE Trans. on Inform. Theory, 55, 9, 2009.
[招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
20 / 30
21. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ
確率変数 X に確率密度関数が存在するための必要十分条件
µ(D): D ∈ B の確率
確率密度関数が存在する必要十分条件
以下は、同値 (µ ≪ λ)
各 D ∈ B で、λ(D) = 0 =⇒ µ(D) = 0
∫
dµ
µ(D) = f (t)dλ(t) なる B 可測な := f が存在
D dλ
.
参考: f : R → R が B 可測
⇐⇒ 各 D ∈ B について、{x ∈ R|f (x) ∈ D} ∈ B
(Lebesgue 積分を適用する条件)
.
[招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
21 / 30
22. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ
一般化確率密度関数の推定
Radon-Nikodym の定理
以下は同値 (µ ≪ η):
各 D ∈ B で、η(D) = 0 =⇒ µ(D) = 0
∫
dµ .
µ(D) = f (t)dη(t) なる F 可測な := f が存在
D dη
1
例 2: µ({k}) > 0, η({k}) := , k ∈ Y := {1, 2, · · · }
k(k + 1)
∑
µ(D) = f (k)η({k}) , D ⊆ Y .
k∈D
dµ µ({k})
µ ≪ η =⇒ (k) = f (k) = = k(k + 1)µ({k})
dη η({k})
[招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
22 / 30
23. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ
B1 := {{1}, {2, 3, · · · }}
B2 := {{1}, {2}, {3, 4, · · · }}
...
Bk := {{1}, {2}, · · · , {k}, {k + 1, k + 2, · · · }}
...
ヒストグラム Bk で、
Y n ∋ (y1 , · · · , yn ) ∈ (b1 , · · · , bn ) ∈ Bk のとき、
n
f (y ) := fk (y1 ) · · · fk (yn ) = Pk (b1 ) · · · Pk (bn )
n n
k
η(b1 ) . . . η(bn )
n n
Qk (b1 , · · · , bn )
n
gk (y ) :=
λ(b1 ) · · · λ(bn )
[招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
23 / 30
24. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ
{Bk } をどのような f についても、k → ∞ で (fk ) → h(f ) となる
ように選ぶと、
1 f n (y n )
log n n → 0
n g (y )
g n (y n )η({y1 }) · · · η({yn }) が、
P(y n ) = f n (y n )η({y1 }) · · · η({yn }) の推定になる
[招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
24 / 30
25. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ
有限アルファベットの場合も特種ケースとして含まれる
例 3: Z := {0, 1, · · · , m − 1}
C0 = {Z}, C1 = C2 = · · · = {{0}, {1}, · · · , {m − 1}}
η({0}) = · · · η({m − 1}) = 1/m
とおけば、µ ≪ η
z n ∈ C n ⇐⇒ c n ∈ C1 = C2 = · · ·
n n
n n
n n
f (z ) = P (c ) ,
(1/m)n
∞
g n (z n ) = g n (z n ) = · · · = g n (z n ) = ∑ ω g n (z n ) = Q (c )
=⇒ n n
1
2 l l
(1/m)n
l=1
1 f n (z n ) 1 P n (c n )
=⇒ log n n = log n n → 0
n g (z ) n Q (c )
[招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
25 / 30
26. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ
(X , Y ) ∈ X × Y
例 4: 例 1 と例 2 の {Aj }, {Bk } から、{Aj × Bk } を構成
Qjk : (Aj × Bk )n の予測確率
n
n n n
fj,k (x , y ) := fj,k (x1 , y1 ) · · · fj,k (xn , yn )
Pj,k (a1 , b1 ) · · · Pj,k (an , bn )
=
λ(a1 ) . . . λ(an )η(b1 ) . . . η(bn )
Qjk ((a1 , b1 ) · · · , (an , bn ))
n
n n n
g (x , y ) :=
jk
λ(a1 ) · · · λ(an )η(b1 ) · · · η(bn )
∑
jk ωjk = 1, ωjk > 0,
∞
∑
g n (x n , y n ) := ωjk gjk (x n , y n )
n
k=1
1 f n (x n , y n )
log n n n → 0
n g (x , y )
[招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
26 / 30
27. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ
離散や連続を仮定しないユニバーサルな予測
Suzuki, 2011
µ ≪ η のとき、ヒストグラムの列 {Aj } をもつ Bayes 測度 g を構
成すると、h(fj ) → h(f ) を満足する任意の f に対して、
1 f n (u n ) .
log n n → 0
n g (u )
一般化されたユニバーサルな Bayes 測度
g n+1 (x n+1 ) f n+1 (x n+1 )
g (xn+1 |x n ) = → f (xn+1 |x n ) = .
g n (x n ) f n (x n )
各 D ∈ B について
∫
ν(D|x n ) = g (x|x n )dη(x)
D
[招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ .
27 / 30
37. …
¡ …
e
EZ Y E
Z
Y
[招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
28 / 30
38. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ
(1)-(11) の構造の同定
p1 , · · · , p11 : 構造の事前確率
p1 g n (x n )g n (y n )g n (z n ),
p2 g n (x n )g n (y n , z n ), p3 g n (y n )g n (z n , X ), p4 g n (z n )g n (x n , y n ),
g n (x n , y n )g n (X , z n ) g n (x n , y n )g n (y n , z n ) g n (x n , z n )g n (y n , z n )
p5 , p6 , p7 ,
g n (x n ) g n (y n ) g n (z n )
g n (y n )g n (z n )g n (x n , y n , z n ) g n (z n )g n (x n )g n (x n , y n , z n )
p8 , p9 ,
g n (y n , z n ) g n (z n , x n )
g n (x n )g n (y n )g n (x n , y n , z n )
p10 , p11 g n (x n , y n , z n )
g n (x n , y n )
[招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
29 / 30