SlideShare a Scribd company logo
1 of 30
Download to read offline
Cover 先生と私   準備     Cover 先生が提起した未解決問題       ユニバーサルな予測の一般化        まとめ




       [招待講演] Cover 先生の研究室で思い出に残っているテーマ
       ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼


                              鈴木 譲

                               大阪大学




                          2012 年 12 月 11 日
                           SITA 2012 (別府)




 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                   1 / 30
Cover 先生と私    準備     Cover 先生が提起した未解決問題    ユニバーサルな予測の一般化          まとめ


                            Road Map



    1   Cover 先生と私

    2   準備

    3   Cover 先生が提起した未解決問題

    4   ユニバーサルな予測の一般化

    5   まとめ




 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                   2 / 30
Cover 先生と私       準備           Cover 先生が提起した未解決問題   ユニバーサルな予測の一般化   まとめ


                                         予測とは?

        x n := (x1 , · · · , xn ) ∈ {0, 1}n から、xn+1 ∈ {0, 1} を予測
                                                                   .
        x n のもとでの xn+1 の確率の推定値 Q(xn+1 |x n ) を構成

        たとえば、                                                  .
                               1 1
          1   Q(xn+1 |x n ) = ( , )
                               2 2




                                                                         .
                                                           n−c c
          2   c を x n での xn+1 の頻度として、Q(xn+1 |x n ) = (        , )
                                                            n  n
.                                 n−c +1 c +1
          3   Q(xn+1 |x n ) = (         ,     )
                                   n+2    n+2

        ねらい: 真の確率 P(xn+1 |x n ) に収束させたい
.       Q(xn+1 |x n ) −→ P(xn+1 |x n ) (n → ∞)

     [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                        3 / 30
Cover 先生と私      準備      Cover 先生が提起した未解決問題     ユニバーサルな予測の一般化      まとめ


                       符号化・符号語・一意復号可能


    A: 有限集合 (有限アルファベット)
    φ : An → {0, 1}∗ 符号化

    l : An → N+ が φ の長さ
                              n)
    符号語 φ(x n ) ∈ {0, 1}l(x        となるときの、x n → l(x n ) の対応

     
             l が一意復号可能な符号化の長さ                              .
     ⇐⇒      l∑が瞬時復号可能な符号化の長さ
                 2−l(x ) ≤ 1
                      n
     ⇐⇒                                                .
             x n ∈An
    (→ Elements of Information Theory)



 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                   4 / 30
Cover 先生と私    準備      Cover 先生が提起した未解決問題     ユニバーサルな予測の一般化        まとめ


                            エントロピー

    P n : x n ∈ An の確率 (定常エルゴード)
                 1∑
    H := lim         −P(x n ) log P(x n ) (エントロピー)
           n→∞ n n
                   x

    Shannon-McMillan-Breiman の定理
              1
    確率 1 で、− log P n (x n ) → H (n → ∞)
              n
    証明 (独立のときのみ): P n (x n ) = P(x1 ) · · · P(xn )
                                                          .
                      1∑
                         n
        1
       − log P (x ) =
              n n
                            − log P(xi ) → E [− log P(X )] = H
        n             n
                        i=1
                                                        .
    (大数の強法則)

 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                   5 / 30
Cover 先生と私          準備              Cover 先生が提起した未解決問題   ユニバーサルな予測の一般化   まとめ


                                    ユニバーサルデータ圧縮



    例: l(x n ) := ⌈− log P n (x n )⌉
             ∑
                   2−l(x
                           n
                               )
                                   ≤1
         x n ∈An

         l(x n )
                 →H
           n
    は、確率 P n が未知だと、長さ l を構成できない。
    ユニバーサルデータ圧縮
    P n が未知でも、l(x n ) := − log Q n (x n ) が上記 2 条件を満足




 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                          6 / 30
Cover 先生と私     準備      Cover 先生が提起した未解決問題        ユニバーサルな予測の一般化    まとめ


                            例: Bayes 符号
    2 進アルファベット A = {0, 1}、独立情報源、0 ≤ θ ≤ 1 として
                          ∫
              Q n (x n ) = w (θ)P(x n |θ)dθ

    a, b > 0, c を x n ∈ An における xi = 1 の頻度として、

                  Γ(a + b) a−1
             w (θ) =       θ (1 − θ)b−1 , P(x n |θ) = θc (1 − θ)n−c
                  Γ(a)Γ(b)
                   Γ(a + b) Γ(c + a)Γ(n − c + b)
      ⇐⇒ Q(x n ) =          ·
                   Γ(a)Γ(b)     Γ(n + a + b)

    a = b = 1/2 (Krichevsky-Trofimov) と Stirling の公式から、

                           1
                          − log Q n (x n ) → H
                           n

 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                      7 / 30
Cover 先生と私    準備     Cover 先生が提起した未解決問題         ユニバーサルな予測の一般化     まとめ


                          ユニバーサル性

                          1
                         − log P n (x n ) → H
                          n
                          1
                         − log Q n (x n ) → H
                          n

    Q n がユニバーサルな Bayes 測度
    すべての P n について、

                          1    P n (x n )
                            log n n → 0
                          n    Q (x )

         有限アルファベット A = {0, 1, · · · , m − 1}
         情報源が定常エルゴード
                                                          .
 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                   8 / 30
Cover 先生と私         準備         Cover 先生が提起した未解決問題                ユニバーサルな予測の一般化   まとめ


         1975 年にモスクワで、Cover 先生が提起した未解決問題
        1 ドル賭けて、勝てば 2 ドル、負ければ戻ってこない
         
        A = {0, 1}, P n は未知
          1   1 を、(Q(0|x 0 ), Q(1|x 0 )) で賭ける

.         2   x1 = 0
          3   1 → 2Q(0|x 0 ) を、(Q(0|x 1 ), Q(1|x 1 )) で賭ける

.         4   x2 = 1
          5   2Q(0|x 0 ) → 2Q(0|x 0 ) · 2Q(1|x 1 ) を、(Q(0|x 2 ), Q(1|x 2 )) で賭ける

.         6   ···


              2Q(x1 |x 0 ) · 2Q(x2 |x 1 ) · · · 2Q(xn |x n−1 ) = 2n Q n (x n )
.
              P n を知っている人は、2n P n (x n )

.    [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                                     9 / 30
Cover 先生と私   準備       Cover 先生が提起した未解決問題          ユニバーサルな予測の一般化   まとめ


                             未解決問題 1


    ユニバーサルな賭けの存在
    どのような定常エルゴードな (未知の)P n についても

                  1                     1
                    log[2n Q n (x n )] → log[2n P n (x n )]
                  n                     n
    (n → ∞) となるような計算可能な Q n は存在するか。 .

    存在する:

        P n を知らなくても、P n を知っている人と同程度に勝てる
                  (ユニバーサルデータ圧縮)

                                                              .

 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                   10 / 30
Cover 先生と私    準備      Cover 先生が提起した未解決問題      ユニバーサルな予測の一般化       まとめ


                            未解決問題 2


    ユニバーサルな予測の存在 (その 1)
    どのような定常エルゴードな (未知の)P についても、
    各 x0 ∈ {0, 1} について、
                              −1            −1
                       Q(x0 |x−n ) → P(x0 |x−∞ )

    (n → ∞) となるような Q は存在するか。                              .
    存在する:
         Ornstein 1978 (有限アルファベット)
         Algoet 1992 (一般)


                                                      .
 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                   11 / 30
Cover 先生と私    準備       Cover 先生が提起した未解決問題          ユニバーサルな予測の一般化      まとめ


             証明: (Morvai, Yakowitz, Gy¨rfy, 1996)
                                      o


    0 = λ0 → τ1 → λ1 → τ2 → · · ·

       · · · X−λj−1 −τj · · · X−1−τj X−τj · · · X−λj−1 · · · X−1 X0
                     λj−1                             λj−1

                              τj

                                   λj :=λj−1 +τj



                     1∑
                       k
                                          −1
                         X−τj → Q(X0 = 1|X−∞ )
                     k
                        j=1



 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                       12 / 30
Cover 先生と私     準備       Cover 先生が提起した未解決問題         ユニバーサルな予測の一般化   まとめ


                               未解決問題 2


    ユニバーサルな予測の存在 (その 2)
    どのような定常エルゴードな (未知の)P についても、
    各 xn+1 ∈ {0, 1} について、

                         Q(xn+1 |x n ) → P(xn+1 |x n )

    (n → ∞) となるような Q は存在するか。                                   .
    存在しない:
         Shields, 1991 (Cutting and Stacking)
         Algoet, 1997


                                                           .
 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                    13 / 30
Cover 先生と私       準備           Cover 先生が提起した未解決問題         ユニバーサルな予測の一般化   まとめ


                                          証明

                       s

    状態 s: · · · 1 0 · · · 0 xn+1
                  xn
     
    q(s): 状態 s に初めて到達したときの Q(1|s)
                           {
                             3/4 (q(s) ≤ 1/2)
                 P(1|s) :=
                             1/4 (q(s) > 1/2)

     
    確率 1 でどの状態 s も生じるので、

                           |P(xn+1 |x n ) − Q(xn+1 |x n )| ≥ 1/4

    が確率 1 で無限回生じる。

 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                          14 / 30
Cover 先生と私    準備     Cover 先生が提起した未解決問題               ユニバーサルな予測の一般化   まとめ


             未解決問題 3: ポートフォリオ (賭けの一般化)
    (X0 , X1 ): 非負の値をとる確率変数の組
             (0) (1)  (0)  (1)
    bi = (bi , bi ), bi + bi = 1
                                 (0)   (0)      (1)    (1)
                    (bi , Xi ) := bi Xi      + bi Xi
                                  ∏
    bi : x i−1 に基づいて決めた戦略 =⇒ Sn := n (bi , Xi∏
    ˆ                        ˆ
                                    i=1
                                         ˆ   )
    bi∗ = b : X n の分布に基づいた最適な戦略 =⇒ S ∗ :=      n     ∗
             i                          n      i=1 (bi , Xi )

    問題 3: ユニバーサルなポートフォリオの存在
    どのような定常エルゴードな (未知の)X n の分布についても、

                   1                1   ∗
                      log Sn → log Sn
                           ˆ
                   n                n
    (n → ∞) となるような (b1 , · · · , bn ) は存在するか。
                     ˆ           ˆ

    存在する (→ Elements of Information Theory)
 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                       15 / 30
Cover 先生と私      準備        Cover 先生が提起した未解決問題            ユニバーサルな予測の一般化          まとめ


                  ユニバーサルな予測の Bayes 的方法

    (c0 , c1 ) := (n − c, c) (x n での (0, 1) の頻度)

                                Γ(a + b) Γ(c + a)Γ(n − c + b)
                 Q n (x n ) =            ·
                                Γ(a)Γ(b)     Γ(n + a + b)

    Γ(x + 1) = xΓ(x), x > 0 より、a = b = 1/2 のとき

                                 n−c +a   c +a     c0 + 1/2 c1 + 1/2
    (Q(0|x n ), Q(1|x n )) = (          ,      )=(         ,         )
                                 n+a+b n+a+b         n+1      n+1
    一般には、A = {0, 1, · · · , m − 1} として、

                                                c0 + 1/2        cm−1 + 1/2
       (Q(0|x n ), · · · , Q(m − 1|x n )) = (            ,··· ,            )
                                                n + m/2          n + m/2

    独立でなく、定常エルゴードの場合に拡張することは可能

 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                                16 / 30
Cover 先生と私    準備    Cover 先生が提起した未解決問題     ユニバーサルな予測の一般化          まとめ


                   ユニバーサルな Bayes 測度
    確率変数が有限個の値をとる場合
               ∑
                 Q n (x n ) ≤ 1
                         x n ∈An

                         1    P n (x n )
                           log n n → 1
                         n    Q (x )

    一般の確率変数の場合
    ユニバーサルな Bayes 測度は、どのようになるのか。


             x n が連続の場合や、離散でも連続でもない場合は、
                   どのようにして、xn+1 を予測するのか

    (簡単のため、独立な情報源のみを扱うが、拡張はいつでも可能)
                             .
 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                   17 / 30
                                                     .
Cover 先生と私      準備        Cover 先生が提起した未解決問題           ユニバーサルな予測の一般化             まとめ


             X が確率密度関数 f をもつとき (Ryabko の方法)
    X : X の取りうる値
    x n = x1 · · · xn ∈ X n
    f を複数のヒストグラム f1 , f2 , · · · でそれぞれ近似
    各ヒストグラム Aj を、X を細分化した区間の集合で表現。
    f を近似した fj で、fj (x1 ) · · · fj (xn ) を計算。
                                              .
         A0 := {X }
         Aj+1 が Aj の細分
                                                                      .
    例 1: A0 = {[0, 1)} のとき、下記はこの条件を満足する:
     A1 = {[0, 1/2), [1/2, 1)}
     A2 = {[0, 1/4), [1/4, 1/2), [1/2, 3/4), [3/4, 1)}
     ...
     Aj = {[0, 2−(j−1) ), [2−(j−1) , 2 · 2−(j−1) ), · · · , [(2j−1 − 1)2−(j−1) , 1)}
     ...
 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                                   18 / 30
Cover 先生と私      準備        Cover 先生が提起した未解決問題           ユニバーサルな予測の一般化          まとめ




    B: R の Borel 集合全体
    λ : B → R (Lebesgue 測度, B ∋ a = [b, c) =⇒ λ(a) = c − b)
     
    ヒストグラム Aj で、
    X n ∋ (x1 , · · · , xn ) ∈ (a1 , · · · , an ) ∈ An のとき、
                                                      j
             
              f n (x n ) := f (x ) · · · f (x ) = Pj (a1 ) · · · Pj (an )
              j
                                j 1            j n
                                                        λ(a1 ) . . . λ(an )
              n n               Qjn (a1 , · · · , an )
              g (x ) :=
              j
                                 λ(a1 ) · · · λ(an )




 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                               19 / 30
Cover 先生と私     準備        Cover 先生が提起した未解決問題              ユニバーサルな予測の一般化   まとめ



               ∑
    {ωj }∞ :
         j=1       ωj = 1, ωj > 0,
                                        ∞
                                        ∑
                             n    n
                            g (x ) :=         ωj gjn (x n )
                                        j=1

    {Aj } をどのような f についても、j → ∞ で
                       ∫
               h(f ) := −f (x) log f (x)dλ(x)

    として、h(fj ) → h(f ) となるように選ぶと、

                                 1    f n (x n )
                                   log n n → 0
                                 n    g (x )
    B. Ryabko. IEEE Trans. on Inform. Theory, 55, 9, 2009.

 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                          20 / 30
Cover 先生と私    準備     Cover 先生が提起した未解決問題    ユニバーサルな予測の一般化          まとめ


    確率変数 X に確率密度関数が存在するための必要十分条件


    µ(D): D ∈ B の確率

    確率密度関数が存在する必要十分条件
    以下は、同値 (µ ≪ λ)
         各 D ∈ B で、λ(D) = 0 =⇒ µ(D) = 0
                ∫
                                       dµ
         µ(D) =    f (t)dλ(t) なる B 可測な    := f が存在
                 D                     dλ

                                                         .
    参考: f : R → R が B 可測
    ⇐⇒ 各 D ∈ B について、{x ∈ R|f (x) ∈ D} ∈ B
    (Lebesgue 積分を適用する条件)

                                                     .
 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                   21 / 30
Cover 先生と私      準備        Cover 先生が提起した未解決問題           ユニバーサルな予測の一般化        まとめ


                         一般化確率密度関数の推定

    Radon-Nikodym の定理
    以下は同値 (µ ≪ η):
         各 D ∈ B で、η(D) = 0 =⇒ µ(D) = 0
                ∫
                                       dµ                               .
         µ(D) =    f (t)dη(t) なる F 可測な    := f が存在
                 D                     dη
                                          1
    例 2: µ({k}) > 0, η({k}) :=                  , k ∈ Y := {1, 2, · · · }
                                       k(k + 1)
                                 ∑
                        µ(D) =         f (k)η({k}) , D ⊆ Y          .
                                 k∈D

                        dµ               µ({k})
             µ ≪ η =⇒      (k) = f (k) =        = k(k + 1)µ({k})
                        dη               η({k})

 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                             22 / 30
Cover 先生と私       準備        Cover 先生が提起した未解決問題             ユニバーサルな予測の一般化       まとめ




     B1 := {{1}, {2, 3, · · · }}
     B2 := {{1}, {2}, {3, 4, · · · }}
     ...
     Bk := {{1}, {2}, · · · , {k}, {k + 1, k + 2, · · · }}
     ...
    ヒストグラム Bk で、
    Y n ∋ (y1 , · · · , yn ) ∈ (b1 , · · · , bn ) ∈ Bk のとき、
                                                      n

            
             f (y ) := fk (y1 ) · · · fk (yn ) = Pk (b1 ) · · · Pk (bn )
             n n
             k
                                                        η(b1 ) . . . η(bn )
             n n
                               Qk (b1 , · · · , bn )
                                   n
             gk (y ) :=
                                 λ(b1 ) · · · λ(bn )




 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                               23 / 30
Cover 先生と私     準備      Cover 先生が提起した未解決問題        ユニバーサルな予測の一般化    まとめ




    {Bk } をどのような f についても、k → ∞ で (fk ) → h(f ) となる
    ように選ぶと、
                    1    f n (y n )
                      log n n → 0
                    n    g (y )

                        g n (y n )η({y1 }) · · · η({yn }) が、
             P(y n ) = f n (y n )η({y1 }) · · · η({yn }) の推定になる




 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                   24 / 30
Cover 先生と私       準備       Cover 先生が提起した未解決問題           ユニバーサルな予測の一般化             まとめ


      有限アルファベットの場合も特種ケースとして含まれる
    例 3: Z := {0, 1, · · · , m − 1}

             C0 = {Z}, C1 = C2 = · · · = {{0}, {1}, · · · , {m − 1}}

                        η({0}) = · · · η({m − 1}) = 1/m
    とおけば、µ ≪ η

              z n ∈ C n ⇐⇒ c n ∈ C1 = C2 = · · ·
                                  n    n
                            n n
               n n
               f (z ) = P (c ) ,
              
                         (1/m)n
                                                           ∞
               g n (z n ) = g n (z n ) = · · · = g n (z n ) = ∑ ω g n (z n ) = Q (c )
      =⇒                                                                          n n
               1
              
                             2                                   l l
                                                                                (1/m)n
                                                           l=1
              1    f n (z n ) 1 P n (c n )
      =⇒        log n n = log n n → 0
              n    g (z )     n Q (c )

 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                                   25 / 30
Cover 先生と私      準備        Cover 先生が提起した未解決問題                    ユニバーサルな予測の一般化   まとめ


                                 (X , Y ) ∈ X × Y
    例 4: 例 1 と例 2 の {Aj }, {Bk } から、{Aj × Bk } を構成
     
    Qjk : (Aj × Bk )n の予測確率
     n

             n n n
             fj,k (x , y ) := fj,k (x1 , y1 ) · · · fj,k (xn , yn )
            
            
                                 Pj,k (a1 , b1 ) · · · Pj,k (an , bn )
            
                            =
                               λ(a1 ) . . . λ(an )η(b1 ) . . . η(bn )
            
                                 Qjk ((a1 , b1 ) · · · , (an , bn ))
                                     n
             n n n
             g (x , y ) :=
             jk
                               λ(a1 ) · · · λ(an )η(b1 ) · · · η(bn )
    ∑
      jk ωjk = 1, ωjk > 0,
                                              ∞
                                              ∑
                        g n (x n , y n ) :=         ωjk gjk (x n , y n )
                                                          n

                                              k=1

                               1       f n (x n , y n )
                                 log n n n → 0
                               n    g (x , y )
 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼
                                                                                 26 / 30
Cover 先生と私         準備           Cover 先生が提起した未解決問題           ユニバーサルな予測の一般化         まとめ


                離散や連続を仮定しないユニバーサルな予測
    Suzuki, 2011
    µ ≪ η のとき、ヒストグラムの列 {Aj } をもつ Bayes 測度 g を構
    成すると、h(fj ) → h(f ) を満足する任意の f に対して、

                                     1    f n (u n )                       .
                                       log n n → 0
                                     n    g (u )

    一般化されたユニバーサルな Bayes 測度
                                g n+1 (x n+1 )                    f n+1 (x n+1 )
             g (xn+1 |x n ) =                  → f (xn+1 |x n ) =         .
                                   g n (x n )                        f n (x n )

    各 D ∈ B について
                                              ∫
                                ν(D|x n ) =       g (x|x n )dη(x)
                                              D

 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼            .
                                                                                    27 / 30
Cover 先生と私   準備      Cover 先生が提起した未解決問題    ユニバーサルな予測の一般化          まとめ


         その他の応用例: Bayesian ネットワークの構造推定
X      X      X
              (1) 
 (2) 
 (3) 
                               u
                               e
e
                  Y  Z Y EZ Y    Z

More Related Content

What's hot

オンライン凸最適化と線形識別モデル学習の最前線_IBIS2011
オンライン凸最適化と線形識別モデル学習の最前線_IBIS2011オンライン凸最適化と線形識別モデル学習の最前線_IBIS2011
オンライン凸最適化と線形識別モデル学習の最前線_IBIS2011Preferred Networks
 
パターン認識 05 ロジスティック回帰
パターン認識 05 ロジスティック回帰パターン認識 05 ロジスティック回帰
パターン認識 05 ロジスティック回帰sleipnir002
 
今さら聞けないカーネル法とサポートベクターマシン
今さら聞けないカーネル法とサポートベクターマシン今さら聞けないカーネル法とサポートベクターマシン
今さら聞けないカーネル法とサポートベクターマシンShinya Shimizu
 
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介Deep Learning JP
 
13.2 隠れマルコフモデル
13.2 隠れマルコフモデル13.2 隠れマルコフモデル
13.2 隠れマルコフモデルshow you
 
第8章 ガウス過程回帰による異常検知
第8章 ガウス過程回帰による異常検知第8章 ガウス過程回帰による異常検知
第8章 ガウス過程回帰による異常検知Chika Inoshita
 
TokyoNLP#7 きれいなジャイアンのカカカカ☆カーネル法入門-C++
TokyoNLP#7 きれいなジャイアンのカカカカ☆カーネル法入門-C++TokyoNLP#7 きれいなジャイアンのカカカカ☆カーネル法入門-C++
TokyoNLP#7 きれいなジャイアンのカカカカ☆カーネル法入門-C++sleepy_yoshi
 
Crfと素性テンプレート
Crfと素性テンプレートCrfと素性テンプレート
Crfと素性テンプレートKei Uchiumi
 
混合ガウスモデルとEMアルゴリスム
混合ガウスモデルとEMアルゴリスム混合ガウスモデルとEMアルゴリスム
混合ガウスモデルとEMアルゴリスム貴之 八木
 
Sparse estimation tutorial 2014
Sparse estimation tutorial 2014Sparse estimation tutorial 2014
Sparse estimation tutorial 2014Taiji Suzuki
 
はじめてのパターン認識輪読会 10章後半
はじめてのパターン認識輪読会 10章後半はじめてのパターン認識輪読会 10章後半
はじめてのパターン認識輪読会 10章後半koba cky
 

What's hot (17)

分布 isseing333
分布 isseing333分布 isseing333
分布 isseing333
 
PRML chapter7
PRML chapter7PRML chapter7
PRML chapter7
 
演習発表 Sari v.1.1
演習発表 Sari v.1.1演習発表 Sari v.1.1
演習発表 Sari v.1.1
 
オンライン凸最適化と線形識別モデル学習の最前線_IBIS2011
オンライン凸最適化と線形識別モデル学習の最前線_IBIS2011オンライン凸最適化と線形識別モデル学習の最前線_IBIS2011
オンライン凸最適化と線形識別モデル学習の最前線_IBIS2011
 
Prml07
Prml07Prml07
Prml07
 
パターン認識 05 ロジスティック回帰
パターン認識 05 ロジスティック回帰パターン認識 05 ロジスティック回帰
パターン認識 05 ロジスティック回帰
 
今さら聞けないカーネル法とサポートベクターマシン
今さら聞けないカーネル法とサポートベクターマシン今さら聞けないカーネル法とサポートベクターマシン
今さら聞けないカーネル法とサポートベクターマシン
 
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
 
演習発表 Sari v.1.2
演習発表 Sari v.1.2演習発表 Sari v.1.2
演習発表 Sari v.1.2
 
13.2 隠れマルコフモデル
13.2 隠れマルコフモデル13.2 隠れマルコフモデル
13.2 隠れマルコフモデル
 
Oshasta em
Oshasta emOshasta em
Oshasta em
 
第8章 ガウス過程回帰による異常検知
第8章 ガウス過程回帰による異常検知第8章 ガウス過程回帰による異常検知
第8章 ガウス過程回帰による異常検知
 
TokyoNLP#7 きれいなジャイアンのカカカカ☆カーネル法入門-C++
TokyoNLP#7 きれいなジャイアンのカカカカ☆カーネル法入門-C++TokyoNLP#7 きれいなジャイアンのカカカカ☆カーネル法入門-C++
TokyoNLP#7 きれいなジャイアンのカカカカ☆カーネル法入門-C++
 
Crfと素性テンプレート
Crfと素性テンプレートCrfと素性テンプレート
Crfと素性テンプレート
 
混合ガウスモデルとEMアルゴリスム
混合ガウスモデルとEMアルゴリスム混合ガウスモデルとEMアルゴリスム
混合ガウスモデルとEMアルゴリスム
 
Sparse estimation tutorial 2014
Sparse estimation tutorial 2014Sparse estimation tutorial 2014
Sparse estimation tutorial 2014
 
はじめてのパターン認識輪読会 10章後半
はじめてのパターン認識輪読会 10章後半はじめてのパターン認識輪読会 10章後半
はじめてのパターン認識輪読会 10章後半
 

Similar to 若手研究者のための招待講演会

Integrating different data types by regularized unsupervised multiple kernel...
Integrating different data types by regularized  unsupervised multiple kernel...Integrating different data types by regularized  unsupervised multiple kernel...
Integrating different data types by regularized unsupervised multiple kernel...Y-h Taguchi
 
Shunsuke Horii
Shunsuke HoriiShunsuke Horii
Shunsuke HoriiSuurist
 
最近傍探索と直積量子化(Nearest neighbor search and Product Quantization)
最近傍探索と直積量子化(Nearest neighbor search and Product Quantization)最近傍探索と直積量子化(Nearest neighbor search and Product Quantization)
最近傍探索と直積量子化(Nearest neighbor search and Product Quantization)Nguyen Tuan
 
東京大学工学部計数工学科応用音響学 D2 Clustering
東京大学工学部計数工学科応用音響学 D2 Clustering東京大学工学部計数工学科応用音響学 D2 Clustering
東京大学工学部計数工学科応用音響学 D2 ClusteringHiroshi Ono
 
ウィナーフィルタと適応フィルタ
ウィナーフィルタと適応フィルタウィナーフィルタと適応フィルタ
ウィナーフィルタと適応フィルタToshihisa Tanaka
 
経験過程
経験過程経験過程
経験過程hoxo_m
 
確率・統計の基礎勉強会 (1)
確率・統計の基礎勉強会 (1)確率・統計の基礎勉強会 (1)
確率・統計の基礎勉強会 (1)Hiroaki Tanaka
 
Numpy scipyで独立成分分析
Numpy scipyで独立成分分析Numpy scipyで独立成分分析
Numpy scipyで独立成分分析Shintaro Fukushima
 
Introduction to Categorical Programming (Revised)
Introduction to Categorical Programming (Revised)Introduction to Categorical Programming (Revised)
Introduction to Categorical Programming (Revised)Masahiro Sakai
 
2014年度秋学期 応用数学(解析) 第2部・基本的な微分方程式 / 第5回 微分方程式とは,変数分離形 (2014. 10. 23)
2014年度秋学期 応用数学(解析) 第2部・基本的な微分方程式 / 第5回 微分方程式とは,変数分離形 (2014. 10. 23)2014年度秋学期 応用数学(解析) 第2部・基本的な微分方程式 / 第5回 微分方程式とは,変数分離形 (2014. 10. 23)
2014年度秋学期 応用数学(解析) 第2部・基本的な微分方程式 / 第5回 微分方程式とは,変数分離形 (2014. 10. 23)Akira Asano
 
様々な全域木問題
様々な全域木問題様々な全域木問題
様々な全域木問題tmaehara
 
070 統計的推測 母集団と推定
070 統計的推測 母集団と推定070 統計的推測 母集団と推定
070 統計的推測 母集団と推定t2tarumi
 
050 確率と確率分布
050 確率と確率分布050 確率と確率分布
050 確率と確率分布t2tarumi
 
wq-1. ポアソン分布、指数分布、アーラン分布
wq-1. ポアソン分布、指数分布、アーラン分布wq-1. ポアソン分布、指数分布、アーラン分布
wq-1. ポアソン分布、指数分布、アーラン分布kunihikokaneko1
 
x^2+ny^2の形で表せる素数の法則と類体論
x^2+ny^2の形で表せる素数の法則と類体論x^2+ny^2の形で表せる素数の法則と類体論
x^2+ny^2の形で表せる素数の法則と類体論Junpei Tsuji
 
データ圧縮
データ圧縮データ圧縮
データ圧縮Joe Suzuki
 
量子アニーリング解説 1
量子アニーリング解説 1量子アニーリング解説 1
量子アニーリング解説 1Kohta Ishikawa
 
ユニバーサルなベイズ測度について
ユニバーサルなベイズ測度についてユニバーサルなベイズ測度について
ユニバーサルなベイズ測度についてJoe Suzuki
 

Similar to 若手研究者のための招待講演会 (20)

Integrating different data types by regularized unsupervised multiple kernel...
Integrating different data types by regularized  unsupervised multiple kernel...Integrating different data types by regularized  unsupervised multiple kernel...
Integrating different data types by regularized unsupervised multiple kernel...
 
Shunsuke Horii
Shunsuke HoriiShunsuke Horii
Shunsuke Horii
 
PRML 8.4-8.4.3
PRML 8.4-8.4.3 PRML 8.4-8.4.3
PRML 8.4-8.4.3
 
最近傍探索と直積量子化(Nearest neighbor search and Product Quantization)
最近傍探索と直積量子化(Nearest neighbor search and Product Quantization)最近傍探索と直積量子化(Nearest neighbor search and Product Quantization)
最近傍探索と直積量子化(Nearest neighbor search and Product Quantization)
 
東京大学工学部計数工学科応用音響学 D2 Clustering
東京大学工学部計数工学科応用音響学 D2 Clustering東京大学工学部計数工学科応用音響学 D2 Clustering
東京大学工学部計数工学科応用音響学 D2 Clustering
 
ウィナーフィルタと適応フィルタ
ウィナーフィルタと適応フィルタウィナーフィルタと適応フィルタ
ウィナーフィルタと適応フィルタ
 
経験過程
経験過程経験過程
経験過程
 
確率・統計の基礎勉強会 (1)
確率・統計の基礎勉強会 (1)確率・統計の基礎勉強会 (1)
確率・統計の基礎勉強会 (1)
 
Numpy scipyで独立成分分析
Numpy scipyで独立成分分析Numpy scipyで独立成分分析
Numpy scipyで独立成分分析
 
Introduction to Categorical Programming (Revised)
Introduction to Categorical Programming (Revised)Introduction to Categorical Programming (Revised)
Introduction to Categorical Programming (Revised)
 
2014年度秋学期 応用数学(解析) 第2部・基本的な微分方程式 / 第5回 微分方程式とは,変数分離形 (2014. 10. 23)
2014年度秋学期 応用数学(解析) 第2部・基本的な微分方程式 / 第5回 微分方程式とは,変数分離形 (2014. 10. 23)2014年度秋学期 応用数学(解析) 第2部・基本的な微分方程式 / 第5回 微分方程式とは,変数分離形 (2014. 10. 23)
2014年度秋学期 応用数学(解析) 第2部・基本的な微分方程式 / 第5回 微分方程式とは,変数分離形 (2014. 10. 23)
 
様々な全域木問題
様々な全域木問題様々な全域木問題
様々な全域木問題
 
070 統計的推測 母集団と推定
070 統計的推測 母集団と推定070 統計的推測 母集団と推定
070 統計的推測 母集団と推定
 
Chapter9 2
Chapter9 2Chapter9 2
Chapter9 2
 
050 確率と確率分布
050 確率と確率分布050 確率と確率分布
050 確率と確率分布
 
wq-1. ポアソン分布、指数分布、アーラン分布
wq-1. ポアソン分布、指数分布、アーラン分布wq-1. ポアソン分布、指数分布、アーラン分布
wq-1. ポアソン分布、指数分布、アーラン分布
 
x^2+ny^2の形で表せる素数の法則と類体論
x^2+ny^2の形で表せる素数の法則と類体論x^2+ny^2の形で表せる素数の法則と類体論
x^2+ny^2の形で表せる素数の法則と類体論
 
データ圧縮
データ圧縮データ圧縮
データ圧縮
 
量子アニーリング解説 1
量子アニーリング解説 1量子アニーリング解説 1
量子アニーリング解説 1
 
ユニバーサルなベイズ測度について
ユニバーサルなベイズ測度についてユニバーサルなベイズ測度について
ユニバーサルなベイズ測度について
 

More from Joe Suzuki

RとPythonを比較する
RとPythonを比較するRとPythonを比較する
RとPythonを比較するJoe Suzuki
 
R集会@統数研
R集会@統数研R集会@統数研
R集会@統数研Joe Suzuki
 
E-learning Development of Statistics and in Duex: Practical Approaches and Th...
E-learning Development of Statistics and in Duex: Practical Approaches and Th...E-learning Development of Statistics and in Duex: Practical Approaches and Th...
E-learning Development of Statistics and in Duex: Practical Approaches and Th...Joe Suzuki
 
分枝限定法でモデル選択の計算量を低減する
分枝限定法でモデル選択の計算量を低減する分枝限定法でモデル選択の計算量を低減する
分枝限定法でモデル選択の計算量を低減するJoe Suzuki
 
連続変量を含む条件付相互情報量の推定
連続変量を含む条件付相互情報量の推定連続変量を含む条件付相互情報量の推定
連続変量を含む条件付相互情報量の推定Joe Suzuki
 
E-learning Design and Development for Data Science in Osaka University
E-learning Design and Development for Data Science in Osaka UniversityE-learning Design and Development for Data Science in Osaka University
E-learning Design and Development for Data Science in Osaka UniversityJoe Suzuki
 
AMBN2017 サテライトワークショップ
AMBN2017 サテライトワークショップAMBN2017 サテライトワークショップ
AMBN2017 サテライトワークショップJoe Suzuki
 
CRAN Rパッケージ BNSLの概要
CRAN Rパッケージ BNSLの概要CRAN Rパッケージ BNSLの概要
CRAN Rパッケージ BNSLの概要Joe Suzuki
 
Forest Learning from Data
Forest Learning from DataForest Learning from Data
Forest Learning from DataJoe Suzuki
 
A Bayesian Approach to Data Compression
A Bayesian Approach to Data CompressionA Bayesian Approach to Data Compression
A Bayesian Approach to Data CompressionJoe Suzuki
 
A Conjecture on Strongly Consistent Learning
A Conjecture on Strongly Consistent LearningA Conjecture on Strongly Consistent Learning
A Conjecture on Strongly Consistent LearningJoe Suzuki
 
A Generalization of the Chow-Liu Algorithm and its Applications to Artificial...
A Generalization of the Chow-Liu Algorithm and its Applications to Artificial...A Generalization of the Chow-Liu Algorithm and its Applications to Artificial...
A Generalization of the Chow-Liu Algorithm and its Applications to Artificial...Joe Suzuki
 
A Generalization of Nonparametric Estimation and On-Line Prediction for Stati...
A Generalization of Nonparametric Estimation and On-Line Prediction for Stati...A Generalization of Nonparametric Estimation and On-Line Prediction for Stati...
A Generalization of Nonparametric Estimation and On-Line Prediction for Stati...Joe Suzuki
 
研究紹介(学生向け)
研究紹介(学生向け)研究紹介(学生向け)
研究紹介(学生向け)Joe Suzuki
 
Bayesian Criteria based on Universal Measures
Bayesian Criteria based on Universal MeasuresBayesian Criteria based on Universal Measures
Bayesian Criteria based on Universal MeasuresJoe Suzuki
 
MDL/Bayesian Criteria based on Universal Coding/Measure
MDL/Bayesian Criteria based on Universal Coding/MeasureMDL/Bayesian Criteria based on Universal Coding/Measure
MDL/Bayesian Criteria based on Universal Coding/MeasureJoe Suzuki
 
The Universal Measure for General Sources and its Application to MDL/Bayesian...
The Universal Measure for General Sources and its Application to MDL/Bayesian...The Universal Measure for General Sources and its Application to MDL/Bayesian...
The Universal Measure for General Sources and its Application to MDL/Bayesian...Joe Suzuki
 
Universal Prediction without assuming either Discrete or Continuous
Universal Prediction without assuming either Discrete or ContinuousUniversal Prediction without assuming either Discrete or Continuous
Universal Prediction without assuming either Discrete or ContinuousJoe Suzuki
 
Bayesian network structure estimation based on the Bayesian/MDL criteria when...
Bayesian network structure estimation based on the Bayesian/MDL criteria when...Bayesian network structure estimation based on the Bayesian/MDL criteria when...
Bayesian network structure estimation based on the Bayesian/MDL criteria when...Joe Suzuki
 

More from Joe Suzuki (20)

RとPythonを比較する
RとPythonを比較するRとPythonを比較する
RとPythonを比較する
 
R集会@統数研
R集会@統数研R集会@統数研
R集会@統数研
 
E-learning Development of Statistics and in Duex: Practical Approaches and Th...
E-learning Development of Statistics and in Duex: Practical Approaches and Th...E-learning Development of Statistics and in Duex: Practical Approaches and Th...
E-learning Development of Statistics and in Duex: Practical Approaches and Th...
 
分枝限定法でモデル選択の計算量を低減する
分枝限定法でモデル選択の計算量を低減する分枝限定法でモデル選択の計算量を低減する
分枝限定法でモデル選択の計算量を低減する
 
連続変量を含む条件付相互情報量の推定
連続変量を含む条件付相互情報量の推定連続変量を含む条件付相互情報量の推定
連続変量を含む条件付相互情報量の推定
 
E-learning Design and Development for Data Science in Osaka University
E-learning Design and Development for Data Science in Osaka UniversityE-learning Design and Development for Data Science in Osaka University
E-learning Design and Development for Data Science in Osaka University
 
UAI 2017
UAI 2017UAI 2017
UAI 2017
 
AMBN2017 サテライトワークショップ
AMBN2017 サテライトワークショップAMBN2017 サテライトワークショップ
AMBN2017 サテライトワークショップ
 
CRAN Rパッケージ BNSLの概要
CRAN Rパッケージ BNSLの概要CRAN Rパッケージ BNSLの概要
CRAN Rパッケージ BNSLの概要
 
Forest Learning from Data
Forest Learning from DataForest Learning from Data
Forest Learning from Data
 
A Bayesian Approach to Data Compression
A Bayesian Approach to Data CompressionA Bayesian Approach to Data Compression
A Bayesian Approach to Data Compression
 
A Conjecture on Strongly Consistent Learning
A Conjecture on Strongly Consistent LearningA Conjecture on Strongly Consistent Learning
A Conjecture on Strongly Consistent Learning
 
A Generalization of the Chow-Liu Algorithm and its Applications to Artificial...
A Generalization of the Chow-Liu Algorithm and its Applications to Artificial...A Generalization of the Chow-Liu Algorithm and its Applications to Artificial...
A Generalization of the Chow-Liu Algorithm and its Applications to Artificial...
 
A Generalization of Nonparametric Estimation and On-Line Prediction for Stati...
A Generalization of Nonparametric Estimation and On-Line Prediction for Stati...A Generalization of Nonparametric Estimation and On-Line Prediction for Stati...
A Generalization of Nonparametric Estimation and On-Line Prediction for Stati...
 
研究紹介(学生向け)
研究紹介(学生向け)研究紹介(学生向け)
研究紹介(学生向け)
 
Bayesian Criteria based on Universal Measures
Bayesian Criteria based on Universal MeasuresBayesian Criteria based on Universal Measures
Bayesian Criteria based on Universal Measures
 
MDL/Bayesian Criteria based on Universal Coding/Measure
MDL/Bayesian Criteria based on Universal Coding/MeasureMDL/Bayesian Criteria based on Universal Coding/Measure
MDL/Bayesian Criteria based on Universal Coding/Measure
 
The Universal Measure for General Sources and its Application to MDL/Bayesian...
The Universal Measure for General Sources and its Application to MDL/Bayesian...The Universal Measure for General Sources and its Application to MDL/Bayesian...
The Universal Measure for General Sources and its Application to MDL/Bayesian...
 
Universal Prediction without assuming either Discrete or Continuous
Universal Prediction without assuming either Discrete or ContinuousUniversal Prediction without assuming either Discrete or Continuous
Universal Prediction without assuming either Discrete or Continuous
 
Bayesian network structure estimation based on the Bayesian/MDL criteria when...
Bayesian network structure estimation based on the Bayesian/MDL criteria when...Bayesian network structure estimation based on the Bayesian/MDL criteria when...
Bayesian network structure estimation based on the Bayesian/MDL criteria when...
 

若手研究者のための招待講演会

  • 1. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ [招待講演] Cover 先生の研究室で思い出に残っているテーマ ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 鈴木 譲 大阪大学 2012 年 12 月 11 日 SITA 2012 (別府) [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 1 / 30
  • 2. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ Road Map 1 Cover 先生と私 2 準備 3 Cover 先生が提起した未解決問題 4 ユニバーサルな予測の一般化 5 まとめ [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 2 / 30
  • 3. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ 予測とは? x n := (x1 , · · · , xn ) ∈ {0, 1}n から、xn+1 ∈ {0, 1} を予測 . x n のもとでの xn+1 の確率の推定値 Q(xn+1 |x n ) を構成 たとえば、 . 1 1 1 Q(xn+1 |x n ) = ( , ) 2 2 . n−c c 2 c を x n での xn+1 の頻度として、Q(xn+1 |x n ) = ( , ) n n . n−c +1 c +1 3 Q(xn+1 |x n ) = ( , ) n+2 n+2 ねらい: 真の確率 P(xn+1 |x n ) に収束させたい . Q(xn+1 |x n ) −→ P(xn+1 |x n ) (n → ∞) [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 3 / 30
  • 4. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ 符号化・符号語・一意復号可能 A: 有限集合 (有限アルファベット) φ : An → {0, 1}∗ 符号化 l : An → N+ が φ の長さ n) 符号語 φ(x n ) ∈ {0, 1}l(x となるときの、x n → l(x n ) の対応   l が一意復号可能な符号化の長さ . ⇐⇒ l∑が瞬時復号可能な符号化の長さ 2−l(x ) ≤ 1 n ⇐⇒ . x n ∈An (→ Elements of Information Theory) [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 4 / 30
  • 5. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ エントロピー P n : x n ∈ An の確率 (定常エルゴード) 1∑ H := lim −P(x n ) log P(x n ) (エントロピー) n→∞ n n x Shannon-McMillan-Breiman の定理 1 確率 1 で、− log P n (x n ) → H (n → ∞) n 証明 (独立のときのみ): P n (x n ) = P(x1 ) · · · P(xn ) . 1∑ n 1 − log P (x ) = n n − log P(xi ) → E [− log P(X )] = H n n i=1 . (大数の強法則) [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 5 / 30
  • 6. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ ユニバーサルデータ圧縮 例: l(x n ) := ⌈− log P n (x n )⌉ ∑ 2−l(x n ) ≤1 x n ∈An l(x n ) →H n は、確率 P n が未知だと、長さ l を構成できない。 ユニバーサルデータ圧縮 P n が未知でも、l(x n ) := − log Q n (x n ) が上記 2 条件を満足 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 6 / 30
  • 7. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ 例: Bayes 符号 2 進アルファベット A = {0, 1}、独立情報源、0 ≤ θ ≤ 1 として ∫ Q n (x n ) = w (θ)P(x n |θ)dθ a, b > 0, c を x n ∈ An における xi = 1 の頻度として、 Γ(a + b) a−1 w (θ) = θ (1 − θ)b−1 , P(x n |θ) = θc (1 − θ)n−c Γ(a)Γ(b) Γ(a + b) Γ(c + a)Γ(n − c + b) ⇐⇒ Q(x n ) = · Γ(a)Γ(b) Γ(n + a + b) a = b = 1/2 (Krichevsky-Trofimov) と Stirling の公式から、 1 − log Q n (x n ) → H n [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 7 / 30
  • 8. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ ユニバーサル性 1 − log P n (x n ) → H n 1 − log Q n (x n ) → H n Q n がユニバーサルな Bayes 測度 すべての P n について、 1 P n (x n ) log n n → 0 n Q (x ) 有限アルファベット A = {0, 1, · · · , m − 1} 情報源が定常エルゴード . [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 8 / 30
  • 9. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ 1975 年にモスクワで、Cover 先生が提起した未解決問題 1 ドル賭けて、勝てば 2 ドル、負ければ戻ってこない   A = {0, 1}, P n は未知 1 1 を、(Q(0|x 0 ), Q(1|x 0 )) で賭ける . 2 x1 = 0 3 1 → 2Q(0|x 0 ) を、(Q(0|x 1 ), Q(1|x 1 )) で賭ける . 4 x2 = 1 5 2Q(0|x 0 ) → 2Q(0|x 0 ) · 2Q(1|x 1 ) を、(Q(0|x 2 ), Q(1|x 2 )) で賭ける . 6 ··· 2Q(x1 |x 0 ) · 2Q(x2 |x 1 ) · · · 2Q(xn |x n−1 ) = 2n Q n (x n ) . P n を知っている人は、2n P n (x n ) . [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 9 / 30
  • 10. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ 未解決問題 1 ユニバーサルな賭けの存在 どのような定常エルゴードな (未知の)P n についても 1 1 log[2n Q n (x n )] → log[2n P n (x n )] n n (n → ∞) となるような計算可能な Q n は存在するか。 . 存在する: P n を知らなくても、P n を知っている人と同程度に勝てる (ユニバーサルデータ圧縮) . [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 10 / 30
  • 11. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ 未解決問題 2 ユニバーサルな予測の存在 (その 1) どのような定常エルゴードな (未知の)P についても、 各 x0 ∈ {0, 1} について、 −1 −1 Q(x0 |x−n ) → P(x0 |x−∞ ) (n → ∞) となるような Q は存在するか。 . 存在する: Ornstein 1978 (有限アルファベット) Algoet 1992 (一般) . [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 11 / 30
  • 12. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ 証明: (Morvai, Yakowitz, Gy¨rfy, 1996) o 0 = λ0 → τ1 → λ1 → τ2 → · · · · · · X−λj−1 −τj · · · X−1−τj X−τj · · · X−λj−1 · · · X−1 X0 λj−1 λj−1 τj λj :=λj−1 +τj 1∑ k −1 X−τj → Q(X0 = 1|X−∞ ) k j=1 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 12 / 30
  • 13. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ 未解決問題 2 ユニバーサルな予測の存在 (その 2) どのような定常エルゴードな (未知の)P についても、 各 xn+1 ∈ {0, 1} について、 Q(xn+1 |x n ) → P(xn+1 |x n ) (n → ∞) となるような Q は存在するか。 . 存在しない: Shields, 1991 (Cutting and Stacking) Algoet, 1997 . [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 13 / 30
  • 14. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ 証明 s 状態 s: · · · 1 0 · · · 0 xn+1 xn   q(s): 状態 s に初めて到達したときの Q(1|s) { 3/4 (q(s) ≤ 1/2) P(1|s) := 1/4 (q(s) > 1/2)   確率 1 でどの状態 s も生じるので、 |P(xn+1 |x n ) − Q(xn+1 |x n )| ≥ 1/4 が確率 1 で無限回生じる。 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 14 / 30
  • 15. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ 未解決問題 3: ポートフォリオ (賭けの一般化) (X0 , X1 ): 非負の値をとる確率変数の組 (0) (1) (0) (1) bi = (bi , bi ), bi + bi = 1 (0) (0) (1) (1) (bi , Xi ) := bi Xi + bi Xi ∏ bi : x i−1 に基づいて決めた戦略 =⇒ Sn := n (bi , Xi∏ ˆ ˆ i=1 ˆ ) bi∗ = b : X n の分布に基づいた最適な戦略 =⇒ S ∗ := n ∗ i n i=1 (bi , Xi ) 問題 3: ユニバーサルなポートフォリオの存在 どのような定常エルゴードな (未知の)X n の分布についても、 1 1 ∗ log Sn → log Sn ˆ n n (n → ∞) となるような (b1 , · · · , bn ) は存在するか。 ˆ ˆ 存在する (→ Elements of Information Theory) [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 15 / 30
  • 16. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ ユニバーサルな予測の Bayes 的方法 (c0 , c1 ) := (n − c, c) (x n での (0, 1) の頻度) Γ(a + b) Γ(c + a)Γ(n − c + b) Q n (x n ) = · Γ(a)Γ(b) Γ(n + a + b) Γ(x + 1) = xΓ(x), x > 0 より、a = b = 1/2 のとき n−c +a c +a c0 + 1/2 c1 + 1/2 (Q(0|x n ), Q(1|x n )) = ( , )=( , ) n+a+b n+a+b n+1 n+1 一般には、A = {0, 1, · · · , m − 1} として、 c0 + 1/2 cm−1 + 1/2 (Q(0|x n ), · · · , Q(m − 1|x n )) = ( ,··· , ) n + m/2 n + m/2 独立でなく、定常エルゴードの場合に拡張することは可能 [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 16 / 30
  • 17. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ ユニバーサルな Bayes 測度 確率変数が有限個の値をとる場合 ∑ Q n (x n ) ≤ 1 x n ∈An 1 P n (x n ) log n n → 1 n Q (x ) 一般の確率変数の場合 ユニバーサルな Bayes 測度は、どのようになるのか。 x n が連続の場合や、離散でも連続でもない場合は、 どのようにして、xn+1 を予測するのか (簡単のため、独立な情報源のみを扱うが、拡張はいつでも可能) . [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 17 / 30 .
  • 18. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ X が確率密度関数 f をもつとき (Ryabko の方法) X : X の取りうる値 x n = x1 · · · xn ∈ X n f を複数のヒストグラム f1 , f2 , · · · でそれぞれ近似 各ヒストグラム Aj を、X を細分化した区間の集合で表現。 f を近似した fj で、fj (x1 ) · · · fj (xn ) を計算。 . A0 := {X } Aj+1 が Aj の細分 . 例 1: A0 = {[0, 1)} のとき、下記はこの条件を満足する: A1 = {[0, 1/2), [1/2, 1)} A2 = {[0, 1/4), [1/4, 1/2), [1/2, 3/4), [3/4, 1)} ... Aj = {[0, 2−(j−1) ), [2−(j−1) , 2 · 2−(j−1) ), · · · , [(2j−1 − 1)2−(j−1) , 1)} ... [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 18 / 30
  • 19. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ B: R の Borel 集合全体 λ : B → R (Lebesgue 測度, B ∋ a = [b, c) =⇒ λ(a) = c − b)   ヒストグラム Aj で、 X n ∋ (x1 , · · · , xn ) ∈ (a1 , · · · , an ) ∈ An のとき、 j   f n (x n ) := f (x ) · · · f (x ) = Pj (a1 ) · · · Pj (an )  j  j 1 j n λ(a1 ) . . . λ(an )  n n Qjn (a1 , · · · , an )  g (x ) :=  j λ(a1 ) · · · λ(an ) [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 19 / 30
  • 20. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ ∑ {ωj }∞ : j=1 ωj = 1, ωj > 0, ∞ ∑ n n g (x ) := ωj gjn (x n ) j=1 {Aj } をどのような f についても、j → ∞ で ∫ h(f ) := −f (x) log f (x)dλ(x) として、h(fj ) → h(f ) となるように選ぶと、 1 f n (x n ) log n n → 0 n g (x ) B. Ryabko. IEEE Trans. on Inform. Theory, 55, 9, 2009. [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 20 / 30
  • 21. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ 確率変数 X に確率密度関数が存在するための必要十分条件 µ(D): D ∈ B の確率 確率密度関数が存在する必要十分条件 以下は、同値 (µ ≪ λ) 各 D ∈ B で、λ(D) = 0 =⇒ µ(D) = 0 ∫ dµ µ(D) = f (t)dλ(t) なる B 可測な := f が存在 D dλ   . 参考: f : R → R が B 可測 ⇐⇒ 各 D ∈ B について、{x ∈ R|f (x) ∈ D} ∈ B (Lebesgue 積分を適用する条件) . [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 21 / 30
  • 22. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ 一般化確率密度関数の推定 Radon-Nikodym の定理 以下は同値 (µ ≪ η): 各 D ∈ B で、η(D) = 0 =⇒ µ(D) = 0 ∫ dµ . µ(D) = f (t)dη(t) なる F 可測な := f が存在 D dη 1 例 2: µ({k}) > 0, η({k}) := , k ∈ Y := {1, 2, · · · } k(k + 1) ∑ µ(D) = f (k)η({k}) , D ⊆ Y . k∈D dµ µ({k}) µ ≪ η =⇒ (k) = f (k) = = k(k + 1)µ({k}) dη η({k}) [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 22 / 30
  • 23. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ B1 := {{1}, {2, 3, · · · }} B2 := {{1}, {2}, {3, 4, · · · }} ... Bk := {{1}, {2}, · · · , {k}, {k + 1, k + 2, · · · }} ... ヒストグラム Bk で、 Y n ∋ (y1 , · · · , yn ) ∈ (b1 , · · · , bn ) ∈ Bk のとき、 n   f (y ) := fk (y1 ) · · · fk (yn ) = Pk (b1 ) · · · Pk (bn )  n n  k η(b1 ) . . . η(bn )  n n  Qk (b1 , · · · , bn ) n  gk (y ) := λ(b1 ) · · · λ(bn ) [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 23 / 30
  • 24. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ {Bk } をどのような f についても、k → ∞ で (fk ) → h(f ) となる ように選ぶと、 1 f n (y n ) log n n → 0 n g (y ) g n (y n )η({y1 }) · · · η({yn }) が、 P(y n ) = f n (y n )η({y1 }) · · · η({yn }) の推定になる [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 24 / 30
  • 25. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ 有限アルファベットの場合も特種ケースとして含まれる 例 3: Z := {0, 1, · · · , m − 1} C0 = {Z}, C1 = C2 = · · · = {{0}, {1}, · · · , {m − 1}} η({0}) = · · · η({m − 1}) = 1/m とおけば、µ ≪ η z n ∈ C n ⇐⇒ c n ∈ C1 = C2 = · · · n n  n n  n n  f (z ) = P (c ) ,   (1/m)n ∞  g n (z n ) = g n (z n ) = · · · = g n (z n ) = ∑ ω g n (z n ) = Q (c ) =⇒ n n  1   2 l l (1/m)n l=1 1 f n (z n ) 1 P n (c n ) =⇒ log n n = log n n → 0 n g (z ) n Q (c ) [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 25 / 30
  • 26. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ (X , Y ) ∈ X × Y 例 4: 例 1 と例 2 の {Aj }, {Bk } から、{Aj × Bk } を構成   Qjk : (Aj × Bk )n の予測確率 n  n n n  fj,k (x , y ) := fj,k (x1 , y1 ) · · · fj,k (xn , yn )    Pj,k (a1 , b1 ) · · · Pj,k (an , bn )  = λ(a1 ) . . . λ(an )η(b1 ) . . . η(bn )   Qjk ((a1 , b1 ) · · · , (an , bn )) n  n n n  g (x , y ) :=  jk λ(a1 ) · · · λ(an )η(b1 ) · · · η(bn ) ∑ jk ωjk = 1, ωjk > 0, ∞ ∑ g n (x n , y n ) := ωjk gjk (x n , y n ) n k=1 1 f n (x n , y n ) log n n n → 0 n g (x , y ) [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 26 / 30
  • 27. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ 離散や連続を仮定しないユニバーサルな予測 Suzuki, 2011 µ ≪ η のとき、ヒストグラムの列 {Aj } をもつ Bayes 測度 g を構 成すると、h(fj ) → h(f ) を満足する任意の f に対して、 1 f n (u n ) . log n n → 0 n g (u ) 一般化されたユニバーサルな Bayes 測度 g n+1 (x n+1 ) f n+1 (x n+1 ) g (xn+1 |x n ) = → f (xn+1 |x n ) = . g n (x n ) f n (x n ) 各 D ∈ B について ∫ ν(D|x n ) = g (x|x n )dη(x) D [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ . 27 / 30
  • 28. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ その他の応用例: Bayesian ネットワークの構造推定
  • 29. X X X (1) (2) (3) u e
  • 30. e Y Z Y EZ Y Z
  • 31. X X X (4) (5) (6) ¡ ¡ e ! ¡ ¡ ¡
  • 32. e ¡ Y Z Y Z Y EZ
  • 33. X X X (7) (8) (9) e u ¡ e ! u ¡ ¡ e
  • 34. e ¡ Y ' Z Y Z Y ' Z
  • 35. X X (10) e (11) ¡ e
  • 36. e
  • 37. ¡ … e EZ Y E Z Y [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 28 / 30
  • 38. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ (1)-(11) の構造の同定 p1 , · · · , p11 : 構造の事前確率 p1 g n (x n )g n (y n )g n (z n ), p2 g n (x n )g n (y n , z n ), p3 g n (y n )g n (z n , X ), p4 g n (z n )g n (x n , y n ), g n (x n , y n )g n (X , z n ) g n (x n , y n )g n (y n , z n ) g n (x n , z n )g n (y n , z n ) p5 , p6 , p7 , g n (x n ) g n (y n ) g n (z n ) g n (y n )g n (z n )g n (x n , y n , z n ) g n (z n )g n (x n )g n (x n , y n , z n ) p8 , p9 , g n (y n , z n ) g n (z n , x n ) g n (x n )g n (y n )g n (x n , y n , z n ) p10 , p11 g n (x n , y n , z n ) g n (x n , y n ) [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 29 / 30
  • 39. Cover 先生と私 準備 Cover 先生が提起した未解決問題 ユニバーサルな予測の一般化 まとめ まとめ ユニバーサルな Bayes 予測 ユニバーサルな予測 ベイジアンネットワークの構造推定 MDL 基準の連続データへの適用 など、応用範囲が非常に広く、期待できる。 . Cover 先生が亡くなられたことについて 非常に残念ではあるが、元学生、ビジター、彼の論文を読んだ人 などに、学問に対する自由な精神は引き継がれていくはずだ。 . [招待講演] Cover 先生の研究室で思い出に残っているテーマ, ∼ 定常エルゴードな系列に対してのユニバーサルな予測 ∼ 30 / 30