SlideShare a Scribd company logo
1 of 67
Download to read offline
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
                             Ðàçíîå




            Ñêðûòûå ìàðêîâñêèå ìîäåëè

                         Ñåðãåé Íèêîëåíêî



          Machine Learning  CS Club, âåñíà 2008




                   Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Ìàðêîâñêèå öåïè
       Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé   Âîçíèêàþùèå çàäà÷è
                                    Ðàçíîå   Ðåøåíèÿ çàäà÷



Outline

  1   Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
        Ìàðêîâñêèå öåïè
        Âîçíèêàþùèå çàäà÷è
        Ðåøåíèÿ çàäà÷

  2   Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
        Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
        Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ

  3   Ðàçíîå
        Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
        Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
        Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå


                          Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå    Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé    Âîçíèêàþùèå çàäà÷è
                                  Ðàçíîå    Ðåøåíèÿ çàäà÷



Ìàðêîâñêèå öåïè


     Ìàðêîâñêàÿ öåïü çàäà¼òñÿ íà÷àëüíûì ðàñïðåäåëåíèåì
     âåðîÿòíîñòåé p 0 (x ) è âåðîÿòíîñòÿìè ïåðåõîäà T (x ; x ).
     T (x ; x )  ýòî ðàñïðåäåëåíèå ñëåäóþùåãî ýëåìåíòà öåïè â
     çàâèñèìîñòè îò ñëåäóþùåãî; ðàñïðåäåëåíèå íà (t + 1)ì
     øàãå ðàâíî

                          pt +1 (x   )=    T (x ; x )pt (x )dx .

      äèñêðåòíîì ñëó÷àå             T (x ; x )  ýòî ìàòðèöà âåðîÿòíîñòåé
     p(x = i |x = j ).


                        Ñåðãåé Íèêîëåíêî    Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé   Âîçíèêàþùèå çàäà÷è
                                  Ðàçíîå   Ðåøåíèÿ çàäà÷



Äèñêðåòíûå ìàðêîâñêèå öåïè


     Ìû áóäåì íàõîäèòüñÿ â äèñêðåòíîì ñëó÷àå.
     Ìàðêîâñêàÿ ìîäåëü  ýòî êîãäà ìû ìîæåì íàáëþäàòü
     êàêèå-òî ôóíêöèè îò ìàðêîâñêîãî ïðîöåññà.




                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé   Âîçíèêàþùèå çàäà÷è
                                  Ðàçíîå   Ðåøåíèÿ çàäà÷



Äèñêðåòíûå ìàðêîâñêèå öåïè


     Çäåñü x (t )  ñàì ïðîöåññ (ìîäåëü), à y (t )  òî, ÷òî ìû
     íàáëþäàåì.
     Çàäà÷à  îïðåäåëèòü ñêðûòûå ïàðàìåòðû ïðîöåññà.




                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå       Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé       Âîçíèêàþùèå çàäà÷è
                                  Ðàçíîå       Ðåøåíèÿ çàäà÷



Äèñêðåòíûå ìàðêîâñêèå öåïè



     Ãëàâíîå ñâîéñòâî  ñëåäóþùåå ñîñòîÿíèå íå çàâèñèò îò
     èñòîðèè, òîëüêî îò ïðåäûäóùåãî ñîñòîÿíèÿ.

        p(x (t ) = xj |x (t − 1) = xjt−    1
                                               , . . . , x (1) = xj ) =
                                                                 1


                                           = p (x (t ) = xj |x (t − 1) = xjt − ).
                                                                                1




     Áîëåå òîãî, ýòè âåðîÿòíîñòè aij = p (x (t ) = xj |x (t − 1) = xi )
     åù¼ è îò âðåìåíè t íå çàâèñÿò.
     Ýòè âåðîÿòíîñòè è ñîñòàâëÿþò ìàòðèöó ïåðåõîäà                         A = (aij ).



                        Ñåðãåé Íèêîëåíêî       Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé   Âîçíèêàþùèå çàäà÷è
                                  Ðàçíîå   Ðåøåíèÿ çàäà÷



Âåðîÿòíîñòè ïåðåõîäà




     Åñòåñòâåííûå ñâîéñòâà:
     aij ≥ 0.
        j aij = 1.




                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå       Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé       Âîçíèêàþùèå çàäà÷è
                                  Ðàçíîå       Ðåøåíèÿ çàäà÷



Ïðÿìàÿ çàäà÷à



     Åñòåñòâåííàÿ çàäà÷à: ñ êàêîé âåðîÿòíîñòüþ âûïàäåò òà èëè
     èíàÿ ïîñëåäîâàòåëüíîñòü ñîáûòèé?
     Ò.å. íàéòè íóæíî äëÿ ïîñëåäîâàòåëüíîñòè                         Q = qi   1
                                                                                   . . . qik

               p(Q |ìîäåëü) = p(qi )p(qi |qi
                                           1       2   1
                                                           ) . . . p (qik |qik − ).
                                                                               1




     Êàçàëîñü áû, ýòî òðèâèàëüíî.
     ×òî æå ñëîæíîãî â ðåàëüíûõ çàäà÷àõ?




                        Ñåðãåé Íèêîëåíêî       Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé   Âîçíèêàþùèå çàäà÷è
                                  Ðàçíîå   Ðåøåíèÿ çàäà÷



Ñêðûòûå ìàðêîâñêèå ìîäåëè




     À ñëîæíî òî, ÷òî íèêòî íàì íå ñêàæåò, ÷òî ìîäåëü äîëæíà
     áûòü èìåííî òàêîé.
     È, êðîìå òîãî, ìû îáû÷íî íàáëþäàåì íå x (t ), ò.å.
     ðåàëüíûå ñîñòîÿíèÿ ìîäåëè, à y (t ), ò.å. íåêîòîðóþ
     ôóíêöèþ îò íèõ (äàííûå).
     Äàâàéòå ïðèâåä¼ì ïðèìåð.




                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé   Âîçíèêàþùèå çàäà÷è
                                  Ðàçíîå   Ðåøåíèÿ çàäà÷



Ñêðûòûå ìàðêîâñêèå ìîäåëè: ïðèìåð



     Ïóñòü êòî-òî áðîñàåò ìîíåòêó è ñîîáùàåò íàì
     ðåçóëüòàòû  ïîñëåäîâàòåëüíîñòü îðëîâ è ðåøåê.
     Íî ìû íå çíàåì, ÷òî îí áðîñàåò ìîíåòêó, ìû òîëüêî çíàåì,
     ÷òî åñòü âîò òàêàÿ ïîñëåäîâàòåëüíîñòü áèòîâ.
     Åñëè ìû ïðåäïîëîæèì, ÷òî îí áðîñàåò îäíó ìîíåòêó,
     ìîäåëü áóäåò îäíà: äâà ñîñòîÿíèÿ, âåðîÿòíîñòè ïåðåõîäà
     ìåæäó íèìè p è 1 − p , âåðîÿòíîñòè îñòàòüñÿ 1 − p è p .




                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé   Âîçíèêàþùèå çàäà÷è
                                  Ðàçíîå   Ðåøåíèÿ çàäà÷



Ñêðûòûå ìàðêîâñêèå ìîäåëè: ïðèìåð




     Íî ìû æå ìîæåì ïîäóìàòü, ÷òî ó íåãî äâå ìîíåòêè! :)
     Òîãäà ñîñòîÿíèÿ ïî-ïðåæíåìó äâà, íî ïàðàìåòðîâ áîëüøå.
     À åñëè òðè ìîíåòêè?..
      îáùåì, çàäà÷è óæå ÿñíû.




                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé   Âîçíèêàþùèå çàäà÷è
                                  Ðàçíîå   Ðåøåíèÿ çàäà÷



Çàäà÷è ñêðûòûõ ìàðêîâñêèõ ìîäåëåé



     Ïåðâàÿ: íàéòè âåðîÿòíîñòü ïîñëåäîâàòåëüíîñòè
     íàáëþäåíèé â äàííîé ìîäåëè.
     Âòîðàÿ: íàéòè ¾îïòèìàëüíóþ¿ ïîñëåäîâàòåëüíîñòü
     ñîñòîÿíèé ïðè óñëîâèè äàííîé ìîäåëè è äàííîé
     ïîñëåäîâàòåëüíîñòè íàáëþäåíèé.
     Òðåòüÿ: íàéòè íàèáîëåå ïðàâäîïîäîáíóþ ìîäåëü
     (ïàðàìåòðû ìîäåëè).




                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé   Âîçíèêàþùèå çàäà÷è
                                  Ðàçíîå   Ðåøåíèÿ çàäà÷



Ñîñòîÿíèÿ è íàáëþäàåìûå




     X    = {x1 , . . . , xn }  ìíîæåñòâî ñîñòîÿíèé.
     V = {v1 , . . . , vm }  àëôàâèò, èç êîòîðîãî ìû âûáèðàåì
     íàáëþäàåìûå y (ìíîæåñòâî çíà÷åíèé y ).
     qt    ñîñòîÿíèå âî âðåìÿ t , yt  íàáëþäàåìàÿ âî âðåìÿ t .




                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé   Âîçíèêàþùèå çàäà÷è
                                  Ðàçíîå   Ðåøåíèÿ çàäà÷



Ðàñïðåäåëåíèÿ



     aij = p(qt +1 = xj |qt = xi )  âåðîÿòíîñòü ïåðåõîäà èç i â j .
     bj (k ) = p(vk |xj )  âåðîÿòíîñòü ïîëó÷èòü äàííûå vk â
     ñîñòîÿíèè j .
     Íà÷àëüíîå ðàñïðåäåëåíèå π = {πj }, πj = p (q1 = xj ).
     Äàííûå áóäåì îáîçíà÷àòü ÷åðåç D = d1 . . . dT
     (ïîñëåäîâàòåëüíîñòü íàáëþäàåìûõ, di ïðèíèìàþò
     çíà÷åíèÿ èç V ).




                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå             Ìàðêîâñêèå öåïè
    Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé              Âîçíèêàþùèå çàäà÷è
                                        Ðàçíîå       Ðåøåíèÿ çàäà÷



Êîììåíòàðèé



    Ïðîùå ãîâîðÿ, âîò êàê ðàáîòàåò HMM (hidden Markov
    model).
    Âûáåðåì íà÷àëüíîå ñîñòîÿíèå                        x1 ïî ðàñïðåäåëåíèþ π.
    Ïî t îò 1 äî T :
           Âûáåðåì íàáëþäàåìóþ                   d
                                                 t   ïî ðàñïðåäåëåíèþ       p (v |x ).
                                                                                 k   j


           Âûáåðåì ñëåäóþùåå ñîñòîÿíèå ïî ðàñïðåäåëåíèþ

           p (qt   +1   = x |q = x ).
                           j   t    i



    Òàêèì àëãîðèòìîì ìîæíî âûáðàòü ñëó÷àéíóþ
    ïîñëåäîâàòåëüíîñòü íàáëþäàåìûõ.




                           Ñåðãåé Íèêîëåíêî          Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Ìàðêîâñêèå öåïè
    Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé    Âîçíèêàþùèå çàäà÷è
                                 Ðàçíîå    Ðåøåíèÿ çàäà÷



Çàäà÷è
     Òåïåðü ìîæíî ôîðìàëèçîâàòü ïîñòàíîâêó çàäà÷.
     Ïåðâàÿ çàäà÷à: ïî äàííîé ìîäåëè λ = (A, B , π) è
     ïîñëåäîâàòåëüíîñòè D íàéòè p (D |λ). Ôàêòè÷åñêè, ýòî
     íóæíî äëÿ òîãî, ÷òîáû îöåíèòü, íàñêîëüêî õîðîøî ìîäåëü
     ïîäõîäèò ê äàííûì.
     Âòîðàÿ çàäà÷à: ïî äàííîé ìîäåëè λ è ïîñëåäîâàòåëüíîñòè
     D íàéòè ¾îïòèìàëüíóþ¿ ïîñëåäîâàòåëüíîñòü ñîñòîÿíèé
     Q = q1 . . . qT . Êàê è ðàíüøå, áóäåò äâà ðåøåíèÿ:
     ¾ïîáèòîâîå¿ è îáùåå.
     Òðåòüÿ çàäà÷à: îïòèìèçèðîâàòü ïàðàìåòðû ìîäåëè
     λ = (A, B , π) òàê, ÷òîáû ìàêñèìèçèðîâàòü p (D |λ) ïðè
     äàííîì D (íàéòè ìîäåëü ìàêñèìàëüíîãî ïðàâäîïîäîáèÿ).
     Ýòà çàäà÷à  ãëàâíàÿ, â íåé è çàêëþ÷àåòñÿ îáó÷åíèå
     ñêðûòûõ ìàðêîâñêèõ ìîäåëåé.
                       Ñåðãåé Íèêîëåíêî    Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå      Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé      Âîçíèêàþùèå çàäà÷è
                                     Ðàçíîå   Ðåøåíèÿ çàäà÷



Ïîñòàíîâêà ïåðâîé çàäà÷è



     Ôîðìàëüíî, ïåðâàÿ çàäà÷à âûãëÿäèò òàê. Íóæíî íàéòè

        p(D |λ) =           p(D |Q , λ)p(D |λ) =
                       Q
                   =               bq (d1 ) . . . bqT (dT )πq aq q
                                     1                        1    1   2
                                                                           . . . aqT − qT .
                                                                                     1

                       q
                       1 ,...,qT




     Íè÷åãî íå íàïîìèíàåò?




                           Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå    Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé    Âîçíèêàþùèå çàäà÷è
                                  Ðàçíîå    Ðåøåíèÿ çàäà÷



Ñóòü ðåøåíèÿ ïåðâîé çàäà÷è


     Ïðàâèëüíî, ýòî òàêàÿ æå çàäà÷à ìàðãèíàëèçàöèè, êàê ìû
     ðåøàåì âñ¼ âðåìÿ.
     Ìû âîñïîëüçóåìñÿ òàê íàçûâàåìîé forwardbackward
     procedure, ïî ñóòè  âû÷èñëåíèåì íà ðåø¼òêå, êàê â
     äåêîäèðîâàíèè.
     Áóäåì ïîñëåäîâàòåëüíî âû÷èñëÿòü ïðîìåæóòî÷íûå
     âåëè÷èíû âèäà

                          αt (i ) = p (d1 . . . dt , qt = xi |λ),

     ò.å. èñêîìûå âåðîÿòíîñòè, íî åù¼ ñ ó÷¼òîì òåêóùåãî
     ñîñòîÿíèÿ.


                        Ñåðãåé Íèêîëåíêî    Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå       Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé       Âîçíèêàþùèå çàäà÷è
                                  Ðàçíîå       Ðåøåíèÿ çàäà÷



Ðåøåíèå ïåðâîé çàäà÷è

     Èíèöèàëèçèðóåì α1 (i ) = πi bi (d1 ).
     Øàã èíäóêöèè:
                                           n
                       αt +1 (j ) =            αt (i )aij   bj (dt +1 ).
                                       i =1
     Ïîñëå òîãî êàê äîéä¼ì äî øàãà                    T , ïîäñ÷èòàåì òî, ÷òî íàì
     íóæíî:
                                                  n
                                p(D |λ) =              αT (i ).
                                                i =1
     Ôàêòè÷åñêè, ýòî òîëüêî ïðÿìîé ïðîõîä, îáðàòíûé íàì
     çäåñü íå ïîíàäîáèëñÿ.
     ×òî âû÷èñëÿë áû îáðàòíûé ïðîõîä?
                        Ñåðãåé Íèêîëåíêî       Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå       Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé       Âîçíèêàþùèå çàäà÷è
                                  Ðàçíîå       Ðåøåíèÿ çàäà÷



Îáðàòíûé ïðîõîä


     Îí âû÷èñëÿë áû óñëîâíûå âåðîÿòíîñòè
     βt (i ) = p (dt +1 . . . dT |qt = xi , λ).
     Èõ ìîæíî âû÷èñëèòü, ïðîèíèöèàëèçèðîâàâ βT (i ) = 1, à
     çàòåì ïî èíäóêöèè:
                                      n
                         βt (i ) =          aij bj (dt +1 )βt +1 (j ).
                                     j =1
     Ýòî íàì ïðèãîäèòñÿ ÷óòü ïîçæå, ïðè ðåøåíèè âòîðîé è
     òðåòüåé çàäà÷è.



                        Ñåðãåé Íèêîëåíêî       Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé   Âîçíèêàþùèå çàäà÷è
                                  Ðàçíîå   Ðåøåíèÿ çàäà÷



Äâà âàðèàíòà âòîðîé çàäà÷è




     Êàê ìû óæå óïîìèíàëè, âîçìîæíû äâà âàðèàíòà.
     Ïåðâûé: ðåøàòü ¾ïîáèòîâî¿, îòâå÷àÿ íà âîïðîñ ¾êàêîå
     íàèáîëåå âåðîÿòíîå ñîñòîÿíèå âî âðåìÿ j ?¿.
     Âòîðîé: ðåøàòü çàäà÷ó ¾êàêàÿ íàèáîëåå âåðîÿòíàÿ
     ïîñëåäîâàòåëüíîñòü ñîñòîÿíèé?¿.




                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé   Âîçíèêàþùèå çàäà÷è
                                  Ðàçíîå   Ðåøåíèÿ çàäà÷



Ïîáèòîâîå ðåøåíèå



     Ðàññìîòðèì âñïîìîãàòåëüíûå ïåðåìåííûå

                              γt (i ) = p (qt = xi |D , λ).

     Íàøà çàäà÷à  íàéòè

                    qt = argmax1≤i ≤n γt (i ),        1 ≤ t ≤ T.

     Êàê ýòî ñäåëàòü?




                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå     Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé     Âîçíèêàþùèå çàäà÷è
                                   Ðàçíîå    Ðåøåíèÿ çàäà÷



Ïîáèòîâîå ðåøåíèå




     Âûðàæàåì ÷åðåç α è β:

                                αt (i )βt (i )       αt (i )βt (i )
                    γt (i ) =                  =    n α (i )β (i ) .
                                 p(D |λ)            i =1 t        t
     Íà çíàìåíàòåëü ìîæíî íå îáðàùàòü âíèìàíèÿ  íàì
     íóæåí argmax.




                        Ñåðãåé Íèêîëåíêî     Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå            Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé            Âîçíèêàþùèå çàäà÷è
                                      Ðàçíîå        Ðåøåíèÿ çàäà÷



Ðåøåíèå îòíîñèòåëüíî ïîñëåäîâàòåëüíîñòè



     ×òîáû îòâåòèòü íà âîïðîñ î íàèáîëåå âåðîÿòíîé
     ïîñëåäîâàòåëüíîñòè, ìû áóäåì èñïîëüçîâàòü óæå
     çíàêîìûé àëãîðèòì Âèòåðáè.
     Òî åñòü, ïî ñóòè, òî æå ñàìîå äèíàìè÷åñêîå
     ïðîãðàììèðîâàíèå.
     Íàøè âñïîìîãàòåëüíûå ïåðåìåííûå  ýòî

             δt (i ) =       max          p (q1 q2 . . . qt = xi , d1 d2 . . . dt |λ) .
                         q
                         1   ,...,qt −1




                         Ñåðãåé Íèêîëåíêî           Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå       Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé       Âîçíèêàþùèå çàäà÷è
                                  Ðàçíîå       Ðåøåíèÿ çàäà÷



Ðåøåíèå îòíîñèòåëüíî ïîñëåäîâàòåëüíîñòè



     Ò.å. δt (i )  ìàêñèìàëüíàÿ âåðîÿòíîñòü äîñòè÷ü ñîñòîÿíèÿ
     xi íà øàãå t ñðåäè âñåõ ïóòåé ñ çàäàííûìè íàáëþäàåìûìè.
     Ïî èíäóêöèè:

                       δt +1 (j ) = max δt (i )aij       bj (dt +1 ).
                                           i
     È íàäî åù¼ çàïîìèíàòü àðãóìåíòû, à íå òîëüêî çíà÷åíèÿ;
     äëÿ ýòîãî áóäåò ìàññèâ ψt (j ).




                        Ñåðãåé Íèêîëåíêî       Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå    Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé    Âîçíèêàþùèå çàäà÷è
                                  Ðàçíîå    Ðåøåíèÿ çàäà÷



Ðåøåíèå îòíîñèòåëüíî ïîñëåäîâàòåëüíîñòè: àëãîðèòì


     Ïðîèíèöèàëèçèðóåì δ1 (i ) = πi bi (d1 ), ψ1 (i ) = [].
     Èíäóêöèÿ:

                         δt (j ) = max [δt −1 (i )aij ] bj (dt ),
                                   1≤i ≤n

                       ψt (j ) = argmax1≤i ≤n [δt −1 (i )aij ] .
     Êîãäà äîéä¼ì äî øàãà           T , ôèíàëüíûé øàã:
              p∗ =    max δT (i ),          qT
                                             ∗
                                                 = argmax1≤i ≤n δT (i ).
                     1≤i ≤n

     È âû÷èñëèì ïîñëåäîâàòåëüíîñòü: qt = ψt +1 (qt +1 ).
                                     ∗           ∗




                        Ñåðãåé Íèêîëåíêî    Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé   Âîçíèêàþùèå çàäà÷è
                                  Ðàçíîå   Ðåøåíèÿ çàäà÷



Îáùàÿ ñóòü òðåòüåé çàäà÷è



     Àíàëèòè÷åñêè íàéòè ãëîáàëüíûé ìàêñèìóì p (D |λ) ó íàñ
     íèêàê íå ïîëó÷èòñÿ.
     Çàòî ìû ðàññìîòðèì èòåðàòèâíóþ ïðîöåäóðó (ïî ñóòè 
     ãðàäèåíòíûé ïîäú¼ì), êîòîðàÿ ïðèâåä¼ò ê ëîêàëüíîìó
     ìàêñèìóìó.
     Ýòî íàçûâàåòñÿ àëãîðèòì ÁàóìàÂåëõà (BaumWelch
     algorithm). Îí ÿâëÿåòñÿ íà ñàìîì äåëå ÷àñòíûì ñëó÷àåì
     àëãîðèòìà EM.




                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå       Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé       Âîçíèêàþùèå çàäà÷è
                                    Ðàçíîå     Ðåøåíèÿ çàäà÷



Âñïîìîãàòåëüíûå ïåðåìåííûå


     Òåïåðü íàøèìè âñïîìîãàòåëüíûìè ïåðåìåííûìè áóäóò
     âåðîÿòíîñòè òîãî, ÷òî ìû âî âðåìÿ t â ñîñòîÿíèè xi , à âî
     âðåìÿ t + 1  â ñîñòîÿíèè xj :

                        ξt (i , j ) = p (qt = xi , qt +1 = xj |D , λ).

     Åñëè ïåðåïèñàòü ÷åðåç óæå çíàêîìûå ïåðåìåííûå:

                     αt (i )aij bj (dt +1 )βt +1 (j )         αt (i )aij bj (dt +1 )βt +1 (j )
     ξt (i , j ) =                                    =                                           .
                                 p(D |λ)                     i j αt (i )aij bj (dt +1 )βt +1 (j )
     Îòìåòèì òàêæå, ÷òî γt (i ) =                 j ξt (i , j ).


                          Ñåðãåé Íèêîëåíêî     Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå     Ìàðêîâñêèå öåïè
       Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé     Âîçíèêàþùèå çàäà÷è
                                     Ðàçíîå    Ðåøåíèÿ çàäà÷



Èäåÿ

         t γt (i )  ýòî îæèäàåìîå êîëè÷åñòâî ïåðåõîäîâ èç
       ñîñòîÿíèÿ xi , à t ξt (i , j )  èç xi â xj .
       Òåïåðü íà øàãå M ìû áóäåì ïåðåîöåíèâàòü âåðîÿòíîñòè:

               πi = îæèäàåìàÿ ÷àñòîòà â xi íà øàãå 1 = γ1 (i ),
               

                           ê-âî ïåðåõîäîâ èç xi â xj                t ξt (i , j ) .
                   a
                   ij =                             =
                             ê-âî ïåðåõîäîâ èç xi                    t γt (i )

       bj (k ) =
                  ê-âî ïîÿâëåíèé â xi è íàáëþäåíèé vk
                                                       =
                                                                                 t :dt =vk γt (i ) .
                            ê-âî ïîÿâëåíèé â xi                                       t γt (i )
       EM-àëãîðèòì ïðèâåä¼ò ê öåëè: íà÷àòü ñ λ = (A, B , π),
       ïîäñ÷èòàòü  = (A, B , π), ñíîâà ïåðåñ÷èòàòü ïàðàìåòðû è
                  λ      
       ò.ä.
                            Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé   Âîçíèêàþùèå çàäà÷è
                                  Ðàçíîå   Ðåøåíèÿ çàäà÷



Ðàññòîÿíèå ÊóëüáàêàËåéáëåðà



     KullbackLeibler distance (divergence)  ýòî
     èíôîðìàöèîííî-òåîðåòè÷åñêàÿ ìåðà òîãî, íàñêîëüêî
     äàëåêè ðàñïðåäåëåíèÿ äðóã îò äðóãà.

                                                             p1 (x )
                       DKL (p1 , p2 ) =        p1 (x ) log           .
                                           x                 p2 (x )
     Èçâåñòíî, ÷òî ýòî ðàññòîÿíèå âñåãäà íåîòðèöàòåëüíî,
     ðàâíî íóëþ i p1 ≡ p2 .




                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Ìàðêîâñêèå öåïè
    Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé    Âîçíèêàþùèå çàäà÷è
                                 Ðàçíîå    Ðåøåíèÿ çàäà÷



Ïðèìåíèòåëüíî ê HMM

    Ìû îïðåäåëèì

                             p(Q , D |λ)             p(Q , D |λ )
                p1 (Q ) =                , p2 (Q ) =              .
                              p(D |λ)                 p(D |λ )
    Òîãäà p1 è p2  ðàñïðåäåëåíèÿ, è ðàññòîÿíèå
    KullbackLeibler:

                                 p(Q , D |λ) p(Q , D |λ)p(D |λ )
       0 ≤ DLK (λ, λ ) =                    log                      =
                              Q p (D |λ)        p(Q , D |λ )p(D |λ)
                            p(D |λ )        p(Q , D |λ) p(Q , D |λ)
                      = log          +                 log              .
                            p(D |λ) Q p(D |λ)              p(Q , D |λ )


                       Ñåðãåé Íèêîëåíêî    Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Ìàðêîâñêèå öåïè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé   Âîçíèêàþùèå çàäà÷è
                                  Ðàçíîå   Ðåøåíèÿ çàäà÷



Âñïîìîãàòåëüíàÿ ôóíêöèÿ


     Ââåä¼ì âñïîìîãàòåëüíóþ ôóíêöèþ

                   Q (λ, λ ) =         p(Q |D , λ) log p(Q |D , λ ).
                                   Q
     Òîãäà èç íåðàâåíñòâà ñëåäóåò, ÷òî

                       Q (λ, λ ) − Q (λ, λ) ≤ log p(D |λ ) .
                               p(D |λ)                 p(D |λ)
     Ò.å., åñëè Q (λ, λ )  Q (λ, λ), òî p(D |λ )  p(D |λ).
     Ò.å., åñëè ìû ìàêñèìèçèðóåì Q (λ, λ ) ïî λ , ìû òåì
     ñàìûì áóäåì äâèãàòüñÿ â íóæíóþ ñòîðîíó.


                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå         Ìàðêîâñêèå öåïè
    Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé         Âîçíèêàþùèå çàäà÷è




          Q
                                  Ðàçíîå        Ðåøåíèÿ çàäà÷



Ôóíêöèÿ

    Íóæíî ìàêñèìèçèðîâàòü                  Q (λ, λ ). Ïåðåïèøåì:
       Q (λ, λ ) =           p(Q |D , λ) log p(Q |D , λ ) =
                         Q
                =         p(Q |D , λ) log πq     1
                                                         aqt− qt bqt (dt ) =
                                                                1

                     Q                               t
     =        p(Q |D , λ) log πq   1
                                       +       p(Q |D , λ)          log aqt − qt bqt (dt ).
                                                                             1

          Q                                Q                    t
    Ïîñëåäíåå âûðàæåíèå ëåãêî äèôôåðåíöèðîâàòü ïî aij ,
    bi (k ) è πi , äîáàâëÿòü ñîîòâåòñòâóþùèå ìíîæèòåëè
    Ëàãðàíæà è ðåøàòü. Ïîëó÷èòñÿ èìåííî ïåðåñ÷¼ò ïî
    àëãîðèòìó ÁàóìàÂåëõà (ïðîâåðüòå!).

                         Ñåðãåé Íèêîëåíêî       Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
                                             Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
       Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
                                             Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
                                    Ðàçíîå



Outline

  1   Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
        Ìàðêîâñêèå öåïè
        Âîçíèêàþùèå çàäà÷è
        Ðåøåíèÿ çàäà÷

  2   Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
        Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
        Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ

  3   Ðàçíîå
        Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
        Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
        Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå


                          Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
                                           Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
                                           Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
                                  Ðàçíîå



Ñïåöèàëüíûå âèäû ìîäåëåé



     HMM    ýðãîäè÷íà, åñëè ∀i , j aij  0.
     HMM àöèêëè÷íà (left-right model, Bakis model), åñëè ∀j  i
     aij = 0 (ìàòðèöà òðåóãîëüíàÿ) è π1 = 1 (íà÷èíàåì âñåãäà â
     ñîñòîÿíèè 1).
      àöèêëè÷íûõ ñåòÿõ åù¼ ÷àñòî áûâàåò îãðàíè÷åíèå íà
     ïðûæîê (constrained jump) ðàçìåðîì ∆: ∀j  i + ∆ aij = 0
     (ìàòðèöà ìóëüòèäèàãîíàëüíàÿ).




                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
                                           Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
                                           Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
                                  Ðàçíîå



Íåïðåðûâíûå ïëîòíîñòè íàáëþäàåìûõ



     Ó íàñ áûëè äèñêðåòíûå íàáëþäàåìûå ñ âåðîÿòíîñòÿìè
     B = (bj (k )).
     Íî â ðåàëüíîé æèçíè âñ¼ ñëîæíåå: çà÷àñòóþ ìû
     íàáëþäàåì íåïðåðûâíûå ñèãíàëû, à íå äèñêðåòíûå
     âåëè÷èíû, è äèñêðåòèçîâàòü èõ èëè ïëîõî, èëè íåóäîáíî.
     Ïðè ýòîì ñàìó öåïü ìîæíî îñòàâèòü äèñêðåòíîé, ò.å.
     ïåðåéòè ê íåïðåðûâíûì bj (D ).




                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
                                              Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
                                              Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
                                  Ðàçíîå



Ñïåöèàëüíûé âèä ïëîòíîñòè

     Íå äëÿ âñåõ ïëîòíîñòåé íàéäåíû àëãîðèòìû ïåðåñ÷¼òà
     (îáîáùåíèÿ àëãîðèòìà ÁàóìàÂåëõà).
     Íàèáîëåå îáùèé ðåçóëüòàò âåðåí, êîãäà bj (D ) ìîæíî
     ïðåäñòàâèòü â âèäå
                                      M
                         bj (D ) =          cjm P(D , µjm , σjm ),
                                     m =1
     ãäå cjm  êîýôôèöèåíòû ñìåñè ( m cjm = 1), à P 
     âûïóêëîå ðàñïðåäåëåíèå ñî ñðåäíèì µ è âàðèàöèåé σ
     (ãàóññèàí ïîäîéä¼ò).
     Ê ñ÷àñòüþ, òàêîé êîíñòðóêöèåé ìîæíî ïðèáëèçèòü ëþáîå
     íåïðåðûâíîå ðàñïðåäåëåíèå, ïîýòîìó ýòî ìîæíî øèðîêî
     ïðèìåíÿòü.
                        Ñåðãåé Íèêîëåíêî      Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
                                            Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
                                            Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
                                  Ðàçíîå



Âñïîìîãàòåëüíûå ïåðåìåííûå



     γt (j , m)  âåðîÿòíîñòü áûòü â ñîñòîÿíèè j âî âðåìÿ t ,
     ïðè÷¼ì çà D îòâå÷àåò mé êîìïîíåíò ñìåñè.
     Ôîðìàëüíî ãîâîðÿ,

                           αt (j )βt (j )           cjm P(dt , µjm , σjm )
      γt (j , m) =        N α (j )β (j )           M c P(d , µ , σ ) .
                          j =1 t        t          m=1 jm       t jm jm
     Åñëè   M = 1, òî ýòî óæå èçâåñòíûå íàì γt (j ).



                        Ñåðãåé Íèêîëåíêî    Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
                                           Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
                                           Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
                                  Ðàçíîå



Àëãîðèòì äëÿ ýòîãî ñëó÷àÿ


     Íóæíî íàó÷èòüñÿ ïåðåñ÷èòûâàòü bj (D ), ò.å. ïåðåñ÷èòûâàòü
     cjm , µjm è σjm .
     Ýòî äåëàåòñÿ òàê:
                                        T γ (j , m)
                           cjm =
                                       t =1 t             ,
                                    T       M
                                    t =1 m=1 γt (j , m)
                                       T γ (j , m) · d
                                         1 t            t,
                             µjm = t =T
                             
                                        t =1 γt (j , m)
                            T γ (j , m) · (d − µ )(d − µ )t
                
                σjm =       t =1 t           t       jm t    jm .
                                        T γ (j , m)
                                        t =1 t

                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
                                           Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
    Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
                                           Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
                                 Ðàçíîå



Ïðîáëåìà

     Êàê ìîäåëèðîâàòü ïðîäîëæèòåëüíîñòü íàõîæäåíèÿ â òîì
     èëè èíîì ñîñòîÿíèè?
      äèñêðåòíîì ñëó÷àå âåðîÿòíîñòü ïðîáûòü â ñîñòîÿíèè                  id
     øàãîâ:
                                 d
                      pi (d ) = aii −1 (1 − aii ).
     Îäíàêî äëÿ áîëüøèíñòâà ôèçè÷åñêèõ ñèãíàëîâ òàêîå
     ýêñïîíåíöèàëüíîå ðàñïðåäåëåíèå íå ñîîòâåòñòâóåò
     äåéñòâèòåëüíîñòè. Ìû áû õîòåëè ÿâíî çàäàâàòü ïëîòíîñòü
     ïðåáûâàíèÿ â äàííîì ñîñòîÿíèè.
     Ò.å. âìåñòî êîýôôèöèåíòîâ ïåðåõîäà â ñåáÿ aii  ÿâíîå
     çàäàíèå ðàñïðåäåëåíèÿ pi (d ).


                       Ñåðãåé Íèêîëåíêî    Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
                                            Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
                                            Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
                                   Ðàçíîå



Âñïîìîãàòåëüíûå ïåðåìåííûå



     Ââåä¼ì ïåðåìåííûå

           αt (i ) = p (d1 . . . dt , xi çàêàí÷èâàåòñÿ âî âðåìÿ t |λ).

     Âñåãî çà ïåðâûå t øàãîâ ïîñåùåíî r ñîñòîÿíèé q1 . . . qr , è
     ìû òàì îñòàâàëèñü d1 , . . . , dr . Ò.å. îãðàíè÷åíèÿ:
                                               r
                              qr   = xi ,            ds = t .
                                              s =1




                        Ñåðãåé Íèêîëåíêî    Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
                                                    Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
                                                    Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
                                       Ðàçíîå



Âû÷èñëåíèå αt (i )




      Òîãäà ïîëó÷àåòñÿ

        αt (i ) =              πq pq (d1 )p (d1 d2 . . . dd |q1 )
                                   1    1                         1

                     q      d
                         aq q pq (d2 )p(dd +1 . . . dd +d |q2 ) . . .
                           1   2   2            1             1   2


                              . . . aqr − qr pqr (dr )p (dd +...+dr − +1 . . . dt |qr ).
                                            1                 1         1




                           Ñåðãåé Íèêîëåíêî         Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
                                                 Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
                                                 Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
                                   Ðàçíîå



Âû÷èñëåíèå αt (i )


      Ïî èíäóêöèè
                             n D                                    t
                αt (j ) =               αt −d (j )aij pj (d )                bj (ds ),
                            i =1 d =1                           s =t −d +1
      ãäå   D    ìàêñèìàëüíàÿ îñòàíîâêà â ëþáîì èç ñîñòîÿíèé.
      Òîãäà, êàê è ðàíüøå,
                                                   n
                                  p(d |λ) =             αT (i ).
                                                 i =1



                        Ñåðãåé Íèêîëåíêî         Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
                                           Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
                                           Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
                                  Ðàçíîå



Âñïîìîãàòåëüíûå ïåðåìåííûå




     Äëÿ ïåðåñ÷¼òà ïîòðåáóþòñÿ åù¼ òðè ïåðåìåííûå:

           α∗ (i ) = p (d1 . . . dt , xi íà÷èíàåòñÿ âî âðåìÿ t + 1|λ),
            t
          βt (i ) = p (dt +1 . . . dT |xi çàêàí÷èâàåòñÿ âî âðåìÿ t , λ),
         β∗ (i ) = p (dt +1 . . . dT |xi íà÷èíàåòñÿ âî âðåìÿ t + 1, λ).
          t




                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
                                                Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
                                                Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
                                     Ðàçíîå



Âñïîìîãàòåëüíûå ïåðåìåííûå

     Ñîîòíîøåíèÿ ìåæäó íèìè:
                                                n
                                 α∗ (j ) =
                                  t                   αt (i )aij ,
                                               i =1
                                 D                             t
                   αt (i ) =          α∗−d (
                                       t      i )pi (d )                bi (ds ),
                               d =1                        s =t −d +1
                                                n
                                 βt (i ) =            aij β∗ (j ),
                                                           t
                                               j =1
                                  D                           t +d
                     β∗ (i ) =
                      t                 βt +d (i )pi (d )             bi (ds ).
                                 d =1                       s =t +1
                        Ñåðãåé Íèêîëåíêî        Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
                                           Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
                                           Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
                                  Ðàçíîå



Ôîðìóëû ïåðåñ÷¼òà


     Ïðèâåä¼ì ôîðìóëû ïåðåñ÷¼òà.
     πi  ïðîñòî âåðîÿòíîñòü òîãî, ÷òî xi áûë ïåðâûì
     ñîñòîÿíèåì:
                                πi β∗ (i )
                                    0
                          πi =
                           ^               .
                                p(d |λ)
     aij òà æå ôîðìóëà, ÷òî îáû÷íî, òîëüêî âìåñòå ñ α åñòü
     åù¼ è β, êîòîðàÿ ãîâîðèò, ÷òî íîâîå ñîñòîÿíèå íà÷èíàåòñÿ
     íà ñëåäóþùåì øàãå:
                                      T α (i )a β∗ (j )
                        a
                        ^ij =         t =1 t   ij t
                                  n       T α (i )a β∗ (k ) .
                                  k =1 t =1 t      ik t


                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
                                                 Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
                                                 Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
                                  Ðàçíîå



Ôîðìóëû ïåðåñ÷¼òà

     bi (k )  îòíîøåíèå îæèäàíèÿ êîëè÷åñòâà ñîáûòèé dt = vk
     â ñîñòîÿíèè xi ê îæèäàíèþ êîëè÷åñòâà ëþáîãî vj â
     ñîñòîÿíèè xi :
                       T                         α∗ (i )β∗ (i ) −            ατ (i )βτ (i )
     bi (k ) =
     ^                 t =1,dt =vk         τt    τ      τ           τt
                                                                                                  .
                   m       T                          ∗  i       i) −
                                                             )β∗ (               ατ (i )βτ (i )
                   k =1 t =1,dt =vk              τt ατ (      τ           τt

     pi (d )  îòíîøåíèå îæèäàíèÿ êîëè÷åñòâà ðàç, êîòîðûå xi
     ñëó÷èëîñü ñ ïðîäîëæèòåëüíîñòüþ d , ê êîëè÷åñòâó ðàç,
     êîòîðûå xi âîîáùå ñëó÷àëîñü:
                            T α∗ (i )p (d )β (i ) t +d b (d )
          pi (d ) =
          ^                 t =1 t    i      t +d      s =t +1 i s
                        D       T α∗ (i )p (d )β (i ) t +d b (d ) .
                        d =1 t =1 t       i       t +d      s =t +1 i s

                        Ñåðãåé Íèêîëåíêî         Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
                                           Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
                                           Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
                                  Ðàçíîå



Çà è ïðîòèâ



     Òàêîé ïîäõîä î÷åíü ïîëåçåí, êîãäà pi (d ) äàëåêî îò
     ýêñïîíåíöèàëüíîãî.
     Îäíàêî îí ñèëüíî óâåëè÷èâàåò âû÷èñëèòåëüíóþ ñëîæíîñòü
     (â D 2 ðàç).
     È, êðîìå òîãî, ñòàíîâèòñÿ ãîðàçäî áîëüøå ïàðàìåòðîâ, ò.å.
     íóæíî, âîîáùå ãîâîðÿ, áîëüøå äàííûõ, ÷òîáû ýòè
     ïàðàìåòðû íàä¼æíî îöåíèòü.




                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
                                            Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
                                            Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
                                  Ðàçíîå



Ïàðàìåòðè÷åñêàÿ ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ



     ×òîáû óìåíüøèòü êîëè÷åñòâî ïàðàìåòðîâ, ìîæíî èíîãäà
     ñ÷èòàòü, ÷òî pi (d )  êëàññè÷åñêîå ðàñïðåäåëåíèå ñ íå
     ñëèøêîì áîëüøèì êîëè÷åñòâîì ïàðàìåòðîâ.
     Íàïðèìåð, pi (d ) ìîæåò áûòü ðàâíîìåðíûì, èëè
     íîðìàëüíûì (pi (d ) = N (d , µi , σ2 )), èëè
                                        i
     ãàììàðàñïðåäåëåíèåì:

                                       ηνi d νi −1 e −ηi d
                              pi (d ) = i                  .
                                              Γ (νi )




                        Ñåðãåé Íèêîëåíêî    Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
       Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé   Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
                                    Ðàçíîå   Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå



Outline

  1   Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
        Ìàðêîâñêèå öåïè
        Âîçíèêàþùèå çàäà÷è
        Ðåøåíèÿ çàäà÷

  2   Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
        Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
        Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ

  3   Ðàçíîå
        Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
        Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
        Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå


                          Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå          Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
    Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé           Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
                                 Ðàçíîå           Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå



Îáùàÿ èäåÿ


     Ðå÷ü èä¼ò î ìîäåëÿõ, â êîòîðûõ ñëåäóþùèå êîìïîíåíòû
     âåêòîðà íàáëþäàåìûõ çàâèñÿò îò ïðåäûäóùèõ ñ
     íåêîòîðûìè êîýôôèöèåíòàìè.
     Ò.å. d = (d1 , . . . , dK )  âåêòîð íàáëþäàåìûõ, è ìîäåëü
     òàêàÿ:
                                            p
                              dk = −              ai dk −i + ek ,
                                           i =1
     ãäå ek  ãàóññèàíû ñ íóëåâûì ñðåäíèì è âàðèàöèåé σ2 ,
     ai  êîýôôèöèåíòû àâòîðåãðåññèè.


                       Ñåðãåé Íèêîëåíêî           Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå        Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé        Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
                                      Ðàçíîå    Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå



Ðàñïðåäåëåíèå

     Ìîæíî ïîêàçàòü, ÷òî ïëîòíîñòü                  d   äëÿ áîëüøèõ             k
     ñòàáèëèçèðóåòñÿ íà
                                                                  δ(d ,a)
                         p(d ) = (2πσ2 )−K /2 e −
                                                             1
                                                            2σ2             ,

     ãäå (ïîëîæèâ       a0 = 1)
                                                         p
                      δ(d , a) = ra (0)r (0) + 2               ra (i )r (i ),
                                                        i =1
                               p −i                         K −i −1
                   ra (i ) =          aj aj +i , r (i ) =              dj dj +i .
                               j =0                            j =0

                        Ñåðãåé Íèêîëåíêî        Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé   Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
                                  Ðàçíîå   Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå



Êîììåíòàðèé ê ðàñïðåäåëåíèþ

     Íà ñàìîì äåëå r (i )  àâòîêîððåëÿöèÿ âûáîðêè, à ra (i ) 
     àâòîêîððåëÿöèÿ êîýôôèöèåíòîâ àâòîðåãðåññèè.
     Àâòîêîððåëÿöèÿ  ýòî êîððåëÿöèÿ ïðîöåññà ñ ñàìèì ñîáîé
     â ïðåäûäóùèå ïåðèîäû âðåìåíè; èñïîëüçóåòñÿ â ñòàòèñòèêå
     è îáðàáîòêå ñèãíàëîâ äëÿ ïîèñêà ïàòòåðíîâ â äàííûõ.
     Ïî îïðåäåëåíèþ, äëÿ ïðîöåññà Xt R (t , s ) = E [(Xt −µ)(Xs −µ)] ,
                                                          σ               2


     à åñëè ïðîöåññ ñòàöèîíàðíûé (íå çàâèñèò îò êîíêðåòíîãî
     âðåìåíè), òî
                                   E [(Xt − µ)(Xt +k − µ)]
                        R (k ) =                                .
                                               σ2
      îáðàáîòêå ñèãíàëîâ (à ìû â íåé) ÷àñòî èñïîëüçóþò
     àâòîêîððåëÿöèþ áåç íîðìàëèçàöèè, ò.å. äëÿ äèñêðåòíîãî
     ñèãíàëà R (j ) = k xj xj −k .
                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå     Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé     Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
                                  Ðàçíîå     Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå



Ñêðûòàÿ ìàðêîâñêàÿ ìîäåëü

     Êàê ïðèìåíèòü àâòîðåãðåññèâíóþ ìîäåëü?
     Î÷åíü ïðîñòî: ñíà÷àëà íîðìàëèçóåì âåêòîð íàáëþäåíèé:

                          d                2π         K ^
                  d=√
                  ^            , p (d ) = ( )−K /2 e − δ(d ,a) .
                                    ^
                                           K
                                                                  2

                          K σ2
     À çàòåì ðàññìîòðèì ñìåñü
                                            M
                              bj (D ) =           cjm bjm (D ),
                                           m =1
     ãäå bjm çàäà¼òñÿ âåêòîðîì àâòîðåãðåññèè ajm (ò.å. åãî
     êîýôôèöèåíòàìè rajm ).


                        Ñåðãåé Íèêîëåíêî     Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå      Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé      Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
                                  Ðàçíîå      Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå



Àëãîðèòì ïåðåñ÷¼òà


     Íàäî íàó÷èòüñÿ ïåðåñ÷èòûâàòü rajm . Äëÿ ýòîãî ñõåìà òàêàÿ:
     ñíà÷àëà íàó÷èìñÿ ïåðåñ÷èòûâàòü rjm , ïîòîì èç íèõ
     ïîëó÷èì ajm , à ïîòîì ïî íèì ïåðåñ÷èòàåì rajm .

                                           T γ (j , m) · r
                             r
                             jm =         t =1 t         t
                                              T γ (j , m) ,
                                              t =1 t
     ãäå

                                αt (j )βt (j )             cjm bjm (dt )
           γt (j , m) =        N α (j )β (j )             M c b (d ) .
                               j =1 t        t            m=1 jm jm t


                        Ñåðãåé Íèêîëåíêî      Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé   Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
                                  Ðàçíîå   Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå



Ïîñòàíîâêà çàäà÷è



     Ìû ðàíüøå ïðåäïîëàãàëè, ÷òî íàøà ìàðêîâñêàÿ ìîäåëü
     õîðîøî îïèñûâàåò ïðîöåññ.
     Íà ñàìîì äåëå ýòî íå âñåãäà òàê.
     Äàâàéòå ïîïðîáóåì ðåøèòü áîëåå ïðàêòè÷åñêóþ çàäà÷ó:
     åñòü íåñêîëüêî ñèãíàëîâ, è ìû äîëæíû èõ îïèñàòü
     ìàðêîâñêèìè ìîäåëÿìè òàê, ÷òîáû êàê ìîæíî òî÷íåå
     îòäåëÿòü èõ äðóã îò äðóãà.




                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé   Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
                                  Ðàçíîå   Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå



ML




     Ñòàíäàðòíàÿ èäåÿ â òîì, ÷òî ìû õîòèì íàó÷èòüñÿ
     ñðàâíèâàòü ìîäåëè, ò.å. äëÿ ðàçíûõ ìîäåëåé λν , ν = 1..V ,
     íàó÷èòüñÿ îöåíèâàòü p (d ν |λν ), à ïîòîì âûáðàòü èç íèõ
     ìàêñèìóì.
     Ýòî òàê íàçûâàåìûé ML criterion (îò maximum likelihood).




                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå       Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
      Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé       Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
                                   Ðàçíîå       Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå



MMI

      Àëüòåðíàòèâà  ìåòîä ìàêñèìàëüíîé âçàèìíîé
      èíôîðìàöèè (maximum mutual information, MMI).
      Â ïðîñòåéøåé ñèòóàöèè ýòîò ìåòîä ïðèìåíÿåòñÿ, ÷òîáû
      âûÿñíèòü, êàêèå ïàðàìåòðû áîëüøå âñåãî âëèÿþò íà
      ðàçëè÷åíèå çàäàííûõ êëàññîâ.
      Åñëè åñòü äàííûå x = (x1 , . . . , xn ) è íàáîð êëàññîâ G , ïî
      êîòîðûì èõ êëàññèôèöèðóþò, òî íóæíî ïîäñ÷èòàòü
      èíôîðìàöèþ ìåæäó xi è êëàññîì C :

                            I (xi , C ) = H (C ) − H (C |xi ),
      ò.å. ìàêñèìèçèðîâàòü

              H (C |xi ) = −                p(c , xi   = vj ) log p (c |xi = vj ).
                                ∈ G vj

                         Ñåðãåé Íèêîëåíêî       Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå    Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
      Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé    Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
                                   Ðàçíîå    Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå



MMI

      Äëÿ ìàðêîâñêèõ ìîäåëåé ýòî âûðàæàåòñÿ êàê
      ìàêñèìèçàöèÿ ñðåäíåãî ðàññòîÿíèÿ ìåæäó äàííûìè                              d   è
      ïîëíûì íàáîðîì ìîäåëåé λ = (λ1 , . . . , λV ):

                   Iν = max      log p (d |λν ) − log       p(d ν |λw )   ,
                           λ
                                                        w
      ò.å. ìû îòäåëÿåì ïðàâèëüíóþ ìîäåëü µ îò äðóãèõ ìîäåëåé
      íà ïîñëåäîâàòåëüíîñòè d .
      À òåïåðü ìîæíî ïðîñóììèðîâàòü ïî âñåì ìîäåëÿì è òàêèì
      îáðàçîì íàäåÿòüñÿ, ÷òî ïîëó÷èòñÿ ñàìûé ¾ðàçäåë¼ííûé¿
      íàáîð:
                            V
               I   = max          log p (d ν |λν ) − log        p(d ν |λw )   ,
                      λ
                           ν=1                              w
                          Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
      Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé   Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
                                   Ðàçíîå   Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå



MDI

      Òðåòèé ïîäõîä: ïðåäïîëîæèì, ÷òî ñèãíàë íå îáÿçàòåëüíî
      ìàðêîâñêèé, íî ó íåãî åñòü íåêîòîðûå îãðàíè÷åíèÿ (íà
      êîððåëÿöèþ, íàïðèìåð).
      Íàäî íàéòè òàêèå ïàðàìåòðû, êîòîðûå ìèíèìèçèðóþò
      ðàçäåëÿþùóþ èíôîðìàöèþ (discrimination information, DI)
      ìåæäó íàáîðîì ðàñïðåäåëåíèé Q , óäîâëåòâîðÿþùèõ
      îãðàíè÷åíèÿì, è íàáîðîì ìàðêîâñêèõ ðàñïðåäåëåíèé pλ :
                                        q (y )
                           D (Q ||pλ ) = q (y ) ln
                                               dy .
                                        p(y )
      Ò.å. ìû ïðåäïîëàãàåì, ÷òî ñèãíàë èç Q , è èùåì òàêóþ λ,
      ÷òîáû ðàññòîÿíèå äî ñîîòâåòñòâóþùåãî ýëåìåíòà q áûëî
      ìèíèìàëüíûì.
      Òîæå ïî ñóòè ìîäèôèöèðîâàííûé àëãîðèòì ÁàóìàÂåëõà.
                         Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
    Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé    Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
                                 Ðàçíîå    Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå



Êàê ñðàâíèâàòü HMM?

     Âñïîìíèì ïðèìåð ñ ìîíåòêîé è ðàññìîòðèì äâå ìîäåëè:
     λ1 = (A1 , B1 , π1 ), λ2 = (A2 , B2 , π2 ):

     A1 =        p      1−p
                                  , B1 =
                                              q      1−q
                                                               , π1 = (1/2 1/2),
              1−p          p               1−q          q

     A2 =        r      1−r
                                 , B2 =
                                             s      1−s
                                                              , π2 = (1/2 1/2),
              1−r         r                1−s         s
     ×òîáû ìîäåëè ïðîèçâîäèëè â ñðåäíåì îäèíàêîâûå
     ïîñëåäîâàòåëüíîñòè íàáëþäåíèé, íóæíî, ÷òîáû
     E [dt = vk |λ1 ] = E [dt = vk |λ2 ], ò.å.
             pq + (1 − p)(1 − q ) = rs + (1 − r )(1 − s ).
     Ìîäåëè ñ p = 0.6, q = 0.7 è r = 0.2, s = 13/30 äàäóò
     îäèíàêîâûå ðåçóëüòàòû.
                       Ñåðãåé Íèêîëåíêî    Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå      Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
    Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé       Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
                                    Ðàçíîå    Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå



Êàê ñðàâíèâàòü HMM?

     Íóæíà ìåòðèêà. Îïðåäåëèì ðàññòîÿíèå ìåæäó ìîäåëÿìè
                                1
              D (λ1 , λ2 ) =        (log p (d (2) |λ1 ) − log p (d (2) |λ2 )),
                               T
     ãäå d (2) ïîðîæäåíî ìîäåëüþ λ2 , ò.å. ìû ïðîâåðÿåì,
     íàñêîëüêî õîðîøî λ1 ñîîòâåòñòâóåò íàáëþäåíèÿì ïî
     ìîäåëè λ2 ïî ñðàâíåíèþ ñ ñàìîé λ2 .
     Ýòî, êîíå÷íî, íåñèììåòðè÷íîå ðàññòîÿíèå, ïîýòîìó
     îáû÷íî áåðóò

                                         D (λ1 , λ2 ) + D (λ2 , λ1 )
                     Ds (λ1 , λ2 ) =                                   .
                                                      2


                       Ñåðãåé Íèêîëåíêî       Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé   Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
                                  Ðàçíîå   Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå



Íà÷àëüíûå çíà÷åíèÿ ïàðàìåòðîâ

     Àëãîðèòì ÁàóìàÂåëõà, ïî ñóòè ñâîåé ãðàäèåíòíûé,
     êîíå÷íî, äà¼ò òîëüêî ëîêàëüíûé ìàêñèìóì.
     Çíà÷èò, âàæíî, êàê âûáèðàòü íà÷àëüíûå çíà÷åíèÿ
     ïàðàìåòðîâ.
     Äëÿ π è A íà ñàìîì äåëå îñîáîé ïðîáëåìû íåò: îáû÷íî
     õîðîøî ðàáîòàþò èëè ñëó÷àéíûå, èëè ðàâíîìåðíûå
     íà÷àëüíûå çíà÷åíèÿ.
     Äëÿ B õîðîøèå íà÷àëüíûå îöåíêè ìîãóò áûòü âåñüìà
     ïîëåçíû â äèñêðåòíîì ñëó÷àå è ïðàêòè÷åñêè íåîáõîäèìû â
     íåïðåðûâíîì.
     Êàê èõ ïîëó÷èòü?


                        Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå      Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
     Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé      Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
                                  Ðàçíîå      Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå



Íà÷àëüíûå çíà÷åíèÿ ïàðàìåòðîâ

      íåïðåðûâíîì ñëó÷àå ó íàñ ðàñïðåäåëåíèå áûëî ñìåñüþ
     äðóãèõ ðàñïðåäåëåíèé:
                                      M
                         bj (D ) =          cjm P(D , µjm , σjm ).
                                     m =1
     Êàê áû íàì îöåíèòü íà÷àëüíûå ïàðàìåòðû µjm , σjm , èìåÿ
     äàííûå âñåõ íàáëþäåíèé?
     Ìîæíî ïðèìåíèòü êëàñòåðèçàöèþ. Ìû ïðîñòî
     êëàñòåðèçóåì äàííûå D (ïî êàæäîìó âðåìåíè j îòäåëüíî)
     è ïîëó÷èì íåïëîõèå íà÷àëüíûå çíà÷åíèÿ.




                        Ñåðãåé Íèêîëåíêî      Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
    Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé    Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
                                 Ðàçíîå    Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå



Èíòåðïîëÿöèÿ



     Äàííûõ ÷àñòî íå õâàòàåò. Ïàðàìåòðîâ áûâàåò ñëèøêîì
     ìíîãî.
     Îäèí èç ïóòåé  èíòåðïîëÿöèÿ. Âûáðàòü âìåñòå ñ λ
     ìîäåëü ïîìåíüøå λ , äëÿ êîòîðîé äàííûõ äîñòàòî÷íî, è
     ñ÷èòàòü èíòåðïîëèðîâàííóþ ìîäåëü

                                ^ = λ + (1 − )λ .
                                λ




                       Ñåðãåé Íèêîëåíêî    Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
    Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé    Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
                                 Ðàçíîå    Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå



Èíòåðïîëÿöèÿ



     Ãëàâíîå  ïðàâèëüíî îöåíèòü (ýòî ôóíêöèÿ êîëè÷åñòâà
     èìåþùèõñÿ òåñòîâûõ äàííûõ).
     Åñòü ñïåöèàëüíûå ïîäõîäû, ïðè êîòîðûõ äàííûå äåëÿòñÿ
     íà D = D1 ∪ D2 , ïîòîì D1 èñïîëüçóåòñÿ äëÿ òðåíèðîâêè, à
     D2  äëÿ îöåíêè . Ðàçáèåíèå ìîæíî ñî âðåìåíåì
     äâèãàòü.
     Äðóãîé ïóòü  äîáàâëÿòü ñïåöèàëüíûå îãðàíè÷åíèÿ
     (íàïðèìåð, bj (k ) ≥ ).




                       Ñåðãåé Íèêîëåíêî    Ñêðûòûå ìàðêîâñêèå ìîäåëè
Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå   Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
   Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé   Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
                                Ðàçíîå   Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå




Ñïàñèáî çà âíèìàíèå!

   Lecture notes è ñëàéäû áóäóò ïîÿâëÿòüñÿ íà ìîåé
   homepage:
   http://logic.pdmi.ras.ru/∼sergey/index.php?page=teaching
   Ïðèñûëàéòå ëþáûå çàìå÷àíèÿ, ðåøåíèÿ óïðàæíåíèé,
   íîâûå ÷èñëåííûå ïðèìåðû è ïðî÷åå ïî àäðåñàì:
   sergey@logic.pdmi.ras.ru, snikolenko@gmail.com
   Çàõîäèòå â ÆÆ             smartnik.




                      Ñåðãåé Íèêîëåíêî   Ñêðûòûå ìàðêîâñêèå ìîäåëè

More Related Content

What's hot

Тодорхой интеграл
Тодорхой интегралТодорхой интеграл
Тодорхой интегралBattur
 
Хязгаарыг бодох
Хязгаарыг бодохХязгаарыг бодох
Хязгаарыг бодохBattur
 
20090920 cryptoprotocols nikolenko_lecture02
20090920 cryptoprotocols nikolenko_lecture0220090920 cryptoprotocols nikolenko_lecture02
20090920 cryptoprotocols nikolenko_lecture02Computer Science Club
 
8 a i 2016_ros
8 a i 2016_ros8 a i 2016_ros
8 a i 2016_ros8new
 
20080323 machine learning_nikolenko_lecture05
20080323 machine learning_nikolenko_lecture0520080323 machine learning_nikolenko_lecture05
20080323 machine learning_nikolenko_lecture05Computer Science Club
 
20130216 machinelearning khachay_lecture01
20130216 machinelearning khachay_lecture0120130216 machinelearning khachay_lecture01
20130216 machinelearning khachay_lecture01Computer Science Club
 
20080316 machine learning_nikolenko_lecture03
20080316 machine learning_nikolenko_lecture0320080316 machine learning_nikolenko_lecture03
20080316 machine learning_nikolenko_lecture03Computer Science Club
 
8 rm s 2016
8 rm s 20168 rm s 2016
8 rm s 20168new
 
Проектирование и анализ расписания движения поездов на основе макс-плюс алгеб...
Проектирование и анализ расписания движения поездов на основе макс-плюс алгеб...Проектирование и анализ расписания движения поездов на основе макс-плюс алгеб...
Проектирование и анализ расписания движения поездов на основе макс-плюс алгеб...Evgenii Kozhanov
 
Математические модели и методы верификации программно-конфигурируемых сетей
Математические модели и методы верификации программно-конфигурируемых сетейМатематические модели и методы верификации программно-конфигурируемых сетей
Математические модели и методы верификации программно-конфигурируемых сетейARCCN
 
Олон хувьсагчтай функцийн экстремум
Олон хувьсагчтай функцийн экстремумОлон хувьсагчтай функцийн экстремум
Олон хувьсагчтай функцийн экстремумBattur
 
Олон хувьсагчтай функцийн үндэс
Олон хувьсагчтай функцийн үндэсОлон хувьсагчтай функцийн үндэс
Олон хувьсагчтай функцийн үндэсBattur
 
8 g i 2016
8 g i 20168 g i 2016
8 g i 20168new
 
Евгений Кирпичёв Многопоточное программирование
Евгений Кирпичёв   Многопоточное программированиеЕвгений Кирпичёв   Многопоточное программирование
Евгений Кирпичёв Многопоточное программированиеSiel01
 
Shugaman tegshitgel system
Shugaman tegshitgel systemShugaman tegshitgel system
Shugaman tegshitgel systemgansukh123
 
Гидротаран Марухина_Основные формулы
Гидротаран Марухина_Основные формулыГидротаран Марухина_Основные формулы
Гидротаран Марухина_Основные формулыVõ Hồng Quý
 
Автомобильный тахометр TХ-319t
Автомобильный тахометр TХ-319tАвтомобильный тахометр TХ-319t
Автомобильный тахометр TХ-319tkvz
 

What's hot (19)

Тодорхой интеграл
Тодорхой интегралТодорхой интеграл
Тодорхой интеграл
 
Хязгаарыг бодох
Хязгаарыг бодохХязгаарыг бодох
Хязгаарыг бодох
 
20090920 cryptoprotocols nikolenko_lecture02
20090920 cryptoprotocols nikolenko_lecture0220090920 cryptoprotocols nikolenko_lecture02
20090920 cryptoprotocols nikolenko_lecture02
 
8 a i 2016_ros
8 a i 2016_ros8 a i 2016_ros
8 a i 2016_ros
 
20080323 machine learning_nikolenko_lecture05
20080323 machine learning_nikolenko_lecture0520080323 machine learning_nikolenko_lecture05
20080323 machine learning_nikolenko_lecture05
 
20091004 mfcs itsykson_lecture04
20091004 mfcs itsykson_lecture0420091004 mfcs itsykson_lecture04
20091004 mfcs itsykson_lecture04
 
20130216 machinelearning khachay_lecture01
20130216 machinelearning khachay_lecture0120130216 machinelearning khachay_lecture01
20130216 machinelearning khachay_lecture01
 
20080316 machine learning_nikolenko_lecture03
20080316 machine learning_nikolenko_lecture0320080316 machine learning_nikolenko_lecture03
20080316 machine learning_nikolenko_lecture03
 
8 rm s 2016
8 rm s 20168 rm s 2016
8 rm s 2016
 
Проектирование и анализ расписания движения поездов на основе макс-плюс алгеб...
Проектирование и анализ расписания движения поездов на основе макс-плюс алгеб...Проектирование и анализ расписания движения поездов на основе макс-плюс алгеб...
Проектирование и анализ расписания движения поездов на основе макс-плюс алгеб...
 
Математические модели и методы верификации программно-конфигурируемых сетей
Математические модели и методы верификации программно-конфигурируемых сетейМатематические модели и методы верификации программно-конфигурируемых сетей
Математические модели и методы верификации программно-конфигурируемых сетей
 
Ορόσημο Φροντιστήριο (Αθήνα). Βοήθημα μαθηματικών Α' λυκείου 2015 |
Ορόσημο Φροντιστήριο (Αθήνα). Βοήθημα μαθηματικών Α' λυκείου 2015 |Ορόσημο Φροντιστήριο (Αθήνα). Βοήθημα μαθηματικών Α' λυκείου 2015 |
Ορόσημο Φροντιστήριο (Αθήνα). Βοήθημα μαθηματικών Α' λυκείου 2015 |
 
Олон хувьсагчтай функцийн экстремум
Олон хувьсагчтай функцийн экстремумОлон хувьсагчтай функцийн экстремум
Олон хувьсагчтай функцийн экстремум
 
Олон хувьсагчтай функцийн үндэс
Олон хувьсагчтай функцийн үндэсОлон хувьсагчтай функцийн үндэс
Олон хувьсагчтай функцийн үндэс
 
8 g i 2016
8 g i 20168 g i 2016
8 g i 2016
 
Евгений Кирпичёв Многопоточное программирование
Евгений Кирпичёв   Многопоточное программированиеЕвгений Кирпичёв   Многопоточное программирование
Евгений Кирпичёв Многопоточное программирование
 
Shugaman tegshitgel system
Shugaman tegshitgel systemShugaman tegshitgel system
Shugaman tegshitgel system
 
Гидротаран Марухина_Основные формулы
Гидротаран Марухина_Основные формулыГидротаран Марухина_Основные формулы
Гидротаран Марухина_Основные формулы
 
Автомобильный тахометр TХ-319t
Автомобильный тахометр TХ-319tАвтомобильный тахометр TХ-319t
Автомобильный тахометр TХ-319t
 

Viewers also liked

L'ortodonzia fissa secondo il Centro Vitaldent di Latina
L'ortodonzia fissa secondo il Centro Vitaldent di LatinaL'ortodonzia fissa secondo il Centro Vitaldent di Latina
L'ortodonzia fissa secondo il Centro Vitaldent di LatinaVitaldentItalia
 
20080224 cryptography hirsch_lecture02
20080224 cryptography hirsch_lecture0220080224 cryptography hirsch_lecture02
20080224 cryptography hirsch_lecture02Computer Science Club
 
20071104 verification konev_lecture14
20071104 verification konev_lecture1420071104 verification konev_lecture14
20071104 verification konev_lecture14Computer Science Club
 
Exportaciones del Ecuador20
Exportaciones del Ecuador20Exportaciones del Ecuador20
Exportaciones del Ecuador20DANY HERNANDEZ
 
El color
El colorEl color
El colorgene_29
 
MI CONTEXTO DE FORMACION
MI CONTEXTO DE FORMACIONMI CONTEXTO DE FORMACION
MI CONTEXTO DE FORMACIONjonathanym1984
 
Projeto execucao lf
Projeto execucao lfProjeto execucao lf
Projeto execucao lff3fernando
 
20080323 efficientalgorithms kulikov_lecture19
20080323 efficientalgorithms kulikov_lecture1920080323 efficientalgorithms kulikov_lecture19
20080323 efficientalgorithms kulikov_lecture19Computer Science Club
 
Metode berpikir-filsafat-islam
Metode berpikir-filsafat-islamMetode berpikir-filsafat-islam
Metode berpikir-filsafat-islamBusiness idea
 
Bagan debat tk. kab. serang april 2014
Bagan debat tk.  kab. serang  april  2014Bagan debat tk.  kab. serang  april  2014
Bagan debat tk. kab. serang april 2014Rohadi Mpd
 
Legal, ethical and contracutal assignment
Legal, ethical and contracutal assignment Legal, ethical and contracutal assignment
Legal, ethical and contracutal assignment Cherie17
 
PRIME LEASING LOGO FINAL3
PRIME LEASING LOGO FINAL3PRIME LEASING LOGO FINAL3
PRIME LEASING LOGO FINAL3Ivana Vidinlic
 

Viewers also liked (20)

Sampel map
Sampel mapSampel map
Sampel map
 
L'ortodonzia fissa secondo il Centro Vitaldent di Latina
L'ortodonzia fissa secondo il Centro Vitaldent di LatinaL'ortodonzia fissa secondo il Centro Vitaldent di Latina
L'ortodonzia fissa secondo il Centro Vitaldent di Latina
 
Factorizacion
FactorizacionFactorizacion
Factorizacion
 
Sena
SenaSena
Sena
 
20080224 cryptography hirsch_lecture02
20080224 cryptography hirsch_lecture0220080224 cryptography hirsch_lecture02
20080224 cryptography hirsch_lecture02
 
20071104 verification konev_lecture14
20071104 verification konev_lecture1420071104 verification konev_lecture14
20071104 verification konev_lecture14
 
Control y ejecucion
Control y ejecucionControl y ejecucion
Control y ejecucion
 
Exportaciones del Ecuador20
Exportaciones del Ecuador20Exportaciones del Ecuador20
Exportaciones del Ecuador20
 
El color
El colorEl color
El color
 
Marisol
 Marisol Marisol
Marisol
 
MI CONTEXTO DE FORMACION
MI CONTEXTO DE FORMACIONMI CONTEXTO DE FORMACION
MI CONTEXTO DE FORMACION
 
Projeto execucao lf
Projeto execucao lfProjeto execucao lf
Projeto execucao lf
 
Cembre TC120 Hydraulic Cable Cuttting Tool Manual
Cembre TC120 Hydraulic Cable Cuttting Tool ManualCembre TC120 Hydraulic Cable Cuttting Tool Manual
Cembre TC120 Hydraulic Cable Cuttting Tool Manual
 
Chamilo
ChamiloChamilo
Chamilo
 
20080323 efficientalgorithms kulikov_lecture19
20080323 efficientalgorithms kulikov_lecture1920080323 efficientalgorithms kulikov_lecture19
20080323 efficientalgorithms kulikov_lecture19
 
Metode berpikir-filsafat-islam
Metode berpikir-filsafat-islamMetode berpikir-filsafat-islam
Metode berpikir-filsafat-islam
 
Bagan debat tk. kab. serang april 2014
Bagan debat tk.  kab. serang  april  2014Bagan debat tk.  kab. serang  april  2014
Bagan debat tk. kab. serang april 2014
 
Jornal UTFPR Notícias 2012
Jornal UTFPR Notícias 2012Jornal UTFPR Notícias 2012
Jornal UTFPR Notícias 2012
 
Legal, ethical and contracutal assignment
Legal, ethical and contracutal assignment Legal, ethical and contracutal assignment
Legal, ethical and contracutal assignment
 
PRIME LEASING LOGO FINAL3
PRIME LEASING LOGO FINAL3PRIME LEASING LOGO FINAL3
PRIME LEASING LOGO FINAL3
 

More from Computer Science Club

20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugsComputer Science Club
 
20140531 serebryany lecture02_find_scary_cpp_bugs
20140531 serebryany lecture02_find_scary_cpp_bugs20140531 serebryany lecture02_find_scary_cpp_bugs
20140531 serebryany lecture02_find_scary_cpp_bugsComputer Science Club
 
20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugsComputer Science Club
 
20140511 parallel programming_kalishenko_lecture12
20140511 parallel programming_kalishenko_lecture1220140511 parallel programming_kalishenko_lecture12
20140511 parallel programming_kalishenko_lecture12Computer Science Club
 
20140427 parallel programming_zlobin_lecture11
20140427 parallel programming_zlobin_lecture1120140427 parallel programming_zlobin_lecture11
20140427 parallel programming_zlobin_lecture11Computer Science Club
 
20140420 parallel programming_kalishenko_lecture10
20140420 parallel programming_kalishenko_lecture1020140420 parallel programming_kalishenko_lecture10
20140420 parallel programming_kalishenko_lecture10Computer Science Club
 
20140413 parallel programming_kalishenko_lecture09
20140413 parallel programming_kalishenko_lecture0920140413 parallel programming_kalishenko_lecture09
20140413 parallel programming_kalishenko_lecture09Computer Science Club
 
20140329 graph drawing_dainiak_lecture02
20140329 graph drawing_dainiak_lecture0220140329 graph drawing_dainiak_lecture02
20140329 graph drawing_dainiak_lecture02Computer Science Club
 
20140329 graph drawing_dainiak_lecture01
20140329 graph drawing_dainiak_lecture0120140329 graph drawing_dainiak_lecture01
20140329 graph drawing_dainiak_lecture01Computer Science Club
 
20140310 parallel programming_kalishenko_lecture03-04
20140310 parallel programming_kalishenko_lecture03-0420140310 parallel programming_kalishenko_lecture03-04
20140310 parallel programming_kalishenko_lecture03-04Computer Science Club
 
20140216 parallel programming_kalishenko_lecture01
20140216 parallel programming_kalishenko_lecture0120140216 parallel programming_kalishenko_lecture01
20140216 parallel programming_kalishenko_lecture01Computer Science Club
 

More from Computer Science Club (20)

20141223 kuznetsov distributed
20141223 kuznetsov distributed20141223 kuznetsov distributed
20141223 kuznetsov distributed
 
Computer Vision
Computer VisionComputer Vision
Computer Vision
 
20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs
 
20140531 serebryany lecture02_find_scary_cpp_bugs
20140531 serebryany lecture02_find_scary_cpp_bugs20140531 serebryany lecture02_find_scary_cpp_bugs
20140531 serebryany lecture02_find_scary_cpp_bugs
 
20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs
 
20140511 parallel programming_kalishenko_lecture12
20140511 parallel programming_kalishenko_lecture1220140511 parallel programming_kalishenko_lecture12
20140511 parallel programming_kalishenko_lecture12
 
20140427 parallel programming_zlobin_lecture11
20140427 parallel programming_zlobin_lecture1120140427 parallel programming_zlobin_lecture11
20140427 parallel programming_zlobin_lecture11
 
20140420 parallel programming_kalishenko_lecture10
20140420 parallel programming_kalishenko_lecture1020140420 parallel programming_kalishenko_lecture10
20140420 parallel programming_kalishenko_lecture10
 
20140413 parallel programming_kalishenko_lecture09
20140413 parallel programming_kalishenko_lecture0920140413 parallel programming_kalishenko_lecture09
20140413 parallel programming_kalishenko_lecture09
 
20140329 graph drawing_dainiak_lecture02
20140329 graph drawing_dainiak_lecture0220140329 graph drawing_dainiak_lecture02
20140329 graph drawing_dainiak_lecture02
 
20140329 graph drawing_dainiak_lecture01
20140329 graph drawing_dainiak_lecture0120140329 graph drawing_dainiak_lecture01
20140329 graph drawing_dainiak_lecture01
 
20140310 parallel programming_kalishenko_lecture03-04
20140310 parallel programming_kalishenko_lecture03-0420140310 parallel programming_kalishenko_lecture03-04
20140310 parallel programming_kalishenko_lecture03-04
 
20140223-SuffixTrees-lecture01-03
20140223-SuffixTrees-lecture01-0320140223-SuffixTrees-lecture01-03
20140223-SuffixTrees-lecture01-03
 
20140216 parallel programming_kalishenko_lecture01
20140216 parallel programming_kalishenko_lecture0120140216 parallel programming_kalishenko_lecture01
20140216 parallel programming_kalishenko_lecture01
 
20131106 h10 lecture6_matiyasevich
20131106 h10 lecture6_matiyasevich20131106 h10 lecture6_matiyasevich
20131106 h10 lecture6_matiyasevich
 
20131027 h10 lecture5_matiyasevich
20131027 h10 lecture5_matiyasevich20131027 h10 lecture5_matiyasevich
20131027 h10 lecture5_matiyasevich
 
20131027 h10 lecture5_matiyasevich
20131027 h10 lecture5_matiyasevich20131027 h10 lecture5_matiyasevich
20131027 h10 lecture5_matiyasevich
 
20131013 h10 lecture4_matiyasevich
20131013 h10 lecture4_matiyasevich20131013 h10 lecture4_matiyasevich
20131013 h10 lecture4_matiyasevich
 
20131006 h10 lecture3_matiyasevich
20131006 h10 lecture3_matiyasevich20131006 h10 lecture3_matiyasevich
20131006 h10 lecture3_matiyasevich
 
20131006 h10 lecture3_matiyasevich
20131006 h10 lecture3_matiyasevich20131006 h10 lecture3_matiyasevich
20131006 h10 lecture3_matiyasevich
 

20080420 machine learning_nikolenko_lecture10

  • 1. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Ðàçíîå Ñêðûòûå ìàðêîâñêèå ìîäåëè Ñåðãåé Íèêîëåíêî Machine Learning CS Club, âåñíà 2008 Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 2. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Outline 1 Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Âîçíèêàþùèå çàäà÷è Ðåøåíèÿ çàäà÷ 2 Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ 3 Ðàçíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 3. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Ìàðêîâñêèå öåïè Ìàðêîâñêàÿ öåïü çàäà¼òñÿ íà÷àëüíûì ðàñïðåäåëåíèåì âåðîÿòíîñòåé p 0 (x ) è âåðîÿòíîñòÿìè ïåðåõîäà T (x ; x ). T (x ; x ) ýòî ðàñïðåäåëåíèå ñëåäóþùåãî ýëåìåíòà öåïè â çàâèñèìîñòè îò ñëåäóþùåãî; ðàñïðåäåëåíèå íà (t + 1)ì øàãå ðàâíî pt +1 (x )= T (x ; x )pt (x )dx .  äèñêðåòíîì ñëó÷àå T (x ; x ) ýòî ìàòðèöà âåðîÿòíîñòåé p(x = i |x = j ). Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 4. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Äèñêðåòíûå ìàðêîâñêèå öåïè Ìû áóäåì íàõîäèòüñÿ â äèñêðåòíîì ñëó÷àå. Ìàðêîâñêàÿ ìîäåëü ýòî êîãäà ìû ìîæåì íàáëþäàòü êàêèå-òî ôóíêöèè îò ìàðêîâñêîãî ïðîöåññà. Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 5. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Äèñêðåòíûå ìàðêîâñêèå öåïè Çäåñü x (t ) ñàì ïðîöåññ (ìîäåëü), à y (t ) òî, ÷òî ìû íàáëþäàåì. Çàäà÷à îïðåäåëèòü ñêðûòûå ïàðàìåòðû ïðîöåññà. Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 6. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Äèñêðåòíûå ìàðêîâñêèå öåïè Ãëàâíîå ñâîéñòâî ñëåäóþùåå ñîñòîÿíèå íå çàâèñèò îò èñòîðèè, òîëüêî îò ïðåäûäóùåãî ñîñòîÿíèÿ. p(x (t ) = xj |x (t − 1) = xjt− 1 , . . . , x (1) = xj ) = 1 = p (x (t ) = xj |x (t − 1) = xjt − ). 1 Áîëåå òîãî, ýòè âåðîÿòíîñòè aij = p (x (t ) = xj |x (t − 1) = xi ) åù¼ è îò âðåìåíè t íå çàâèñÿò. Ýòè âåðîÿòíîñòè è ñîñòàâëÿþò ìàòðèöó ïåðåõîäà A = (aij ). Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 7. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Âåðîÿòíîñòè ïåðåõîäà Åñòåñòâåííûå ñâîéñòâà: aij ≥ 0. j aij = 1. Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 8. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Ïðÿìàÿ çàäà÷à Åñòåñòâåííàÿ çàäà÷à: ñ êàêîé âåðîÿòíîñòüþ âûïàäåò òà èëè èíàÿ ïîñëåäîâàòåëüíîñòü ñîáûòèé? Ò.å. íàéòè íóæíî äëÿ ïîñëåäîâàòåëüíîñòè Q = qi 1 . . . qik p(Q |ìîäåëü) = p(qi )p(qi |qi 1 2 1 ) . . . p (qik |qik − ). 1 Êàçàëîñü áû, ýòî òðèâèàëüíî. ×òî æå ñëîæíîãî â ðåàëüíûõ çàäà÷àõ? Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 9. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Ñêðûòûå ìàðêîâñêèå ìîäåëè À ñëîæíî òî, ÷òî íèêòî íàì íå ñêàæåò, ÷òî ìîäåëü äîëæíà áûòü èìåííî òàêîé. È, êðîìå òîãî, ìû îáû÷íî íàáëþäàåì íå x (t ), ò.å. ðåàëüíûå ñîñòîÿíèÿ ìîäåëè, à y (t ), ò.å. íåêîòîðóþ ôóíêöèþ îò íèõ (äàííûå). Äàâàéòå ïðèâåä¼ì ïðèìåð. Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 10. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Ñêðûòûå ìàðêîâñêèå ìîäåëè: ïðèìåð Ïóñòü êòî-òî áðîñàåò ìîíåòêó è ñîîáùàåò íàì ðåçóëüòàòû ïîñëåäîâàòåëüíîñòü îðëîâ è ðåøåê. Íî ìû íå çíàåì, ÷òî îí áðîñàåò ìîíåòêó, ìû òîëüêî çíàåì, ÷òî åñòü âîò òàêàÿ ïîñëåäîâàòåëüíîñòü áèòîâ. Åñëè ìû ïðåäïîëîæèì, ÷òî îí áðîñàåò îäíó ìîíåòêó, ìîäåëü áóäåò îäíà: äâà ñîñòîÿíèÿ, âåðîÿòíîñòè ïåðåõîäà ìåæäó íèìè p è 1 − p , âåðîÿòíîñòè îñòàòüñÿ 1 − p è p . Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 11. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Ñêðûòûå ìàðêîâñêèå ìîäåëè: ïðèìåð Íî ìû æå ìîæåì ïîäóìàòü, ÷òî ó íåãî äâå ìîíåòêè! :) Òîãäà ñîñòîÿíèÿ ïî-ïðåæíåìó äâà, íî ïàðàìåòðîâ áîëüøå. À åñëè òðè ìîíåòêè?..  îáùåì, çàäà÷è óæå ÿñíû. Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 12. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Çàäà÷è ñêðûòûõ ìàðêîâñêèõ ìîäåëåé Ïåðâàÿ: íàéòè âåðîÿòíîñòü ïîñëåäîâàòåëüíîñòè íàáëþäåíèé â äàííîé ìîäåëè. Âòîðàÿ: íàéòè ¾îïòèìàëüíóþ¿ ïîñëåäîâàòåëüíîñòü ñîñòîÿíèé ïðè óñëîâèè äàííîé ìîäåëè è äàííîé ïîñëåäîâàòåëüíîñòè íàáëþäåíèé. Òðåòüÿ: íàéòè íàèáîëåå ïðàâäîïîäîáíóþ ìîäåëü (ïàðàìåòðû ìîäåëè). Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 13. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Ñîñòîÿíèÿ è íàáëþäàåìûå X = {x1 , . . . , xn } ìíîæåñòâî ñîñòîÿíèé. V = {v1 , . . . , vm } àëôàâèò, èç êîòîðîãî ìû âûáèðàåì íàáëþäàåìûå y (ìíîæåñòâî çíà÷åíèé y ). qt ñîñòîÿíèå âî âðåìÿ t , yt íàáëþäàåìàÿ âî âðåìÿ t . Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 14. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Ðàñïðåäåëåíèÿ aij = p(qt +1 = xj |qt = xi ) âåðîÿòíîñòü ïåðåõîäà èç i â j . bj (k ) = p(vk |xj ) âåðîÿòíîñòü ïîëó÷èòü äàííûå vk â ñîñòîÿíèè j . Íà÷àëüíîå ðàñïðåäåëåíèå π = {πj }, πj = p (q1 = xj ). Äàííûå áóäåì îáîçíà÷àòü ÷åðåç D = d1 . . . dT (ïîñëåäîâàòåëüíîñòü íàáëþäàåìûõ, di ïðèíèìàþò çíà÷åíèÿ èç V ). Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 15. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Êîììåíòàðèé Ïðîùå ãîâîðÿ, âîò êàê ðàáîòàåò HMM (hidden Markov model). Âûáåðåì íà÷àëüíîå ñîñòîÿíèå x1 ïî ðàñïðåäåëåíèþ π. Ïî t îò 1 äî T : Âûáåðåì íàáëþäàåìóþ d t ïî ðàñïðåäåëåíèþ p (v |x ). k j Âûáåðåì ñëåäóþùåå ñîñòîÿíèå ïî ðàñïðåäåëåíèþ p (qt +1 = x |q = x ). j t i Òàêèì àëãîðèòìîì ìîæíî âûáðàòü ñëó÷àéíóþ ïîñëåäîâàòåëüíîñòü íàáëþäàåìûõ. Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 16. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Çàäà÷è Òåïåðü ìîæíî ôîðìàëèçîâàòü ïîñòàíîâêó çàäà÷. Ïåðâàÿ çàäà÷à: ïî äàííîé ìîäåëè λ = (A, B , π) è ïîñëåäîâàòåëüíîñòè D íàéòè p (D |λ). Ôàêòè÷åñêè, ýòî íóæíî äëÿ òîãî, ÷òîáû îöåíèòü, íàñêîëüêî õîðîøî ìîäåëü ïîäõîäèò ê äàííûì. Âòîðàÿ çàäà÷à: ïî äàííîé ìîäåëè λ è ïîñëåäîâàòåëüíîñòè D íàéòè ¾îïòèìàëüíóþ¿ ïîñëåäîâàòåëüíîñòü ñîñòîÿíèé Q = q1 . . . qT . Êàê è ðàíüøå, áóäåò äâà ðåøåíèÿ: ¾ïîáèòîâîå¿ è îáùåå. Òðåòüÿ çàäà÷à: îïòèìèçèðîâàòü ïàðàìåòðû ìîäåëè λ = (A, B , π) òàê, ÷òîáû ìàêñèìèçèðîâàòü p (D |λ) ïðè äàííîì D (íàéòè ìîäåëü ìàêñèìàëüíîãî ïðàâäîïîäîáèÿ). Ýòà çàäà÷à ãëàâíàÿ, â íåé è çàêëþ÷àåòñÿ îáó÷åíèå ñêðûòûõ ìàðêîâñêèõ ìîäåëåé. Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 17. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Ïîñòàíîâêà ïåðâîé çàäà÷è Ôîðìàëüíî, ïåðâàÿ çàäà÷à âûãëÿäèò òàê. Íóæíî íàéòè p(D |λ) = p(D |Q , λ)p(D |λ) = Q = bq (d1 ) . . . bqT (dT )πq aq q 1 1 1 2 . . . aqT − qT . 1 q 1 ,...,qT Íè÷åãî íå íàïîìèíàåò? Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 18. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Ñóòü ðåøåíèÿ ïåðâîé çàäà÷è Ïðàâèëüíî, ýòî òàêàÿ æå çàäà÷à ìàðãèíàëèçàöèè, êàê ìû ðåøàåì âñ¼ âðåìÿ. Ìû âîñïîëüçóåìñÿ òàê íàçûâàåìîé forwardbackward procedure, ïî ñóòè âû÷èñëåíèåì íà ðåø¼òêå, êàê â äåêîäèðîâàíèè. Áóäåì ïîñëåäîâàòåëüíî âû÷èñëÿòü ïðîìåæóòî÷íûå âåëè÷èíû âèäà αt (i ) = p (d1 . . . dt , qt = xi |λ), ò.å. èñêîìûå âåðîÿòíîñòè, íî åù¼ ñ ó÷¼òîì òåêóùåãî ñîñòîÿíèÿ. Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 19. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Ðåøåíèå ïåðâîé çàäà÷è Èíèöèàëèçèðóåì α1 (i ) = πi bi (d1 ). Øàã èíäóêöèè: n αt +1 (j ) = αt (i )aij bj (dt +1 ). i =1 Ïîñëå òîãî êàê äîéä¼ì äî øàãà T , ïîäñ÷èòàåì òî, ÷òî íàì íóæíî: n p(D |λ) = αT (i ). i =1 Ôàêòè÷åñêè, ýòî òîëüêî ïðÿìîé ïðîõîä, îáðàòíûé íàì çäåñü íå ïîíàäîáèëñÿ. ×òî âû÷èñëÿë áû îáðàòíûé ïðîõîä? Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 20. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Îáðàòíûé ïðîõîä Îí âû÷èñëÿë áû óñëîâíûå âåðîÿòíîñòè βt (i ) = p (dt +1 . . . dT |qt = xi , λ). Èõ ìîæíî âû÷èñëèòü, ïðîèíèöèàëèçèðîâàâ βT (i ) = 1, à çàòåì ïî èíäóêöèè: n βt (i ) = aij bj (dt +1 )βt +1 (j ). j =1 Ýòî íàì ïðèãîäèòñÿ ÷óòü ïîçæå, ïðè ðåøåíèè âòîðîé è òðåòüåé çàäà÷è. Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 21. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Äâà âàðèàíòà âòîðîé çàäà÷è Êàê ìû óæå óïîìèíàëè, âîçìîæíû äâà âàðèàíòà. Ïåðâûé: ðåøàòü ¾ïîáèòîâî¿, îòâå÷àÿ íà âîïðîñ ¾êàêîå íàèáîëåå âåðîÿòíîå ñîñòîÿíèå âî âðåìÿ j ?¿. Âòîðîé: ðåøàòü çàäà÷ó ¾êàêàÿ íàèáîëåå âåðîÿòíàÿ ïîñëåäîâàòåëüíîñòü ñîñòîÿíèé?¿. Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 22. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Ïîáèòîâîå ðåøåíèå Ðàññìîòðèì âñïîìîãàòåëüíûå ïåðåìåííûå γt (i ) = p (qt = xi |D , λ). Íàøà çàäà÷à íàéòè qt = argmax1≤i ≤n γt (i ), 1 ≤ t ≤ T. Êàê ýòî ñäåëàòü? Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 23. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Ïîáèòîâîå ðåøåíèå Âûðàæàåì ÷åðåç α è β: αt (i )βt (i ) αt (i )βt (i ) γt (i ) = = n α (i )β (i ) . p(D |λ) i =1 t t Íà çíàìåíàòåëü ìîæíî íå îáðàùàòü âíèìàíèÿ íàì íóæåí argmax. Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 24. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Ðåøåíèå îòíîñèòåëüíî ïîñëåäîâàòåëüíîñòè ×òîáû îòâåòèòü íà âîïðîñ î íàèáîëåå âåðîÿòíîé ïîñëåäîâàòåëüíîñòè, ìû áóäåì èñïîëüçîâàòü óæå çíàêîìûé àëãîðèòì Âèòåðáè. Òî åñòü, ïî ñóòè, òî æå ñàìîå äèíàìè÷åñêîå ïðîãðàììèðîâàíèå. Íàøè âñïîìîãàòåëüíûå ïåðåìåííûå ýòî δt (i ) = max p (q1 q2 . . . qt = xi , d1 d2 . . . dt |λ) . q 1 ,...,qt −1 Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 25. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Ðåøåíèå îòíîñèòåëüíî ïîñëåäîâàòåëüíîñòè Ò.å. δt (i ) ìàêñèìàëüíàÿ âåðîÿòíîñòü äîñòè÷ü ñîñòîÿíèÿ xi íà øàãå t ñðåäè âñåõ ïóòåé ñ çàäàííûìè íàáëþäàåìûìè. Ïî èíäóêöèè: δt +1 (j ) = max δt (i )aij bj (dt +1 ). i È íàäî åù¼ çàïîìèíàòü àðãóìåíòû, à íå òîëüêî çíà÷åíèÿ; äëÿ ýòîãî áóäåò ìàññèâ ψt (j ). Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 26. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Ðåøåíèå îòíîñèòåëüíî ïîñëåäîâàòåëüíîñòè: àëãîðèòì Ïðîèíèöèàëèçèðóåì δ1 (i ) = πi bi (d1 ), ψ1 (i ) = []. Èíäóêöèÿ: δt (j ) = max [δt −1 (i )aij ] bj (dt ), 1≤i ≤n ψt (j ) = argmax1≤i ≤n [δt −1 (i )aij ] . Êîãäà äîéä¼ì äî øàãà T , ôèíàëüíûé øàã: p∗ = max δT (i ), qT ∗ = argmax1≤i ≤n δT (i ). 1≤i ≤n È âû÷èñëèì ïîñëåäîâàòåëüíîñòü: qt = ψt +1 (qt +1 ). ∗ ∗ Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 27. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Îáùàÿ ñóòü òðåòüåé çàäà÷è Àíàëèòè÷åñêè íàéòè ãëîáàëüíûé ìàêñèìóì p (D |λ) ó íàñ íèêàê íå ïîëó÷èòñÿ. Çàòî ìû ðàññìîòðèì èòåðàòèâíóþ ïðîöåäóðó (ïî ñóòè ãðàäèåíòíûé ïîäú¼ì), êîòîðàÿ ïðèâåä¼ò ê ëîêàëüíîìó ìàêñèìóìó. Ýòî íàçûâàåòñÿ àëãîðèòì ÁàóìàÂåëõà (BaumWelch algorithm). Îí ÿâëÿåòñÿ íà ñàìîì äåëå ÷àñòíûì ñëó÷àåì àëãîðèòìà EM. Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 28. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Âñïîìîãàòåëüíûå ïåðåìåííûå Òåïåðü íàøèìè âñïîìîãàòåëüíûìè ïåðåìåííûìè áóäóò âåðîÿòíîñòè òîãî, ÷òî ìû âî âðåìÿ t â ñîñòîÿíèè xi , à âî âðåìÿ t + 1 â ñîñòîÿíèè xj : ξt (i , j ) = p (qt = xi , qt +1 = xj |D , λ). Åñëè ïåðåïèñàòü ÷åðåç óæå çíàêîìûå ïåðåìåííûå: αt (i )aij bj (dt +1 )βt +1 (j ) αt (i )aij bj (dt +1 )βt +1 (j ) ξt (i , j ) = = . p(D |λ) i j αt (i )aij bj (dt +1 )βt +1 (j ) Îòìåòèì òàêæå, ÷òî γt (i ) = j ξt (i , j ). Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 29. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Èäåÿ t γt (i ) ýòî îæèäàåìîå êîëè÷åñòâî ïåðåõîäîâ èç ñîñòîÿíèÿ xi , à t ξt (i , j ) èç xi â xj . Òåïåðü íà øàãå M ìû áóäåì ïåðåîöåíèâàòü âåðîÿòíîñòè: πi = îæèäàåìàÿ ÷àñòîòà â xi íà øàãå 1 = γ1 (i ), ê-âî ïåðåõîäîâ èç xi â xj t ξt (i , j ) . a ij = = ê-âî ïåðåõîäîâ èç xi t γt (i ) bj (k ) = ê-âî ïîÿâëåíèé â xi è íàáëþäåíèé vk = t :dt =vk γt (i ) . ê-âî ïîÿâëåíèé â xi t γt (i ) EM-àëãîðèòì ïðèâåä¼ò ê öåëè: íà÷àòü ñ λ = (A, B , π), ïîäñ÷èòàòü = (A, B , π), ñíîâà ïåðåñ÷èòàòü ïàðàìåòðû è λ ò.ä. Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 30. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Ðàññòîÿíèå ÊóëüáàêàËåéáëåðà KullbackLeibler distance (divergence) ýòî èíôîðìàöèîííî-òåîðåòè÷åñêàÿ ìåðà òîãî, íàñêîëüêî äàëåêè ðàñïðåäåëåíèÿ äðóã îò äðóãà. p1 (x ) DKL (p1 , p2 ) = p1 (x ) log . x p2 (x ) Èçâåñòíî, ÷òî ýòî ðàññòîÿíèå âñåãäà íåîòðèöàòåëüíî, ðàâíî íóëþ i p1 ≡ p2 . Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 31. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Ïðèìåíèòåëüíî ê HMM Ìû îïðåäåëèì p(Q , D |λ) p(Q , D |λ ) p1 (Q ) = , p2 (Q ) = . p(D |λ) p(D |λ ) Òîãäà p1 è p2 ðàñïðåäåëåíèÿ, è ðàññòîÿíèå KullbackLeibler: p(Q , D |λ) p(Q , D |λ)p(D |λ ) 0 ≤ DLK (λ, λ ) = log = Q p (D |λ) p(Q , D |λ )p(D |λ) p(D |λ ) p(Q , D |λ) p(Q , D |λ) = log + log . p(D |λ) Q p(D |λ) p(Q , D |λ ) Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 32. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Ðàçíîå Ðåøåíèÿ çàäà÷ Âñïîìîãàòåëüíàÿ ôóíêöèÿ Ââåä¼ì âñïîìîãàòåëüíóþ ôóíêöèþ Q (λ, λ ) = p(Q |D , λ) log p(Q |D , λ ). Q Òîãäà èç íåðàâåíñòâà ñëåäóåò, ÷òî Q (λ, λ ) − Q (λ, λ) ≤ log p(D |λ ) . p(D |λ) p(D |λ) Ò.å., åñëè Q (λ, λ ) Q (λ, λ), òî p(D |λ ) p(D |λ). Ò.å., åñëè ìû ìàêñèìèçèðóåì Q (λ, λ ) ïî λ , ìû òåì ñàìûì áóäåì äâèãàòüñÿ â íóæíóþ ñòîðîíó. Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 33. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è Q Ðàçíîå Ðåøåíèÿ çàäà÷ Ôóíêöèÿ Íóæíî ìàêñèìèçèðîâàòü Q (λ, λ ). Ïåðåïèøåì: Q (λ, λ ) = p(Q |D , λ) log p(Q |D , λ ) = Q = p(Q |D , λ) log πq 1 aqt− qt bqt (dt ) = 1 Q t = p(Q |D , λ) log πq 1 + p(Q |D , λ) log aqt − qt bqt (dt ). 1 Q Q t Ïîñëåäíåå âûðàæåíèå ëåãêî äèôôåðåíöèðîâàòü ïî aij , bi (k ) è πi , äîáàâëÿòü ñîîòâåòñòâóþùèå ìíîæèòåëè Ëàãðàíæà è ðåøàòü. Ïîëó÷èòñÿ èìåííî ïåðåñ÷¼ò ïî àëãîðèòìó ÁàóìàÂåëõà (ïðîâåðüòå!). Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 34. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ Ðàçíîå Outline 1 Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Âîçíèêàþùèå çàäà÷è Ðåøåíèÿ çàäà÷ 2 Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ 3 Ðàçíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 35. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ Ðàçíîå Ñïåöèàëüíûå âèäû ìîäåëåé HMM ýðãîäè÷íà, åñëè ∀i , j aij 0. HMM àöèêëè÷íà (left-right model, Bakis model), åñëè ∀j i aij = 0 (ìàòðèöà òðåóãîëüíàÿ) è π1 = 1 (íà÷èíàåì âñåãäà â ñîñòîÿíèè 1).  àöèêëè÷íûõ ñåòÿõ åù¼ ÷àñòî áûâàåò îãðàíè÷åíèå íà ïðûæîê (constrained jump) ðàçìåðîì ∆: ∀j i + ∆ aij = 0 (ìàòðèöà ìóëüòèäèàãîíàëüíàÿ). Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 36. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ Ðàçíîå Íåïðåðûâíûå ïëîòíîñòè íàáëþäàåìûõ Ó íàñ áûëè äèñêðåòíûå íàáëþäàåìûå ñ âåðîÿòíîñòÿìè B = (bj (k )). Íî â ðåàëüíîé æèçíè âñ¼ ñëîæíåå: çà÷àñòóþ ìû íàáëþäàåì íåïðåðûâíûå ñèãíàëû, à íå äèñêðåòíûå âåëè÷èíû, è äèñêðåòèçîâàòü èõ èëè ïëîõî, èëè íåóäîáíî. Ïðè ýòîì ñàìó öåïü ìîæíî îñòàâèòü äèñêðåòíîé, ò.å. ïåðåéòè ê íåïðåðûâíûì bj (D ). Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 37. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ Ðàçíîå Ñïåöèàëüíûé âèä ïëîòíîñòè Íå äëÿ âñåõ ïëîòíîñòåé íàéäåíû àëãîðèòìû ïåðåñ÷¼òà (îáîáùåíèÿ àëãîðèòìà ÁàóìàÂåëõà). Íàèáîëåå îáùèé ðåçóëüòàò âåðåí, êîãäà bj (D ) ìîæíî ïðåäñòàâèòü â âèäå M bj (D ) = cjm P(D , µjm , σjm ), m =1 ãäå cjm êîýôôèöèåíòû ñìåñè ( m cjm = 1), à P âûïóêëîå ðàñïðåäåëåíèå ñî ñðåäíèì µ è âàðèàöèåé σ (ãàóññèàí ïîäîéä¼ò). Ê ñ÷àñòüþ, òàêîé êîíñòðóêöèåé ìîæíî ïðèáëèçèòü ëþáîå íåïðåðûâíîå ðàñïðåäåëåíèå, ïîýòîìó ýòî ìîæíî øèðîêî ïðèìåíÿòü. Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 38. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ Ðàçíîå Âñïîìîãàòåëüíûå ïåðåìåííûå γt (j , m) âåðîÿòíîñòü áûòü â ñîñòîÿíèè j âî âðåìÿ t , ïðè÷¼ì çà D îòâå÷àåò mé êîìïîíåíò ñìåñè. Ôîðìàëüíî ãîâîðÿ, αt (j )βt (j ) cjm P(dt , µjm , σjm ) γt (j , m) = N α (j )β (j ) M c P(d , µ , σ ) . j =1 t t m=1 jm t jm jm Åñëè M = 1, òî ýòî óæå èçâåñòíûå íàì γt (j ). Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 39. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ Ðàçíîå Àëãîðèòì äëÿ ýòîãî ñëó÷àÿ Íóæíî íàó÷èòüñÿ ïåðåñ÷èòûâàòü bj (D ), ò.å. ïåðåñ÷èòûâàòü cjm , µjm è σjm . Ýòî äåëàåòñÿ òàê: T γ (j , m) cjm = t =1 t , T M t =1 m=1 γt (j , m) T γ (j , m) · d 1 t t, µjm = t =T t =1 γt (j , m) T γ (j , m) · (d − µ )(d − µ )t σjm = t =1 t t jm t jm . T γ (j , m) t =1 t Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 40. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ Ðàçíîå Ïðîáëåìà Êàê ìîäåëèðîâàòü ïðîäîëæèòåëüíîñòü íàõîæäåíèÿ â òîì èëè èíîì ñîñòîÿíèè?  äèñêðåòíîì ñëó÷àå âåðîÿòíîñòü ïðîáûòü â ñîñòîÿíèè id øàãîâ: d pi (d ) = aii −1 (1 − aii ). Îäíàêî äëÿ áîëüøèíñòâà ôèçè÷åñêèõ ñèãíàëîâ òàêîå ýêñïîíåíöèàëüíîå ðàñïðåäåëåíèå íå ñîîòâåòñòâóåò äåéñòâèòåëüíîñòè. Ìû áû õîòåëè ÿâíî çàäàâàòü ïëîòíîñòü ïðåáûâàíèÿ â äàííîì ñîñòîÿíèè. Ò.å. âìåñòî êîýôôèöèåíòîâ ïåðåõîäà â ñåáÿ aii ÿâíîå çàäàíèå ðàñïðåäåëåíèÿ pi (d ). Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 41. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ Ðàçíîå Âñïîìîãàòåëüíûå ïåðåìåííûå Ââåä¼ì ïåðåìåííûå αt (i ) = p (d1 . . . dt , xi çàêàí÷èâàåòñÿ âî âðåìÿ t |λ). Âñåãî çà ïåðâûå t øàãîâ ïîñåùåíî r ñîñòîÿíèé q1 . . . qr , è ìû òàì îñòàâàëèñü d1 , . . . , dr . Ò.å. îãðàíè÷åíèÿ: r qr = xi , ds = t . s =1 Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 42. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ Ðàçíîå Âû÷èñëåíèå αt (i ) Òîãäà ïîëó÷àåòñÿ αt (i ) = πq pq (d1 )p (d1 d2 . . . dd |q1 ) 1 1 1 q d aq q pq (d2 )p(dd +1 . . . dd +d |q2 ) . . . 1 2 2 1 1 2 . . . aqr − qr pqr (dr )p (dd +...+dr − +1 . . . dt |qr ). 1 1 1 Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 43. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ Ðàçíîå Âû÷èñëåíèå αt (i ) Ïî èíäóêöèè n D t αt (j ) = αt −d (j )aij pj (d ) bj (ds ), i =1 d =1 s =t −d +1 ãäå D ìàêñèìàëüíàÿ îñòàíîâêà â ëþáîì èç ñîñòîÿíèé. Òîãäà, êàê è ðàíüøå, n p(d |λ) = αT (i ). i =1 Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 44. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ Ðàçíîå Âñïîìîãàòåëüíûå ïåðåìåííûå Äëÿ ïåðåñ÷¼òà ïîòðåáóþòñÿ åù¼ òðè ïåðåìåííûå: α∗ (i ) = p (d1 . . . dt , xi íà÷èíàåòñÿ âî âðåìÿ t + 1|λ), t βt (i ) = p (dt +1 . . . dT |xi çàêàí÷èâàåòñÿ âî âðåìÿ t , λ), β∗ (i ) = p (dt +1 . . . dT |xi íà÷èíàåòñÿ âî âðåìÿ t + 1, λ). t Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 45. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ Ðàçíîå Âñïîìîãàòåëüíûå ïåðåìåííûå Ñîîòíîøåíèÿ ìåæäó íèìè: n α∗ (j ) = t αt (i )aij , i =1 D t αt (i ) = α∗−d ( t i )pi (d ) bi (ds ), d =1 s =t −d +1 n βt (i ) = aij β∗ (j ), t j =1 D t +d β∗ (i ) = t βt +d (i )pi (d ) bi (ds ). d =1 s =t +1 Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 46. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ Ðàçíîå Ôîðìóëû ïåðåñ÷¼òà Ïðèâåä¼ì ôîðìóëû ïåðåñ÷¼òà. πi ïðîñòî âåðîÿòíîñòü òîãî, ÷òî xi áûë ïåðâûì ñîñòîÿíèåì: πi β∗ (i ) 0 πi = ^ . p(d |λ) aij òà æå ôîðìóëà, ÷òî îáû÷íî, òîëüêî âìåñòå ñ α åñòü åù¼ è β, êîòîðàÿ ãîâîðèò, ÷òî íîâîå ñîñòîÿíèå íà÷èíàåòñÿ íà ñëåäóþùåì øàãå: T α (i )a β∗ (j ) a ^ij = t =1 t ij t n T α (i )a β∗ (k ) . k =1 t =1 t ik t Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 47. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ Ðàçíîå Ôîðìóëû ïåðåñ÷¼òà bi (k ) îòíîøåíèå îæèäàíèÿ êîëè÷åñòâà ñîáûòèé dt = vk â ñîñòîÿíèè xi ê îæèäàíèþ êîëè÷åñòâà ëþáîãî vj â ñîñòîÿíèè xi : T α∗ (i )β∗ (i ) − ατ (i )βτ (i ) bi (k ) = ^ t =1,dt =vk τt τ τ τt . m T ∗ i i) − )β∗ ( ατ (i )βτ (i ) k =1 t =1,dt =vk τt ατ ( τ τt pi (d ) îòíîøåíèå îæèäàíèÿ êîëè÷åñòâà ðàç, êîòîðûå xi ñëó÷èëîñü ñ ïðîäîëæèòåëüíîñòüþ d , ê êîëè÷åñòâó ðàç, êîòîðûå xi âîîáùå ñëó÷àëîñü: T α∗ (i )p (d )β (i ) t +d b (d ) pi (d ) = ^ t =1 t i t +d s =t +1 i s D T α∗ (i )p (d )β (i ) t +d b (d ) . d =1 t =1 t i t +d s =t +1 i s Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 48. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ Ðàçíîå Çà è ïðîòèâ Òàêîé ïîäõîä î÷åíü ïîëåçåí, êîãäà pi (d ) äàëåêî îò ýêñïîíåíöèàëüíîãî. Îäíàêî îí ñèëüíî óâåëè÷èâàåò âû÷èñëèòåëüíóþ ñëîæíîñòü (â D 2 ðàç). È, êðîìå òîãî, ñòàíîâèòñÿ ãîðàçäî áîëüøå ïàðàìåòðîâ, ò.å. íóæíî, âîîáùå ãîâîðÿ, áîëüøå äàííûõ, ÷òîáû ýòè ïàðàìåòðû íàä¼æíî îöåíèòü. Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 49. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ Ðàçíîå Ïàðàìåòðè÷åñêàÿ ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ ×òîáû óìåíüøèòü êîëè÷åñòâî ïàðàìåòðîâ, ìîæíî èíîãäà ñ÷èòàòü, ÷òî pi (d ) êëàññè÷åñêîå ðàñïðåäåëåíèå ñ íå ñëèøêîì áîëüøèì êîëè÷åñòâîì ïàðàìåòðîâ. Íàïðèìåð, pi (d ) ìîæåò áûòü ðàâíîìåðíûì, èëè íîðìàëüíûì (pi (d ) = N (d , µi , σ2 )), èëè i ãàììàðàñïðåäåëåíèåì: ηνi d νi −1 e −ηi d pi (d ) = i . Γ (νi ) Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 50. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå Outline 1 Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè Âîçíèêàþùèå çàäà÷è Ðåøåíèÿ çàäà÷ 2 Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ 3 Ðàçíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 51. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå Îáùàÿ èäåÿ Ðå÷ü èä¼ò î ìîäåëÿõ, â êîòîðûõ ñëåäóþùèå êîìïîíåíòû âåêòîðà íàáëþäàåìûõ çàâèñÿò îò ïðåäûäóùèõ ñ íåêîòîðûìè êîýôôèöèåíòàìè. Ò.å. d = (d1 , . . . , dK ) âåêòîð íàáëþäàåìûõ, è ìîäåëü òàêàÿ: p dk = − ai dk −i + ek , i =1 ãäå ek ãàóññèàíû ñ íóëåâûì ñðåäíèì è âàðèàöèåé σ2 , ai êîýôôèöèåíòû àâòîðåãðåññèè. Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 52. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå Ðàñïðåäåëåíèå Ìîæíî ïîêàçàòü, ÷òî ïëîòíîñòü d äëÿ áîëüøèõ k ñòàáèëèçèðóåòñÿ íà δ(d ,a) p(d ) = (2πσ2 )−K /2 e − 1 2σ2 , ãäå (ïîëîæèâ a0 = 1) p δ(d , a) = ra (0)r (0) + 2 ra (i )r (i ), i =1 p −i K −i −1 ra (i ) = aj aj +i , r (i ) = dj dj +i . j =0 j =0 Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 53. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå Êîììåíòàðèé ê ðàñïðåäåëåíèþ Íà ñàìîì äåëå r (i ) àâòîêîððåëÿöèÿ âûáîðêè, à ra (i ) àâòîêîððåëÿöèÿ êîýôôèöèåíòîâ àâòîðåãðåññèè. Àâòîêîððåëÿöèÿ ýòî êîððåëÿöèÿ ïðîöåññà ñ ñàìèì ñîáîé â ïðåäûäóùèå ïåðèîäû âðåìåíè; èñïîëüçóåòñÿ â ñòàòèñòèêå è îáðàáîòêå ñèãíàëîâ äëÿ ïîèñêà ïàòòåðíîâ â äàííûõ. Ïî îïðåäåëåíèþ, äëÿ ïðîöåññà Xt R (t , s ) = E [(Xt −µ)(Xs −µ)] , σ 2 à åñëè ïðîöåññ ñòàöèîíàðíûé (íå çàâèñèò îò êîíêðåòíîãî âðåìåíè), òî E [(Xt − µ)(Xt +k − µ)] R (k ) = . σ2  îáðàáîòêå ñèãíàëîâ (à ìû â íåé) ÷àñòî èñïîëüçóþò àâòîêîððåëÿöèþ áåç íîðìàëèçàöèè, ò.å. äëÿ äèñêðåòíîãî ñèãíàëà R (j ) = k xj xj −k . Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 54. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå Ñêðûòàÿ ìàðêîâñêàÿ ìîäåëü Êàê ïðèìåíèòü àâòîðåãðåññèâíóþ ìîäåëü? Î÷åíü ïðîñòî: ñíà÷àëà íîðìàëèçóåì âåêòîð íàáëþäåíèé: d 2π K ^ d=√ ^ , p (d ) = ( )−K /2 e − δ(d ,a) . ^ K 2 K σ2 À çàòåì ðàññìîòðèì ñìåñü M bj (D ) = cjm bjm (D ), m =1 ãäå bjm çàäà¼òñÿ âåêòîðîì àâòîðåãðåññèè ajm (ò.å. åãî êîýôôèöèåíòàìè rajm ). Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 55. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå Àëãîðèòì ïåðåñ÷¼òà Íàäî íàó÷èòüñÿ ïåðåñ÷èòûâàòü rajm . Äëÿ ýòîãî ñõåìà òàêàÿ: ñíà÷àëà íàó÷èìñÿ ïåðåñ÷èòûâàòü rjm , ïîòîì èç íèõ ïîëó÷èì ajm , à ïîòîì ïî íèì ïåðåñ÷èòàåì rajm . T γ (j , m) · r r jm = t =1 t t T γ (j , m) , t =1 t ãäå αt (j )βt (j ) cjm bjm (dt ) γt (j , m) = N α (j )β (j ) M c b (d ) . j =1 t t m=1 jm jm t Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 56. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå Ïîñòàíîâêà çàäà÷è Ìû ðàíüøå ïðåäïîëàãàëè, ÷òî íàøà ìàðêîâñêàÿ ìîäåëü õîðîøî îïèñûâàåò ïðîöåññ. Íà ñàìîì äåëå ýòî íå âñåãäà òàê. Äàâàéòå ïîïðîáóåì ðåøèòü áîëåå ïðàêòè÷åñêóþ çàäà÷ó: åñòü íåñêîëüêî ñèãíàëîâ, è ìû äîëæíû èõ îïèñàòü ìàðêîâñêèìè ìîäåëÿìè òàê, ÷òîáû êàê ìîæíî òî÷íåå îòäåëÿòü èõ äðóã îò äðóãà. Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 57. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå ML Ñòàíäàðòíàÿ èäåÿ â òîì, ÷òî ìû õîòèì íàó÷èòüñÿ ñðàâíèâàòü ìîäåëè, ò.å. äëÿ ðàçíûõ ìîäåëåé λν , ν = 1..V , íàó÷èòüñÿ îöåíèâàòü p (d ν |λν ), à ïîòîì âûáðàòü èç íèõ ìàêñèìóì. Ýòî òàê íàçûâàåìûé ML criterion (îò maximum likelihood). Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 58. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå MMI Àëüòåðíàòèâà ìåòîä ìàêñèìàëüíîé âçàèìíîé èíôîðìàöèè (maximum mutual information, MMI).  ïðîñòåéøåé ñèòóàöèè ýòîò ìåòîä ïðèìåíÿåòñÿ, ÷òîáû âûÿñíèòü, êàêèå ïàðàìåòðû áîëüøå âñåãî âëèÿþò íà ðàçëè÷åíèå çàäàííûõ êëàññîâ. Åñëè åñòü äàííûå x = (x1 , . . . , xn ) è íàáîð êëàññîâ G , ïî êîòîðûì èõ êëàññèôèöèðóþò, òî íóæíî ïîäñ÷èòàòü èíôîðìàöèþ ìåæäó xi è êëàññîì C : I (xi , C ) = H (C ) − H (C |xi ), ò.å. ìàêñèìèçèðîâàòü H (C |xi ) = − p(c , xi = vj ) log p (c |xi = vj ). ∈ G vj Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 59. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå MMI Äëÿ ìàðêîâñêèõ ìîäåëåé ýòî âûðàæàåòñÿ êàê ìàêñèìèçàöèÿ ñðåäíåãî ðàññòîÿíèÿ ìåæäó äàííûìè d è ïîëíûì íàáîðîì ìîäåëåé λ = (λ1 , . . . , λV ): Iν = max log p (d |λν ) − log p(d ν |λw ) , λ w ò.å. ìû îòäåëÿåì ïðàâèëüíóþ ìîäåëü µ îò äðóãèõ ìîäåëåé íà ïîñëåäîâàòåëüíîñòè d . À òåïåðü ìîæíî ïðîñóììèðîâàòü ïî âñåì ìîäåëÿì è òàêèì îáðàçîì íàäåÿòüñÿ, ÷òî ïîëó÷èòñÿ ñàìûé ¾ðàçäåë¼ííûé¿ íàáîð: V I = max log p (d ν |λν ) − log p(d ν |λw ) , λ ν=1 w Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 60. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå MDI Òðåòèé ïîäõîä: ïðåäïîëîæèì, ÷òî ñèãíàë íå îáÿçàòåëüíî ìàðêîâñêèé, íî ó íåãî åñòü íåêîòîðûå îãðàíè÷åíèÿ (íà êîððåëÿöèþ, íàïðèìåð). Íàäî íàéòè òàêèå ïàðàìåòðû, êîòîðûå ìèíèìèçèðóþò ðàçäåëÿþùóþ èíôîðìàöèþ (discrimination information, DI) ìåæäó íàáîðîì ðàñïðåäåëåíèé Q , óäîâëåòâîðÿþùèõ îãðàíè÷åíèÿì, è íàáîðîì ìàðêîâñêèõ ðàñïðåäåëåíèé pλ : q (y ) D (Q ||pλ ) = q (y ) ln dy . p(y ) Ò.å. ìû ïðåäïîëàãàåì, ÷òî ñèãíàë èç Q , è èùåì òàêóþ λ, ÷òîáû ðàññòîÿíèå äî ñîîòâåòñòâóþùåãî ýëåìåíòà q áûëî ìèíèìàëüíûì. Òîæå ïî ñóòè ìîäèôèöèðîâàííûé àëãîðèòì ÁàóìàÂåëõà. Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 61. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå Êàê ñðàâíèâàòü HMM? Âñïîìíèì ïðèìåð ñ ìîíåòêîé è ðàññìîòðèì äâå ìîäåëè: λ1 = (A1 , B1 , π1 ), λ2 = (A2 , B2 , π2 ): A1 = p 1−p , B1 = q 1−q , π1 = (1/2 1/2), 1−p p 1−q q A2 = r 1−r , B2 = s 1−s , π2 = (1/2 1/2), 1−r r 1−s s ×òîáû ìîäåëè ïðîèçâîäèëè â ñðåäíåì îäèíàêîâûå ïîñëåäîâàòåëüíîñòè íàáëþäåíèé, íóæíî, ÷òîáû E [dt = vk |λ1 ] = E [dt = vk |λ2 ], ò.å. pq + (1 − p)(1 − q ) = rs + (1 − r )(1 − s ). Ìîäåëè ñ p = 0.6, q = 0.7 è r = 0.2, s = 13/30 äàäóò îäèíàêîâûå ðåçóëüòàòû. Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 62. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå Êàê ñðàâíèâàòü HMM? Íóæíà ìåòðèêà. Îïðåäåëèì ðàññòîÿíèå ìåæäó ìîäåëÿìè 1 D (λ1 , λ2 ) = (log p (d (2) |λ1 ) − log p (d (2) |λ2 )), T ãäå d (2) ïîðîæäåíî ìîäåëüþ λ2 , ò.å. ìû ïðîâåðÿåì, íàñêîëüêî õîðîøî λ1 ñîîòâåòñòâóåò íàáëþäåíèÿì ïî ìîäåëè λ2 ïî ñðàâíåíèþ ñ ñàìîé λ2 . Ýòî, êîíå÷íî, íåñèììåòðè÷íîå ðàññòîÿíèå, ïîýòîìó îáû÷íî áåðóò D (λ1 , λ2 ) + D (λ2 , λ1 ) Ds (λ1 , λ2 ) = . 2 Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 63. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå Íà÷àëüíûå çíà÷åíèÿ ïàðàìåòðîâ Àëãîðèòì ÁàóìàÂåëõà, ïî ñóòè ñâîåé ãðàäèåíòíûé, êîíå÷íî, äà¼ò òîëüêî ëîêàëüíûé ìàêñèìóì. Çíà÷èò, âàæíî, êàê âûáèðàòü íà÷àëüíûå çíà÷åíèÿ ïàðàìåòðîâ. Äëÿ π è A íà ñàìîì äåëå îñîáîé ïðîáëåìû íåò: îáû÷íî õîðîøî ðàáîòàþò èëè ñëó÷àéíûå, èëè ðàâíîìåðíûå íà÷àëüíûå çíà÷åíèÿ. Äëÿ B õîðîøèå íà÷àëüíûå îöåíêè ìîãóò áûòü âåñüìà ïîëåçíû â äèñêðåòíîì ñëó÷àå è ïðàêòè÷åñêè íåîáõîäèìû â íåïðåðûâíîì. Êàê èõ ïîëó÷èòü? Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 64. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå Íà÷àëüíûå çíà÷åíèÿ ïàðàìåòðîâ  íåïðåðûâíîì ñëó÷àå ó íàñ ðàñïðåäåëåíèå áûëî ñìåñüþ äðóãèõ ðàñïðåäåëåíèé: M bj (D ) = cjm P(D , µjm , σjm ). m =1 Êàê áû íàì îöåíèòü íà÷àëüíûå ïàðàìåòðû µjm , σjm , èìåÿ äàííûå âñåõ íàáëþäåíèé? Ìîæíî ïðèìåíèòü êëàñòåðèçàöèþ. Ìû ïðîñòî êëàñòåðèçóåì äàííûå D (ïî êàæäîìó âðåìåíè j îòäåëüíî) è ïîëó÷èì íåïëîõèå íà÷àëüíûå çíà÷åíèÿ. Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 65. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå Èíòåðïîëÿöèÿ Äàííûõ ÷àñòî íå õâàòàåò. Ïàðàìåòðîâ áûâàåò ñëèøêîì ìíîãî. Îäèí èç ïóòåé èíòåðïîëÿöèÿ. Âûáðàòü âìåñòå ñ λ ìîäåëü ïîìåíüøå λ , äëÿ êîòîðîé äàííûõ äîñòàòî÷íî, è ñ÷èòàòü èíòåðïîëèðîâàííóþ ìîäåëü ^ = λ + (1 − )λ . λ Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 66. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå Èíòåðïîëÿöèÿ Ãëàâíîå ïðàâèëüíî îöåíèòü (ýòî ôóíêöèÿ êîëè÷åñòâà èìåþùèõñÿ òåñòîâûõ äàííûõ). Åñòü ñïåöèàëüíûå ïîäõîäû, ïðè êîòîðûõ äàííûå äåëÿòñÿ íà D = D1 ∪ D2 , ïîòîì D1 èñïîëüçóåòñÿ äëÿ òðåíèðîâêè, à D2 äëÿ îöåíêè . Ðàçáèåíèå ìîæíî ñî âðåìåíåì äâèãàòü. Äðóãîé ïóòü äîáàâëÿòü ñïåöèàëüíûå îãðàíè÷åíèÿ (íàïðèìåð, bj (k ) ≥ ). Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
  • 67. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå Ñïàñèáî çà âíèìàíèå! Lecture notes è ñëàéäû áóäóò ïîÿâëÿòüñÿ íà ìîåé homepage: http://logic.pdmi.ras.ru/∼sergey/index.php?page=teaching Ïðèñûëàéòå ëþáûå çàìå÷àíèÿ, ðåøåíèÿ óïðàæíåíèé, íîâûå ÷èñëåííûå ïðèìåðû è ïðî÷åå ïî àäðåñàì: sergey@logic.pdmi.ras.ru, snikolenko@gmail.com Çàõîäèòå â ÆÆ smartnik. Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè