28. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè
Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è
Ðàçíîå Ðåøåíèÿ çàäà÷
Âñïîìîãàòåëüíûå ïåðåìåííûå
Òåïåðü íàøèìè âñïîìîãàòåëüíûìè ïåðåìåííûìè áóäóò
âåðîÿòíîñòè òîãî, ÷òî ìû âî âðåìÿ t â ñîñòîÿíèè xi , à âî
âðåìÿ t + 1 â ñîñòîÿíèè xj :
ξt (i , j ) = p (qt = xi , qt +1 = xj |D , λ).
Åñëè ïåðåïèñàòü ÷åðåç óæå çíàêîìûå ïåðåìåííûå:
αt (i )aij bj (dt +1 )βt +1 (j ) αt (i )aij bj (dt +1 )βt +1 (j )
ξt (i , j ) = = .
p(D |λ) i j αt (i )aij bj (dt +1 )βt +1 (j )
Îòìåòèì òàêæå, ÷òî γt (i ) = j ξt (i , j ).
Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
29. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Ìàðêîâñêèå öåïè
Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Âîçíèêàþùèå çàäà÷è
Ðàçíîå Ðåøåíèÿ çàäà÷
Èäåÿ
t γt (i ) ýòî îæèäàåìîå êîëè÷åñòâî ïåðåõîäîâ èç
ñîñòîÿíèÿ xi , à t ξt (i , j ) èç xi â xj .
Òåïåðü íà øàãå M ìû áóäåì ïåðåîöåíèâàòü âåðîÿòíîñòè:
πi = îæèäàåìàÿ ÷àñòîòà â xi íà øàãå 1 = γ1 (i ),
ê-âî ïåðåõîäîâ èç xi â xj t ξt (i , j ) .
a
ij = =
ê-âî ïåðåõîäîâ èç xi t γt (i )
bj (k ) =
ê-âî ïîÿâëåíèé â xi è íàáëþäåíèé vk
=
t :dt =vk γt (i ) .
ê-âî ïîÿâëåíèé â xi t γt (i )
EM-àëãîðèòì ïðèâåä¼ò ê öåëè: íà÷àòü ñ λ = (A, B , π),
ïîäñ÷èòàòü = (A, B , π), ñíîâà ïåðåñ÷èòàòü ïàðàìåòðû è
λ
ò.ä.
Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
38. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
Ðàçíîå
Âñïîìîãàòåëüíûå ïåðåìåííûå
γt (j , m) âåðîÿòíîñòü áûòü â ñîñòîÿíèè j âî âðåìÿ t ,
ïðè÷¼ì çà D îòâå÷àåò mé êîìïîíåíò ñìåñè.
Ôîðìàëüíî ãîâîðÿ,
αt (j )βt (j ) cjm P(dt , µjm , σjm )
γt (j , m) = N α (j )β (j ) M c P(d , µ , σ ) .
j =1 t t m=1 jm t jm jm
Åñëè M = 1, òî ýòî óæå èçâåñòíûå íàì γt (j ).
Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
39. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
Ðàçíîå
Àëãîðèòì äëÿ ýòîãî ñëó÷àÿ
Íóæíî íàó÷èòüñÿ ïåðåñ÷èòûâàòü bj (D ), ò.å. ïåðåñ÷èòûâàòü
cjm , µjm è σjm .
Ýòî äåëàåòñÿ òàê:
T γ (j , m)
cjm =
t =1 t ,
T M
t =1 m=1 γt (j , m)
T γ (j , m) · d
1 t t,
µjm = t =T
t =1 γt (j , m)
T γ (j , m) · (d − µ )(d − µ )t
σjm = t =1 t t jm t jm .
T γ (j , m)
t =1 t
Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
40. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
Ðàçíîå
Ïðîáëåìà
Êàê ìîäåëèðîâàòü ïðîäîëæèòåëüíîñòü íàõîæäåíèÿ â òîì
èëè èíîì ñîñòîÿíèè?
 äèñêðåòíîì ñëó÷àå âåðîÿòíîñòü ïðîáûòü â ñîñòîÿíèè id
øàãîâ:
d
pi (d ) = aii −1 (1 − aii ).
Îäíàêî äëÿ áîëüøèíñòâà ôèçè÷åñêèõ ñèãíàëîâ òàêîå
ýêñïîíåíöèàëüíîå ðàñïðåäåëåíèå íå ñîîòâåòñòâóåò
äåéñòâèòåëüíîñòè. Ìû áû õîòåëè ÿâíî çàäàâàòü ïëîòíîñòü
ïðåáûâàíèÿ â äàííîì ñîñòîÿíèè.
Ò.å. âìåñòî êîýôôèöèåíòîâ ïåðåõîäà â ñåáÿ aii ÿâíîå
çàäàíèå ðàñïðåäåëåíèÿ pi (d ).
Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
41. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
Ðàçíîå
Âñïîìîãàòåëüíûå ïåðåìåííûå
Ââåä¼ì ïåðåìåííûå
αt (i ) = p (d1 . . . dt , xi çàêàí÷èâàåòñÿ âî âðåìÿ t |λ).
Âñåãî çà ïåðâûå t øàãîâ ïîñåùåíî r ñîñòîÿíèé q1 . . . qr , è
ìû òàì îñòàâàëèñü d1 , . . . , dr . Ò.å. îãðàíè÷åíèÿ:
r
qr = xi , ds = t .
s =1
Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
43. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
Ðàçíîå
Âû÷èñëåíèå αt (i )
Ïî èíäóêöèè
n D t
αt (j ) = αt −d (j )aij pj (d ) bj (ds ),
i =1 d =1 s =t −d +1
ãäå D ìàêñèìàëüíàÿ îñòàíîâêà â ëþáîì èç ñîñòîÿíèé.
Òîãäà, êàê è ðàíüøå,
n
p(d |λ) = αT (i ).
i =1
Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
44. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
Ðàçíîå
Âñïîìîãàòåëüíûå ïåðåìåííûå
Äëÿ ïåðåñ÷¼òà ïîòðåáóþòñÿ åù¼ òðè ïåðåìåííûå:
α∗ (i ) = p (d1 . . . dt , xi íà÷èíàåòñÿ âî âðåìÿ t + 1|λ),
t
βt (i ) = p (dt +1 . . . dT |xi çàêàí÷èâàåòñÿ âî âðåìÿ t , λ),
β∗ (i ) = p (dt +1 . . . dT |xi íà÷èíàåòñÿ âî âðåìÿ t + 1, λ).
t
Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
45. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
Ðàçíîå
Âñïîìîãàòåëüíûå ïåðåìåííûå
Ñîîòíîøåíèÿ ìåæäó íèìè:
n
α∗ (j ) =
t αt (i )aij ,
i =1
D t
αt (i ) = α∗−d (
t i )pi (d ) bi (ds ),
d =1 s =t −d +1
n
βt (i ) = aij β∗ (j ),
t
j =1
D t +d
β∗ (i ) =
t βt +d (i )pi (d ) bi (ds ).
d =1 s =t +1
Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
46. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
Ðàçíîå
Ôîðìóëû ïåðåñ÷¼òà
Ïðèâåä¼ì ôîðìóëû ïåðåñ÷¼òà.
πi ïðîñòî âåðîÿòíîñòü òîãî, ÷òî xi áûë ïåðâûì
ñîñòîÿíèåì:
πi β∗ (i )
0
πi =
^ .
p(d |λ)
aij òà æå ôîðìóëà, ÷òî îáû÷íî, òîëüêî âìåñòå ñ α åñòü
åù¼ è β, êîòîðàÿ ãîâîðèò, ÷òî íîâîå ñîñòîÿíèå íà÷èíàåòñÿ
íà ñëåäóþùåì øàãå:
T α (i )a β∗ (j )
a
^ij = t =1 t ij t
n T α (i )a β∗ (k ) .
k =1 t =1 t ik t
Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
47. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå
Ñìåñè âûïóêëûõ ðàñïðåäåëåíèé
Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé
Ïðîäîëæèòåëüíîñòü ñîñòîÿíèÿ
Ðàçíîå
Ôîðìóëû ïåðåñ÷¼òà
bi (k ) îòíîøåíèå îæèäàíèÿ êîëè÷åñòâà ñîáûòèé dt = vk
â ñîñòîÿíèè xi ê îæèäàíèþ êîëè÷åñòâà ëþáîãî vj â
ñîñòîÿíèè xi :
T α∗ (i )β∗ (i ) − ατ (i )βτ (i )
bi (k ) =
^ t =1,dt =vk τt τ τ τt
.
m T ∗ i i) −
)β∗ ( ατ (i )βτ (i )
k =1 t =1,dt =vk τt ατ ( τ τt
pi (d ) îòíîøåíèå îæèäàíèÿ êîëè÷åñòâà ðàç, êîòîðûå xi
ñëó÷èëîñü ñ ïðîäîëæèòåëüíîñòüþ d , ê êîëè÷åñòâó ðàç,
êîòîðûå xi âîîáùå ñëó÷àëîñü:
T α∗ (i )p (d )β (i ) t +d b (d )
pi (d ) =
^ t =1 t i t +d s =t +1 i s
D T α∗ (i )p (d )β (i ) t +d b (d ) .
d =1 t =1 t i t +d s =t +1 i s
Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
51. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå
Îáùàÿ èäåÿ
Ðå÷ü èä¼ò î ìîäåëÿõ, â êîòîðûõ ñëåäóþùèå êîìïîíåíòû
âåêòîðà íàáëþäàåìûõ çàâèñÿò îò ïðåäûäóùèõ ñ
íåêîòîðûìè êîýôôèöèåíòàìè.
Ò.å. d = (d1 , . . . , dK ) âåêòîð íàáëþäàåìûõ, è ìîäåëü
òàêàÿ:
p
dk = − ai dk −i + ek ,
i =1
ãäå ek ãàóññèàíû ñ íóëåâûì ñðåäíèì è âàðèàöèåé σ2 ,
ai êîýôôèöèåíòû àâòîðåãðåññèè.
Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
52. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå
Ðàñïðåäåëåíèå
Ìîæíî ïîêàçàòü, ÷òî ïëîòíîñòü d äëÿ áîëüøèõ k
ñòàáèëèçèðóåòñÿ íà
δ(d ,a)
p(d ) = (2πσ2 )−K /2 e −
1
2σ2 ,
ãäå (ïîëîæèâ a0 = 1)
p
δ(d , a) = ra (0)r (0) + 2 ra (i )r (i ),
i =1
p −i K −i −1
ra (i ) = aj aj +i , r (i ) = dj dj +i .
j =0 j =0
Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
53. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå
Êîììåíòàðèé ê ðàñïðåäåëåíèþ
Íà ñàìîì äåëå r (i ) àâòîêîððåëÿöèÿ âûáîðêè, à ra (i )
àâòîêîððåëÿöèÿ êîýôôèöèåíòîâ àâòîðåãðåññèè.
Àâòîêîððåëÿöèÿ ýòî êîððåëÿöèÿ ïðîöåññà ñ ñàìèì ñîáîé
â ïðåäûäóùèå ïåðèîäû âðåìåíè; èñïîëüçóåòñÿ â ñòàòèñòèêå
è îáðàáîòêå ñèãíàëîâ äëÿ ïîèñêà ïàòòåðíîâ â äàííûõ.
Ïî îïðåäåëåíèþ, äëÿ ïðîöåññà Xt R (t , s ) = E [(Xt −µ)(Xs −µ)] ,
σ 2
à åñëè ïðîöåññ ñòàöèîíàðíûé (íå çàâèñèò îò êîíêðåòíîãî
âðåìåíè), òî
E [(Xt − µ)(Xt +k − µ)]
R (k ) = .
σ2
 îáðàáîòêå ñèãíàëîâ (à ìû â íåé) ÷àñòî èñïîëüçóþò
àâòîêîððåëÿöèþ áåç íîðìàëèçàöèè, ò.å. äëÿ äèñêðåòíîãî
ñèãíàëà R (j ) = k xj xj −k .
Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
54. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå
Ñêðûòàÿ ìàðêîâñêàÿ ìîäåëü
Êàê ïðèìåíèòü àâòîðåãðåññèâíóþ ìîäåëü?
Î÷åíü ïðîñòî: ñíà÷àëà íîðìàëèçóåì âåêòîð íàáëþäåíèé:
d 2π K ^
d=√
^ , p (d ) = ( )−K /2 e − δ(d ,a) .
^
K
2
K σ2
À çàòåì ðàññìîòðèì ñìåñü
M
bj (D ) = cjm bjm (D ),
m =1
ãäå bjm çàäà¼òñÿ âåêòîðîì àâòîðåãðåññèè ajm (ò.å. åãî
êîýôôèöèåíòàìè rajm ).
Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè
55. Ñêðûòûå ìàðêîâñêèå ìîäåëè: îñíîâíîå Àâòîðåãðåññèâíûå ìàðêîâñêèå ìîäåëè
Ñïåöèàëüíûå âèäû ìàðêîâñêèõ ìîäåëåé Êðèòåðèè îïòèìèçàöèè HMM: ML, MMI, MDI
Ðàçíîå Ñðàâíåíèÿ, íà÷àëüíûå çíà÷åíèÿ è íåäîñòàþùèå äàííûå
Àëãîðèòì ïåðåñ÷¼òà
Íàäî íàó÷èòüñÿ ïåðåñ÷èòûâàòü rajm . Äëÿ ýòîãî ñõåìà òàêàÿ:
ñíà÷àëà íàó÷èìñÿ ïåðåñ÷èòûâàòü rjm , ïîòîì èç íèõ
ïîëó÷èì ajm , à ïîòîì ïî íèì ïåðåñ÷èòàåì rajm .
T γ (j , m) · r
r
jm = t =1 t t
T γ (j , m) ,
t =1 t
ãäå
αt (j )βt (j ) cjm bjm (dt )
γt (j , m) = N α (j )β (j ) M c b (d ) .
j =1 t t m=1 jm jm t
Ñåðãåé Íèêîëåíêî Ñêðûòûå ìàðêîâñêèå ìîäåëè