SlideShare a Scribd company logo
1 of 60
Download to read offline
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî




                  Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã

                                  Ñåðãåé Íèêîëåíêî



                   Machine Learning  CS Club, âåñíà 2008




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Äâå çàäà÷è
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Ïî÷åìó ýòî òðóäíî?

Outline

   1   Ââåäåíèå è òðèâèàëüíûå ïîäõîäû
         Äâå çàäà÷è
         Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé
         Ïî÷åìó ýòî òðóäíî?
   2   Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì
         Âûáîðêà ïî çíà÷èìîñòè
         Âûáîðêà ñ îòêëîíåíèåì
   3   Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî
        Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî
        Ãèááñó
        Ìàðêîâñêèå ìåòîäû è slice sampling
        Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Äâå çàäà÷è
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Ïî÷åìó ýòî òðóäíî?

Ïî÷åìó ïðîáëåìà



         Ïóñòü ó íàñ åñòü íåêîòîðîå âåðîÿòíîñòíîå ðàñïðåäåëåíèå.
         Êàê ñ íèì ðàáîòàòü? Êàê, íàïðèìåð, åãî ñèìóëèðîâàòü?
         Ìû íå âñåãäà ìîæåì ïðèáëèçèòü (êàê ïî ìåòîäó Ëàïëàñà)
         ðàñïðåäåëåíèå êàêèì-íèáóäü èçâåñòíûì òàê, ÷òîáû âñ¼
         ïîñ÷èòàòü â ÿâíîì âèäå.
         Íàïðèìåð, â êëàñòåðèçàöèè: ìóëüòèìîäàëüíîå
         ðàñïðåäåëåíèå ñ êó÷åé ïàðàìåòðîâ, ÷òî ñ íèì äåëàòü?




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Äâå çàäà÷è
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Ïî÷åìó ýòî òðóäíî?

Ïîñòàíîâêà çàäà÷è



         Ïóñòü èìååòñÿ íåêîå ðàñïðåäåëåíèå p (x ).
         Çàäà÷à 1: íàó÷èòüñÿ ãåíåðèðîâàòü ñýìïëû {x (r ) }R=1 ïî p (x ).
                                                          r
         Çàäà÷à 2: íàó÷èòüñÿ îöåíèâàòü îæèäàíèÿ ôóíêöèé ïî
         ðàñïðåäåëåíèþ p (x ), ò.å. íàó÷èòüñÿ îöåíèâàòü èíòåãðàëû
         âèäà
                                   Ep [φ] = p(x )φ(x )dx .




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Äâå çàäà÷è
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Ïî÷åìó ýòî òðóäíî?

Ïîñòàíîâêà çàäà÷è


         Ìû áóäåì îáû÷íî ïðåäïîëàãàòü, ÷òî x  ýòî âåêòîð èç Rn
         ñ êîìïîíåíòàìè xn , íî èíîãäà áóäåì ðàññìàòðèâàòü
         äèñêðåòíûå ìíîæåñòâà çíà÷åíèé.
         Ôóíêöèè φ  ýòî, íàïðèìåð, ìîìåíòû ñëó÷àéíûõ âåëè÷èí,
         çàâèñÿùèõ îò x .
         Íàïðèìåð, åñëè t (x )  ñëó÷àéíàÿ âåëè÷èíà, òî å¼
         ñðåäíåå  ýòî Ep [t (x )] ( p (x )t (x )dx ), à å¼ âàðèàöèÿ ðàâíà
         Ep [t 2 ] − (Ep [t ])2 .
         È ìû ïðåäïîëàãàåì, ÷òî ÿâíî âû÷èñëèòü íå ïîëó÷àåòñÿ 
         ñëèøêîì ñëîæíàÿ ôóíêöèÿ p .



                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Äâå çàäà÷è
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Ïî÷åìó ýòî òðóäíî?

Îæèäàíèÿ è ñýìïëèíã

         Ìû áóäåì çàíèìàòüñÿ òîëüêî ñýìïëèíãîì, ïîòîìó ÷òî
         çàäà÷à îöåíêè îæèäàíèé ôóíêöèé ëåãêî ðåøèòñÿ, åñëè ìû
         íàó÷èìñÿ äåëàòü ñýìïëèíã.
         Êàê îíà ðåøèòñÿ?




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Äâå çàäà÷è
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Ïî÷åìó ýòî òðóäíî?

Îæèäàíèÿ è ñýìïëèíã

         Ìû áóäåì çàíèìàòüñÿ òîëüêî ñýìïëèíãîì, ïîòîìó ÷òî
         çàäà÷à îöåíêè îæèäàíèé ôóíêöèé ëåãêî ðåøèòñÿ, åñëè ìû
         íàó÷èìñÿ äåëàòü ñýìïëèíã.
         Êàê îíà ðåøèòñÿ?
         Íóæíî âçÿòü ñýìïëû {x (r ) }R=1 è ïîäñ÷èòàòü
                                     r
                                        1
                                     ^
                                     φ=             φ(x (r ) ).
                                            R   r
         Îæèäàíèå φ ðàâíî Ep [φ], à âàðèàöèÿ óáûâàåò îáðàòíî
                   ^
         ïðîïîðöèîíàëüíî R .




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Äâå çàäà÷è
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Ïî÷åìó ýòî òðóäíî?

×òî æå ñëîæíîãî â ñýìïëèíãå?



         Ìû ïðåäïîëàãàåì, ÷òî äàíà ôóíêöèÿ p ∗ (x ), êîòîðàÿ
         îòëè÷àåòñÿ îò p (x ) òîëüêî íîðìèðîâî÷íîé êîíñòàíòîé
         Z = p∗ (x )dx : p(x ) = p∗ (x )/Z .
         Ïî÷åìó òðóäíî äåëàòü ñýìïëèíã?
         Âî-ïåðâûõ, ìû îáû÷íî íå çíàåì     Z ; íî ýòî íå ãëàâíîå.
         Ãëàâíîå  îáû÷íî ïðàâèëüíûå ñýìïëû p ∗ ÷àñòî ïîïàäàþò
         òóäà, ãäå p ∗ âåëèêà. À êàê îïðåäåëèòü, ãäå îíà âåëèêà, íå
         âû÷èñëÿÿ å¼ âåçäå?




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Äâå çàäà÷è
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Ïî÷åìó ýòî òðóäíî?

Äèñêðåòèçàöèÿ ïðîñòðàíñòâà


         Ïðîñòåéøàÿ èäåÿ: äàâàéòå äèñêðåòèçóåì ïðîñòðàíñòâî,
         âû÷èñëèì p ∗ íà êàæäîì ó÷àñòêå (ïóñòü îíà ãëàäêàÿ),
         ïîòîì áóäåì áðàòü äèñêðåòíûå ñýìïëû, çíàÿ âñå
         âåðîÿòíîñòè (ýòî íåòðóäíî).
         Ñêîëüêî æå áóäåò äèñêðåòíûõ ó÷àñòêîâ?
         Ãëàâíàÿ ïðîáëåìà  îáû÷íî âåëèêà ðàçìåðíîñòü x .
         Íàïðèìåð, åñëè ðàçäåëèòü êàæäóþ îñü íà 20 ó÷àñòêîâ, òî
         ó÷àñòêîâ áóäåò 20n ; à n â ðåàëüíûõ çàäà÷àõ ìîæåò
         äîñòèãàòü íåñêîëüêèõ òûñÿ÷...
         Èíûìè ñëîâàìè, òàêîé ïîäõîä íèêàê íå ðàáîòàåò.



                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Äâå çàäà÷è
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Ïî÷åìó ýòî òðóäíî?

Ïðèìåð: ñêîëüêî â îçåðå íåôòè?


         Ïåðåä âàìè  ó÷àñòîê, ïîä êîòîðûì çàëåæè íåôòè (äà
         õîòü ïîäçåìíîå îçåðî íåôòè).
         Âàì íóæíî îïðåäåëèòü, ñêîëüêî å¼ òóò.
         Âû ìîæåòå ïðîâîäèòü çàìåð â êàæäîé êîíêðåòíîé òî÷êå,
         ÷òîáû îïðåäåëèòü ãëóáèíó ñëîÿ â ýòîé òî÷êå.
         Ïðîáëåìà â òîì, ÷òî çíà÷èòåëüíàÿ ÷àñòü îáùåãî îáú¼ìà
         íåôòè ìîæåò áûòü ñîñðåäîòî÷åíà â ãëóáîêèõ, íî óçêèõ
         êàíüîíàõ.
         È ýòî òîëüêî ðàçìåðíîñòü äâà. :)



                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû       Äâå çàäà÷è
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì      Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî        Ïî÷åìó ýòî òðóäíî?

Ðàâíîìåðíîå ñýìïëèðîâàíèå


         Ìîæåò áûòü, âñ¼-òàêè ïîëó÷èòñÿ ðåøèòü õîòÿ áû âòîðóþ
         çàäà÷ó?
         Äàâàéòå áðàòü ñýìïëû {x (r ) }R=1 ðàâíîìåðíî èç âñåãî
                                       r
         ïðîñòðàíñòâà, çàòåì âû÷èñëÿòü òàì p ∗ è íîðìàëèçîâàòü
         ïîñðåäñòâîì ZR = R=1 p ∗ (x (r ) .
                             r
         Òîãäà φ
               ^ ìîæíî áóäåò îöåíèòü êàê

                                            R
                                  1
                               ^
                               φ=                 φ(x (r ) )p ∗ (x (r ) ).
                                      ZR   r =1
          ÷¼ì ïðîáëåìà?


                            Ñåðãåé Íèêîëåíêî       Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Äâå çàäà÷è
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Ïî÷åìó ýòî òðóäíî?

Ðàâíîìåðíîå ñýìïëèðîâàíèå



         Äà â òîì æå ñàìîì.
         Îáû÷íî çíà÷èòåëüíàÿ ÷àñòü p ∗ ñîñðåäîòî÷åíà â î÷åíü
         íåáîëüøîé ÷àñòè ïðîñòðàíñòâà.
         Âåðîÿòíîñòü ïîïàñòü â íå¼ çà R ðàâíîìåðíî âûáðàííûõ
         ñýìïëîâ òîæå ýêñïîíåíöèàëüíî ìàëà (íàïðèìåð, åñëè ïî
         êàæäîé îñè âåðîÿòíîñòü ïîïàñòü 1/2, è âñ¼ íåçàâèñèìî, òî
         ïîëó÷èòñÿ âåðîÿòíîñòü 2−n ).
         Òàê ÷òî äàæå âòîðóþ çàäà÷ó ðåøèòü íå ïîëó÷èòñÿ.




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Âûáîðêà ïî çíà÷èìîñòè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Âûáîðêà ñ îòêëîíåíèåì
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî

Outline

   1   Ââåäåíèå è òðèâèàëüíûå ïîäõîäû
         Äâå çàäà÷è
         Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé
         Ïî÷åìó ýòî òðóäíî?
   2   Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì
         Âûáîðêà ïî çíà÷èìîñòè
         Âûáîðêà ñ îòêëîíåíèåì
   3   Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî
        Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî
        Ãèááñó
        Ìàðêîâñêèå ìåòîäû è slice sampling
        Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Âûáîðêà ïî çíà÷èìîñòè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Âûáîðêà ñ îòêëîíåíèåì
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî

Ñóòü ìåòîäà




         Âûáîðêà ïî çíà÷èìîñòè  importance sampling.
         Ìû ðåøàåì òîëüêî âòîðóþ çàäà÷ó, à íå ïåðâóþ.
         Òî åñòü íàì íóæíî áðàòü ñýìïëû, ïðè ýòîì æåëàòåëüíî
         ïîïàäàÿ â çîíû, ãäå ôóíêöèÿ p ∗ èìååò áîëüøèå çíà÷åíèÿ.




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Âûáîðêà ïî çíà÷èìîñòè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Âûáîðêà ñ îòêëîíåíèåì
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî

Ñóòü ìåòîäà




         Ïðåäïîëîæèì, ÷òî ó íàñ åñòü êàêîå-òî äðóãîå
         ðàñïðåäåëåíèå âåðîÿòíîñòåé q (òî÷íåå, q ∗ ), ïîïðîùå, è ìû
         óìååì áðàòü åãî ñýìïëû.
         Òîãäà àëãîðèòì òàêîé: ñíà÷àëà âçÿòü ñýìïë ïî q ∗ , à çàòåì
         ïîäïðàâèòü åãî òàê, ÷òîáû ïîëó÷èëñÿ âñ¼-òàêè ñýìïë ïî p ∗ .




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû     Âûáîðêà ïî çíà÷èìîñòè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì    Âûáîðêà ñ îòêëîíåíèåì
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî

Ôîðìàëüíûé àëãîðèòì



         Âçÿòü ñýìïëû {x (r ) }R=1 ïî ðàñïðåäåëåíèþ
                               r                                  q∗.
         Ðàññ÷èòàòü âåñà
                                                      (r )
                                        wr = p ∗(x (r )) .
                                                  ∗

                                             q (x
         Îöåíèòü ôóíêöèþ ïî ôîðìóëå
                                                         (r )
                                     ^
                                     φ=         r wr φ(x ) .
                                                    r wr




                            Ñåðãåé Íèêîëåíêî     Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Âûáîðêà ïî çíà÷èìîñòè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Âûáîðêà ñ îòêëîíåíèåì
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî

Îáñóæäåíèå

         Çà÷åì íóæíî q ? ×åì ýòî ëó÷øå ðàâíîìåðíîãî
         ðàñïðåäåëåíèÿ?




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Âûáîðêà ïî çíà÷èìîñòè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Âûáîðêà ñ îòêëîíåíèåì
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî

Îáñóæäåíèå

         Çà÷åì íóæíî q ? ×åì ýòî ëó÷øå ðàâíîìåðíîãî
         ðàñïðåäåëåíèÿ?
         Ïðîùå ãîâîðÿ, ðàñïðåäåëåíèå q äîëæíî ïîìî÷ü âûáðàòü òå
         ó÷àñòêè, íà êîòîðûõ èìååò ñìûñë ñýìïëèòü r .
         Åñëè q õîðîøåå, òî ìîæåò ïîìî÷ü, à åñëè ïëîõîå, ìîæåò
         òîëüêî íàâðåäèòü.
         Íî åñòü è áîëåå ôóíäàìåíòàëüíûå ïðîáëåìû.




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Âûáîðêà ïî çíà÷èìîñòè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Âûáîðêà ñ îòêëîíåíèåì
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî

Ïðîáëåìû




         Âî-ïåðâûõ, ñýìïëåð          q íå äîëæåí áûòü ñëèøêîì óçêèì.
         Íàïðèìåð, åñëè ñýìïëåð ãàóññèàíîâñêèé ñ íåáîëüøîé
         âàðèàöèåé, òî ïèêè r äàëåêî îò öåíòðà q âîîáùå íèêòî íå
         çàìåòèò.




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Âûáîðêà ïî çíà÷èìîñòè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Âûáîðêà ñ îòêëîíåíèåì
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî

Ïðîáëåìû




         Âî-âòîðûõ, ìîæåò ñëó÷èòüñÿ, ÷òî âñå ñýìïëû áóäóò
         íàïðî÷ü óáèòû íåáîëüøèì êîëè÷åñòâîì ñýìïëîâ ñ
         îãðîìíûìè âåñàìè. Ýòî ïëîõî.
         ×òîáû ïîêàçàòü, êàê ýòî áûâàåò, äàâàéòå ïåðåéä¼ì â
         ìíîãîìåðíûé ñëó÷àé.




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Âûáîðêà ïî çíà÷èìîñòè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Âûáîðêà ñ îòêëîíåíèåì
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî

Ïðîáëåìû



               Ïóñòü åñòü ðàâíîìåðíîå ðàñïðåäåëåíèå r íà åäèíè÷íîì
               øàðå è ñýìïëåð q  ïðîèçâåäåíèå ãàóññèàíîâ ñ öåíòðîì â
               íóëå:
                                          1
                                                  e − 2σ2 i xi .
                                                       1
                              p(x ) =
                                                             2

                                      (2πσ2 )N /2

   Óïðàæíåíèå.           Íàéäèòå ñðåäíåå è äèñïåðñèþ ðàññòîÿíèÿ
   r   2   =     i xi òî÷êè, âçÿòîé ïî ýòîìó ðàñïðåäåëåíèþ.
                   2




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Âûáîðêà ïî çíà÷èìîñòè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Âûáîðêà ñ îòêëîíåíèåì
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî

Ïðîáëåìû




                                                                        √
         Îòâåò íà óïðàæíåíèå: ðàññòîÿíèå áóäåò N σ2 ±                       2N σ 2
         (ðàñïðåäåëåíèå áóäåò ïîõîæå íà ãàóññîâñêîå).
         Çíà÷èò, ïî÷òè âñå ñýìïëû ëåæàò â ¾òèïè÷íîì ìíîæåñòâå¿,
                                    √
         êîëüöå ðàññòîÿíèåì îêîëî σ N îò íóëÿ.




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Âûáîðêà ïî çíà÷èìîñòè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Âûáîðêà ñ îòêëîíåíèåì
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî

Ïðîáëåìû


         Òîãäà áîëüøèíñòâî ñýìïëîâ              q áóäóò ëåæàòü â èíòåðâàëå
                                         1
                                                       √
                                                    N   2N
                                          2 )n/2
                                                 2− 2 ± 2 ,
                                     (2πσ

         è íåíóëåâûå âåñà áóäóò èìåòü çíà÷åíèÿ ïîðÿäêà
                                                      √

                                      (2πσ )n /2 2 N ± 2 N .
                                            2      2
                                                       2



         Ýòî çíà÷èò, ÷òî ìàêñèìàëüíûé âåñ áóäåò îòíîñèòüñÿ ê
                                √
         ñðåäíåìó ïðèìåðíî êàê 2 2N (äâå äèñïåðñèè), à ýòî î÷åíü
         ìíîãî.


                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Âûáîðêà ïî çíà÷èìîñòè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Âûáîðêà ñ îòêëîíåíèåì
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî

Çàêëþ÷åíèå


         Åñëè ðàçìåðíîñòåé ìíîãî, òî ó âûáîðêè ïî çíà÷èìîñòè
         åñòü äâå áîëüøèå ïðîáëåìû.
         Âî-ïåðâûõ, ÷òîáû ïîëó÷èòü ðàçóìíûå ñýìïëû, íóæíî óæå
         çàðàíåå âûáðàòü q òàê, ÷òîáû îíî õîðîøî
         àïïðîêñèìèðîâàëî p .
         Âî-âòîðûõ, äàæå åñëè èõ ïîëó÷èòü, ÷àñòî ìîæåò òàê
         ñëó÷èòüñÿ, ÷òî âåñà ó íåêîòîðûõ ñýìïëîâ áóäóò ñëèøêîì
         âåëèêè.
          îáùåì, äëÿ ñëó÷àÿ ìíîãèõ ðàçìåðíîñòåé ýòî íå î÷åíü
         õîðîøèé ìåòîä.



                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Âûáîðêà ïî çíà÷èìîñòè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Âûáîðêà ñ îòêëîíåíèåì
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî

Ñóòü




         Âûáîðêà ñ îòêëîíåíèåì  rejection sampling.
         Ñóòü ìåòîäà â òîì, ÷òî òåïåðü ó íàñ åñòü q ∗ , êîòîðîå ìû
         ìîæåì ñýìïëèðîâàòü è ïðî êîòîðîå ìû çíàåì êîíñòàíòó c ,
         òàêóþ, ÷òî
                            ∀x cq ∗ (x )  p ∗ (x ).
         Òîãäà ìû ñóìååì ñýìïëèðîâàòü p .




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Âûáîðêà ïî çíà÷èìîñòè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Âûáîðêà ñ îòêëîíåíèåì
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî

Àëãîðèòì ôîðìàëüíî




         Âçÿòü ñýìïë     x ïî ðàñïðåäåëåíèþ q ∗ (x ).
         Âûáðàòü ñëó÷àéíîå ÷èñëî u ðàâíîìåðíî èç èíòåðâàëà
         [0, cq ∗ (x )].
         Âû÷èñëèòü p ∗ (x ). Åñëè u  p ∗ (x ), x îòêëîíÿåòñÿ (îòñþäà è
         íàçâàíèå), èíà÷å äîáàâëÿåòñÿ â ñýìïëû.




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Âûáîðêà ïî çíà÷èìîñòè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Âûáîðêà ñ îòêëîíåíèåì
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî

Îáîñíîâàíèå




         Àëãîðèòì ðàáîòàåò, ïîòîìó ÷òî âûáèðàåò òî÷êè [x , u ]
         ðàâíîìåðíî èç îáëàñòè ïîä ãðàôèêîì p ∗ (x ), à ýòî è
         çíà÷èò, ÷òî ïîëó÷àòñÿ ñýìïëû p ∗ .




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Âûáîðêà ïî çíà÷èìîñòè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Âûáîðêà ñ îòêëîíåíèåì
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî

Ïðîáëåìû




         Êàê è ó ïðåäûäóùåãî àëãîðèòìà, ó âûáîðêè ñ îòêëîíåíèåì
         íà÷èíàþòñÿ ïðîáëåìû â áîëüøèõ èçìåðåíèÿõ.
         Ñóòü ïðîáëåìû òà æå, ÷òî â ïðåäûäóùåì ñëó÷àå, à
         âûðàæàåòñÿ îíà â òîì, ÷òî c áóäåò î÷åíü áîëüøèì
         (ýêñïîíåíöèàëüíûì îò n), è ïî÷òè âñå ñýìïëû áóäóò
         îòâåðãàòüñÿ.




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Outline

   1   Ââåäåíèå è òðèâèàëüíûå ïîäõîäû
         Äâå çàäà÷è
         Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé
         Ïî÷åìó ýòî òðóäíî?
   2   Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì
         Âûáîðêà ïî çíà÷èìîñòè
         Âûáîðêà ñ îòêëîíåíèåì
   3   Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî
        Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî
        Ãèááñó
        Ìàðêîâñêèå ìåòîäû è slice sampling
        Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Îáùàÿ èäåÿ


         Ñóòü àëãîðèòìà ïîõîæà íà âûáîðêó ñ îòêëîíåíèåì, íî åñòü
         âàæíîå îòëè÷èå.
         Ðàñïðåäåëåíèå q òåïåðü áóäåò ìåíÿòüñÿ ñî âðåìåíåì,
         çàâèñåòü îò òåêóùåãî ñîñòîÿíèÿ àëãîðèòìà.
         Êàê è ïðåæäå, íóæíî ðàñïðåäåëåíèå q , òî÷íåå, ñåìåéñòâî
         q (x ; x (t ) ), ãäå x (t )  òåêóùåå ñîñòîÿíèå.
         Íî òåïåðü q íå äîëæíî áûòü ïðèáëèæåíèåì p , à äîëæíî
         ïðîñòî áûòü êàêèì-íèáóäü ñýìïëèðóåìûì ðàñïðåäåëåíèåì
         (íàïðèìåð, ñôåðè÷åñêèé ãàóññèàí).
         Êàíäèäàò â íîâîå ñîñòîÿíèå             x   ñýìïëèðóåòñÿ èç q (x ; x (t ) ).



                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Àëãîðèòì



         Î÷åðåäíàÿ èòåðàöèÿ íà÷èíàåòñÿ ñ ñîñòîÿíèÿ                     x (i ) .
         Âûáðàòü      x   ïî ðàñïðåäåëåíèþ q (x ; x (i ) ).
         Âû÷èñëèòü
                                                 (i ) x
                              a = p∗ (x(i )) q (x ; (i ) ) .
                                    ∗

                                  p (x ) q (x ; x )
         Ñ âåðîÿòíîñòüþ a (1, åñëè a ≥ 1) x (i +1) := x               , èíà÷å
         x (i +1) := x (i ) .



                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Îáñóæäåíèå



         Ñóòü â òîì, ÷òî ìû ïåðåõîäèì â íîâûé öåíòð
         ðàñïðåäåëåíèÿ, åñëè ïðèìåì î÷åðåäíîé øàã.
         Ïîëó÷àåòñÿ ýòàêèé random walk, çàâèñÿùèé îò
         ðàñïðåäåëåíèÿ p ∗ .
         q(x (i ) ;x ) äëÿ ñèììåòðè÷íûõ ðàñïðåäåëåíèé (ãàóññèàíà)
         q ( x ; x (i ) )
         ðàâíî 1, ýòî ïðîñòî ïîïðàâêà íà àñèììåòðèþ.
         Îòëè÷èå îò rejection sampling: åñëè íå ïðèìåì, òî íå
         ïðîñòî îòáðàñûâàåì øàã, à çàïèñûâàåì x (i ) åù¼ ðàç.




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Îáñóæäåíèå
         Î÷åâèäíî, ÷òî x (i )  îòíþäü íå íåçàâèñèìû.
         Íåçàâèñèìûå ñýìïëû ïîëó÷àþòñÿ òîëüêî ñ áîëüøèìè
         èíòåðâàëàìè.
         Ïîñêîëüêó ýòî random walk, òî åñëè áîëüøàÿ ÷àñòü q
         ñîñðåäîòî÷åíà â ðàäèóñå , à îáùèé ðàäèóñ p ∗ ðàâåí D , òî
         äëÿ ïîëó÷åíèÿ íåçàâèñèìîãî ñýìïëà íóæíî áóäåò
         ìèíèìóì... ñêîëüêî?
   Óïðàæíåíèå.   Ðàññìîòðèì îäíîìåðíîå ñëó÷àéíîå áëóæäàíèå,
   ãäå íà êàæäîì øàãå ñ âåðîÿòíîñòüþ 1/2 òî÷êà äâèæåòñÿ âëåâî
   èëè âïðàâî. Êàêîå îæèäàåìîå ðàññòîÿíèå òî÷êè îò íóëÿ ïîñëå
   T øàãîâ?
           D   2
               øàãîâ (è ýòî îöåíêà ñíèçó).
         Õîðîøèå íîâîñòè: ýòî âåðíî äëÿ ëþáîé ðàçìåðíîñòè. Òî
         åñòü âðåìåíè íàäî ìíîãî, íî íåò êàòàñòðîôû ïðè ïåðåõîäå
                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Êîãäà ðàçìåðíîñòü âåëèêà



         Êîãäà ðàçìåðíîñòü áîëüøàÿ, ìîæíî íå ñðàçó âñå
         ïåðåìåííûå èçìåíÿòü ïî q (x ; x ), à âûáðàòü íåñêîëüêî
         ðàñïðåäåëåíèé qj , êàæäîå èç êîòîðûõ êàñàåòñÿ ÷àñòè
         ïåðåìåííûõ, è ïðèíèìàòü èëè îòâåðãàòü èçìåíåíèÿ ïî
         î÷åðåäè.
         Òîãäà ïðîöåññ ïîéä¼ò áûñòðåå, ÷àùå ïðèíèìàòü èçìåíåíèÿ
         áóäåì.




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Èäåÿ ñýìïëèðîâàíèÿ ïî Ãèááñó




         Ïóñòü ðàçìåðíîñòü áîëüøàÿ. ×òî äåëàòü?
         Äàâàéòå ïîïðîáóåì âûáèðàòü ñýìïë íå âåñü ñðàçó, à
         ïîêîìïîíåíòíî.
         Òîãäà íàâåðíÿêà ýòè îäíîìåðíûå ðàñïðåäåëåíèÿ îêàæóòñÿ
         ïðîùå, è ñýìïë ìû âûáåðåì.




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Íà äâóõ ïåðåìåííûõ




         Ïóñòü åñòü äâå êîîðäèíàòû:x è y . Íà÷èíàåì ñ (x 0 , y 0 ).
         Âûáèðàåì x 1 ïî ðàñïðåäåëåíèþ p (x |y = y 0 ).
         Âûáèðàåì y 1 ïî ðàñïðåäåëåíèþ p (y |x = x 1 ).
         Ïîâòîðÿåì.




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû         Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì        Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî          Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Îáùàÿ ñõåìà


         Â îáùåì âèäå âñ¼ òî æå ñàìîå: xit +1 âûáèðàåì ïî
         ðàñïðåäåëåíèþ

                             p(xi |x1+1 , . . . , xit−11 , xit+1 , . . . , xn )
                                    t                +                      t

         è ïîâòîðÿåì.
         Ýòî ÷àñòíûé ñëó÷àé àëãîðèòìà Ìåòðîïîëèñà (êàêèå òóò
         ðàñïðåäåëåíèÿ q ?).
         Ïîýòîìó ñýìïëèðîâàíèå ïî Ãèááñó ñõîäèòñÿ, è, òàê êàê ýòî
         òîò æå random walk ïî ñóòè, âåðíà òà æå êâàäðàòè÷íàÿ
         îöåíêà.


                            Ñåðãåé Íèêîëåíêî         Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Îáñóæäåíèå


         Íóæíî çíàòü p (xi |x1 , . . . , xi −1 , xi +1 , . . . , xn ). Ýòî, íàïðèìåð,
         îñîáåííî ëåãêî çíàòü â áàéåñîâñêèõ ñåòÿõ.
         Êàê áóäåò ðàáîòàòü ñýìïëèðîâàíèå ïî Ãèááñó â
         áàéåñîâñêîé ñåòè?
         Äëÿ ñýìïëèðîâàíèÿ ïî Ãèááñó íå íóæíî íèêàêèõ
         îñîáåííûõ ïðåäïîëîæåíèé èëè çíàíèé. Ìîæíî áûñòðî
         ñäåëàòü ðàáîòàþùóþ ìîäåëü, ïîýòîìó ýòî î÷åíü
         ïîïóëÿðíûé àëãîðèòì.
         Â áîëüøèõ ðàçìåðíîñòÿõ ìîæåò îêàçàòüñÿ ýôôåêòèâíåå
         ñýìïëèòü ïî íåñêîëüêî ïåðåìåííûõ ñðàçó, à íå ïî îäíîé.



                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

BUGS




         Ãèááñ â áàéåñîâñêèõ ñåòÿõ  the BUGS Project.
         http://www.mrc-bsu.cam.ac.uk/bugs/




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû     Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì    Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî      Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Ìàðêîâñêèå öåïè


         Ìàðêîâñêàÿ öåïü çàäà¼òñÿ íà÷àëüíûì ðàñïðåäåëåíèåì
         âåðîÿòíîñòåé p 0 (x ) è âåðîÿòíîñòÿìè ïåðåõîäà T (x ; x ).
         T (x ; x )  ýòî ðàñïðåäåëåíèå ñëåäóþùåãî ýëåìåíòà öåïè â
         çàâèñèìîñòè îò ñëåäóþùåãî; ðàñïðåäåëåíèå íà (t + 1)ì
         øàãå ðàâíî

                              pt +1 (x   )=     T (x ; x )pt (x )dx .
          äèñêðåòíîì ñëó÷àå             T (x ; x )  ýòî ìàòðèöà âåðîÿòíîñòåé
         p(x = i |x = j ).


                            Ñåðãåé Íèêîëåíêî     Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû      Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì     Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî       Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Ñâîéñòâà ìàðêîâñêèõ öåïåé: èíâàðèàíòíîå
ðàñïðåäåëåíèå


         Íå âñÿêàÿ ìàðêîâñêàÿ öåïü íàì ïîäîéä¼ò.
         Âî-ïåðâûõ, öåïü äîëæíà ñõîäèòüñÿ ê ðàñïðåäåëåíèþ,
         êîòîðîå íàñ èíòåðåñóåò.
         Ýòî íàçûâàåòñÿ èíâàðèàíòíûì ðàñïðåäåëåíèåì;
         èíâàðèàíòíîå ðàñïðåäåëåíèå π óäîâëåòâîðÿåò

                                 π(x ) =        T (x ; x )π(x )dx .
         Íàì íóæíî, ÷òîáû èíâàðèàíòíûì ðàñïðåäåëåíèåì íàøåé
         öåïè áûëî p (x ), êîòîðîå ìû õîòèì ñýìïëèðîâàòü.


                            Ñåðãåé Íèêîëåíêî      Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Ñâîéñòâà ìàðêîâñêèõ öåïåé: ýðãîäè÷íîñòü

         Íó, è íóæíî, ÷òîáû ñîáñòâåííî ñõîäèëîñü:

                         ∀p 0 (x )    pt (x ) −→ π(x ) ïðè t → ∞.
         Êàêèå ìîãóò áûòü ïðèìåðû íåýðãîäè÷íûõ öåïåé?




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Ñâîéñòâà ìàðêîâñêèõ öåïåé: ýðãîäè÷íîñòü

         Íó, è íóæíî, ÷òîáû ñîáñòâåííî ñõîäèëîñü:

                         ∀p 0 (x )    pt (x ) −→ π(x ) ïðè t → ∞.
         Êàêèå ìîãóò áûòü ïðèìåðû íåýðãîäè÷íûõ öåïåé?
         Â öåïè ìîãóò áûòü íåäîñòèæèìûå ñîñòîÿíèÿ (òîãäà ïðåäåë
         çàâèñèò îò p 0 ).
         Ó öåïè ìîæåò áûòü ïåðèîä, ò.å. ïðåäåëüíîå ðàñïðåäåëåíèå
         ìîæåò ìåíÿòüñÿ ñ íåêîòîðûì ïåðèîäîì (íàïðèìåð, ïî
         ñîîáðàæåíèÿì ÷¼òíîñòè).




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Èç ÷åãî äåëàþò ìàðêîâñêèå öåïè




         Åñòü íåñêîëüêî óäîáíûõ êîíñòðóêöèé, ñ ïîìîùüþ êîòîðûõ
         ìîæíî ïîñòðîèòü äîñòàòî÷íî ñëîæíóþ ôóíêöèþ T ,
         ñîõðàíÿÿ å¼ ñâîéñòâà.
         Äàâàéòå èõ ðàññìîòðèì.




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Èç ÷åãî äåëàþò ìàðêîâñêèå öåïè: êîíêàòåíàöèÿ




         Ìîæíî êîíêàòåíèðîâàòü ðàñïðåäåëåíèÿ, çàïóñêàÿ èõ äðóã
         çà äðóãîì:

                         T (x , x ) = T2 (x , x )T1 (x , x )dx           .

         Ïðè ýòîì ñîõðàíÿåòñÿ èíâàðèàíòíîå ðàñïðåäåëåíèå
         (äîêàæèòå).




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû      Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì     Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî       Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Èç ÷åãî äåëàþò ìàðêîâñêèå öåïè: ñìåñü




         Ìîæíî ñìåøèâàòü ðàñïðåäåëåíèÿ. Åñëè áûëè ôóíêöèè
         Ti (x , x ), òî ìîæíî ââåñòè íîâóþ
                      T (x , x ) =         pi Ti (x , x ),   ãäå       pi = 1.
                                       i                           i




                            Ñåðãåé Íèêîëåíêî      Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Óñëîâèå áàëàíñà


         Åù¼ îäíî ïîëåçíîå ñâîéñòâî:

                           ∀x , y    T (x , y )p(y ) = T (y , x )p(x ).
         Ò.å. âåðîÿòíîñòü òîãî, ÷òî ìû âûáåðåì x è äîéä¼ì äî y ,
         ðàâíà âåðîÿòíîñòè âûáðàòü y è äîéòè äî x .
         Òàêèå öåïè íàçûâàþòñÿ îáðàòèìûìè (reversible).
         Åñëè âûïîëíÿåòñÿ óñëîâèå áàëàíñà, òî p (x ) 
         èíâàðèàíòíîå ðàñïðåäåëåíèå. Ýòî ñâîéñòâî ìîæåò
         ïðèãîäèòüñÿ.



                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Ñóòü




         Slice sampling  åù¼ îäèí àëãîðèòì, ïîõîæèé íà àëãîðèòì
         Ìåòðîïîëèñà.
         Ïðèìåíÿåòñÿ â òåõ æå ñèòóàöèÿõ, íî â í¼ì áîëüøå
         íàñòðàèâàåìûõ ïàðàìåòðîâ è âîîáùå ãèáêîñòè.




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Àëãîðèòì â îäíîìåðíîì ñëó÷àå


         Ìû õîòèì ñäåëàòü random walk èç îäíîé òî÷êè ïîä
         ãðàôèêîì p ∗ â äðóãóþ òî÷êó ïîä ãðàôèêîì p ∗ , äà òàê,
         ÷òîáû â ïðåäåëå ïîëó÷èëîñü ðàâíîìåðíîå ðàñïðåäåëåíèå.
         Âîò êàê áóäåì äåëàòü ïåðåõîä (x , u ) → (x , u ):
               Âû÷èñëèì      p ∗ (x )   è âûáåðåì   u      [0, p ∗ (x )].
                                                        ðàâíîìåðíî èç

               Ñäåëàåì ãîðèçîíòàëüíûé èíòåðâàë (x , x ) âîêðóã x .
                                                                 l       r


               Çàòåì áóäåì âûáèðàòü x ðàâíîìåðíî èç (x , x ), ïîêà íå        l   r


               ïîïàä¼ì ïîä ãðàôèê.

               Åñëè íå ïîïàäàåì, ìîäèôèöèðóåì              (x , x ).
                                                             l       r



         Îñòàëîñü ïîíÿòü, êàê ñäåëàòü (xl , xr ) è êàê åãî ïîòîì
         ìîäèôèöèðîâàòü.


                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû     Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì    Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî      Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Äîïîëíåíèÿ ê àëãîðèòìó




         Èñõîäíûé âûáîð (xl , xr ):
               Âûáðàòü  r ðàâíîìåðíî èç [0, ].
               x := x − r , x := x + ( − r ).
                 l             r


               Ðàçäâèãàòü ãðàíèöû íà            , ïîêà   p ∗ (x )  u
                                                              l         è   p ∗ (x )  u
                                                                                 r         .


         Ìîäèôèêàöèÿ (xl , xr ): Åñëè           x   ëåæèò âûøå          p∗ , ñîêðàùàåì
         èíòåðâàë äî x .




                            Ñåðãåé Íèêîëåíêî     Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Ñâîéñòâà



         Â àëãîðèòìå Ìåòðîïîëèñà íóæíî áûëî âûáèðàòü ðàçìåð
         øàãà. È îò íåãî âñ¼ çàâèñåëî êâàäðàòè÷íî.
         À òóò ðàçìåð øàãà ïîäïðàâëÿåòñÿ ñàì ñîáîé, è ýòà
         ïîïðàâêà ïðîèñõîäèò çà ëèíåéíîå âðåìÿ (à òî è ëîãàðèôì).
          çàäà÷àõ ñ áîëüøîé ðàçìåðíîñòüþ íóæíî ñíà÷àëà
         âûáðàòü (ñëó÷àéíî èëè ñîâïàäàþùèìè ñ îñÿìè)
         íàïðàâëåíèå èçìåíåíèÿ y , à ïîòîì ïðîâîäèòü àëãîðèòì
         îòíîñèòåëüíî ïàðàìåòðà α â ðàñïðåäåëåíèè p ∗ (x + αy ).




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Èäåÿ




         Ðàññìîòðèì ñèòóàöèþ, êîãäà âåðîÿòíîñòü ìîæíî çàïèñàòü
         êàê p (x ) = Z e −E (x ) .
                      1

         Âî ìíîãèõ òàêèõ ñëó÷àÿõ ìîæíî âû÷èñëèòü íå òîëüêî
         E (x ), íî è ãðàäèåíò E (x ).
         Òàêóþ èíôîðìàöèþ õîòåëîñü áû èñïîëüçîâàòü.




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Ãàìèëüòîíîâà ìåõàíèêà




         Çàéì¼ìñÿ ìàòôèçèêîé: ðàññìîòðèì ìåõàíè÷åñêóþ ñèñòåìó.
         Ñîñòîÿíèå ñèñòåìû îïèñûâàåòñÿ îáîáù¼ííûìè
         êîîðäèíàòàìè q è îáîáù¼ííûìè ìîìåíòàìè p (âåêòîðíûå
         ïåðåìåííûå).
         ż îáùàÿ ýíåðãèÿ H (q , p , t ) = V (q , t ) + K (p , t ), ãäå         V   
         ïîòåíöèàëüíàÿ, K  êèíåòè÷åñêàÿ.




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Ãàìèëüòîíîâà ìåõàíèêà




         Òîãäà ñèñòåìà áóäåò îïèñûâàòüñÿ ãàìèëüòîíîâûìè
         óðàâíåíèÿìè
                          p = − ∂H ,
                          _
                                ∂q
                                        q = ∂H .
                                        _
                                            ∂p




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Ñóòü



         Ãàìèëüòîíîâ ìåòîä Ìîíòå-Êàðëî  ýòî âàðèàöèÿ ìåòîäà
         Ìåòðîïîëèñà.
         Ïðîñòðàíñòâî ïîèñêà x ðàñøèðÿåòñÿ                 ìîìåíòàìè p.
         Òåïåðü áëóæäàíèå îñóùåñòâëÿåòñÿ äâóìÿ ñïîñîáàìè:
         ïåðâûé ïðîñòî ñëó÷àéíî áëóæäàåò ïî ïðîñòðàíñòâó
         ìîìåíòîâ (ïî Ãèááñó, íàïðèìåð).
         Ìîìåíòû íåçàâèñèìû è ðàñïðåäåëåíû íîðìàëüíî, òàê ÷òî
         òóò âñ¼ â ïîðÿäêå.




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Ñóòü

         Ââåä¼ì     ãàìèëüòîíèàí
                                  H (x, p) = E (x) + K (p),
         ãäå   K    êèíåòè÷åñêàÿ ýíåðãèÿ, íàïðèìåð               K (bp) = pT p .
                                                                            2
         Òîãäà âòîðîé øàã ïûòàåòñÿ ñýìïëèðîâàòü ñîâìåñòíóþ
         âåðîÿòíîñòü

                   pH (x, p) = Z1 e −H (x,p) = Z1 e −E (x) Z1 e −K (p) .
                                    H                 H             H
         Ïîòîì ìîæíî áóäåò ïðîñòî îòáðîñèòü K è ïîëó÷èòü
         ñýìïëû äëÿ e −E (x) , ïîòîìó ÷òî òóò âñ¼ òàê õîðîøî
         ðàçäåëÿåòñÿ.

                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Ñóòü



         Ìû õîòèì ïîñòðîèòü òðàåêòîðèþ â ïðîñòðàíñòâå (x, p), íà
         êîòîðîé H îñòà¼òñÿ ïîñòîÿííûì, à çàòåì ïî ìåòîäó
         Ìåòðîïîëèñà ëèáî ïðèíÿòü, ëèáî îòêëîíèòü ýòîò ñýìïë.
         Ïîíÿòíî, ÷òî x = p, à ãàìèëüòîíîâû óðàâíåíèÿ íàì
                      _

         ãîâîðÿò, ÷òî
                                     ∂E (x)
                               p=−
                                _           .
                                      ∂x




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Ñóòü


         Îñòàëîñü ýòî ïðîèíòåãðèðîâàòü. Äëÿ ýòîãî ìîæíî
         èñïîëüçîâàòü leapfrog technique (÷åõàðäà?) ïðèáëèæ¼ííîãî
         èíòåãðèðîâàíèÿ:

                                                                 ∂E
                       pi (t + τ )
                               2       =            pi (t ) − τ ∂xi x(t ) ,
                                                               2
                       xi (t + τ)      =         xi (t ) + mi pi (t + τ ),
                                                             τ
                                                                      2
                                                              ∂E
                       pi (t + τ)      =    pi (t + τ ) − τ
                                                    2     2   ∂xi x(t +τ) .


         Äîïîëíèòåëüíûå ¾ïîëîâèííûå¿ øàãè ïîçâîëÿþò äîáèòüñÿ
         ïîãðåøíîñòè âòîðîãî ïîðÿäêà ïî τ.



                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå

Ñóòü



         Àëãîðèòì äåëàåò m leapfrog øàãîâ, ïîòîì ïî ìåòîäó
         Ìåòðîïîëèñà ïðèíèìàåò èëè îòâåðãàåò ïîëó÷èâøóþñÿ
         òî÷êó (ïðîåêöèþ íà x).
         Òî åñòü åñëè ìû ìîæåì ïîäñ÷èòûâàòü E , à íå òîëüêî E ,
         ìû ìîæåì âêëþ÷èòü ýòó èíôîðìàöèþ â íàø random walk.
         Â ðåçóëüòàòå îí áóäåò äâèãàòüñÿ áîëåå-ìåíåå â ïðàâèëüíîì
                                               √
         íàïðàâëåíèè, è ïðîéäåííîå ðàññòîÿíèå n ïðåâðàòèòñÿ â n
         (äîêàçûâàòü óæ íå áóäåì).




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
Ââåäåíèå è òðèâèàëüíûå ïîäõîäû    Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè
Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì   Ìàðêîâñêèå ìåòîäû è slice sampling
              Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî     Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå




   Ñïàñèáî çà âíèìàíèå!

         Lecture notes è ñëàéäû áóäóò ïîÿâëÿòüñÿ íà ìîåé
         homepage:
         http://logic.pdmi.ras.ru/∼sergey/index.php?page=teaching
         Ïðèñûëàéòå ëþáûå çàìå÷àíèÿ, ðåøåíèÿ óïðàæíåíèé,
         íîâûå ÷èñëåííûå ïðèìåðû è ïðî÷åå ïî àäðåñàì:
         sergey@logic.pdmi.ras.ru, snikolenko@gmail.com
         Çàõîäèòå â ÆÆ             smartnik.




                            Ñåðãåé Íèêîëåíêî    Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã

More Related Content

What's hot

Легалізація громадських, благодійних організацій, ОСББ, ОСН
Легалізація громадських, благодійних організацій, ОСББ, ОСНЛегалізація громадських, благодійних організацій, ОСББ, ОСН
Легалізація громадських, благодійних організацій, ОСББ, ОСНLawngo
 
20101028 reals and_integers_matiyasevich_ekb_lecture01-02
20101028 reals and_integers_matiyasevich_ekb_lecture01-0220101028 reals and_integers_matiyasevich_ekb_lecture01-02
20101028 reals and_integers_matiyasevich_ekb_lecture01-02Computer Science Club
 

What's hot (10)

Lekts12
Lekts12Lekts12
Lekts12
 
4504
45044504
4504
 
Garch
GarchGarch
Garch
 
4776
47764776
4776
 
6028
60286028
6028
 
Легалізація громадських, благодійних організацій, ОСББ, ОСН
Легалізація громадських, благодійних організацій, ОСББ, ОСНЛегалізація громадських, благодійних організацій, ОСББ, ОСН
Легалізація громадських, благодійних організацій, ОСББ, ОСН
 
5767
57675767
5767
 
4326
43264326
4326
 
Saw baglaa boodol st
Saw baglaa boodol stSaw baglaa boodol st
Saw baglaa boodol st
 
20101028 reals and_integers_matiyasevich_ekb_lecture01-02
20101028 reals and_integers_matiyasevich_ekb_lecture01-0220101028 reals and_integers_matiyasevich_ekb_lecture01-02
20101028 reals and_integers_matiyasevich_ekb_lecture01-02
 

Viewers also liked

Teknik konfigurasi dan_fasilitas_jaringan
Teknik konfigurasi dan_fasilitas_jaringanTeknik konfigurasi dan_fasilitas_jaringan
Teknik konfigurasi dan_fasilitas_jaringanSejahtera Affif
 
безопасность веб приложений сегодня. дмитрий евтеев. зал 4
безопасность веб приложений сегодня. дмитрий евтеев. зал 4безопасность веб приложений сегодня. дмитрий евтеев. зал 4
безопасность веб приложений сегодня. дмитрий евтеев. зал 4rit2011
 
разработчики с марса, пользователи с венеры. место встречи – сайт. к. стернин...
разработчики с марса, пользователи с венеры. место встречи – сайт. к. стернин...разработчики с марса, пользователи с венеры. место встречи – сайт. к. стернин...
разработчики с марса, пользователи с венеры. место встречи – сайт. к. стернин...rit2011
 
Beautiful World Waterfalls
Beautiful World WaterfallsBeautiful World Waterfalls
Beautiful World WaterfallsJodiesjourneycom
 
Colmenar
ColmenarColmenar
ColmenarLeerte
 
Informática educativa i isa delbons
Informática educativa i   isa delbonsInformática educativa i   isa delbons
Informática educativa i isa delbonsDelbons1
 
Letter of Reference Julie Hentges
Letter of Reference Julie HentgesLetter of Reference Julie Hentges
Letter of Reference Julie HentgesThomas Carter
 
2014科展複審時間
2014科展複審時間2014科展複審時間
2014科展複審時間Howard Chang
 
Cembre PO 7000 Hydraulic Cable Cutting Tool Foot Pump - PO 7000 Manual
Cembre PO 7000 Hydraulic Cable Cutting Tool Foot Pump - PO 7000 ManualCembre PO 7000 Hydraulic Cable Cutting Tool Foot Pump - PO 7000 Manual
Cembre PO 7000 Hydraulic Cable Cutting Tool Foot Pump - PO 7000 ManualThorne & Derrick International
 
Il Centro Vital Dent di Cagliari spiega come prevenire l'alitosi
Il Centro Vital Dent di Cagliari spiega come prevenire l'alitosiIl Centro Vital Dent di Cagliari spiega come prevenire l'alitosi
Il Centro Vital Dent di Cagliari spiega come prevenire l'alitosiVitaldentItalia
 
Portfolio copy-120819233710-phpapp01
Portfolio copy-120819233710-phpapp01Portfolio copy-120819233710-phpapp01
Portfolio copy-120819233710-phpapp01Sejahtera Affif
 
I pv6 малоизвестные подробности. андрей пантюхин. зал 2
I pv6   малоизвестные подробности. андрей пантюхин. зал 2I pv6   малоизвестные подробности. андрей пантюхин. зал 2
I pv6 малоизвестные подробности. андрей пантюхин. зал 2rit2011
 

Viewers also liked (20)

Impact Results
Impact ResultsImpact Results
Impact Results
 
Sp duas pocas i
Sp duas pocas iSp duas pocas i
Sp duas pocas i
 
Exterior building
Exterior buildingExterior building
Exterior building
 
Teknik konfigurasi dan_fasilitas_jaringan
Teknik konfigurasi dan_fasilitas_jaringanTeknik konfigurasi dan_fasilitas_jaringan
Teknik konfigurasi dan_fasilitas_jaringan
 
безопасность веб приложений сегодня. дмитрий евтеев. зал 4
безопасность веб приложений сегодня. дмитрий евтеев. зал 4безопасность веб приложений сегодня. дмитрий евтеев. зал 4
безопасность веб приложений сегодня. дмитрий евтеев. зал 4
 
разработчики с марса, пользователи с венеры. место встречи – сайт. к. стернин...
разработчики с марса, пользователи с венеры. место встречи – сайт. к. стернин...разработчики с марса, пользователи с венеры. место встречи – сайт. к. стернин...
разработчики с марса, пользователи с венеры. место встречи – сайт. к. стернин...
 
Beautiful World Waterfalls
Beautiful World WaterfallsBeautiful World Waterfalls
Beautiful World Waterfalls
 
Sensor tactil
Sensor tactilSensor tactil
Sensor tactil
 
Colmenar
ColmenarColmenar
Colmenar
 
Sãopaulo fotos
Sãopaulo fotosSãopaulo fotos
Sãopaulo fotos
 
Informática educativa i isa delbons
Informática educativa i   isa delbonsInformática educativa i   isa delbons
Informática educativa i isa delbons
 
Letter of Reference Julie Hentges
Letter of Reference Julie HentgesLetter of Reference Julie Hentges
Letter of Reference Julie Hentges
 
Eu parlement 17 mei
Eu parlement 17 meiEu parlement 17 mei
Eu parlement 17 mei
 
Aprendizaxe interxeneracional pw
Aprendizaxe interxeneracional pwAprendizaxe interxeneracional pw
Aprendizaxe interxeneracional pw
 
2014科展複審時間
2014科展複審時間2014科展複審時間
2014科展複審時間
 
Cembre PO 7000 Hydraulic Cable Cutting Tool Foot Pump - PO 7000 Manual
Cembre PO 7000 Hydraulic Cable Cutting Tool Foot Pump - PO 7000 ManualCembre PO 7000 Hydraulic Cable Cutting Tool Foot Pump - PO 7000 Manual
Cembre PO 7000 Hydraulic Cable Cutting Tool Foot Pump - PO 7000 Manual
 
Il Centro Vital Dent di Cagliari spiega come prevenire l'alitosi
Il Centro Vital Dent di Cagliari spiega come prevenire l'alitosiIl Centro Vital Dent di Cagliari spiega come prevenire l'alitosi
Il Centro Vital Dent di Cagliari spiega come prevenire l'alitosi
 
Boletim da escola
Boletim da escolaBoletim da escola
Boletim da escola
 
Portfolio copy-120819233710-phpapp01
Portfolio copy-120819233710-phpapp01Portfolio copy-120819233710-phpapp01
Portfolio copy-120819233710-phpapp01
 
I pv6 малоизвестные подробности. андрей пантюхин. зал 2
I pv6   малоизвестные подробности. андрей пантюхин. зал 2I pv6   малоизвестные подробности. андрей пантюхин. зал 2
I pv6 малоизвестные подробности. андрей пантюхин. зал 2
 

Similar to 20080323 machine learning_nikolenko_lecture04

Similar to 20080323 machine learning_nikolenko_lecture04 (14)

êàòîëîã
êàòîëîãêàòîëîã
êàòîëîã
 
Db
DbDb
Db
 
1097
10971097
1097
 
1492
14921492
1492
 
Mery biydaalt
Mery biydaaltMery biydaalt
Mery biydaalt
 
Lekts15
Lekts15Lekts15
Lekts15
 
Lekts15
Lekts15Lekts15
Lekts15
 
5874
58745874
5874
 
5970
59705970
5970
 
1497
14971497
1497
 
Int marketing partners working with the world
Int marketing partners   working with the worldInt marketing partners   working with the world
Int marketing partners working with the world
 
4519
45194519
4519
 
5570
55705570
5570
 
5513
55135513
5513
 

More from Computer Science Club

20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugsComputer Science Club
 
20140531 serebryany lecture02_find_scary_cpp_bugs
20140531 serebryany lecture02_find_scary_cpp_bugs20140531 serebryany lecture02_find_scary_cpp_bugs
20140531 serebryany lecture02_find_scary_cpp_bugsComputer Science Club
 
20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugsComputer Science Club
 
20140511 parallel programming_kalishenko_lecture12
20140511 parallel programming_kalishenko_lecture1220140511 parallel programming_kalishenko_lecture12
20140511 parallel programming_kalishenko_lecture12Computer Science Club
 
20140427 parallel programming_zlobin_lecture11
20140427 parallel programming_zlobin_lecture1120140427 parallel programming_zlobin_lecture11
20140427 parallel programming_zlobin_lecture11Computer Science Club
 
20140420 parallel programming_kalishenko_lecture10
20140420 parallel programming_kalishenko_lecture1020140420 parallel programming_kalishenko_lecture10
20140420 parallel programming_kalishenko_lecture10Computer Science Club
 
20140413 parallel programming_kalishenko_lecture09
20140413 parallel programming_kalishenko_lecture0920140413 parallel programming_kalishenko_lecture09
20140413 parallel programming_kalishenko_lecture09Computer Science Club
 
20140329 graph drawing_dainiak_lecture02
20140329 graph drawing_dainiak_lecture0220140329 graph drawing_dainiak_lecture02
20140329 graph drawing_dainiak_lecture02Computer Science Club
 
20140329 graph drawing_dainiak_lecture01
20140329 graph drawing_dainiak_lecture0120140329 graph drawing_dainiak_lecture01
20140329 graph drawing_dainiak_lecture01Computer Science Club
 
20140310 parallel programming_kalishenko_lecture03-04
20140310 parallel programming_kalishenko_lecture03-0420140310 parallel programming_kalishenko_lecture03-04
20140310 parallel programming_kalishenko_lecture03-04Computer Science Club
 
20140216 parallel programming_kalishenko_lecture01
20140216 parallel programming_kalishenko_lecture0120140216 parallel programming_kalishenko_lecture01
20140216 parallel programming_kalishenko_lecture01Computer Science Club
 

More from Computer Science Club (20)

20141223 kuznetsov distributed
20141223 kuznetsov distributed20141223 kuznetsov distributed
20141223 kuznetsov distributed
 
Computer Vision
Computer VisionComputer Vision
Computer Vision
 
20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs
 
20140531 serebryany lecture02_find_scary_cpp_bugs
20140531 serebryany lecture02_find_scary_cpp_bugs20140531 serebryany lecture02_find_scary_cpp_bugs
20140531 serebryany lecture02_find_scary_cpp_bugs
 
20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs
 
20140511 parallel programming_kalishenko_lecture12
20140511 parallel programming_kalishenko_lecture1220140511 parallel programming_kalishenko_lecture12
20140511 parallel programming_kalishenko_lecture12
 
20140427 parallel programming_zlobin_lecture11
20140427 parallel programming_zlobin_lecture1120140427 parallel programming_zlobin_lecture11
20140427 parallel programming_zlobin_lecture11
 
20140420 parallel programming_kalishenko_lecture10
20140420 parallel programming_kalishenko_lecture1020140420 parallel programming_kalishenko_lecture10
20140420 parallel programming_kalishenko_lecture10
 
20140413 parallel programming_kalishenko_lecture09
20140413 parallel programming_kalishenko_lecture0920140413 parallel programming_kalishenko_lecture09
20140413 parallel programming_kalishenko_lecture09
 
20140329 graph drawing_dainiak_lecture02
20140329 graph drawing_dainiak_lecture0220140329 graph drawing_dainiak_lecture02
20140329 graph drawing_dainiak_lecture02
 
20140329 graph drawing_dainiak_lecture01
20140329 graph drawing_dainiak_lecture0120140329 graph drawing_dainiak_lecture01
20140329 graph drawing_dainiak_lecture01
 
20140310 parallel programming_kalishenko_lecture03-04
20140310 parallel programming_kalishenko_lecture03-0420140310 parallel programming_kalishenko_lecture03-04
20140310 parallel programming_kalishenko_lecture03-04
 
20140223-SuffixTrees-lecture01-03
20140223-SuffixTrees-lecture01-0320140223-SuffixTrees-lecture01-03
20140223-SuffixTrees-lecture01-03
 
20140216 parallel programming_kalishenko_lecture01
20140216 parallel programming_kalishenko_lecture0120140216 parallel programming_kalishenko_lecture01
20140216 parallel programming_kalishenko_lecture01
 
20131106 h10 lecture6_matiyasevich
20131106 h10 lecture6_matiyasevich20131106 h10 lecture6_matiyasevich
20131106 h10 lecture6_matiyasevich
 
20131027 h10 lecture5_matiyasevich
20131027 h10 lecture5_matiyasevich20131027 h10 lecture5_matiyasevich
20131027 h10 lecture5_matiyasevich
 
20131027 h10 lecture5_matiyasevich
20131027 h10 lecture5_matiyasevich20131027 h10 lecture5_matiyasevich
20131027 h10 lecture5_matiyasevich
 
20131013 h10 lecture4_matiyasevich
20131013 h10 lecture4_matiyasevich20131013 h10 lecture4_matiyasevich
20131013 h10 lecture4_matiyasevich
 
20131006 h10 lecture3_matiyasevich
20131006 h10 lecture3_matiyasevich20131006 h10 lecture3_matiyasevich
20131006 h10 lecture3_matiyasevich
 
20131006 h10 lecture3_matiyasevich
20131006 h10 lecture3_matiyasevich20131006 h10 lecture3_matiyasevich
20131006 h10 lecture3_matiyasevich
 

20080323 machine learning_nikolenko_lecture04

  • 1. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã Ñåðãåé Íèêîëåíêî Machine Learning CS Club, âåñíà 2008 Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 2. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Äâå çàäà÷è Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Ïî÷åìó ýòî òðóäíî? Outline 1 Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Äâå çàäà÷è Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé Ïî÷åìó ýòî òðóäíî? 2 Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Âûáîðêà ïî çíà÷èìîñòè Âûáîðêà ñ îòêëîíåíèåì 3 Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãèááñó Ìàðêîâñêèå ìåòîäû è slice sampling Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 3. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Äâå çàäà÷è Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Ïî÷åìó ýòî òðóäíî? Ïî÷åìó ïðîáëåìà Ïóñòü ó íàñ åñòü íåêîòîðîå âåðîÿòíîñòíîå ðàñïðåäåëåíèå. Êàê ñ íèì ðàáîòàòü? Êàê, íàïðèìåð, åãî ñèìóëèðîâàòü? Ìû íå âñåãäà ìîæåì ïðèáëèçèòü (êàê ïî ìåòîäó Ëàïëàñà) ðàñïðåäåëåíèå êàêèì-íèáóäü èçâåñòíûì òàê, ÷òîáû âñ¼ ïîñ÷èòàòü â ÿâíîì âèäå. Íàïðèìåð, â êëàñòåðèçàöèè: ìóëüòèìîäàëüíîå ðàñïðåäåëåíèå ñ êó÷åé ïàðàìåòðîâ, ÷òî ñ íèì äåëàòü? Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 4. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Äâå çàäà÷è Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Ïî÷åìó ýòî òðóäíî? Ïîñòàíîâêà çàäà÷è Ïóñòü èìååòñÿ íåêîå ðàñïðåäåëåíèå p (x ). Çàäà÷à 1: íàó÷èòüñÿ ãåíåðèðîâàòü ñýìïëû {x (r ) }R=1 ïî p (x ). r Çàäà÷à 2: íàó÷èòüñÿ îöåíèâàòü îæèäàíèÿ ôóíêöèé ïî ðàñïðåäåëåíèþ p (x ), ò.å. íàó÷èòüñÿ îöåíèâàòü èíòåãðàëû âèäà Ep [φ] = p(x )φ(x )dx . Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 5. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Äâå çàäà÷è Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Ïî÷åìó ýòî òðóäíî? Ïîñòàíîâêà çàäà÷è Ìû áóäåì îáû÷íî ïðåäïîëàãàòü, ÷òî x ýòî âåêòîð èç Rn ñ êîìïîíåíòàìè xn , íî èíîãäà áóäåì ðàññìàòðèâàòü äèñêðåòíûå ìíîæåñòâà çíà÷åíèé. Ôóíêöèè φ ýòî, íàïðèìåð, ìîìåíòû ñëó÷àéíûõ âåëè÷èí, çàâèñÿùèõ îò x . Íàïðèìåð, åñëè t (x ) ñëó÷àéíàÿ âåëè÷èíà, òî å¼ ñðåäíåå ýòî Ep [t (x )] ( p (x )t (x )dx ), à å¼ âàðèàöèÿ ðàâíà Ep [t 2 ] − (Ep [t ])2 . È ìû ïðåäïîëàãàåì, ÷òî ÿâíî âû÷èñëèòü íå ïîëó÷àåòñÿ ñëèøêîì ñëîæíàÿ ôóíêöèÿ p . Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 6. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Äâå çàäà÷è Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Ïî÷åìó ýòî òðóäíî? Îæèäàíèÿ è ñýìïëèíã Ìû áóäåì çàíèìàòüñÿ òîëüêî ñýìïëèíãîì, ïîòîìó ÷òî çàäà÷à îöåíêè îæèäàíèé ôóíêöèé ëåãêî ðåøèòñÿ, åñëè ìû íàó÷èìñÿ äåëàòü ñýìïëèíã. Êàê îíà ðåøèòñÿ? Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 7. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Äâå çàäà÷è Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Ïî÷åìó ýòî òðóäíî? Îæèäàíèÿ è ñýìïëèíã Ìû áóäåì çàíèìàòüñÿ òîëüêî ñýìïëèíãîì, ïîòîìó ÷òî çàäà÷à îöåíêè îæèäàíèé ôóíêöèé ëåãêî ðåøèòñÿ, åñëè ìû íàó÷èìñÿ äåëàòü ñýìïëèíã. Êàê îíà ðåøèòñÿ? Íóæíî âçÿòü ñýìïëû {x (r ) }R=1 è ïîäñ÷èòàòü r 1 ^ φ= φ(x (r ) ). R r Îæèäàíèå φ ðàâíî Ep [φ], à âàðèàöèÿ óáûâàåò îáðàòíî ^ ïðîïîðöèîíàëüíî R . Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 8. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Äâå çàäà÷è Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Ïî÷åìó ýòî òðóäíî? ×òî æå ñëîæíîãî â ñýìïëèíãå? Ìû ïðåäïîëàãàåì, ÷òî äàíà ôóíêöèÿ p ∗ (x ), êîòîðàÿ îòëè÷àåòñÿ îò p (x ) òîëüêî íîðìèðîâî÷íîé êîíñòàíòîé Z = p∗ (x )dx : p(x ) = p∗ (x )/Z . Ïî÷åìó òðóäíî äåëàòü ñýìïëèíã? Âî-ïåðâûõ, ìû îáû÷íî íå çíàåì Z ; íî ýòî íå ãëàâíîå. Ãëàâíîå îáû÷íî ïðàâèëüíûå ñýìïëû p ∗ ÷àñòî ïîïàäàþò òóäà, ãäå p ∗ âåëèêà. À êàê îïðåäåëèòü, ãäå îíà âåëèêà, íå âû÷èñëÿÿ å¼ âåçäå? Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 9. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Äâå çàäà÷è Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Ïî÷åìó ýòî òðóäíî? Äèñêðåòèçàöèÿ ïðîñòðàíñòâà Ïðîñòåéøàÿ èäåÿ: äàâàéòå äèñêðåòèçóåì ïðîñòðàíñòâî, âû÷èñëèì p ∗ íà êàæäîì ó÷àñòêå (ïóñòü îíà ãëàäêàÿ), ïîòîì áóäåì áðàòü äèñêðåòíûå ñýìïëû, çíàÿ âñå âåðîÿòíîñòè (ýòî íåòðóäíî). Ñêîëüêî æå áóäåò äèñêðåòíûõ ó÷àñòêîâ? Ãëàâíàÿ ïðîáëåìà îáû÷íî âåëèêà ðàçìåðíîñòü x . Íàïðèìåð, åñëè ðàçäåëèòü êàæäóþ îñü íà 20 ó÷àñòêîâ, òî ó÷àñòêîâ áóäåò 20n ; à n â ðåàëüíûõ çàäà÷àõ ìîæåò äîñòèãàòü íåñêîëüêèõ òûñÿ÷... Èíûìè ñëîâàìè, òàêîé ïîäõîä íèêàê íå ðàáîòàåò. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 10. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Äâå çàäà÷è Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Ïî÷åìó ýòî òðóäíî? Ïðèìåð: ñêîëüêî â îçåðå íåôòè? Ïåðåä âàìè ó÷àñòîê, ïîä êîòîðûì çàëåæè íåôòè (äà õîòü ïîäçåìíîå îçåðî íåôòè). Âàì íóæíî îïðåäåëèòü, ñêîëüêî å¼ òóò. Âû ìîæåòå ïðîâîäèòü çàìåð â êàæäîé êîíêðåòíîé òî÷êå, ÷òîáû îïðåäåëèòü ãëóáèíó ñëîÿ â ýòîé òî÷êå. Ïðîáëåìà â òîì, ÷òî çíà÷èòåëüíàÿ ÷àñòü îáùåãî îáú¼ìà íåôòè ìîæåò áûòü ñîñðåäîòî÷åíà â ãëóáîêèõ, íî óçêèõ êàíüîíàõ. È ýòî òîëüêî ðàçìåðíîñòü äâà. :) Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 11. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Äâå çàäà÷è Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Ïî÷åìó ýòî òðóäíî? Ðàâíîìåðíîå ñýìïëèðîâàíèå Ìîæåò áûòü, âñ¼-òàêè ïîëó÷èòñÿ ðåøèòü õîòÿ áû âòîðóþ çàäà÷ó? Äàâàéòå áðàòü ñýìïëû {x (r ) }R=1 ðàâíîìåðíî èç âñåãî r ïðîñòðàíñòâà, çàòåì âû÷èñëÿòü òàì p ∗ è íîðìàëèçîâàòü ïîñðåäñòâîì ZR = R=1 p ∗ (x (r ) . r Òîãäà φ ^ ìîæíî áóäåò îöåíèòü êàê R 1 ^ φ= φ(x (r ) )p ∗ (x (r ) ). ZR r =1  ÷¼ì ïðîáëåìà? Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 12. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Äâå çàäà÷è Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Ïî÷åìó ýòî òðóäíî? Ðàâíîìåðíîå ñýìïëèðîâàíèå Äà â òîì æå ñàìîì. Îáû÷íî çíà÷èòåëüíàÿ ÷àñòü p ∗ ñîñðåäîòî÷åíà â î÷åíü íåáîëüøîé ÷àñòè ïðîñòðàíñòâà. Âåðîÿòíîñòü ïîïàñòü â íå¼ çà R ðàâíîìåðíî âûáðàííûõ ñýìïëîâ òîæå ýêñïîíåíöèàëüíî ìàëà (íàïðèìåð, åñëè ïî êàæäîé îñè âåðîÿòíîñòü ïîïàñòü 1/2, è âñ¼ íåçàâèñèìî, òî ïîëó÷èòñÿ âåðîÿòíîñòü 2−n ). Òàê ÷òî äàæå âòîðóþ çàäà÷ó ðåøèòü íå ïîëó÷èòñÿ. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 13. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Âûáîðêà ïî çíà÷èìîñòè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Outline 1 Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Äâå çàäà÷è Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé Ïî÷åìó ýòî òðóäíî? 2 Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Âûáîðêà ïî çíà÷èìîñòè Âûáîðêà ñ îòêëîíåíèåì 3 Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãèááñó Ìàðêîâñêèå ìåòîäû è slice sampling Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 14. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Âûáîðêà ïî çíà÷èìîñòè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Ñóòü ìåòîäà Âûáîðêà ïî çíà÷èìîñòè importance sampling. Ìû ðåøàåì òîëüêî âòîðóþ çàäà÷ó, à íå ïåðâóþ. Òî åñòü íàì íóæíî áðàòü ñýìïëû, ïðè ýòîì æåëàòåëüíî ïîïàäàÿ â çîíû, ãäå ôóíêöèÿ p ∗ èìååò áîëüøèå çíà÷åíèÿ. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 15. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Âûáîðêà ïî çíà÷èìîñòè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Ñóòü ìåòîäà Ïðåäïîëîæèì, ÷òî ó íàñ åñòü êàêîå-òî äðóãîå ðàñïðåäåëåíèå âåðîÿòíîñòåé q (òî÷íåå, q ∗ ), ïîïðîùå, è ìû óìååì áðàòü åãî ñýìïëû. Òîãäà àëãîðèòì òàêîé: ñíà÷àëà âçÿòü ñýìïë ïî q ∗ , à çàòåì ïîäïðàâèòü åãî òàê, ÷òîáû ïîëó÷èëñÿ âñ¼-òàêè ñýìïë ïî p ∗ . Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 16. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Âûáîðêà ïî çíà÷èìîñòè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Ôîðìàëüíûé àëãîðèòì Âçÿòü ñýìïëû {x (r ) }R=1 ïî ðàñïðåäåëåíèþ r q∗. Ðàññ÷èòàòü âåñà (r ) wr = p ∗(x (r )) . ∗ q (x Îöåíèòü ôóíêöèþ ïî ôîðìóëå (r ) ^ φ= r wr φ(x ) . r wr Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 17. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Âûáîðêà ïî çíà÷èìîñòè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Îáñóæäåíèå Çà÷åì íóæíî q ? ×åì ýòî ëó÷øå ðàâíîìåðíîãî ðàñïðåäåëåíèÿ? Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 18. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Âûáîðêà ïî çíà÷èìîñòè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Îáñóæäåíèå Çà÷åì íóæíî q ? ×åì ýòî ëó÷øå ðàâíîìåðíîãî ðàñïðåäåëåíèÿ? Ïðîùå ãîâîðÿ, ðàñïðåäåëåíèå q äîëæíî ïîìî÷ü âûáðàòü òå ó÷àñòêè, íà êîòîðûõ èìååò ñìûñë ñýìïëèòü r . Åñëè q õîðîøåå, òî ìîæåò ïîìî÷ü, à åñëè ïëîõîå, ìîæåò òîëüêî íàâðåäèòü. Íî åñòü è áîëåå ôóíäàìåíòàëüíûå ïðîáëåìû. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 19. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Âûáîðêà ïî çíà÷èìîñòè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Ïðîáëåìû Âî-ïåðâûõ, ñýìïëåð q íå äîëæåí áûòü ñëèøêîì óçêèì. Íàïðèìåð, åñëè ñýìïëåð ãàóññèàíîâñêèé ñ íåáîëüøîé âàðèàöèåé, òî ïèêè r äàëåêî îò öåíòðà q âîîáùå íèêòî íå çàìåòèò. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 20. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Âûáîðêà ïî çíà÷èìîñòè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Ïðîáëåìû Âî-âòîðûõ, ìîæåò ñëó÷èòüñÿ, ÷òî âñå ñýìïëû áóäóò íàïðî÷ü óáèòû íåáîëüøèì êîëè÷åñòâîì ñýìïëîâ ñ îãðîìíûìè âåñàìè. Ýòî ïëîõî. ×òîáû ïîêàçàòü, êàê ýòî áûâàåò, äàâàéòå ïåðåéä¼ì â ìíîãîìåðíûé ñëó÷àé. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 21. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Âûáîðêà ïî çíà÷èìîñòè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Ïðîáëåìû Ïóñòü åñòü ðàâíîìåðíîå ðàñïðåäåëåíèå r íà åäèíè÷íîì øàðå è ñýìïëåð q ïðîèçâåäåíèå ãàóññèàíîâ ñ öåíòðîì â íóëå: 1 e − 2σ2 i xi . 1 p(x ) = 2 (2πσ2 )N /2 Óïðàæíåíèå. Íàéäèòå ñðåäíåå è äèñïåðñèþ ðàññòîÿíèÿ r 2 = i xi òî÷êè, âçÿòîé ïî ýòîìó ðàñïðåäåëåíèþ. 2 Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 22. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Âûáîðêà ïî çíà÷èìîñòè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Ïðîáëåìû √ Îòâåò íà óïðàæíåíèå: ðàññòîÿíèå áóäåò N σ2 ± 2N σ 2 (ðàñïðåäåëåíèå áóäåò ïîõîæå íà ãàóññîâñêîå). Çíà÷èò, ïî÷òè âñå ñýìïëû ëåæàò â ¾òèïè÷íîì ìíîæåñòâå¿, √ êîëüöå ðàññòîÿíèåì îêîëî σ N îò íóëÿ. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 23. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Âûáîðêà ïî çíà÷èìîñòè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Ïðîáëåìû Òîãäà áîëüøèíñòâî ñýìïëîâ q áóäóò ëåæàòü â èíòåðâàëå 1 √ N 2N 2 )n/2 2− 2 ± 2 , (2πσ è íåíóëåâûå âåñà áóäóò èìåòü çíà÷åíèÿ ïîðÿäêà √ (2πσ )n /2 2 N ± 2 N . 2 2 2 Ýòî çíà÷èò, ÷òî ìàêñèìàëüíûé âåñ áóäåò îòíîñèòüñÿ ê √ ñðåäíåìó ïðèìåðíî êàê 2 2N (äâå äèñïåðñèè), à ýòî î÷åíü ìíîãî. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 24. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Âûáîðêà ïî çíà÷èìîñòè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Çàêëþ÷åíèå Åñëè ðàçìåðíîñòåé ìíîãî, òî ó âûáîðêè ïî çíà÷èìîñòè åñòü äâå áîëüøèå ïðîáëåìû. Âî-ïåðâûõ, ÷òîáû ïîëó÷èòü ðàçóìíûå ñýìïëû, íóæíî óæå çàðàíåå âûáðàòü q òàê, ÷òîáû îíî õîðîøî àïïðîêñèìèðîâàëî p . Âî-âòîðûõ, äàæå åñëè èõ ïîëó÷èòü, ÷àñòî ìîæåò òàê ñëó÷èòüñÿ, ÷òî âåñà ó íåêîòîðûõ ñýìïëîâ áóäóò ñëèøêîì âåëèêè.  îáùåì, äëÿ ñëó÷àÿ ìíîãèõ ðàçìåðíîñòåé ýòî íå î÷åíü õîðîøèé ìåòîä. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 25. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Âûáîðêà ïî çíà÷èìîñòè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Ñóòü Âûáîðêà ñ îòêëîíåíèåì rejection sampling. Ñóòü ìåòîäà â òîì, ÷òî òåïåðü ó íàñ åñòü q ∗ , êîòîðîå ìû ìîæåì ñýìïëèðîâàòü è ïðî êîòîðîå ìû çíàåì êîíñòàíòó c , òàêóþ, ÷òî ∀x cq ∗ (x ) p ∗ (x ). Òîãäà ìû ñóìååì ñýìïëèðîâàòü p . Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 26. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Âûáîðêà ïî çíà÷èìîñòè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Àëãîðèòì ôîðìàëüíî Âçÿòü ñýìïë x ïî ðàñïðåäåëåíèþ q ∗ (x ). Âûáðàòü ñëó÷àéíîå ÷èñëî u ðàâíîìåðíî èç èíòåðâàëà [0, cq ∗ (x )]. Âû÷èñëèòü p ∗ (x ). Åñëè u p ∗ (x ), x îòêëîíÿåòñÿ (îòñþäà è íàçâàíèå), èíà÷å äîáàâëÿåòñÿ â ñýìïëû. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 27. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Âûáîðêà ïî çíà÷èìîñòè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Îáîñíîâàíèå Àëãîðèòì ðàáîòàåò, ïîòîìó ÷òî âûáèðàåò òî÷êè [x , u ] ðàâíîìåðíî èç îáëàñòè ïîä ãðàôèêîì p ∗ (x ), à ýòî è çíà÷èò, ÷òî ïîëó÷àòñÿ ñýìïëû p ∗ . Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 28. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Âûáîðêà ïî çíà÷èìîñòè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Ïðîáëåìû Êàê è ó ïðåäûäóùåãî àëãîðèòìà, ó âûáîðêè ñ îòêëîíåíèåì íà÷èíàþòñÿ ïðîáëåìû â áîëüøèõ èçìåðåíèÿõ. Ñóòü ïðîáëåìû òà æå, ÷òî â ïðåäûäóùåì ñëó÷àå, à âûðàæàåòñÿ îíà â òîì, ÷òî c áóäåò î÷åíü áîëüøèì (ýêñïîíåíöèàëüíûì îò n), è ïî÷òè âñå ñýìïëû áóäóò îòâåðãàòüñÿ. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 29. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Outline 1 Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Äâå çàäà÷è Êàê âòîðàÿ çàäà÷à ñëåäóåò èç ïåðâîé Ïî÷åìó ýòî òðóäíî? 2 Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Âûáîðêà ïî çíà÷èìîñòè Âûáîðêà ñ îòêëîíåíèåì 3 Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãèááñó Ìàðêîâñêèå ìåòîäû è slice sampling Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 30. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Îáùàÿ èäåÿ Ñóòü àëãîðèòìà ïîõîæà íà âûáîðêó ñ îòêëîíåíèåì, íî åñòü âàæíîå îòëè÷èå. Ðàñïðåäåëåíèå q òåïåðü áóäåò ìåíÿòüñÿ ñî âðåìåíåì, çàâèñåòü îò òåêóùåãî ñîñòîÿíèÿ àëãîðèòìà. Êàê è ïðåæäå, íóæíî ðàñïðåäåëåíèå q , òî÷íåå, ñåìåéñòâî q (x ; x (t ) ), ãäå x (t ) òåêóùåå ñîñòîÿíèå. Íî òåïåðü q íå äîëæíî áûòü ïðèáëèæåíèåì p , à äîëæíî ïðîñòî áûòü êàêèì-íèáóäü ñýìïëèðóåìûì ðàñïðåäåëåíèåì (íàïðèìåð, ñôåðè÷åñêèé ãàóññèàí). Êàíäèäàò â íîâîå ñîñòîÿíèå x ñýìïëèðóåòñÿ èç q (x ; x (t ) ). Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 31. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Àëãîðèòì Î÷åðåäíàÿ èòåðàöèÿ íà÷èíàåòñÿ ñ ñîñòîÿíèÿ x (i ) . Âûáðàòü x ïî ðàñïðåäåëåíèþ q (x ; x (i ) ). Âû÷èñëèòü (i ) x a = p∗ (x(i )) q (x ; (i ) ) . ∗ p (x ) q (x ; x ) Ñ âåðîÿòíîñòüþ a (1, åñëè a ≥ 1) x (i +1) := x , èíà÷å x (i +1) := x (i ) . Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 32. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Îáñóæäåíèå Ñóòü â òîì, ÷òî ìû ïåðåõîäèì â íîâûé öåíòð ðàñïðåäåëåíèÿ, åñëè ïðèìåì î÷åðåäíîé øàã. Ïîëó÷àåòñÿ ýòàêèé random walk, çàâèñÿùèé îò ðàñïðåäåëåíèÿ p ∗ . q(x (i ) ;x ) äëÿ ñèììåòðè÷íûõ ðàñïðåäåëåíèé (ãàóññèàíà) q ( x ; x (i ) ) ðàâíî 1, ýòî ïðîñòî ïîïðàâêà íà àñèììåòðèþ. Îòëè÷èå îò rejection sampling: åñëè íå ïðèìåì, òî íå ïðîñòî îòáðàñûâàåì øàã, à çàïèñûâàåì x (i ) åù¼ ðàç. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 33. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Îáñóæäåíèå Î÷åâèäíî, ÷òî x (i ) îòíþäü íå íåçàâèñèìû. Íåçàâèñèìûå ñýìïëû ïîëó÷àþòñÿ òîëüêî ñ áîëüøèìè èíòåðâàëàìè. Ïîñêîëüêó ýòî random walk, òî åñëè áîëüøàÿ ÷àñòü q ñîñðåäîòî÷åíà â ðàäèóñå , à îáùèé ðàäèóñ p ∗ ðàâåí D , òî äëÿ ïîëó÷åíèÿ íåçàâèñèìîãî ñýìïëà íóæíî áóäåò ìèíèìóì... ñêîëüêî? Óïðàæíåíèå. Ðàññìîòðèì îäíîìåðíîå ñëó÷àéíîå áëóæäàíèå, ãäå íà êàæäîì øàãå ñ âåðîÿòíîñòüþ 1/2 òî÷êà äâèæåòñÿ âëåâî èëè âïðàâî. Êàêîå îæèäàåìîå ðàññòîÿíèå òî÷êè îò íóëÿ ïîñëå T øàãîâ? D 2 øàãîâ (è ýòî îöåíêà ñíèçó). Õîðîøèå íîâîñòè: ýòî âåðíî äëÿ ëþáîé ðàçìåðíîñòè. Òî åñòü âðåìåíè íàäî ìíîãî, íî íåò êàòàñòðîôû ïðè ïåðåõîäå Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 34. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Êîãäà ðàçìåðíîñòü âåëèêà Êîãäà ðàçìåðíîñòü áîëüøàÿ, ìîæíî íå ñðàçó âñå ïåðåìåííûå èçìåíÿòü ïî q (x ; x ), à âûáðàòü íåñêîëüêî ðàñïðåäåëåíèé qj , êàæäîå èç êîòîðûõ êàñàåòñÿ ÷àñòè ïåðåìåííûõ, è ïðèíèìàòü èëè îòâåðãàòü èçìåíåíèÿ ïî î÷åðåäè. Òîãäà ïðîöåññ ïîéä¼ò áûñòðåå, ÷àùå ïðèíèìàòü èçìåíåíèÿ áóäåì. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 35. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Èäåÿ ñýìïëèðîâàíèÿ ïî Ãèááñó Ïóñòü ðàçìåðíîñòü áîëüøàÿ. ×òî äåëàòü? Äàâàéòå ïîïðîáóåì âûáèðàòü ñýìïë íå âåñü ñðàçó, à ïîêîìïîíåíòíî. Òîãäà íàâåðíÿêà ýòè îäíîìåðíûå ðàñïðåäåëåíèÿ îêàæóòñÿ ïðîùå, è ñýìïë ìû âûáåðåì. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 36. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Íà äâóõ ïåðåìåííûõ Ïóñòü åñòü äâå êîîðäèíàòû:x è y . Íà÷èíàåì ñ (x 0 , y 0 ). Âûáèðàåì x 1 ïî ðàñïðåäåëåíèþ p (x |y = y 0 ). Âûáèðàåì y 1 ïî ðàñïðåäåëåíèþ p (y |x = x 1 ). Ïîâòîðÿåì. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 37. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Îáùàÿ ñõåìà  îáùåì âèäå âñ¼ òî æå ñàìîå: xit +1 âûáèðàåì ïî ðàñïðåäåëåíèþ p(xi |x1+1 , . . . , xit−11 , xit+1 , . . . , xn ) t + t è ïîâòîðÿåì. Ýòî ÷àñòíûé ñëó÷àé àëãîðèòìà Ìåòðîïîëèñà (êàêèå òóò ðàñïðåäåëåíèÿ q ?). Ïîýòîìó ñýìïëèðîâàíèå ïî Ãèááñó ñõîäèòñÿ, è, òàê êàê ýòî òîò æå random walk ïî ñóòè, âåðíà òà æå êâàäðàòè÷íàÿ îöåíêà. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 38. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Îáñóæäåíèå Íóæíî çíàòü p (xi |x1 , . . . , xi −1 , xi +1 , . . . , xn ). Ýòî, íàïðèìåð, îñîáåííî ëåãêî çíàòü â áàéåñîâñêèõ ñåòÿõ. Êàê áóäåò ðàáîòàòü ñýìïëèðîâàíèå ïî Ãèááñó â áàéåñîâñêîé ñåòè? Äëÿ ñýìïëèðîâàíèÿ ïî Ãèááñó íå íóæíî íèêàêèõ îñîáåííûõ ïðåäïîëîæåíèé èëè çíàíèé. Ìîæíî áûñòðî ñäåëàòü ðàáîòàþùóþ ìîäåëü, ïîýòîìó ýòî î÷åíü ïîïóëÿðíûé àëãîðèòì.  áîëüøèõ ðàçìåðíîñòÿõ ìîæåò îêàçàòüñÿ ýôôåêòèâíåå ñýìïëèòü ïî íåñêîëüêî ïåðåìåííûõ ñðàçó, à íå ïî îäíîé. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 39. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå BUGS Ãèááñ â áàéåñîâñêèõ ñåòÿõ the BUGS Project. http://www.mrc-bsu.cam.ac.uk/bugs/ Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 40. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Ìàðêîâñêèå öåïè Ìàðêîâñêàÿ öåïü çàäà¼òñÿ íà÷àëüíûì ðàñïðåäåëåíèåì âåðîÿòíîñòåé p 0 (x ) è âåðîÿòíîñòÿìè ïåðåõîäà T (x ; x ). T (x ; x ) ýòî ðàñïðåäåëåíèå ñëåäóþùåãî ýëåìåíòà öåïè â çàâèñèìîñòè îò ñëåäóþùåãî; ðàñïðåäåëåíèå íà (t + 1)ì øàãå ðàâíî pt +1 (x )= T (x ; x )pt (x )dx .  äèñêðåòíîì ñëó÷àå T (x ; x ) ýòî ìàòðèöà âåðîÿòíîñòåé p(x = i |x = j ). Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 41. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Ñâîéñòâà ìàðêîâñêèõ öåïåé: èíâàðèàíòíîå ðàñïðåäåëåíèå Íå âñÿêàÿ ìàðêîâñêàÿ öåïü íàì ïîäîéä¼ò. Âî-ïåðâûõ, öåïü äîëæíà ñõîäèòüñÿ ê ðàñïðåäåëåíèþ, êîòîðîå íàñ èíòåðåñóåò. Ýòî íàçûâàåòñÿ èíâàðèàíòíûì ðàñïðåäåëåíèåì; èíâàðèàíòíîå ðàñïðåäåëåíèå π óäîâëåòâîðÿåò π(x ) = T (x ; x )π(x )dx . Íàì íóæíî, ÷òîáû èíâàðèàíòíûì ðàñïðåäåëåíèåì íàøåé öåïè áûëî p (x ), êîòîðîå ìû õîòèì ñýìïëèðîâàòü. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 42. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Ñâîéñòâà ìàðêîâñêèõ öåïåé: ýðãîäè÷íîñòü Íó, è íóæíî, ÷òîáû ñîáñòâåííî ñõîäèëîñü: ∀p 0 (x ) pt (x ) −→ π(x ) ïðè t → ∞. Êàêèå ìîãóò áûòü ïðèìåðû íåýðãîäè÷íûõ öåïåé? Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 43. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Ñâîéñòâà ìàðêîâñêèõ öåïåé: ýðãîäè÷íîñòü Íó, è íóæíî, ÷òîáû ñîáñòâåííî ñõîäèëîñü: ∀p 0 (x ) pt (x ) −→ π(x ) ïðè t → ∞. Êàêèå ìîãóò áûòü ïðèìåðû íåýðãîäè÷íûõ öåïåé?  öåïè ìîãóò áûòü íåäîñòèæèìûå ñîñòîÿíèÿ (òîãäà ïðåäåë çàâèñèò îò p 0 ). Ó öåïè ìîæåò áûòü ïåðèîä, ò.å. ïðåäåëüíîå ðàñïðåäåëåíèå ìîæåò ìåíÿòüñÿ ñ íåêîòîðûì ïåðèîäîì (íàïðèìåð, ïî ñîîáðàæåíèÿì ÷¼òíîñòè). Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 44. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Èç ÷åãî äåëàþò ìàðêîâñêèå öåïè Åñòü íåñêîëüêî óäîáíûõ êîíñòðóêöèé, ñ ïîìîùüþ êîòîðûõ ìîæíî ïîñòðîèòü äîñòàòî÷íî ñëîæíóþ ôóíêöèþ T , ñîõðàíÿÿ å¼ ñâîéñòâà. Äàâàéòå èõ ðàññìîòðèì. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 45. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Èç ÷åãî äåëàþò ìàðêîâñêèå öåïè: êîíêàòåíàöèÿ Ìîæíî êîíêàòåíèðîâàòü ðàñïðåäåëåíèÿ, çàïóñêàÿ èõ äðóã çà äðóãîì: T (x , x ) = T2 (x , x )T1 (x , x )dx . Ïðè ýòîì ñîõðàíÿåòñÿ èíâàðèàíòíîå ðàñïðåäåëåíèå (äîêàæèòå). Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 46. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Èç ÷åãî äåëàþò ìàðêîâñêèå öåïè: ñìåñü Ìîæíî ñìåøèâàòü ðàñïðåäåëåíèÿ. Åñëè áûëè ôóíêöèè Ti (x , x ), òî ìîæíî ââåñòè íîâóþ T (x , x ) = pi Ti (x , x ), ãäå pi = 1. i i Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 47. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Óñëîâèå áàëàíñà Åù¼ îäíî ïîëåçíîå ñâîéñòâî: ∀x , y T (x , y )p(y ) = T (y , x )p(x ). Ò.å. âåðîÿòíîñòü òîãî, ÷òî ìû âûáåðåì x è äîéä¼ì äî y , ðàâíà âåðîÿòíîñòè âûáðàòü y è äîéòè äî x . Òàêèå öåïè íàçûâàþòñÿ îáðàòèìûìè (reversible). Åñëè âûïîëíÿåòñÿ óñëîâèå áàëàíñà, òî p (x ) èíâàðèàíòíîå ðàñïðåäåëåíèå. Ýòî ñâîéñòâî ìîæåò ïðèãîäèòüñÿ. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 48. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Ñóòü Slice sampling åù¼ îäèí àëãîðèòì, ïîõîæèé íà àëãîðèòì Ìåòðîïîëèñà. Ïðèìåíÿåòñÿ â òåõ æå ñèòóàöèÿõ, íî â í¼ì áîëüøå íàñòðàèâàåìûõ ïàðàìåòðîâ è âîîáùå ãèáêîñòè. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 49. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Àëãîðèòì â îäíîìåðíîì ñëó÷àå Ìû õîòèì ñäåëàòü random walk èç îäíîé òî÷êè ïîä ãðàôèêîì p ∗ â äðóãóþ òî÷êó ïîä ãðàôèêîì p ∗ , äà òàê, ÷òîáû â ïðåäåëå ïîëó÷èëîñü ðàâíîìåðíîå ðàñïðåäåëåíèå. Âîò êàê áóäåì äåëàòü ïåðåõîä (x , u ) → (x , u ): Âû÷èñëèì p ∗ (x ) è âûáåðåì u [0, p ∗ (x )]. ðàâíîìåðíî èç Ñäåëàåì ãîðèçîíòàëüíûé èíòåðâàë (x , x ) âîêðóã x . l r Çàòåì áóäåì âûáèðàòü x ðàâíîìåðíî èç (x , x ), ïîêà íå l r ïîïàä¼ì ïîä ãðàôèê. Åñëè íå ïîïàäàåì, ìîäèôèöèðóåì (x , x ). l r Îñòàëîñü ïîíÿòü, êàê ñäåëàòü (xl , xr ) è êàê åãî ïîòîì ìîäèôèöèðîâàòü. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 50. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Äîïîëíåíèÿ ê àëãîðèòìó Èñõîäíûé âûáîð (xl , xr ): Âûáðàòü r ðàâíîìåðíî èç [0, ]. x := x − r , x := x + ( − r ). l r Ðàçäâèãàòü ãðàíèöû íà , ïîêà p ∗ (x ) u l è p ∗ (x ) u r . Ìîäèôèêàöèÿ (xl , xr ): Åñëè x ëåæèò âûøå p∗ , ñîêðàùàåì èíòåðâàë äî x . Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 51. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Ñâîéñòâà  àëãîðèòìå Ìåòðîïîëèñà íóæíî áûëî âûáèðàòü ðàçìåð øàãà. È îò íåãî âñ¼ çàâèñåëî êâàäðàòè÷íî. À òóò ðàçìåð øàãà ïîäïðàâëÿåòñÿ ñàì ñîáîé, è ýòà ïîïðàâêà ïðîèñõîäèò çà ëèíåéíîå âðåìÿ (à òî è ëîãàðèôì).  çàäà÷àõ ñ áîëüøîé ðàçìåðíîñòüþ íóæíî ñíà÷àëà âûáðàòü (ñëó÷àéíî èëè ñîâïàäàþùèìè ñ îñÿìè) íàïðàâëåíèå èçìåíåíèÿ y , à ïîòîì ïðîâîäèòü àëãîðèòì îòíîñèòåëüíî ïàðàìåòðà α â ðàñïðåäåëåíèè p ∗ (x + αy ). Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 52. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Èäåÿ Ðàññìîòðèì ñèòóàöèþ, êîãäà âåðîÿòíîñòü ìîæíî çàïèñàòü êàê p (x ) = Z e −E (x ) . 1 Âî ìíîãèõ òàêèõ ñëó÷àÿõ ìîæíî âû÷èñëèòü íå òîëüêî E (x ), íî è ãðàäèåíò E (x ). Òàêóþ èíôîðìàöèþ õîòåëîñü áû èñïîëüçîâàòü. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 53. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Ãàìèëüòîíîâà ìåõàíèêà Çàéì¼ìñÿ ìàòôèçèêîé: ðàññìîòðèì ìåõàíè÷åñêóþ ñèñòåìó. Ñîñòîÿíèå ñèñòåìû îïèñûâàåòñÿ îáîáù¼ííûìè êîîðäèíàòàìè q è îáîáù¼ííûìè ìîìåíòàìè p (âåêòîðíûå ïåðåìåííûå). ż îáùàÿ ýíåðãèÿ H (q , p , t ) = V (q , t ) + K (p , t ), ãäå V ïîòåíöèàëüíàÿ, K êèíåòè÷åñêàÿ. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 54. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Ãàìèëüòîíîâà ìåõàíèêà Òîãäà ñèñòåìà áóäåò îïèñûâàòüñÿ ãàìèëüòîíîâûìè óðàâíåíèÿìè p = − ∂H , _ ∂q q = ∂H . _ ∂p Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 55. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Ñóòü Ãàìèëüòîíîâ ìåòîä Ìîíòå-Êàðëî ýòî âàðèàöèÿ ìåòîäà Ìåòðîïîëèñà. Ïðîñòðàíñòâî ïîèñêà x ðàñøèðÿåòñÿ ìîìåíòàìè p. Òåïåðü áëóæäàíèå îñóùåñòâëÿåòñÿ äâóìÿ ñïîñîáàìè: ïåðâûé ïðîñòî ñëó÷àéíî áëóæäàåò ïî ïðîñòðàíñòâó ìîìåíòîâ (ïî Ãèááñó, íàïðèìåð). Ìîìåíòû íåçàâèñèìû è ðàñïðåäåëåíû íîðìàëüíî, òàê ÷òî òóò âñ¼ â ïîðÿäêå. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 56. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Ñóòü Ââåä¼ì ãàìèëüòîíèàí H (x, p) = E (x) + K (p), ãäå K êèíåòè÷åñêàÿ ýíåðãèÿ, íàïðèìåð K (bp) = pT p . 2 Òîãäà âòîðîé øàã ïûòàåòñÿ ñýìïëèðîâàòü ñîâìåñòíóþ âåðîÿòíîñòü pH (x, p) = Z1 e −H (x,p) = Z1 e −E (x) Z1 e −K (p) . H H H Ïîòîì ìîæíî áóäåò ïðîñòî îòáðîñèòü K è ïîëó÷èòü ñýìïëû äëÿ e −E (x) , ïîòîìó ÷òî òóò âñ¼ òàê õîðîøî ðàçäåëÿåòñÿ. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 57. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Ñóòü Ìû õîòèì ïîñòðîèòü òðàåêòîðèþ â ïðîñòðàíñòâå (x, p), íà êîòîðîé H îñòà¼òñÿ ïîñòîÿííûì, à çàòåì ïî ìåòîäó Ìåòðîïîëèñà ëèáî ïðèíÿòü, ëèáî îòêëîíèòü ýòîò ñýìïë. Ïîíÿòíî, ÷òî x = p, à ãàìèëüòîíîâû óðàâíåíèÿ íàì _ ãîâîðÿò, ÷òî ∂E (x) p=− _ . ∂x Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 58. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Ñóòü Îñòàëîñü ýòî ïðîèíòåãðèðîâàòü. Äëÿ ýòîãî ìîæíî èñïîëüçîâàòü leapfrog technique (÷åõàðäà?) ïðèáëèæ¼ííîãî èíòåãðèðîâàíèÿ: ∂E pi (t + τ ) 2 = pi (t ) − τ ∂xi x(t ) , 2 xi (t + τ) = xi (t ) + mi pi (t + τ ), τ 2 ∂E pi (t + τ) = pi (t + τ ) − τ 2 2 ∂xi x(t +τ) . Äîïîëíèòåëüíûå ¾ïîëîâèííûå¿ øàãè ïîçâîëÿþò äîáèòüñÿ ïîãðåøíîñòè âòîðîãî ïîðÿäêà ïî τ. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 59. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Ñóòü Àëãîðèòì äåëàåò m leapfrog øàãîâ, ïîòîì ïî ìåòîäó Ìåòðîïîëèñà ïðèíèìàåò èëè îòâåðãàåò ïîëó÷èâøóþñÿ òî÷êó (ïðîåêöèþ íà x). Òî åñòü åñëè ìû ìîæåì ïîäñ÷èòûâàòü E , à íå òîëüêî E , ìû ìîæåì âêëþ÷èòü ýòó èíôîðìàöèþ â íàø random walk.  ðåçóëüòàòå îí áóäåò äâèãàòüñÿ áîëåå-ìåíåå â ïðàâèëüíîì √ íàïðàâëåíèè, è ïðîéäåííîå ðàññòîÿíèå n ïðåâðàòèòñÿ â n (äîêàçûâàòü óæ íå áóäåì). Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã
  • 60. Ââåäåíèå è òðèâèàëüíûå ïîäõîäû Àëãîðèòì ÌåòðîïîëèñàÃàñòèíãñà è ñýìïëèðîâàíèå ïî Ãè Âûáîðêà ïî çíà÷èìîñòè è âûáîðêà ñ îòêëîíåíèåì Ìàðêîâñêèå ìåòîäû è slice sampling Ìàðêîâñêèå ìåòîäû ÌîíòåÊàðëî Êàê ñîêðàòèòü ñëó÷àéíîå áëóæäàíèå Ñïàñèáî çà âíèìàíèå! Lecture notes è ñëàéäû áóäóò ïîÿâëÿòüñÿ íà ìîåé homepage: http://logic.pdmi.ras.ru/∼sergey/index.php?page=teaching Ïðèñûëàéòå ëþáûå çàìå÷àíèÿ, ðåøåíèÿ óïðàæíåíèé, íîâûå ÷èñëåííûå ïðèìåðû è ïðî÷åå ïî àäðåñàì: sergey@logic.pdmi.ras.ru, snikolenko@gmail.com Çàõîäèòå â ÆÆ smartnik. Ñåðãåé Íèêîëåíêî Ìåòîäû ÌîíòåÊàðëî: ñýìïëèíã