SlideShare a Scribd company logo
1 of 24
Download to read offline
Approximate Bayesian Computation (ABC)

               Robin Ryder

                 CREST


             3 novembre 2009




                                         1/24
Introduction




      Contexte : inf´rence bay´sienne
                    e         e
      Donn´es D ; On cherche ` estimer un param`tre θ
          e                  a                 e
      Distribution a posteriori L(θ|D)π(θ)
      Beaucoup de m´thodes (par ex. MCMC) se fondent sur un
                       e
      calcul de la vraisemblance L(θ|D) = P(D|θ)
      Probl`me : Comment faire lorsque ce calcul est trop difficile
           e
      ou trop coˆteux ?
                u




                                                                    2/24
Solution : Approximate Bayesian Computation (ABC)




                                                    3/24
Plan




       Pr´sentation de l’algorithme de base
         e
       Application : datation de l’ancˆtre des primates
                                      e
       Utilisation de statistiques exhaustives ; facteur de Bayes
       Application : Repliement de prot´ines
                                       e
       ABC-MCMC




                                                                    4/24
Contexte




     Vraisemblance L(θ|D) difficile ou impossible ` calculer
                                                a
     Mais facile de simuler un nouveau jeu de donn´es d’apr`s le
                                                  e        e
     mod`le : D = f (θ)
         e




                                                                   5/24
Algorithme Approximate Bayesian Computation




                                              6/24
Algorithme Approximate Bayesian Computation




  Donn´es discr`tes D.
        e       e
  Distribution a priori π(θ).
  On cherche Θ ∼ π(θ) · P(D|θ)
    1   Tirer θ ∼ π
    2   Simuler des donn´es D ∼ f (θ)
                        e
    3   Si D = D, accepter θ ; sinon, rejeter θ
    4   R´p´ter jusqu’` obtenir un ´chantillon de la taille voulue
         e e          a            e
  On obtient un ´chantillon distribu´ selon la densit´
                e                   e                e
  π(θ) · P(D’ = D|θ).
  Exactement la loi a posteriori.
  Tr`s lent.
    e

                                                                     7/24
Algorithme Approximate Bayesian Computation




  Donn´es discr`tes ou continues D
        e       e
  Distribution a priori π(θ)
                  .
  On cherche Θ ∼ π(θ) · P(D|θ)
  Seuil
    1   Tirer θ ∼ π
    2   Simuler des donn´es D ∼ f (θ)
                        e
    3   Si d(D , D) < , accepter θ ; sinon, rejeter θ
    4   R´p´ter jusqu’` obtenir un ´chantillon de la taille voulue
         e e          a            e
  On obtient un ´chantillon distribu´ approximativement selon la loi
                 e                  e
  a posteriori.
  (Pritchard et al., 1999)

                                                                       8/24
3   Si d(D , D) < , accepter θ ; sinon, rejeter θ
Probl`mes :
     e
      Si   est petit, faible taux d’acceptation
      Si est grand, mauvaise approximation (quand     → ∞, on
      simule l’a priori)
      Comment choisir d ?




                                                                9/24
Datation de l’ancˆtre commun des primates
                 e



  Plagnol & Tavar´ (2004) et Wilkinson (2008)
                 e
      ˆ
      Age de l’ancˆtre commun des primates : Biologie mol´culaire
                  e                                      e
      90 MA ; Fossiles 60 MA
      Processus de branchement (param`tre λ) ; ˆge de la racine : τ
                                     e         a
      Sur les Ni esp`ces existant au temps ti (i = 1 . . . 14), on en
                    e
      observe Di ∼ Bin(Ni , αi )
      Param`tres : θ = (τ, λ, α)
           e
      Intervale HPD 95% : 68-99 MA




                                                                        10/24
Statistique exhaustive


  Donn´es discr`tes ou continues D
        e       e
  Distribution a priori π(θ)
                  .
  On cherche Θ ∼ π(θ) · P(D|θ)
  Seuil
  Statistique S, id´alement exhaustive
                    e
    1   Tirer θ ∼ π
    2   Simuler des donn´es D ∼ f (θ)
                        e
    3   Si d(S(D ), S(D)) < , accepter θ ; sinon, rejeter θ
    4   R´p´ter jusqu’` obtenir un ´chantillon de la taille voulue
         e e          a            e
  On obtient un ´chantillon distribu´ approximativement selon la loi
                e                   e
  a posteriori.



                                                                       11/24
Approximations




    3   Si d(S(D ), S(D)) < , accepter θ ; sinon, rejeter θ
  Deux approximations :
         >0
        S statistique non exhaustive




                                                              12/24
Choix de




     Quantile ` 1%
              a
     Attribuer des poids selon d(D , D) : (θi , ωi )




                                                       13/24
Repliement de prot´ines
                  e
  Structure primaire :
  KCNTATCATQRLANFLVHSSNNFGAILSSTNVGSNTY
  Structure tertiaire :




  (Figure : RCSB)
                                          14/24
Choix de mod`le
            e




  Choix de mod`le (structure 3D de prot´ines), Grelaud et al. (2009)
                e                      e
  θ = (m, θm )
  Facteur de Bayes :
  BFm0 /m1 (D) = P(M=m0 |D)π(M=m0 )
                  P(M=m1 |D)π(M=m1 )




                                                                       15/24
Repliement de prot´ines
                  e




                                        1
      Vraisemblance : L(θ|D) =          Zθ   exp(θ     i∼i   I{xi =xi } )
                        1
      L(θm |D) =      Zθm ,m   exp(θm    m
                                        i ∼i
                                               I{xi =xi } ), m = 0 . . . M − 1,
      θm ∈ Θm
      Sm =      ∼
               i mi
                      I{xi =xi }
      S = (S0 (·), . . . , SM−1 (·)) est une statistique exhaustive pour
      (m, θ0 , . . . , θM−1 )




                                                                                  16/24
ABC pour choix de mod`le
                     e




   1   Tirer m ∼ πM (·)
   2   Tirer θm ∼ πm (·)
   3   Simuler D ∼ fm (θm )
   4   Si d(S(D ), S(D)) < , accepter θ ; sinon, rejeter θ
   5   R´p´ter
        e e




                                                             17/24
Ca marche ?
¸




  Gauche :   = 0 ; Droite :   quantile ` 1%
                                       a




                                              18/24
R´sultats
 e




            19/24
ABC-MCMC




  1   Partant de θn , proposer θn+1 = θ
                                          →θn
  2   Calculer α = min 1, P(D|θ )π[(θ )q(θ→θ ) )
                           P(D|θ)π(θ)q(θn
  3   θn+1 = θ avec probabilit´ α ; sinon, θn+1 = θn
                              e




                                                       20/24
ABC-MCMC




   1   Partant de θn , proposer θn+1 = θ
   2   Simuler D = f (θ )
                                              →θ
   3   Calculer α = min Id(D ,D)< , π(θ )q(θn →θ n))
                                    π(θ)q(θ
   4   θn+1 = θ avec probabilit´ h ; sinon, θn+1 = θn
                               e
 (Marjoram et al., PNAS, 2003)




                                                        21/24
Erreur dans le mod`le
                  e



  Supposons qu’il y ait une erreur dans notre mod`le : D = f (θ) + ,
                                                 e
   ∼π
    1   Tirer θ ∼ π
    2   Simuler D ∼ f (θ)
    3   Accepter θ avec probability (proportionnelle `) π (d(D , D))
                                                     a
    4   R´p´ter
         e e
  (Wilkinson, 2008)




                                                                       22/24
1   Partant de (θn , Dn ), proposer θn+1 = θ
2   Simuler D = f (θ )
                                         →θ )π(θ )
3   Calculer α = min 1, π (d(D n,D))q(θn →θ n)π(θn )
                        π (d(D ,D)q(θ
4   θn+1 = θ avec probabilit´ α ; sinon, θn+1 = θn
                            e




                                                       23/24
Questions ?




              24/24

More Related Content

What's hot (19)

Cours econometrie-uqam-st-2-v2
Cours econometrie-uqam-st-2-v2Cours econometrie-uqam-st-2-v2
Cours econometrie-uqam-st-2-v2
 
Slides 2040-4
Slides 2040-4Slides 2040-4
Slides 2040-4
 
Fonctions trigonometriques h12
Fonctions trigonometriques h12Fonctions trigonometriques h12
Fonctions trigonometriques h12
 
Slides 2040-6-a2013
Slides 2040-6-a2013Slides 2040-6-a2013
Slides 2040-6-a2013
 
Slides act2040-a2013-2
Slides act2040-a2013-2Slides act2040-a2013-2
Slides act2040-a2013-2
 
Dérivation et primitivation
Dérivation et primitivationDérivation et primitivation
Dérivation et primitivation
 
Slides 2040-5
Slides 2040-5Slides 2040-5
Slides 2040-5
 
Slides 2040-6
Slides 2040-6Slides 2040-6
Slides 2040-6
 
Slide 2040-1
Slide 2040-1Slide 2040-1
Slide 2040-1
 
Slides 2040-4
Slides 2040-4Slides 2040-4
Slides 2040-4
 
Slides ensae 4
Slides ensae 4Slides ensae 4
Slides ensae 4
 
Slides ensae 7
Slides ensae 7Slides ensae 7
Slides ensae 7
 
Cours econometrie-uqam-st-3-v4
Cours econometrie-uqam-st-3-v4Cours econometrie-uqam-st-3-v4
Cours econometrie-uqam-st-3-v4
 
Séries de Fourier
Séries de FourierSéries de Fourier
Séries de Fourier
 
Algorithmes d'approximation
Algorithmes d'approximationAlgorithmes d'approximation
Algorithmes d'approximation
 
Cours algorithmique et complexite complet
Cours algorithmique et complexite completCours algorithmique et complexite complet
Cours algorithmique et complexite complet
 
Slides act6420-e2014-partie-2
Slides act6420-e2014-partie-2Slides act6420-e2014-partie-2
Slides act6420-e2014-partie-2
 
Sélection de contrôles avec correction
Sélection de contrôles avec correctionSélection de contrôles avec correction
Sélection de contrôles avec correction
 
Cours fourier
Cours fourier Cours fourier
Cours fourier
 

Similar to Approximate Bayesian Computation (ABC)

A new approximation of the Height process of a CSBP
A new approximation of the Height process of a CSBP A new approximation of the Height process of a CSBP
A new approximation of the Height process of a CSBP Mokhtar SELLAMI
 
Cours programmation en matlab2 (1)
Cours programmation en matlab2 (1)Cours programmation en matlab2 (1)
Cours programmation en matlab2 (1)Guesmi Amal
 
analyse numerique
analyse numeriqueanalyse numerique
analyse numeriquehomme00
 
Integrales doubles-ou-triples
Integrales doubles-ou-triplesIntegrales doubles-ou-triples
Integrales doubles-ou-triplesm.a bensaaoud
 
Discrimination et régression pour des dérivées : un résultat de consistance p...
Discrimination et régression pour des dérivées : un résultat de consistance p...Discrimination et régression pour des dérivées : un résultat de consistance p...
Discrimination et régression pour des dérivées : un résultat de consistance p...tuxette
 
Corrige math s1-s3_r_1er_gr_2013
Corrige math s1-s3_r_1er_gr_2013Corrige math s1-s3_r_1er_gr_2013
Corrige math s1-s3_r_1er_gr_2013Ibrahima Sow
 
1314correction_sujet1314.pdf
1314correction_sujet1314.pdf1314correction_sujet1314.pdf
1314correction_sujet1314.pdfKhadijaElaouni2
 
Omp math nombres-complexes
Omp math nombres-complexesOmp math nombres-complexes
Omp math nombres-complexesAhmed Ali
 
Généralisation du théorème de weierstrass et application
Généralisation du théorème de weierstrass et applicationGénéralisation du théorème de weierstrass et application
Généralisation du théorème de weierstrass et applicationKamel Djeddi
 
Minimal Submanifolds Z.C
Minimal Submanifolds Z.CMinimal Submanifolds Z.C
Minimal Submanifolds Z.CZahraa Cheaitou
 
Thermo dynamique l3 v2
Thermo dynamique  l3 v2Thermo dynamique  l3 v2
Thermo dynamique l3 v2RachidFade
 
Ch3 Algorthmique Avancée - Méthodes Récursives
Ch3 Algorthmique Avancée - Méthodes RécursivesCh3 Algorthmique Avancée - Méthodes Récursives
Ch3 Algorthmique Avancée - Méthodes Récursiveslotfibenromdhane
 
estimation parametrique.pdf
estimation parametrique.pdfestimation parametrique.pdf
estimation parametrique.pdfzahrakmar
 
Bandits Algo KL-UCB par Garivier
Bandits Algo KL-UCB par GarivierBandits Algo KL-UCB par Garivier
Bandits Algo KL-UCB par GarivierCdiscount
 

Similar to Approximate Bayesian Computation (ABC) (16)

A new approximation of the Height process of a CSBP
A new approximation of the Height process of a CSBP A new approximation of the Height process of a CSBP
A new approximation of the Height process of a CSBP
 
Cours programmation en matlab2 (1)
Cours programmation en matlab2 (1)Cours programmation en matlab2 (1)
Cours programmation en matlab2 (1)
 
analyse numerique
analyse numeriqueanalyse numerique
analyse numerique
 
Integrales doubles-ou-triples
Integrales doubles-ou-triplesIntegrales doubles-ou-triples
Integrales doubles-ou-triples
 
Discrimination et régression pour des dérivées : un résultat de consistance p...
Discrimination et régression pour des dérivées : un résultat de consistance p...Discrimination et régression pour des dérivées : un résultat de consistance p...
Discrimination et régression pour des dérivées : un résultat de consistance p...
 
Corrige math s1-s3_r_1er_gr_2013
Corrige math s1-s3_r_1er_gr_2013Corrige math s1-s3_r_1er_gr_2013
Corrige math s1-s3_r_1er_gr_2013
 
1314correction_sujet1314.pdf
1314correction_sujet1314.pdf1314correction_sujet1314.pdf
1314correction_sujet1314.pdf
 
Omp math nombres-complexes
Omp math nombres-complexesOmp math nombres-complexes
Omp math nombres-complexes
 
Généralisation du théorème de weierstrass et application
Généralisation du théorème de weierstrass et applicationGénéralisation du théorème de weierstrass et application
Généralisation du théorème de weierstrass et application
 
Théorie des distributions
Théorie des distributionsThéorie des distributions
Théorie des distributions
 
Minimal Submanifolds Z.C
Minimal Submanifolds Z.CMinimal Submanifolds Z.C
Minimal Submanifolds Z.C
 
Thermo dynamique l3 v2
Thermo dynamique  l3 v2Thermo dynamique  l3 v2
Thermo dynamique l3 v2
 
Ch3 Algorthmique Avancée - Méthodes Récursives
Ch3 Algorthmique Avancée - Méthodes RécursivesCh3 Algorthmique Avancée - Méthodes Récursives
Ch3 Algorthmique Avancée - Méthodes Récursives
 
estimation parametrique.pdf
estimation parametrique.pdfestimation parametrique.pdf
estimation parametrique.pdf
 
Bandits Algo KL-UCB par Garivier
Bandits Algo KL-UCB par GarivierBandits Algo KL-UCB par Garivier
Bandits Algo KL-UCB par Garivier
 
Cours 1
Cours 1Cours 1
Cours 1
 

More from Robin Ryder

Bayesian Methods for Historical Linguistics
Bayesian Methods for Historical LinguisticsBayesian Methods for Historical Linguistics
Bayesian Methods for Historical LinguisticsRobin Ryder
 
A phylogenetic model of language diversification
A phylogenetic model of language diversificationA phylogenetic model of language diversification
A phylogenetic model of language diversificationRobin Ryder
 
Statistical Methods in Historical Linguistics
Statistical Methods in Historical LinguisticsStatistical Methods in Historical Linguistics
Statistical Methods in Historical LinguisticsRobin Ryder
 
On the convergence properties of the Wang-Landau algorithm
On the convergence properties of the Wang-Landau algorithmOn the convergence properties of the Wang-Landau algorithm
On the convergence properties of the Wang-Landau algorithmRobin Ryder
 
Bayesian case studies, practical 2
Bayesian case studies, practical 2Bayesian case studies, practical 2
Bayesian case studies, practical 2Robin Ryder
 
Bayesian case studies, practical 1
Bayesian case studies, practical 1Bayesian case studies, practical 1
Bayesian case studies, practical 1Robin Ryder
 
Modèles phylogéniques de la diversification des langues
Modèles phylogéniques de la diversification des languesModèles phylogéniques de la diversification des langues
Modèles phylogéniques de la diversification des languesRobin Ryder
 
Talk at Institut Jean Nicod on 6 October 2010
Talk at Institut Jean Nicod on 6 October 2010Talk at Institut Jean Nicod on 6 October 2010
Talk at Institut Jean Nicod on 6 October 2010Robin Ryder
 
Phylogenetic models and MCMC methods for the reconstruction of language history
Phylogenetic models and MCMC methods for the reconstruction of language historyPhylogenetic models and MCMC methods for the reconstruction of language history
Phylogenetic models and MCMC methods for the reconstruction of language historyRobin Ryder
 
Modèles phylogénétiques de la diversification des langues
Modèles phylogénétiques de la diversification des languesModèles phylogénétiques de la diversification des langues
Modèles phylogénétiques de la diversification des languesRobin Ryder
 

More from Robin Ryder (10)

Bayesian Methods for Historical Linguistics
Bayesian Methods for Historical LinguisticsBayesian Methods for Historical Linguistics
Bayesian Methods for Historical Linguistics
 
A phylogenetic model of language diversification
A phylogenetic model of language diversificationA phylogenetic model of language diversification
A phylogenetic model of language diversification
 
Statistical Methods in Historical Linguistics
Statistical Methods in Historical LinguisticsStatistical Methods in Historical Linguistics
Statistical Methods in Historical Linguistics
 
On the convergence properties of the Wang-Landau algorithm
On the convergence properties of the Wang-Landau algorithmOn the convergence properties of the Wang-Landau algorithm
On the convergence properties of the Wang-Landau algorithm
 
Bayesian case studies, practical 2
Bayesian case studies, practical 2Bayesian case studies, practical 2
Bayesian case studies, practical 2
 
Bayesian case studies, practical 1
Bayesian case studies, practical 1Bayesian case studies, practical 1
Bayesian case studies, practical 1
 
Modèles phylogéniques de la diversification des langues
Modèles phylogéniques de la diversification des languesModèles phylogéniques de la diversification des langues
Modèles phylogéniques de la diversification des langues
 
Talk at Institut Jean Nicod on 6 October 2010
Talk at Institut Jean Nicod on 6 October 2010Talk at Institut Jean Nicod on 6 October 2010
Talk at Institut Jean Nicod on 6 October 2010
 
Phylogenetic models and MCMC methods for the reconstruction of language history
Phylogenetic models and MCMC methods for the reconstruction of language historyPhylogenetic models and MCMC methods for the reconstruction of language history
Phylogenetic models and MCMC methods for the reconstruction of language history
 
Modèles phylogénétiques de la diversification des langues
Modèles phylogénétiques de la diversification des languesModèles phylogénétiques de la diversification des langues
Modèles phylogénétiques de la diversification des langues
 

Recently uploaded

Présentation à Séminaire IA de la Fédération Gay Lussac , 25/03/24 Toulouse
Présentation à Séminaire IA de la Fédération Gay Lussac , 25/03/24 ToulousePrésentation à Séminaire IA de la Fédération Gay Lussac , 25/03/24 Toulouse
Présentation à Séminaire IA de la Fédération Gay Lussac , 25/03/24 ToulouseYvonGervaise
 
Rapport projet de fin d'études licence PFE
Rapport projet de fin d'études licence PFERapport projet de fin d'études licence PFE
Rapport projet de fin d'études licence PFEAhmam Abderrahmane
 
Planning de la semaine du 25 mars au 2 avril 2024
Planning de la semaine du 25 mars au 2 avril 2024Planning de la semaine du 25 mars au 2 avril 2024
Planning de la semaine du 25 mars au 2 avril 2024frizzole
 
Présentation de lancement de la SAE203 - MMI S2
Présentation de lancement de la SAE203 - MMI S2Présentation de lancement de la SAE203 - MMI S2
Présentation de lancement de la SAE203 - MMI S2JeanLucHusson
 
Webinaire Cohésion | Le pouvoir du mentorat au travail : pour qui, pourquoi, ...
Webinaire Cohésion | Le pouvoir du mentorat au travail : pour qui, pourquoi, ...Webinaire Cohésion | Le pouvoir du mentorat au travail : pour qui, pourquoi, ...
Webinaire Cohésion | Le pouvoir du mentorat au travail : pour qui, pourquoi, ...Technologia Formation
 
Formation M2i - Femmes entrepreneures : soyez actrices du changement
Formation M2i - Femmes entrepreneures : soyez actrices du changementFormation M2i - Femmes entrepreneures : soyez actrices du changement
Formation M2i - Femmes entrepreneures : soyez actrices du changementM2i Formation
 
Semaine de la Passion de Jésus-Christ.pptx
Semaine de la Passion de Jésus-Christ.pptxSemaine de la Passion de Jésus-Christ.pptx
Semaine de la Passion de Jésus-Christ.pptxMartin M Flynn
 

Recently uploaded (7)

Présentation à Séminaire IA de la Fédération Gay Lussac , 25/03/24 Toulouse
Présentation à Séminaire IA de la Fédération Gay Lussac , 25/03/24 ToulousePrésentation à Séminaire IA de la Fédération Gay Lussac , 25/03/24 Toulouse
Présentation à Séminaire IA de la Fédération Gay Lussac , 25/03/24 Toulouse
 
Rapport projet de fin d'études licence PFE
Rapport projet de fin d'études licence PFERapport projet de fin d'études licence PFE
Rapport projet de fin d'études licence PFE
 
Planning de la semaine du 25 mars au 2 avril 2024
Planning de la semaine du 25 mars au 2 avril 2024Planning de la semaine du 25 mars au 2 avril 2024
Planning de la semaine du 25 mars au 2 avril 2024
 
Présentation de lancement de la SAE203 - MMI S2
Présentation de lancement de la SAE203 - MMI S2Présentation de lancement de la SAE203 - MMI S2
Présentation de lancement de la SAE203 - MMI S2
 
Webinaire Cohésion | Le pouvoir du mentorat au travail : pour qui, pourquoi, ...
Webinaire Cohésion | Le pouvoir du mentorat au travail : pour qui, pourquoi, ...Webinaire Cohésion | Le pouvoir du mentorat au travail : pour qui, pourquoi, ...
Webinaire Cohésion | Le pouvoir du mentorat au travail : pour qui, pourquoi, ...
 
Formation M2i - Femmes entrepreneures : soyez actrices du changement
Formation M2i - Femmes entrepreneures : soyez actrices du changementFormation M2i - Femmes entrepreneures : soyez actrices du changement
Formation M2i - Femmes entrepreneures : soyez actrices du changement
 
Semaine de la Passion de Jésus-Christ.pptx
Semaine de la Passion de Jésus-Christ.pptxSemaine de la Passion de Jésus-Christ.pptx
Semaine de la Passion de Jésus-Christ.pptx
 

Approximate Bayesian Computation (ABC)

  • 1. Approximate Bayesian Computation (ABC) Robin Ryder CREST 3 novembre 2009 1/24
  • 2. Introduction Contexte : inf´rence bay´sienne e e Donn´es D ; On cherche ` estimer un param`tre θ e a e Distribution a posteriori L(θ|D)π(θ) Beaucoup de m´thodes (par ex. MCMC) se fondent sur un e calcul de la vraisemblance L(θ|D) = P(D|θ) Probl`me : Comment faire lorsque ce calcul est trop difficile e ou trop coˆteux ? u 2/24
  • 3. Solution : Approximate Bayesian Computation (ABC) 3/24
  • 4. Plan Pr´sentation de l’algorithme de base e Application : datation de l’ancˆtre des primates e Utilisation de statistiques exhaustives ; facteur de Bayes Application : Repliement de prot´ines e ABC-MCMC 4/24
  • 5. Contexte Vraisemblance L(θ|D) difficile ou impossible ` calculer a Mais facile de simuler un nouveau jeu de donn´es d’apr`s le e e mod`le : D = f (θ) e 5/24
  • 7. Algorithme Approximate Bayesian Computation Donn´es discr`tes D. e e Distribution a priori π(θ). On cherche Θ ∼ π(θ) · P(D|θ) 1 Tirer θ ∼ π 2 Simuler des donn´es D ∼ f (θ) e 3 Si D = D, accepter θ ; sinon, rejeter θ 4 R´p´ter jusqu’` obtenir un ´chantillon de la taille voulue e e a e On obtient un ´chantillon distribu´ selon la densit´ e e e π(θ) · P(D’ = D|θ). Exactement la loi a posteriori. Tr`s lent. e 7/24
  • 8. Algorithme Approximate Bayesian Computation Donn´es discr`tes ou continues D e e Distribution a priori π(θ) . On cherche Θ ∼ π(θ) · P(D|θ) Seuil 1 Tirer θ ∼ π 2 Simuler des donn´es D ∼ f (θ) e 3 Si d(D , D) < , accepter θ ; sinon, rejeter θ 4 R´p´ter jusqu’` obtenir un ´chantillon de la taille voulue e e a e On obtient un ´chantillon distribu´ approximativement selon la loi e e a posteriori. (Pritchard et al., 1999) 8/24
  • 9. 3 Si d(D , D) < , accepter θ ; sinon, rejeter θ Probl`mes : e Si est petit, faible taux d’acceptation Si est grand, mauvaise approximation (quand → ∞, on simule l’a priori) Comment choisir d ? 9/24
  • 10. Datation de l’ancˆtre commun des primates e Plagnol & Tavar´ (2004) et Wilkinson (2008) e ˆ Age de l’ancˆtre commun des primates : Biologie mol´culaire e e 90 MA ; Fossiles 60 MA Processus de branchement (param`tre λ) ; ˆge de la racine : τ e a Sur les Ni esp`ces existant au temps ti (i = 1 . . . 14), on en e observe Di ∼ Bin(Ni , αi ) Param`tres : θ = (τ, λ, α) e Intervale HPD 95% : 68-99 MA 10/24
  • 11. Statistique exhaustive Donn´es discr`tes ou continues D e e Distribution a priori π(θ) . On cherche Θ ∼ π(θ) · P(D|θ) Seuil Statistique S, id´alement exhaustive e 1 Tirer θ ∼ π 2 Simuler des donn´es D ∼ f (θ) e 3 Si d(S(D ), S(D)) < , accepter θ ; sinon, rejeter θ 4 R´p´ter jusqu’` obtenir un ´chantillon de la taille voulue e e a e On obtient un ´chantillon distribu´ approximativement selon la loi e e a posteriori. 11/24
  • 12. Approximations 3 Si d(S(D ), S(D)) < , accepter θ ; sinon, rejeter θ Deux approximations : >0 S statistique non exhaustive 12/24
  • 13. Choix de Quantile ` 1% a Attribuer des poids selon d(D , D) : (θi , ωi ) 13/24
  • 14. Repliement de prot´ines e Structure primaire : KCNTATCATQRLANFLVHSSNNFGAILSSTNVGSNTY Structure tertiaire : (Figure : RCSB) 14/24
  • 15. Choix de mod`le e Choix de mod`le (structure 3D de prot´ines), Grelaud et al. (2009) e e θ = (m, θm ) Facteur de Bayes : BFm0 /m1 (D) = P(M=m0 |D)π(M=m0 ) P(M=m1 |D)π(M=m1 ) 15/24
  • 16. Repliement de prot´ines e 1 Vraisemblance : L(θ|D) = Zθ exp(θ i∼i I{xi =xi } ) 1 L(θm |D) = Zθm ,m exp(θm m i ∼i I{xi =xi } ), m = 0 . . . M − 1, θm ∈ Θm Sm = ∼ i mi I{xi =xi } S = (S0 (·), . . . , SM−1 (·)) est une statistique exhaustive pour (m, θ0 , . . . , θM−1 ) 16/24
  • 17. ABC pour choix de mod`le e 1 Tirer m ∼ πM (·) 2 Tirer θm ∼ πm (·) 3 Simuler D ∼ fm (θm ) 4 Si d(S(D ), S(D)) < , accepter θ ; sinon, rejeter θ 5 R´p´ter e e 17/24
  • 18. Ca marche ? ¸ Gauche : = 0 ; Droite : quantile ` 1% a 18/24
  • 19. R´sultats e 19/24
  • 20. ABC-MCMC 1 Partant de θn , proposer θn+1 = θ →θn 2 Calculer α = min 1, P(D|θ )π[(θ )q(θ→θ ) ) P(D|θ)π(θ)q(θn 3 θn+1 = θ avec probabilit´ α ; sinon, θn+1 = θn e 20/24
  • 21. ABC-MCMC 1 Partant de θn , proposer θn+1 = θ 2 Simuler D = f (θ ) →θ 3 Calculer α = min Id(D ,D)< , π(θ )q(θn →θ n)) π(θ)q(θ 4 θn+1 = θ avec probabilit´ h ; sinon, θn+1 = θn e (Marjoram et al., PNAS, 2003) 21/24
  • 22. Erreur dans le mod`le e Supposons qu’il y ait une erreur dans notre mod`le : D = f (θ) + , e ∼π 1 Tirer θ ∼ π 2 Simuler D ∼ f (θ) 3 Accepter θ avec probability (proportionnelle `) π (d(D , D)) a 4 R´p´ter e e (Wilkinson, 2008) 22/24
  • 23. 1 Partant de (θn , Dn ), proposer θn+1 = θ 2 Simuler D = f (θ ) →θ )π(θ ) 3 Calculer α = min 1, π (d(D n,D))q(θn →θ n)π(θn ) π (d(D ,D)q(θ 4 θn+1 = θ avec probabilit´ α ; sinon, θn+1 = θn e 23/24
  • 24. Questions ? 24/24