Qu’est-ce que le bayésianisme objectif? Federica Russo Université catholique de Louvain
Dans cet exposé: <ul><li>Le calcul de la probabilité </li></ul><ul><ul><li>Axiomes, Conséquences, et Théorème de Bayes </l...
Le calcul de la probabilité <ul><li>Axiomes </li></ul><ul><ul><li>Soit  S  un ensemble d’énoncés et  P  une fonction qui s...
<ul><li>Conséquences: </li></ul><ul><li>a. P (  A) = 1    P (A) </li></ul><ul><li>b. P (A) = P (B) si dans tout mod èle ...
<ul><li>Indépendence unconditionnelle: </li></ul><ul><li>A et B sont unconditionnellement indépendents ssi  </li></ul><ul>...
Interprétations de la probabilité <ul><li>Classique/Logique </li></ul><ul><ul><li>Proba: rapport entre le nombre de cas fa...
Interprétations de la probabilité Une classification alternative <ul><li>Classique/Logique </li></ul><ul><li>Physique </li...
Interprétation classique <ul><li>Laplace, Pascal, Bernoulli (Jakob) </li></ul><ul><li>La proba est le rapport entre </li><...
Interprétation logique <ul><li>Généralisation de </li></ul><ul><li>l’interprétation classique </li></ul><ul><li>Basée sur ...
Interprétation fréquentiste <ul><li>La proba d’un attribut A dans une classe de référence finie B est la fréquence rélativ...
Interprétation propensionnelle <ul><li>La probabilité est dans le monde,  </li></ul><ul><li>non pas dans notre t ête … </l...
Bayésianisme <ul><li>Une position épistémologique sur le raisonnement scientifique </li></ul><ul><ul><li>Le raisonnement s...
Bayésianisme <ul><li>Une interprétation de la probabilité </li></ul><ul><ul><li>Les probas sont des degrés </li></ul></ul>...
Bayésianisme subjectif <ul><li>Probabilités et paris: </li></ul><ul><ul><li>Les probas sont les quotients de pari  </li></...
Problème… <ul><li>Aribitrarieté:  </li></ul><ul><li>Deux sujets avec les m ê mes infos </li></ul><ul><li>Peuvent choisir d...
Bayésianisme empiriquement basé <ul><li>Ajouter la contrainte « empirique »: </li></ul><ul><ul><li>Les degrés de croyance ...
Bayésianisme objectif <ul><li>Ajouter la contrainte empirique  et </li></ul><ul><li>la contrainte logique: </li></ul><ul><...
Contraintes empiriques <ul><li>Principe de vérité </li></ul><ul><ul><li>Si un sujet sait que  u  est vrai, son degré </li>...
Contraintes logiques <ul><li>Une extension du principe d’indifférence  </li></ul><ul><li>Principe d’entropie maximale </li...
Quels avantages? <ul><li>Pas d’arbitrarieté </li></ul><ul><li>Contenu empirique </li></ul><ul><li>Plusieurs source de « ev...
En résumé: <ul><li>Selons les bayésiens les probas doivent </li></ul><ul><li>satisfaires aux axiomes du calcul </li></ul><...
En résumé: <ul><li>Bayésien subjectif </li></ul><ul><ul><li>Je peux choisir toute valeur de proba entre 0 et 1 </li></ul><...
Desiderata: que voulons-nous d’une inteprétation?  <ul><li>Objectivité </li></ul><ul><ul><li>Rendre compte de l’objectivit...
Application: épidémiologie du cancer <ul><li>Problème:  </li></ul><ul><li>l’épidémiologie a un double objectif </li></ul><...
On marchande …   Parcimonie    Variété      Epistémologie   Calculi     Objectivité Bayes Obj Bayes Emp- B...
Vendu! <ul><li>Fréquentisme- cum -Bayésianisme objectif </li></ul><ul><ul><li>Le pluralisme est une option faisable </li><...
Application: modélisation causale  54  4  13  34  12  2 X 1 Economic development X 2 Social development X 3 Sanitary...
Probas bayésiennes objectives <ul><li>Intuitivement:  </li></ul><ul><li>Les résultats d’un modèle causal expriment une cro...
Test d’hypothèse <ul><li>Idée de base: </li></ul><ul><li>comparer l’hypothèse avec les observations </li></ul><ul><li>Élém...
Interprétation des probas <ul><li>D’un point de vue fréquentiste: </li></ul><ul><ul><li>Nous évaluons la proba d’obtenir <...
Example <ul><li>« le paramètre inconnu    se trouve dans l’intervalle </li></ul><ul><li>(  1 ,   2 ) , niveau de confia...
Hypothèse nulle contre hypothèse alternative <ul><li>On test l’hypothèse nulle contre </li></ul><ul><li>l’hypothèse altern...
La réponse du fréquentiste <ul><li>Les 2 hypothèses ne peuvent pas être traitées </li></ul><ul><li>de la même manière: </l...
La contre-réponse du bayésien <ul><li>Il n’y a pas de région de rejet a construire, </li></ul><ul><li>mais de probabilités...
Guide pour l’action <ul><li>Décisions pour les résultats des tests </li></ul><ul><ul><li>Probas bayésiennes objectives per...
Pourquoi des probas bayésienne objectives? <ul><li>Parce que: </li></ul><ul><li>1) elles ont du sens dans le cas unique </...
En résumé <ul><li>J’ai rappelé </li></ul><ul><ul><li>Le formalisme du calcul de la probabilité </li></ul></ul><ul><ul><li>...
Et en suite …? <ul><li>Le pluralisme est-il une position tenable ? </li></ul><ul><li>Dans quels autres contextes peut-on <...
Upcoming SlideShare
Loading in...5
×

Russo Ihps Oct07 Objectivebayesianism

462

Published on

Published in: Travel, Business
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
462
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
2
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • [attention getter] [task] Dans cet exposé mon but est de donner une introduction aux idées principales du bayésianisme objectif et de montrer comment il peut etre appliqué dans des domains spécifiques [main message] En deux mot, le bayésianisme objectif est une interpretation du calcul de la probablité, où les probas sont interpretées comme des degrés de croyance sous deux types de contraintes: logique et empirique. Je montrairai les avantages d’adopter une telle interpretation dans le domain de l’epidemiologie du cancer et de la modelisation causale. [disclaimer] J’espere ne pas abuser du ‘franglais’
  • Plutot qu’attaquer le bayésianisme objectif directement, j’ai choisi de l’introduire à partire du context formel et conceptuel dans lequel il s’inscrit. Donc [browse on topics &amp; dire qq mots sur chacun des points mentionnés] … Pour faire de la philo de la proba, nous avons certainment besoin de rappeler le systeme formel du calcul de la probabilité. Neanmoins, je donnerai plus de place aux aspets fondationnels et d’interpretation … Je voudrais que ce seminaire soit interactif, je ne l’ai pas conçu comme une ‘lesson plublique’, donc sentez-vous libre de m’interrompre à tout moment si je ne suis pas suffisamment claire ou bien si vous desirez plus d’infos sur les thèmes que je vais presenter
  • Il y a plusieurs façon de presenter le calcul de la probabilité et ses interpretations. Mon point de vue est que on devrait partir par le calcul ‘tout nu’ et ensuite montrer comment il peut etre interpreté Ceci est faisable d’autant plus que la theorie de la probabilité est en fait une theorie mathematique , et on peut donc la presenter independament de ses interpretations. Bien que cela soit controversé, car certains auteur disent que déjà dans l’axiomatisation de Kolmo une interpretation particulière est supposée. On peut definir les proba sur une serie de choses differentes: variables, evenements, enonces … Ici, j’ai choisi de definire les probas sur des enonces car le lien entre le langage rend la signification des enoncés probabilistes un plus intuitive. Donc, en ce qui concerne les maths de la probabilité: Nous avons besoin de 3 notions primitives: 1. un ensemble X non vide de possibles resultats (l’espace de probabilité), 2. une famille F de sousensemble de X qui represente les enoncés possibles, 3. une fonction P qui prend des valeures réelles sur F On interprete donc P comme la probabilité d’un enoncé dans F, disons A Kolmo prenait cette fonction P sur des ensemble, plutot qu’enoncés. Tout ce qu’on met comme argument de P(*) ou P(*|*) sont des expressions d’une algebre booleene, qui en gros correspond à la théorie des ensemble. On peut donc donner aussi une version du calcul basé sur la theorie des ensembles, plutot que sur les evenements (qui posent pas mal de problemes philosophiques) Interpretation sur enoncés est legimite parce que les operateurs vérofonctionnels (  ,  ,  ) sur les enoncés obeissents aux memes principes formels des operateurs booleens sur les ensembles. Ça devient donc assez intuitif de definir la proba sur des enoncés: P(A)=1 si A est vrai, P(A)=0 si A est faux, et toute valeure intermediaire exprime notre incertitude sur A A,B mutuellement exclusifs: Eg: un dé ne peut montrer qu’une face à la fois, donc “P(die will come up 1)=1/6”, “P(die will come up 2)=1/6” son ME; de meme, E.g.2: “socrates est chauve et sage” and “socrates n’est ni chauve ni sage” son ME. Montre les diagrammes de Venn
  • a. n’en suit car la proba totale ne peut pas depasser 1. tres clair dans les diagrammes de venn b. A et B font la meme assertion factuelle Proba conditionnelle est une definition . Proba conditionelle revient a dire que si un enoncé A est vrai (on le sait) , ceci peut affecter la proba d’un autre enoncéB. E.g.: pr (sortir numéro paire)=1/2. pr(sortir numéro pair | 2 ou 4 sont sortis)=1. Bayes’ theorem suit des axiomes et de la definition de la probabilité. C’est une lois qui gouverne l’inversion de la probabilité et met en relation Pr B si A avec la Pr A si B, pourvu que Pr A et Pr B sont connues ou si une procedure conventionnelle pour les determiner est acceptée. E.g: P(A) = P(A|B) P(A)+ P(A|-B)P(-B) (th. of total pr). Bayes’ th. donne proba a posteriori à partir de la proba à priori. Give ex if needed.
  • The 3 conditions for unconditional independence are equivalent. The notion of independence. There are cases where the knowledge that A is true is irrelevant to the probability to be assigned to B. E.g.: pr(throwing a even number)=1/2. Pr (A | the president of u.s. sneeze at the same time of the throw) = still ½! [Conditional independence is the famous screening off relation, central in Bayesian nets and in causality. The notion of independence is central for causality. More on this later.] Notice the difference btw independent events and mutually exclusive events. Independence doesn’t imply that ev are mutually exclusive. Give ex.
  • Classifications des interpretations different de façon remarcable. Pas mal de gens ont proposé leur propre interpretation ou classification, mais à un moment donné apparemment on avait attaint un certain accord en isolant 3 groupes d’interpretations Logique. Se base sur le principe d’indifference = sans raison d’assigner des valeurs differents, le evenements ou enoncés doivent etre considerés comme equiprobable Problem: explication circulaire du concept. Subjective de 2 types: Approaches completement subjectives: tout ce qui compte pour la rationalité c garder la cohérence= satisfaire aux axiomes Otre approches subjective requierent d’autres contraintes Objective de 2 types: Frequetiste: P(A|B) est la frequence relative des A parmi les B. Problem: determiner la classe de reference et la valeure limite si la classe de reference est infinie Propensionnelle: pr est une tendence ou propension à reveler une certaine characteristique. Ça permet d’assigner des valeurs des proba dans des instances singulières
  • Mais on peut donner aussi une classification differente. Ici je suis partiellement JW, qui distingue: cl/logique, physique, bayesienne subjective, et bayesienne objective. Partiellement, car j’ai preferé regrouper les interpretations bayesienne ensemble. Vous verrez dans la suite pourquoi j’ai fait ce choix Pourquoi ‘physique’? Parce que la proba est une characteristique du monde, on dirait, là, dehors, plutot que dans nos tetes. On pourrait donc dire aussi que les interpretations classique/logique sont des abstractions (logiques), les interpretations physiques sont independants du sujet, les interpretations bayesiennes sont dependants du sujet.
  • Origines lointaines (laplace, pascal, bernoulli) Definition de la proba Example jeu du dé Pas de evidence, just un examen de l’espace de probabilité Hypothese principale: equipossibilité des evenements. Keynes l’appelera le principe d’indifference S’adapte tres bien aux jeux de hazard Pas tres applicable en science (on verra dans la suite dans l’application en epidemiologie du cancer) ‘ probable’ n’est pas proprement expliqué
  • Generalisation de l’interpretation classique Proposée par keynes, jeffrey, carnap Role fondamental du principe d’indifference On peut determiner a priori la proba par un examen de l’espace de probabilité si on est pas dans une situation avec probabilités inegales, c-à-d si les evenements sont tous equiprobables Mais si ce n’est pas le cas, on peut calculer une proba a posteriori , et donc l’intepretation logique donne une manière de calculer le degré de support ou confirmation d’une hypothèse a partir de l’information disponble. Elle est ‘logique’ car on calcule la proba a posteriori par un lien ‘logique’ entre l’hypothese et l’evidence. La fonction c de carnap exprime exactement cette idee
  • Comme je l’ai dit tantot, selon les interpretations physique, la proba est une expression quantitative d’une characteristique objective du monde, non pas de notre degré de croyance ou connaissance ou certitude en quelques choses. Première version du frequentisme est du à venn. – classes de references finies Ceci a été etendu aux classes de references infinies Probleme du choix de la classe de reference est bien connu. Nous verrons dans la suite pouquoi cet interpretation échoue du moins dans le domain de l’epidemiologie du cancer
  • De nouveau, la proba est dans le monde, non pas dans notre tete … Proba est propension, disposition, tendence à delivrer un certain resultat (cas singulier) ou une frequences Il y a different versions de l’intepretation propensionnelles, Gillies en donne une tres bonne presentation. Long run et single-case interpretation propensionnelle selon gillies popper a soutenu les deux. Sa motivation, en tout cas, etait de rendre compte des probabilité singuliere en mécanique quantique. C-à-d des resultats qui ne se produisent qu’une fois.
  • On commence à entrer dans le vif … on arrive aux positions bayésiennes … Mais qu’est-ce que le bayésianisme avant tout? distinguer: bayésianisme en tant que position epistemologique sur le raisonnement scientifique bayésianisme en tant qu’interpretation de la probabilité Bien evidemment les deux sont reliés 2 idées principales du bayésianisme: Raisonner (en science) c’est raisonner en accord avec les principes de la probabilité Ceci nous permet d’apprendre de l’experience Le calcule de la probabilté donne le cadre formel pour imposer de contraintes sur les probabilités, la regle de conditionnalisation exprime le principe d’apprentissage par l’experience. On met à jour les proba sur la base de l’info qui se rend disponible.
  • Qu’est-ce que la probabilité? Interpretation ‘mind-dependent’, c-à-d, dépendant du sujet. Probas sont de degrés de croyance rationnelle. Ceci est le noyeau sur lequel le bayésiens se trouvent en accord. Proba exprime notre incertitude vis-à-vis une situation. Proba est une characteristique de notre etat epistemique. Ils sont aussi en accord qu’il s’agit d’une croyance ‘rationnelle’, mais ils donnent des conditions differentes pour definir ce qui est rationnel
  • En gros, un bayesien subjectif soutient que pour etre rationnel il suffit de se conformer aux axiomes du calcul. Obeissance au calcul est une condition necessaire et suffisante pour la rationnalité. Très souvent on explique les probabilité par le comportement d’un parieur. (j’irai pas dans les details, je vais me contenter de donner les idées principales). 2 idées de bases: Les probas sont identifiées aux quotients de pari qu’un parieur est disposer à accepter On defini un pari hollandais une serie de paris tels que les paris sont singulierement acceptables par le parieur mais collectivement portent à une perte certaine quoi qu’il arrive On defini donc un parieur rationnel si on ne peut pas faire de pari hollandais contre lui Deux theoremes pour la statique de l’opinion: Si les degrés de croyance du parieur ne respettent pas les axiomes, le parieu est susceptible du pari hollandais Si les degrés de croyance du parieur respettent les axiomes, le parieur n’est susceptible du pari hollandais Un theoreme pour la dynamique de l’opinion: La conditionnalisation est la seule regle coherente pour mettre à jour les probabilités Donc, obeissance au calcul est condition necessaire et suffisante pour la rationnalité
  • Probleme de l’arbitrarieté surtout dans des contextes scientifiques ou de decision. Seule contrainte: obeir aux aziomes. Solution: metttre d’autres contraintes sur les probas Differentes type de contraintes donne lieu à deux autres sortes de bayésianismes – empiriquement basé et objecif
  • Proposé par example par salmon. Connaissance des fréquences constraind les degrés de croyance. Comment? Example: Si un sujet sait que le 60% des gens avec un type de cancer guerissent et qu’un patient particulier a ce type de cancer, si ce sujet est un bayesien empiriquement basé, il devrait avoir un degré de croyance de .6 que ce patient va guerir
  • Le bayésianisme objectif va au de là du bayésianisme empiriquement basé car il ajoute une contrainte logique. Idée derriere contrainte logique est que l’absance d’info correspond au ‘je ne sais pas’, qui se traduit par une probabilité de .5
  • En peu plus en details ces contraintes empiriques. (je suis JW 2005) Principe de verité Une contrainte empirique parce que on entend par verité la verité empirique, non pas logique. Par example savoir avec certitude qu’un evenement s’est produit ou que le contenu empirique d’un enoncé est vrai Principe de calibration Jon: chance n’est ni une frequence ni une propension, mais l’objet d’une croyance. J’avoue que ce point m’echappe. Il y a aussi d’autres versions du principe de calibration, eg van frassent, qui reviennent à etablir une conformité des degrés de croyance aux frequences connues. Connaissance des frequences C’est exactement le meme principe utilisé par le bayésianisme empiriquement basé
  • Principe d ’indifference ou de raison insuffisante: dans un espace de probabilité donné, il faut donner la meme valeur de probabilité aux evenements, au moins qu’il y ait une raison pour faire autrement Probleme, déjà noté par Jaynes: ceci est un bon critère dans des situations ‘symmetrique’, eg jeux de hazard, mais dans d’autres situations, où en effet il est aussi aribitraire que d’autre critère. Avantage du principe d’entropie maximale: il permet de tenir compte de toute information d’arrière plan et il est le plus évasif possible pour toute infos manquante. Idée derrière: la fonction de proba doit exprimer toute notre connaissance d’arrière plan et seulement cette connaissance, donc elle doit satisfaire à toute contrainte empirique et etre le plus evasive possible à l’egard de toute autre information. L’entropie est une mesure standard de l’incertitude d’une fonction de probabilité. Ceci, avec la justification que je viens de donner, justifie le choix du principe d’entropie
  • En resume, il y a 3 avantages dans l’approche bayesienne objective qui le rendent preferable aux autre approches bayesienne. Evidemment ceci ne repond pas à la question du porqoui on devrait preferer une approche bayesienne plutot que d’autres approches (classique/logique, physique), mais ceci, je pense, est un probleme contextuel, dont serait interessant discuter
  • Je vais maintenant presenter un example assez simple pour illustrer les differences entre les 3 types de bayesiens. (example repris d’un article de JW)
  • [lire et commenter]
  • Ce qu’il y a d’interessant ce n’est pas juste de donner un cadre formel ou philosophique, mais c’est d’appliquer une interpretation. Alors il faut mettre au clair ce que nous nous attendons d’une interpretation, car ce sera sur cette base que nous allons evaluer la pertinance de l’une ou l’autre interpretation dans un context donné. Objectivité Notion of prob qui est objective dans un sens logique: on doit se decider sur ce que c’est la proba. [objectivité sur la notion meme] Si 2 agents sont en desaccord, au moins un des 2 a tort [objectivité dans le sens de non arbitriarieté des assignations des valeurs de proba] Calculi Une theorie phil de la proba devrait donner lieu a une notion qui satisfait aux axiomes de prob, sinon c’est un theorie de qq chose d’autre Epistemologie On connait les proba par des bias differents: mesure des freq des la pop, appelle a des arguments de symmetrie ou theorie sc, on derive prob d’autres probas par le calcul … theorie phil de la proba devrait dire comment et quand nous pouvons utiliser ces techiniques Varieté On a enoncés singuliers et generiques Proba concerne entités differentes (events, ensembles, variables, enoncés, hypotheses) Phil theory of prob should be able to cope with all of them Parsimonie theorie phil de la proba ne devrait pas postuler entités (ontologie) au moins d’etre justifie. Il vaut mieux reduire la proba à qq chose qui existe déjà dans notre ontologie plutot que prendre une notion de proba primitive
  • Premiere application en epidemiologie du cancer. Papier preparer avec JW dans le cadre du projet de recherche CAPITS Epidemiologie s’interesse à la distribution des maladies et d’en trouver les cause qui determinent ces distributions Epidemiologie du cancer cherche à etablir l’etiologie du cancer Quels cancer sont causés par un certain factor, eg tobacco consumption Quels facteurs biologiques sont cancérigènes Quels substances chimiques sont cancérigènes Quels facteurd génétique previennent ou predisposent au cancer Quelles parties de la populations sont les plus exposées à un certain facteur 1° objectif: etablir enoncés causaux generiques (example) 2° objective: les enoncés generiques doivent etre utiles pour les appliquer dans le cas singulier (example) Les deux types d’enoncés sont probabilistes Voilà surgir le probleme de l’interpretation
  • Objectivity: X Class/Log  different sujets peuvent choisir des parttions differents comme equipossible X Subj  2 agents en desaccord, aucun peut etre consideré ayant tort X Emp-based  (moins) si freq sont connues, les assignations ne sont pas arbitraire V Freq  odeterminé objectivement par la classe de reference V Prop  determiné objectivement par l’histoire de l’univers jusqu’à l’instant present V Obj Bayes  p determiné objectivement par la connaissance Calculi X des theories prennent pas nombres reels ou prennent des pairs (intervals) X von mises freq theory ne satisfait pas additivité countable Epistemology X class/log/subj  ne rendent pas conte de l’usage repandu des freq X freq  peut pas expliquer comment degre de croyance donne acces au proba X prop  metaphysical: probleme a identifier lien avec freq V emp-based/obj-bayes  permettent que toute forme de connaissance d’arriere plan contribue a former degres de croyance Variety X freq/prop  peut pas assigner prob à hypothesis or to single-cases Parsimony X prop  prob sont primitive V degres de croyance, sequences des resultats (on y attache une freq) don’t déjà dans notre ontologie
  • Variety c’est le probleme le plus dur: qq interpretations n’a pas de sens dans le cas singulier et autres ne permettent pas d’interpreter proba generiques Seule option faisable semble le pluralisme Emp-base and obj bayes options les plus attractives: permettent utiliser freq dans le cas generique, puis ce freq utilisés comme contrainte pour le cas singulier Toutefois, choix ouvert entre emp-based subjectivism and obj-bayesianism. Obj-Bayes a une vertu pragmatique: en moyenne est plus prudent dans des decisions risquees [GIVE EXAMPLE]
  • Deuxieme application en modelisation causale. qu’est-ce qu’un modele causal [j’essaye de ne pas presupposé aucune connaissance] Graph, equations, relation entre les deux, interpretation des equations, But cognitif et orienté action
  • Remarque, statistique classique est frequentiste, sans vraiment l’admettre ou s’en rendre compte, ou s’en soucier, ou se poser la question En fait, je vais donner 3 raisons pour lesquelles il vaudrait mieux interpreter les enoncés probabilistes selon le bayésianisme objectif. qu’est-ce que les resultats d’un modele causal expriment finalment? Une croyance “evidence-based”, ce qui nous amenerait tout de suite soit au bayesianism empiriquement basé soit au bayésianisme objectif Mais il y les deux raisons qui indiquent de preferer la version objective
  • Rappeller idees de base du test d’hypothese, sans entrer dans le details techniques. Rentre pas non plus dans le choix de la statistique de test. Mettre tout de meme en evidence: Comparer deux hypotheses, On accepte pas l’hypothese alternative, mais on rejete la nulle Pas mal de probleme d’interpretation, eg, signification de ‘significance level’, interpretation de la p-value Ici, on se concentre sur l’interpretation de la probabilité dans le test d’hypothese
  • Pour rappel, le frequentiste ne peut pas donner une valuer de proba aux cas singuliers, donc dans le cadre frequentiste ça n’a pas de sens de parler de la probabilité d’une hypothese. En general, le frequentiste test la probabilité d’obtenir l’echantillon donné si l’hypothese est vraie Par contre, ça a du sens au sein d’une approche bayesien
  • [presenter et discuter l’example]
  • On rentre dans le vif … Strategie du frequentiste differe de celle du bayesien objectif, en premier lieu parce que le frequentiste ne peut pas comparerer, strictement parlant, les probas des hypotheses. Comme je l’ai dit tantot, de fait on accepte/rejete l’hyothese nulle, mais on ne dit rien explicitement sur l’hypothese alternative. Traitement inegale des 2 hypotheses. Le bayesien les traiterait de manière egale, au moins que evidence n’indique le contraire
  • Les 2 types d’erreur et leur gravité. Ceci explique, du point de vue du frequentiste, pour quoi devoir minimiser la probabilité d’erreur II Ça vaut la peine de noter aussi une autre asymmetrie. Erreur de type I a une probabilité alfa (qui en fait est la p-valeur), et l’erreur de type II a une probabilité beta, MAIS, le deux probabilité ne sont pas additives, on calcule beta à l’aide aussi de alfa mais ce ne pas 1-alfa! Ceci est une autre raison pour laquelle les 2 hypotheses ne sont pas traités de façon egale. La probabilité de se tromper sur h nulle n’est pas complementaire à avoir raison sur h alternative Ce qui amene à construire une region de rejet pour h nulle
  • Le bayesien objectif va calculer la probabilité a posteriori des hypotheses, en tenant compte de toute information dont il dispose. Son choix sera fait sur la base de la comparaison de ces deux probabilités.
  • Troisième raison pour laquelle il vaut mieux etre des bayésien objectifs. Je mentionnais le but orienté action de la modélisation causale. Donc, les probas qui sortent de ces modeles devraient nous indiquer les choix à faire. Distinction entre 2 types de décisions (mis à part les decisions sur les hypotheses) [discuter un peu sur le fait d’etre explicite sur l’interpretation causale, sur la necessité de l’etre, et donc d’avoir des outils qui nous permettent de faire de bons choix. Bon choix, c-à-d bien informé par la connaissance d’arriere plan, par le evidence, etc]
  • 2 raisons principales pour lesquelles il vaut mieux utiliser des probas bayesiennes
  • [rappeler le parcours de l’expose]
  • Russo Ihps Oct07 Objectivebayesianism

    1. 1. Qu’est-ce que le bayésianisme objectif? Federica Russo Université catholique de Louvain
    2. 2. Dans cet exposé: <ul><li>Le calcul de la probabilité </li></ul><ul><ul><li>Axiomes, Conséquences, et Théorème de Bayes </li></ul></ul><ul><li>Interprétations du calcul </li></ul><ul><ul><li>Classique/Logique </li></ul></ul><ul><ul><li>Fréquentiste/Propensionnelle </li></ul></ul><ul><ul><li>Bayésienne </li></ul></ul><ul><li>Le bayésianisme </li></ul><ul><ul><li>Comme position épistémologique </li></ul></ul><ul><ul><li>Comme interprétation de la probabilité </li></ul></ul><ul><li>Bayésianisme s </li></ul><ul><ul><li>Subjectif </li></ul></ul><ul><ul><li>Empiriquement basé </li></ul></ul><ul><ul><li>Objectif </li></ul></ul><ul><li>Applications </li></ul><ul><ul><li>En epidemiologie du cancer </li></ul></ul><ul><ul><li>En modélisation causale </li></ul></ul>
    3. 3. Le calcul de la probabilité <ul><li>Axiomes </li></ul><ul><ul><li>Soit S un ensemble d’énoncés et P une fonction qui satisfait aux axiomes de Kolmogorov: </li></ul></ul><ul><ul><ul><li>1. P(A)  0 </li></ul></ul></ul><ul><ul><ul><li>P(A) =1 </li></ul></ul></ul><ul><ul><ul><li>si A est vrai dans tout modèle </li></ul></ul></ul><ul><ul><ul><li>3. P(A  B)= P(A) + P(B) </li></ul></ul></ul><ul><ul><ul><li>si A, B sont mutuellement exclusifs </li></ul></ul></ul>
    4. 4. <ul><li>Conséquences: </li></ul><ul><li>a. P (  A) = 1  P (A) </li></ul><ul><li>b. P (A) = P (B) si dans tout mod èle A  B </li></ul><ul><li>c. P (A  B) = P (A) + P (B)  P (A  B) </li></ul><ul><li>Probabilité Conditionnelle: </li></ul><ul><li>P (A | B) = P (A  B) / P (B) if P (B)  0 </li></ul><ul><li>Théorème de Bayes: </li></ul><ul><li>P (B | A) = P (A | B) P (B) / P (A) </li></ul>
    5. 5. <ul><li>Indépendence unconditionnelle: </li></ul><ul><li>A et B sont unconditionnellement indépendents ssi </li></ul><ul><li>P (A | B) = P (A) ou </li></ul><ul><li>P (A | B) = P (B) ou </li></ul><ul><li>P (A | B) = P (A) P (B) </li></ul><ul><li>Indépendence conditionnelle: </li></ul><ul><li>A est conditionnellement independent de B si C ssi </li></ul><ul><li>P (A | B  C) = P (A | C) </li></ul>
    6. 6. Interprétations de la probabilité <ul><li>Classique/Logique </li></ul><ul><ul><li>Proba: rapport entre le nombre de cas favorables </li></ul></ul><ul><ul><li>et le nombre de cas possibles </li></ul></ul><ul><li>Subjective </li></ul><ul><ul><li>Proba: expression quantitative du degrée </li></ul></ul><ul><ul><li>de croyance, support ou confirmation </li></ul></ul><ul><li>Objective </li></ul><ul><ul><li>Proba: expression quantitative d’une </li></ul></ul><ul><ul><li>charactéristique objective du monde </li></ul></ul>
    7. 7. Interprétations de la probabilité Une classification alternative <ul><li>Classique/Logique </li></ul><ul><li>Physique </li></ul><ul><ul><li>Fréquentiste </li></ul></ul><ul><ul><li>Propensionnelle </li></ul></ul><ul><li>Bayésienne </li></ul><ul><ul><li>Subjective </li></ul></ul><ul><ul><li>Empiriquement basée </li></ul></ul><ul><ul><li>Objective </li></ul></ul>
    8. 8. Interprétation classique <ul><li>Laplace, Pascal, Bernoulli (Jakob) </li></ul><ul><li>La proba est le rapport entre </li></ul><ul><li>le nombre de cas favorables et </li></ul><ul><li>le nombre de cas possibles. </li></ul><ul><li>Pensez au jeu de dés </li></ul><ul><li>Proba assignée en absence de « evidence » </li></ul><ul><li>Equipossibilité, ou le Principe d’indifférence </li></ul><ul><li>de Keynes </li></ul>
    9. 9. Interprétation logique <ul><li>Généralisation de </li></ul><ul><li>l’interprétation classique </li></ul><ul><li>Basée sur le principe d’indifférence </li></ul><ul><li>Donne un « account » le plus général </li></ul><ul><li>possible du degré de support </li></ul><ul><li>ou de confirmation </li></ul><ul><li>Pensez à la fonction c de Carnap </li></ul>
    10. 10. Interprétation fréquentiste <ul><li>La proba d’un attribut A dans une classe de référence finie B est la fréquence rélative de la recurrence de A en B (Venn) </li></ul><ul><li>Extension aux classes de références infinies par la limite de la fréquence (von Mises, Reichenbach) </li></ul>
    11. 11. Interprétation propensionnelle <ul><li>La probabilité est dans le monde, </li></ul><ul><li>non pas dans notre t ête … </li></ul><ul><li>La proba est une propension, disposition </li></ul><ul><li>ou tendence d’une situation physique </li></ul><ul><li>de délivrer un certain résultat ou </li></ul><ul><li>une fréquence </li></ul><ul><li>Popper voulez rendre compte </li></ul><ul><li>des probabilités en mécanique quantique </li></ul>
    12. 12. Bayésianisme <ul><li>Une position épistémologique sur le raisonnement scientifique </li></ul><ul><ul><li>Le raisonnement scientifique se fait en accord </li></ul></ul><ul><ul><li>avec le calcul de la probabilité </li></ul></ul><ul><ul><li>Cette position permet d’apprendre </li></ul></ul><ul><ul><li>de l’expérience (par conditionnalisation) </li></ul></ul><ul><ul><li>Le système formel impose des contraintes </li></ul></ul><ul><ul><li>sur les probabilités </li></ul></ul>
    13. 13. Bayésianisme <ul><li>Une interprétation de la probabilité </li></ul><ul><ul><li>Les probas sont des degrés </li></ul></ul><ul><ul><li>de croyance rationnelle </li></ul></ul><ul><ul><li>Differents bayesianimes sont </li></ul></ul><ul><ul><li>en désaccord sur comment former </li></ul></ul><ul><ul><li>ces degrés de croyance </li></ul></ul>
    14. 14. Bayésianisme subjectif <ul><li>Probabilités et paris: </li></ul><ul><ul><li>Les probas sont les quotients de pari </li></ul></ul><ul><ul><li>Un pari hollandais est une serie de paris: </li></ul></ul><ul><ul><li>(i) singulièrement acceptables par le parieur </li></ul></ul><ul><ul><li>(ii) collectivement portent à une perte, quoi qu’il arrive </li></ul></ul><ul><li>Statique de l’opinion: </li></ul><ul><ul><li>Si les degrés de croyance du parieur ne respettent pas les axiomes, le parieur est susceptible du pari hollandais </li></ul></ul><ul><ul><li>Si les degrés de croyance du parieur respettent les axiomes, le parieur n’est pas susceptible du pari hollandais </li></ul></ul><ul><li>Cinématique de l’opinion: </li></ul><ul><ul><li>La conditionnalisation est la seule règle cohérente pour mettre à jour les probas </li></ul></ul><ul><li>Obéissance au calcul est condition nécessaire et suffisante </li></ul><ul><li>pour la rationnalité </li></ul>
    15. 15. Problème… <ul><li>Aribitrarieté: </li></ul><ul><li>Deux sujets avec les m ê mes infos </li></ul><ul><li>Peuvent choisir des probas différentes, </li></ul><ul><li>tout en étant rationnels </li></ul>Solution… Le bayésianisme empiriquement basé et objectif imposent d’autres contraintes sur les probas
    16. 16. Bayésianisme empiriquement basé <ul><li>Ajouter la contrainte « empirique »: </li></ul><ul><ul><li>Les degrés de croyance se forment </li></ul></ul><ul><ul><li>à partir des fréquences connues </li></ul></ul>
    17. 17. Bayésianisme objectif <ul><li>Ajouter la contrainte empirique et </li></ul><ul><li>la contrainte logique: </li></ul><ul><ul><li>En présence d’infos empiriques, e.g. fréquences, </li></ul></ul><ul><ul><li>celles-ci doivent ê tre incorporées </li></ul></ul><ul><ul><li>En absence de toute infos, il faut être </li></ul></ul><ul><ul><li>le plus ambigu possible, c-à-d, </li></ul></ul><ul><ul><li>les probas tendent vers la valeure moyenne </li></ul></ul>
    18. 18. Contraintes empiriques <ul><li>Principe de vérité </li></ul><ul><ul><li>Si un sujet sait que u est vrai, son degré </li></ul></ul><ul><ul><li>de croyance en u , P( u ) = 1 </li></ul></ul><ul><li>Principe de calibration </li></ul><ul><ul><li>Si un sujet connaît que la « chance » de u est P*( u ), </li></ul></ul><ul><ul><li>son degré de croyance en u devrait être P( u )=P*( u ) </li></ul></ul><ul><li>Connaissance des fréquences </li></ul><ul><ul><li>Si un sujet sait que la fréquence relative </li></ul></ul><ul><ul><li>d’un événement est r , son degré de croyance </li></ul></ul><ul><ul><li>que le prochain cas se produira est r </li></ul></ul>
    19. 19. Contraintes logiques <ul><li>Une extension du principe d’indifférence </li></ul><ul><li>Principe d’entropie maximale </li></ul><ul><ul><li>Un sujet doit adopter, parmi toutes les fonctions </li></ul></ul><ul><ul><li>de probabilité qui satisfont aux contraintes </li></ul></ul><ul><ul><li>imposées par sa connaissance d’arrière plan, </li></ul></ul><ul><ul><li>une fonction P qui maximise l’entropie </li></ul></ul>
    20. 20. Quels avantages? <ul><li>Pas d’arbitrarieté </li></ul><ul><li>Contenu empirique </li></ul><ul><li>Plusieurs source de « evidence » </li></ul>
    21. 21. En résumé: <ul><li>Selons les bayésiens les probas doivent </li></ul><ul><li>satisfaires aux axiomes du calcul </li></ul><ul><li>Example: </li></ul><ul><ul><li>A= demain il va plevoir à Paris </li></ul></ul><ul><ul><li>P(A) est un degré de croyance en A </li></ul></ul><ul><ul><li>Alors, P(A)+P(  A)=1 </li></ul></ul><ul><ul><li>Je connai s seulement la probabilité physique </li></ul></ul><ul><ul><li>(fréquence ou propension) de A, </li></ul></ul><ul><ul><li>disons que cette proba est entre .2 et .3 </li></ul></ul>
    22. 22. En résumé: <ul><li>Bayésien subjectif </li></ul><ul><ul><li>Je peux choisir toute valeur de proba entre 0 et 1 </li></ul></ul><ul><li>Bayésien empiriquement basé </li></ul><ul><ul><li>Mon degré de croyance doit ê tre basé </li></ul></ul><ul><ul><li>sur ma connaissance empirique, </li></ul></ul><ul><ul><li>donc je dois choisir entre .2 et .3, </li></ul></ul><ul><ul><li>toute valeur sera acceptée </li></ul></ul><ul><li>Bayésien objectif </li></ul><ul><ul><li>Mon degré de croyance doit être basé </li></ul></ul><ul><ul><li>sur la connaissance empirique et </li></ul></ul><ul><ul><li>doit être les plus ambigu possible. </li></ul></ul><ul><ul><li>.3 est la valeure qui approche le plus .5 </li></ul></ul>
    23. 23. Desiderata: que voulons-nous d’une inteprétation? <ul><li>Objectivité </li></ul><ul><ul><li>Rendre compte de l’objectivité de la proba </li></ul></ul><ul><li>Calculi </li></ul><ul><ul><li>Expliquer comment raisonner sur la proba </li></ul></ul><ul><li>Épistémologie </li></ul><ul><ul><li>Expliquer comment connaître la proba </li></ul></ul><ul><li>Variété </li></ul><ul><ul><li>Faire face à la grande varieté d’énoncés probabilistes </li></ul></ul><ul><li>Parcimonie </li></ul><ul><ul><li>Être ontologiquement parcimonieux </li></ul></ul>
    24. 24. Application: épidémiologie du cancer <ul><li>Problème: </li></ul><ul><li>l’épidémiologie a un double objectif </li></ul><ul><ul><li>Établir un énoncé générique </li></ul></ul><ul><ul><ul><li>Les non-fumeurs ont un risque majeur (25%) de développer le cancer du poumon si leurs épouses sont des fumeurs </li></ul></ul></ul><ul><ul><li>Établir un énoncé singulier </li></ul></ul><ul><ul><ul><li>Michelle a un cancer du sein métastatique et elle survivra plus de 5 ans avec un probabilité de 0.4 </li></ul></ul></ul><ul><li>Ces deux énoncés sont probabilistes </li></ul>
    25. 25. On marchande …   Parcimonie    Variété      Epistémologie   Calculi     Objectivité Bayes Obj Bayes Emp- Basé Bayes Subj Freq Prop Class/ Log
    26. 26. Vendu! <ul><li>Fréquentisme- cum -Bayésianisme objectif </li></ul><ul><ul><li>Le pluralisme est une option faisable </li></ul></ul><ul><ul><ul><li>Énoncés génériques requièrent </li></ul></ul></ul><ul><ul><ul><li>une interprétation fréquentiste </li></ul></ul></ul><ul><ul><ul><li>Énoncés singuliers requièrent </li></ul></ul></ul><ul><ul><ul><li>une interprétation bayesienne objective </li></ul></ul></ul><ul><ul><li>Le bayésianisme objectif a des vertus </li></ul></ul><ul><ul><li>pragmatiques </li></ul></ul>
    27. 27. Application: modélisation causale  54  4  13  34  12  2 X 1 Economic development X 2 Social development X 3 Sanitary infrastructures X 4 Use of sanitary infrastructures X 5 Age structure Y Mortality
    28. 28. Probas bayésiennes objectives <ul><li>Intuitivement: </li></ul><ul><li>Les résultats d’un modèle causal expriment une croyance (rationnelle) « evidence-based » sur des relations causales </li></ul><ul><li>Bayésianisme, basé empiriquement ou bayésianisme objectif </li></ul>
    29. 29. Test d’hypothèse <ul><li>Idée de base: </li></ul><ul><li>comparer l’hypothèse avec les observations </li></ul><ul><li>Éléments du test: </li></ul><ul><ul><li>Hypothèse nulle: la variation observée est aléatoire </li></ul></ul><ul><ul><li>Hypothèse alternative: la variation observée est réelle </li></ul></ul><ul><ul><li>Statistique de test </li></ul></ul><ul><li>L’hypothèse nulle est acceptée ou rejetée </li></ul><ul><li>selon la valeur-p chosie </li></ul>
    30. 30. Interprétation des probas <ul><li>D’un point de vue fréquentiste: </li></ul><ul><ul><li>Nous évaluons la proba d’obtenir </li></ul></ul><ul><ul><li>l’échantillon si l’hypothèse est vraie </li></ul></ul><ul><ul><li>« la probabilité de l’hypothèse » n’a pas de sens </li></ul></ul><ul><ul><li>car c’est un événement unique </li></ul></ul><ul><li>D’un point de vue bayésien: </li></ul><ul><ul><li>Nous pouvons évaluer la probabilité </li></ul></ul><ul><ul><li>d’une hypothèse </li></ul></ul>
    31. 31. Example <ul><li>« le paramètre inconnu  se trouve dans l’intervalle </li></ul><ul><li>(  1 ,  2 ) , niveau de confiance 95%» </li></ul><ul><li>Ce n’est pas la proba du paramètre! </li></ul><ul><li>Si on tire nombreux échantillons de la même taille et </li></ul><ul><li>on construit les mêmes intervalles autour de  , </li></ul><ul><li>on peut s’attendre que 95% des intervalles contiennent  </li></ul><ul><li>Le fréquentiste ne peut pas évaluer la proba </li></ul><ul><li>de l’hypothèse elle-même </li></ul>
    32. 32. Hypothèse nulle contre hypothèse alternative <ul><li>On test l’hypothèse nulle contre </li></ul><ul><li>l’hypothèse alternative </li></ul><ul><li>Acceptation ou rejet concernent directement </li></ul><ul><li>l’hypothèse nulle et in directement </li></ul><ul><li>l’hypothèse alternative </li></ul><ul><li>Sous l’interprétation bayésienne objective </li></ul><ul><li>les 2 hypothèses sont tout aussi probable, </li></ul><ul><li>au moins que « evidence » n’indique le contraire </li></ul>
    33. 33. La réponse du fréquentiste <ul><li>Les 2 hypothèses ne peuvent pas être traitées </li></ul><ul><li>de la même manière: </li></ul><ul><ul><li>Il est plus grave d’accepter l’hypothèse alternative </li></ul></ul><ul><ul><li>quand elle est fausse </li></ul></ul><ul><ul><li>que de rejeter l’hypothèse nulle quand elle est vraie </li></ul></ul><ul><li>Le fréquentiste doit limiter sa région de rejet </li></ul><ul><li>pour restreindre la probabilité </li></ul><ul><li>d’une erreur de type II </li></ul>
    34. 34. La contre-réponse du bayésien <ul><li>Il n’y a pas de région de rejet a construire, </li></ul><ul><li>mais de probabilités a posteriori à calculer </li></ul><ul><li>Le choix entre l’hypothèse nulle et </li></ul><ul><li>l’alternative est faite sur la base des a posteriori </li></ul>
    35. 35. Guide pour l’action <ul><li>Décisions pour les résultats des tests </li></ul><ul><ul><li>Probas bayésiennes objectives permettent </li></ul></ul><ul><ul><li>de décider entre les a posteriori des hypothèses </li></ul></ul><ul><li>Décisions en matière de politique publique </li></ul><ul><li>(sciences sociales) </li></ul><ul><li>Décisions en matière d’individus </li></ul><ul><li>(sciences médicale) </li></ul>
    36. 36. Pourquoi des probas bayésienne objectives? <ul><li>Parce que: </li></ul><ul><li>1) elles ont du sens dans le cas unique </li></ul><ul><li>2) elles ne laissent pas de place </li></ul><ul><li>à l’arbitrarieté </li></ul>
    37. 37. En résumé <ul><li>J’ai rappelé </li></ul><ul><ul><li>Le formalisme du calcul de la probabilité </li></ul></ul><ul><ul><li>Les majeures interprétations </li></ul></ul><ul><li>J’ai présenté le bayésianisme </li></ul><ul><ul><li>En tant que position épistémologique </li></ul></ul><ul><ul><li>En tant qu’interprétation de la probabilité </li></ul></ul><ul><li>J’ai distingué </li></ul><ul><ul><li>Le bayésianisme subjectif </li></ul></ul><ul><ul><li>Le bayésianisme empiriquement basé </li></ul></ul><ul><ul><li>Le bayésianisme objectif </li></ul></ul><ul><li>J’ai appliqué le bayésianisme objectif </li></ul><ul><ul><li>En épidémiologie du cancer </li></ul></ul><ul><ul><li>En modélisation causale </li></ul></ul>
    38. 38. Et en suite …? <ul><li>Le pluralisme est-il une position tenable ? </li></ul><ul><li>Dans quels autres contextes peut-on </li></ul><ul><li>appliquer le bayésianisme objectif? </li></ul><ul><li>… </li></ul>

    ×