La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Qu’est-ce que le bayésianisme objectif?

Présentations similaires


Présentation au sujet: "Qu’est-ce que le bayésianisme objectif?"— Transcription de la présentation:

1 Qu’est-ce que le bayésianisme objectif?
Federica Russo Université catholique de Louvain [attention getter] [task] Dans cet exposé mon but est de donner une introduction aux idées principales du bayésianisme objectif et de montrer comment il peut etre appliqué dans des domains spécifiques [main message] En deux mot, le bayésianisme objectif est une interpretation du calcul de la probablité, où les probas sont interpretées comme des degrés de croyance sous deux types de contraintes: logique et empirique. Je montrairai les avantages d’adopter une telle interpretation dans le domain de l’epidemiologie du cancer et de la modelisation causale. [disclaimer] J’espere ne pas abuser du ‘franglais’

2 Dans cet exposé: Le calcul de la probabilité Interprétations du calcul
Axiomes, Conséquences, et Théorème de Bayes Interprétations du calcul Classique/Logique Fréquentiste/Propensionnelle Bayésienne Le bayésianisme Comme position épistémologique Comme interprétation de la probabilité Bayésianismes Subjectif Empiriquement basé Objectif Applications En epidemiologie du cancer En modélisation causale Plutot qu’attaquer le bayésianisme objectif directement, j’ai choisi de l’introduire à partire du context formel et conceptuel dans lequel il s’inscrit. Donc [browse on topics & dire qq mots sur chacun des points mentionnés] … Pour faire de la philo de la proba, nous avons certainment besoin de rappeler le systeme formel du calcul de la probabilité. Neanmoins, je donnerai plus de place aux aspets fondationnels et d’interpretation Je voudrais que ce seminaire soit interactif, je ne l’ai pas conçu comme une ‘lesson plublique’, donc sentez-vous libre de m’interrompre à tout moment si je ne suis pas suffisamment claire ou bien si vous desirez plus d’infos sur les thèmes que je vais presenter

3 Le calcul de la probabilité
Axiomes Soit S un ensemble d’énoncés et P une fonction qui satisfait aux axiomes de Kolmogorov: 1. P(A)0 P(A) =1 si A est vrai dans tout modèle 3. P(AB)= P(A) + P(B) si A, B sont mutuellement exclusifs Il y a plusieurs façon de presenter le calcul de la probabilité et ses interpretations. Mon point de vue est que on devrait partir par le calcul ‘tout nu’ et ensuite montrer comment il peut etre interpreté Ceci est faisable d’autant plus que la theorie de la probabilité est en fait une theorie mathematique, et on peut donc la presenter independament de ses interpretations. Bien que cela soit controversé, car certains auteur disent que déjà dans l’axiomatisation de Kolmo une interpretation particulière est supposée. On peut definir les proba sur une serie de choses differentes: variables, evenements, enonces … Ici, j’ai choisi de definire les probas sur des enonces car le lien entre le langage rend la signification des enoncés probabilistes un plus intuitive. Donc, en ce qui concerne les maths de la probabilité: Nous avons besoin de 3 notions primitives: 1. un ensemble X non vide de possibles resultats (l’espace de probabilité), 2. une famille F de sousensemble de X qui represente les enoncés possibles, 3. une fonction P qui prend des valeures réelles sur F On interprete donc P comme la probabilité d’un enoncé dans F, disons A Kolmo prenait cette fonction P sur des ensemble, plutot qu’enoncés. Tout ce qu’on met comme argument de P(*) ou P(*|*) sont des expressions d’une algebre booleene, qui en gros correspond à la théorie des ensemble. On peut donc donner aussi une version du calcul basé sur la theorie des ensembles, plutot que sur les evenements (qui posent pas mal de problemes philosophiques) Interpretation sur enoncés est legimite parce que les operateurs vérofonctionnels (, , ) sur les enoncés obeissents aux memes principes formels des operateurs booleens sur les ensembles. Ça devient donc assez intuitif de definir la proba sur des enoncés: P(A)=1 si A est vrai, P(A)=0 si A est faux, et toute valeure intermediaire exprime notre incertitude sur A A,B mutuellement exclusifs: Eg: un dé ne peut montrer qu’une face à la fois, donc “P(die will come up 1)=1/6”, “P(die will come up 2)=1/6” son ME; de meme, E.g.2: “socrates est chauve et sage” and “socrates n’est ni chauve ni sage” son ME. Montre les diagrammes de Venn

4 b. P (A) = P (B) si dans tout modèle A  B
Conséquences: a. P (A) = 1  P (A) b. P (A) = P (B) si dans tout modèle A  B c. P (A  B) = P (A) + P (B)  P (A  B) Probabilité Conditionnelle: P (A | B) = P (A  B) / P (B) if P (B)  0 Théorème de Bayes: P (B | A) = P (A | B) P (B) / P (A) a. n’en suit car la proba totale ne peut pas depasser 1. tres clair dans les diagrammes de venn b. A et B font la meme assertion factuelle Proba conditionnelle est une definition. Proba conditionelle revient a dire que si un enoncé A est vrai (on le sait), ceci peut affecter la proba d’un autre enoncéB. E.g.: pr (sortir numéro paire)=1/2. pr(sortir numéro pair | 2 ou 4 sont sortis)=1. Bayes’ theorem suit des axiomes et de la definition de la probabilité. C’est une lois qui gouverne l’inversion de la probabilité et met en relation Pr B si A avec la Pr A si B, pourvu que Pr A et Pr B sont connues ou si une procedure conventionnelle pour les determiner est acceptée. E.g: P(A) = P(A|B) P(A)+ P(A|-B)P(-B) (th. of total pr). Bayes’ th. donne proba a posteriori à partir de la proba à priori. Give ex if needed.

5 Indépendence unconditionnelle:
A et B sont unconditionnellement indépendents ssi P (A | B) = P (A) ou P (A | B) = P (B) ou P (A | B) = P (A) P (B) Indépendence conditionnelle: A est conditionnellement independent de B si C ssi P (A | B  C) = P (A | C) The 3 conditions for unconditional independence are equivalent. The notion of independence. There are cases where the knowledge that A is true is irrelevant to the probability to be assigned to B. E.g.: pr(throwing a even number)=1/2. Pr (A | the president of u.s. sneeze at the same time of the throw) = still ½! [Conditional independence is the famous screening off relation, central in Bayesian nets and in causality. The notion of independence is central for causality. More on this later.] Notice the difference btw independent events and mutually exclusive events. Independence doesn’t imply that ev are mutually exclusive. Give ex.

6 Interprétations de la probabilité
Classique/Logique Proba: rapport entre le nombre de cas favorables et le nombre de cas possibles Subjective Proba: expression quantitative du degrée de croyance, support ou confirmation Objective Proba: expression quantitative d’une charactéristique objective du monde Classifications des interpretations different de façon remarcable. Pas mal de gens ont proposé leur propre interpretation ou classification, mais à un moment donné apparemment on avait attaint un certain accord en isolant 3 groupes d’interpretations Logique. Se base sur le principe d’indifference = sans raison d’assigner des valeurs differents, le evenements ou enoncés doivent etre considerés comme equiprobable Problem: explication circulaire du concept. Subjective de 2 types: Approaches completement subjectives: tout ce qui compte pour la rationalité c garder la cohérence= satisfaire aux axiomes Otre approches subjective requierent d’autres contraintes Objective de 2 types: Frequetiste: P(A|B) est la frequence relative des A parmi les B. Problem: determiner la classe de reference et la valeure limite si la classe de reference est infinie Propensionnelle: pr est une tendence ou propension à reveler une certaine characteristique. Ça permet d’assigner des valeurs des proba dans des instances singulières

7 Interprétations de la probabilité Une classification alternative
Classique/Logique Physique Fréquentiste Propensionnelle Bayésienne Subjective Empiriquement basée Objective Mais on peut donner aussi une classification differente. Ici je suis partiellement JW, qui distingue: cl/logique, physique, bayesienne subjective, et bayesienne objective. Partiellement, car j’ai preferé regrouper les interpretations bayesienne ensemble. Vous verrez dans la suite pourquoi j’ai fait ce choix Pourquoi ‘physique’? Parce que la proba est une characteristique du monde, on dirait, là, dehors, plutot que dans nos tetes. On pourrait donc dire aussi que les interpretations classique/logique sont des abstractions (logiques), les interpretations physiques sont independants du sujet, les interpretations bayesiennes sont dependants du sujet.

8 Interprétation classique
Laplace, Pascal, Bernoulli (Jakob) La proba est le rapport entre le nombre de cas favorables et le nombre de cas possibles. Pensez au jeu de dés Proba assignée en absence de «evidence» Equipossibilité, ou le Principe d’indifférence de Keynes Origines lointaines (laplace, pascal, bernoulli) Definition de la proba Example jeu du dé Pas de evidence, just un examen de l’espace de probabilité Hypothese principale: equipossibilité des evenements. Keynes l’appelera le principe d’indifference S’adapte tres bien aux jeux de hazard Pas tres applicable en science (on verra dans la suite dans l’application en epidemiologie du cancer) ‘probable’ n’est pas proprement expliqué

9 Interprétation logique
Généralisation de l’interprétation classique Basée sur le principe d’indifférence Donne un « account » le plus général possible du degré de support ou de confirmation Pensez à la fonction c de Carnap Generalisation de l’interpretation classique Proposée par keynes, jeffrey, carnap Role fondamental du principe d’indifference On peut determiner a priori la proba par un examen de l’espace de probabilité si on est pas dans une situation avec probabilités inegales, c-à-d si les evenements sont tous equiprobables Mais si ce n’est pas le cas, on peut calculer une proba a posteriori, et donc l’intepretation logique donne une manière de calculer le degré de support ou confirmation d’une hypothèse a partir de l’information disponble. Elle est ‘logique’ car on calcule la proba a posteriori par un lien ‘logique’ entre l’hypothese et l’evidence. La fonction c de carnap exprime exactement cette idee

10 Interprétation fréquentiste
La proba d’un attribut A dans une classe de référence finie B est la fréquence rélative de la recurrence de A en B (Venn) Extension aux classes de références infinies par la limite de la fréquence (von Mises, Reichenbach) Comme je l’ai dit tantot, selon les interpretations physique, la proba est une expression quantitative d’une characteristique objective du monde, non pas de notre degré de croyance ou connaissance ou certitude en quelques choses. Première version du frequentisme est du à venn. – classes de references finies Ceci a été etendu aux classes de references infinies Probleme du choix de la classe de reference est bien connu. Nous verrons dans la suite pouquoi cet interpretation échoue du moins dans le domain de l’epidemiologie du cancer

11 Interprétation propensionnelle
La probabilité est dans le monde, non pas dans notre tête … La proba est une propension, disposition ou tendence d’une situation physique de délivrer un certain résultat ou une fréquence Popper voulez rendre compte des probabilités en mécanique quantique De nouveau, la proba est dans le monde, non pas dans notre tete … Proba est propension, disposition, tendence à delivrer un certain resultat (cas singulier) ou une frequences Il y a different versions de l’intepretation propensionnelles, Gillies en donne une tres bonne presentation. Long run et single-case interpretation propensionnelle selon gillies popper a soutenu les deux. Sa motivation, en tout cas, etait de rendre compte des probabilité singuliere en mécanique quantique. C-à-d des resultats qui ne se produisent qu’une fois.

12 Bayésianisme Une position épistémologique sur le raisonnement scientifique Le raisonnement scientifique se fait en accord avec le calcul de la probabilité Cette position permet d’apprendre de l’expérience (par conditionnalisation) Le système formel impose des contraintes sur les probabilités On commence à entrer dans le vif … on arrive aux positions bayésiennes … Mais qu’est-ce que le bayésianisme avant tout? distinguer: bayésianisme en tant que position epistemologique sur le raisonnement scientifique bayésianisme en tant qu’interpretation de la probabilité Bien evidemment les deux sont reliés 2 idées principales du bayésianisme: Raisonner (en science) c’est raisonner en accord avec les principes de la probabilité Ceci nous permet d’apprendre de l’experience Le calcule de la probabilté donne le cadre formel pour imposer de contraintes sur les probabilités, la regle de conditionnalisation exprime le principe d’apprentissage par l’experience. On met à jour les proba sur la base de l’info qui se rend disponible.

13 Bayésianisme Une interprétation de la probabilité
Les probas sont des degrés de croyance rationnelle Differents bayesianimes sont en désaccord sur comment former ces degrés de croyance Qu’est-ce que la probabilité? Interpretation ‘mind-dependent’, c-à-d, dépendant du sujet. Probas sont de degrés de croyance rationnelle. Ceci est le noyeau sur lequel le bayésiens se trouvent en accord. Proba exprime notre incertitude vis-à-vis une situation. Proba est une characteristique de notre etat epistemique. Ils sont aussi en accord qu’il s’agit d’une croyance ‘rationnelle’, mais ils donnent des conditions differentes pour definir ce qui est rationnel

14 Bayésianisme subjectif
Probabilités et paris: Les probas sont les quotients de pari Un pari hollandais est une serie de paris: (i) singulièrement acceptables par le parieur (ii) collectivement portent à une perte, quoi qu’il arrive Statique de l’opinion: Si les degrés de croyance du parieur ne respettent pas les axiomes, le parieur est susceptible du pari hollandais Si les degrés de croyance du parieur respettent les axiomes, le parieur n’est pas susceptible du pari hollandais Cinématique de l’opinion: La conditionnalisation est la seule règle cohérente pour mettre à jour les probas Obéissance au calcul est condition nécessaire et suffisante pour la rationnalité En gros, un bayesien subjectif soutient que pour etre rationnel il suffit de se conformer aux axiomes du calcul. Obeissance au calcul est une condition necessaire et suffisante pour la rationnalité. Très souvent on explique les probabilité par le comportement d’un parieur. (j’irai pas dans les details, je vais me contenter de donner les idées principales). 2 idées de bases: Les probas sont identifiées aux quotients de pari qu’un parieur est disposer à accepter On defini un pari hollandais une serie de paris tels que les paris sont singulierement acceptables par le parieur mais collectivement portent à une perte certaine quoi qu’il arrive On defini donc un parieur rationnel si on ne peut pas faire de pari hollandais contre lui Deux theoremes pour la statique de l’opinion: Si les degrés de croyance du parieur ne respettent pas les axiomes, le parieu est susceptible du pari hollandais Si les degrés de croyance du parieur respettent les axiomes, le parieur n’est susceptible du pari hollandais Un theoreme pour la dynamique de l’opinion: La conditionnalisation est la seule regle coherente pour mettre à jour les probabilités Donc, obeissance au calcul est condition necessaire et suffisante pour la rationnalité

15 Problème… Solution… Aribitrarieté: Deux sujets avec les mêmes infos
Peuvent choisir des probas différentes, tout en étant rationnels Solution… Probleme de l’arbitrarieté surtout dans des contextes scientifiques ou de decision. Seule contrainte: obeir aux aziomes. Solution: metttre d’autres contraintes sur les probas Differentes type de contraintes donne lieu à deux autres sortes de bayésianismes – empiriquement basé et objecif Le bayésianisme empiriquement basé et objectif imposent d’autres contraintes sur les probas

16 Bayésianisme empiriquement basé
Ajouter la contrainte « empirique »: Les degrés de croyance se forment à partir des fréquences connues Proposé par example par salmon. Connaissance des fréquences constraind les degrés de croyance. Comment? Example: Si un sujet sait que le 60% des gens avec un type de cancer guerissent et qu’un patient particulier a ce type de cancer, si ce sujet est un bayesien empiriquement basé, il devrait avoir un degré de croyance de .6 que ce patient va guerir

17 Bayésianisme objectif
Ajouter la contrainte empirique et la contrainte logique: En présence d’infos empiriques, e.g. fréquences, celles-ci doivent être incorporées En absence de toute infos, il faut être le plus ambigu possible, c-à-d, les probas tendent vers la valeure moyenne Le bayésianisme objectif va au de là du bayésianisme empiriquement basé car il ajoute une contrainte logique. Idée derriere contrainte logique est que l’absance d’info correspond au ‘je ne sais pas’, qui se traduit par une probabilité de .5

18 Contraintes empiriques
Principe de vérité Si un sujet sait que u est vrai, son degré de croyance en u, P(u) = 1 Principe de calibration Si un sujet connaît que la « chance » de u est P*(u), son degré de croyance en u devrait être P(u)=P*(u) Connaissance des fréquences Si un sujet sait que la fréquence relative d’un événement est r, son degré de croyance que le prochain cas se produira est r En peu plus en details ces contraintes empiriques. (je suis JW 2005) Principe de verité Une contrainte empirique parce que on entend par verité la verité empirique, non pas logique. Par example savoir avec certitude qu’un evenement s’est produit ou que le contenu empirique d’un enoncé est vrai Principe de calibration Jon: chance n’est ni une frequence ni une propension, mais l’objet d’une croyance. J’avoue que ce point m’echappe. Il y a aussi d’autres versions du principe de calibration, eg van frassent, qui reviennent à etablir une conformité des degrés de croyance aux frequences connues. Connaissance des frequences C’est exactement le meme principe utilisé par le bayésianisme empiriquement basé

19 Contraintes logiques Une extension du principe d’indifférence
Principe d’entropie maximale Un sujet doit adopter, parmi toutes les fonctions de probabilité qui satisfont aux contraintes imposées par sa connaissance d’arrière plan, une fonction P qui maximise l’entropie Principe d’indifference ou de raison insuffisante: dans un espace de probabilité donné, il faut donner la meme valeur de probabilité aux evenements, au moins qu’il y ait une raison pour faire autrement Probleme, déjà noté par Jaynes: ceci est un bon critère dans des situations ‘symmetrique’, eg jeux de hazard, mais dans d’autres situations, où en effet il est aussi aribitraire que d’autre critère. Avantage du principe d’entropie maximale: il permet de tenir compte de toute information d’arrière plan et il est le plus évasif possible pour toute infos manquante. Idée derrière: la fonction de proba doit exprimer toute notre connaissance d’arrière plan et seulement cette connaissance, donc elle doit satisfaire à toute contrainte empirique et etre le plus evasive possible à l’egard de toute autre information. L’entropie est une mesure standard de l’incertitude d’une fonction de probabilité. Ceci, avec la justification que je viens de donner, justifie le choix du principe d’entropie

20 Quels avantages? Pas d’arbitrarieté Contenu empirique
Plusieurs source de « evidence » En resume, il y a 3 avantages dans l’approche bayesienne objective qui le rendent preferable aux autre approches bayesienne. Evidemment ceci ne repond pas à la question du porqoui on devrait preferer une approche bayesienne plutot que d’autres approches (classique/logique, physique), mais ceci, je pense, est un probleme contextuel, dont serait interessant discuter

21 En résumé: Selons les bayésiens les probas doivent
satisfaires aux axiomes du calcul Example: A= demain il va plevoir à Paris P(A) est un degré de croyance en A Alors, P(A)+P(A)=1 Je connais seulement la probabilité physique (fréquence ou propension) de A, disons que cette proba est entre .2 et .3 Je vais maintenant presenter un example assez simple pour illustrer les differences entre les 3 types de bayesiens. (example repris d’un article de JW)

22 En résumé: Bayésien subjectif Bayésien empiriquement basé
Je peux choisir toute valeur de proba entre 0 et 1 Bayésien empiriquement basé Mon degré de croyance doit être basé sur ma connaissance empirique, donc je dois choisir entre .2 et .3, toute valeur sera acceptée Bayésien objectif sur la connaissance empirique et doit être les plus ambigu possible. .3 est la valeure qui approche le plus .5 [lire et commenter]

23 Desiderata: que voulons-nous d’une inteprétation?
Objectivité Rendre compte de l’objectivité de la proba Calculi Expliquer comment raisonner sur la proba Épistémologie Expliquer comment connaître la proba Variété Faire face à la grande varieté d’énoncés probabilistes Parcimonie Être ontologiquement parcimonieux Ce qu’il y a d’interessant ce n’est pas juste de donner un cadre formel ou philosophique, mais c’est d’appliquer une interpretation. Alors il faut mettre au clair ce que nous nous attendons d’une interpretation, car ce sera sur cette base que nous allons evaluer la pertinance de l’une ou l’autre interpretation dans un context donné. Objectivité Notion of prob qui est objective dans un sens logique: on doit se decider sur ce que c’est la proba. [objectivité sur la notion meme] Si 2 agents sont en desaccord, au moins un des 2 a tort [objectivité dans le sens de non arbitriarieté des assignations des valeurs de proba] Calculi Une theorie phil de la proba devrait donner lieu a une notion qui satisfait aux axiomes de prob, sinon c’est un theorie de qq chose d’autre Epistemologie On connait les proba par des bias differents: mesure des freq des la pop, appelle a des arguments de symmetrie ou theorie sc, on derive prob d’autres probas par le calcul … theorie phil de la proba devrait dire comment et quand nous pouvons utiliser ces techiniques Varieté On a enoncés singuliers et generiques Proba concerne entités differentes (events, ensembles, variables, enoncés, hypotheses) Phil theory of prob should be able to cope with all of them Parsimonie theorie phil de la proba ne devrait pas postuler entités (ontologie) au moins d’etre justifie. Il vaut mieux reduire la proba à qq chose qui existe déjà dans notre ontologie plutot que prendre une notion de proba primitive

24 Application: épidémiologie du cancer
Problème: l’épidémiologie a un double objectif Établir un énoncé générique Les non-fumeurs ont un risque majeur (25%) de développer le cancer du poumon si leurs épouses sont des fumeurs Établir un énoncé singulier Michelle a un cancer du sein métastatique et elle survivra plus de 5 ans avec un probabilité de 0.4 Ces deux énoncés sont probabilistes Premiere application en epidemiologie du cancer. Papier preparer avec JW dans le cadre du projet de recherche CAPITS Epidemiologie s’interesse à la distribution des maladies et d’en trouver les cause qui determinent ces distributions Epidemiologie du cancer cherche à etablir l’etiologie du cancer Quels cancer sont causés par un certain factor, eg tobacco consumption Quels facteurs biologiques sont cancérigènes Quels substances chimiques sont cancérigènes Quels facteurd génétique previennent ou predisposent au cancer Quelles parties de la populations sont les plus exposées à un certain facteur 1° objectif: etablir enoncés causaux generiques (example) 2° objective: les enoncés generiques doivent etre utiles pour les appliquer dans le cas singulier (example) Les deux types d’enoncés sont probabilistes Voilà surgir le probleme de l’interpretation

25 On marchande …   Class/ Log Prop Freq Bayes Subj Emp- Basé Obj
Objectivité Calculi Epistémologie Variété Parcimonie Objectivity: X Class/Log  different sujets peuvent choisir des parttions differents comme equipossible X Subj  2 agents en desaccord, aucun peut etre consideré ayant tort X Emp-based  (moins) si freq sont connues, les assignations ne sont pas arbitraire V Freq odeterminé objectivement par la classe de reference V Prop  determiné objectivement par l’histoire de l’univers jusqu’à l’instant present V Obj Bayes  p determiné objectivement par la connaissance Calculi X des theories prennent pas nombres reels ou prennent des pairs (intervals) X von mises freq theory ne satisfait pas additivité countable Epistemology X class/log/subj  ne rendent pas conte de l’usage repandu des freq X freq  peut pas expliquer comment degre de croyance donne acces au proba X prop  metaphysical: probleme a identifier lien avec freq V emp-based/obj-bayes  permettent que toute forme de connaissance d’arriere plan contribue a former degres de croyance Variety X freq/prop  peut pas assigner prob à hypothesis or to single-cases Parsimony X prop  prob sont primitive V degres de croyance, sequences des resultats (on y attache une freq) don’t déjà dans notre ontologie

26 Vendu! Fréquentisme-cum-Bayésianisme objectif
Le pluralisme est une option faisable Énoncés génériques requièrent une interprétation fréquentiste Énoncés singuliers requièrent une interprétation bayesienne objective Le bayésianisme objectif a des vertus pragmatiques Variety c’est le probleme le plus dur: qq interpretations n’a pas de sens dans le cas singulier et autres ne permettent pas d’interpreter proba generiques Seule option faisable semble le pluralisme Emp-base and obj bayes options les plus attractives: permettent utiliser freq dans le cas generique, puis ce freq utilisés comme contrainte pour le cas singulier Toutefois, choix ouvert entre emp-based subjectivism and obj-bayesianism. Obj-Bayes a une vertu pragmatique: en moyenne est plus prudent dans des decisions risquees [GIVE EXAMPLE]

27 Application: modélisation causale
54 4 13 34 12 2 X1 Economic development X2 Social development X3 Sanitary infrastructures X4 Use of sanitary infrastructures X5 Age structure Y Mortality Deuxieme application en modelisation causale. qu’est-ce qu’un modele causal [j’essaye de ne pas presupposé aucune connaissance] Graph, equations, relation entre les deux, interpretation des equations, But cognitif et orienté action

28 Probas bayésiennes objectives
Intuitivement: Les résultats d’un modèle causal expriment une croyance (rationnelle) « evidence-based » sur des relations causales Bayésianisme, basé empiriquement ou bayésianisme objectif Remarque, statistique classique est frequentiste, sans vraiment l’admettre ou s’en rendre compte, ou s’en soucier, ou se poser la question En fait, je vais donner 3 raisons pour lesquelles il vaudrait mieux interpreter les enoncés probabilistes selon le bayésianisme objectif. qu’est-ce que les resultats d’un modele causal expriment finalment? Une croyance “evidence-based”, ce qui nous amenerait tout de suite soit au bayesianism empiriquement basé soit au bayésianisme objectif Mais il y les deux raisons qui indiquent de preferer la version objective

29 Test d’hypothèse Idée de base:
comparer l’hypothèse avec les observations Éléments du test: Hypothèse nulle: la variation observée est aléatoire Hypothèse alternative: la variation observée est réelle Statistique de test L’hypothèse nulle est acceptée ou rejetée selon la valeur-p chosie Rappeller idees de base du test d’hypothese, sans entrer dans le details techniques. Rentre pas non plus dans le choix de la statistique de test. Mettre tout de meme en evidence: Comparer deux hypotheses, On accepte pas l’hypothese alternative, mais on rejete la nulle Pas mal de probleme d’interpretation, eg, signification de ‘significance level’, interpretation de la p-value Ici, on se concentre sur l’interpretation de la probabilité dans le test d’hypothese

30 Interprétation des probas
D’un point de vue fréquentiste: Nous évaluons la proba d’obtenir l’échantillon si l’hypothèse est vraie « la probabilité de l’hypothèse » n’a pas de sens car c’est un événement unique D’un point de vue bayésien: Nous pouvons évaluer la probabilité d’une hypothèse Pour rappel, le frequentiste ne peut pas donner une valuer de proba aux cas singuliers, donc dans le cadre frequentiste ça n’a pas de sens de parler de la probabilité d’une hypothese. En general, le frequentiste test la probabilité d’obtenir l’echantillon donné si l’hypothese est vraie Par contre, ça a du sens au sein d’une approche bayesien

31 Example « le paramètre inconnu  se trouve dans l’intervalle
(1, 2) , niveau de confiance 95%» Ce n’est pas la proba du paramètre! Si on tire nombreux échantillons de la même taille et on construit les mêmes intervalles autour de , on peut s’attendre que 95% des intervalles contiennent  Le fréquentiste ne peut pas évaluer la proba de l’hypothèse elle-même [presenter et discuter l’example]

32 Hypothèse nulle contre hypothèse alternative
On test l’hypothèse nulle contre l’hypothèse alternative Acceptation ou rejet concernent directement l’hypothèse nulle et indirectement Sous l’interprétation bayésienne objective les 2 hypothèses sont tout aussi probable, au moins que « evidence » n’indique le contraire On rentre dans le vif … Strategie du frequentiste differe de celle du bayesien objectif, en premier lieu parce que le frequentiste ne peut pas comparerer, strictement parlant, les probas des hypotheses. Comme je l’ai dit tantot, de fait on accepte/rejete l’hyothese nulle, mais on ne dit rien explicitement sur l’hypothese alternative. Traitement inegale des 2 hypotheses. Le bayesien les traiterait de manière egale, au moins que evidence n’indique le contraire

33 La réponse du fréquentiste
Les 2 hypothèses ne peuvent pas être traitées de la même manière: Il est plus grave d’accepter l’hypothèse alternative quand elle est fausse que de rejeter l’hypothèse nulle quand elle est vraie Le fréquentiste doit limiter sa région de rejet pour restreindre la probabilité d’une erreur de type II Les 2 types d’erreur et leur gravité. Ceci explique, du point de vue du frequentiste, pour quoi devoir minimiser la probabilité d’erreur II Ça vaut la peine de noter aussi une autre asymmetrie. Erreur de type I a une probabilité alfa (qui en fait est la p-valeur), et l’erreur de type II a une probabilité beta, MAIS, le deux probabilité ne sont pas additives, on calcule beta à l’aide aussi de alfa mais ce ne pas 1-alfa! Ceci est une autre raison pour laquelle les 2 hypotheses ne sont pas traités de façon egale. La probabilité de se tromper sur h nulle n’est pas complementaire à avoir raison sur h alternative Ce qui amene à construire une region de rejet pour h nulle

34 La contre-réponse du bayésien
Il n’y a pas de région de rejet a construire, mais de probabilités a posteriori à calculer Le choix entre l’hypothèse nulle et l’alternative est faite sur la base des a posteriori Le bayesien objectif va calculer la probabilité a posteriori des hypotheses, en tenant compte de toute information dont il dispose. Son choix sera fait sur la base de la comparaison de ces deux probabilités.

35 Guide pour l’action Décisions pour les résultats des tests
Probas bayésiennes objectives permettent de décider entre les a posteriori des hypothèses Décisions en matière de politique publique (sciences sociales) Décisions en matière d’individus (sciences médicale) Troisième raison pour laquelle il vaut mieux etre des bayésien objectifs. Je mentionnais le but orienté action de la modélisation causale. Donc, les probas qui sortent de ces modeles devraient nous indiquer les choix à faire. Distinction entre 2 types de décisions (mis à part les decisions sur les hypotheses) [discuter un peu sur le fait d’etre explicite sur l’interpretation causale, sur la necessité de l’etre, et donc d’avoir des outils qui nous permettent de faire de bons choix. Bon choix, c-à-d bien informé par la connaissance d’arriere plan, par le evidence, etc]

36 Pourquoi des probas bayésienne objectives?
Parce que: 1) elles ont du sens dans le cas unique 2) elles ne laissent pas de place à l’arbitrarieté 2 raisons principales pour lesquelles il vaut mieux utiliser des probas bayesiennes

37 En résumé J’ai rappelé J’ai présenté le bayésianisme J’ai distingué
Le formalisme du calcul de la probabilité Les majeures interprétations J’ai présenté le bayésianisme En tant que position épistémologique En tant qu’interprétation de la probabilité J’ai distingué Le bayésianisme subjectif Le bayésianisme empiriquement basé Le bayésianisme objectif J’ai appliqué le bayésianisme objectif En épidémiologie du cancer En modélisation causale [rappeler le parcours de l’expose]

38 Et en suite …? Le pluralisme est-il une position tenable ?
Dans quels autres contextes peut-on appliquer le bayésianisme objectif?


Télécharger ppt "Qu’est-ce que le bayésianisme objectif?"

Présentations similaires


Annonces Google