La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 Statistique et Causalité Selon J. Pearl. 2 Lithiase rénale (paradoxe de Simpson) Population totale ChirurgieTechnique percutanée Succès546 (78%)578.

Présentations similaires


Présentation au sujet: "1 Statistique et Causalité Selon J. Pearl. 2 Lithiase rénale (paradoxe de Simpson) Population totale ChirurgieTechnique percutanée Succès546 (78%)578."— Transcription de la présentation:

1 1 Statistique et Causalité Selon J. Pearl

2 2 Lithiase rénale (paradoxe de Simpson) Population totale ChirurgieTechnique percutanée Succès546 (78%)578 (83%)1124 (80%) Echecs Petit volume ChirurgieTechnique percutanée Succès162 (93%)468 (87%)630 (88%) Echecs (76%)714 Gros volume ChirurgieTechnique percutanée Succès384 (73%)110 (69%)494 (72%) Echecs (23%)686

3 Lithiase rénale Où est le problème? –Succès Petite lithiase Percutané –K. Pearson (1899) : A mixture of heterogeneous groups, each of which exhibits in itself no correlation, will exhibit a greater or lesser amount of correlation. To those who persist in looking upon correlation as cause and effect, this fact must come rather as a shock –Cest linterprétation causale qui est à lorigine du paradoxe Mais: que propose-t-on au prochain patient? –Si on regarde le dossier: chirurgie –Si on ne regarde pas: procédure percutanée !! 3

4 Autrement dit… Quelle est la bonne analyse : ajuster ou ne pas ajuster… –Quelles covariables doit-on introduire dans le modèle? (sélection des covariables sélection de modèle) Quest-ce quun facteur de confusion? –Intuitivement: si je loublie, je vais conclure à une association statistique « fausse » (i.e. non causale!!!) –Plus formellement: En relation causale avec la réponse, indépendamment de lexposition Associé à lexposition, sans en être une conséquence 4

5 Donc… Le problème de sélection des covariables –Nest pas de nature statistique –Il est de nature causale Il faut : –Un formalisme pour la causalité : graphes acycliques orientés, calcul des interventions –Spécifier un modèle causal (expliciter les hypothèses causales) 5

6 6 Graphes Graphe = (S,A) –S: sommets –A: arêtes (relient les sommets 2 par 2) Graphes orientés acycliques (Directed Acyclic Graphs, réseaux bayésiens) –Arêtes orientées (flèches), pas de cycle –Flèche: représente un mécanisme causal (hypothétique) a b c d a b c d a b c d

7 7 Graphes Pratiques pour représenter les lois conjointes (reflètent les hypothèses dindépendance): une variable est indépendante de ses prédécesseurs, conditionnellement à ses parents Peuvent être élaborés selon des hypothèses causales (réseaux bayésiens causaux) –Causalité: intuitive (qualitative, asymétrique)), contrairement à dépendance statistique (quantitative, symétrique)

8 8 Calcul des interventions Consiste à élaguer le modèle causal de base do(X=x): imposer X=x –On élague les flèches arrivant sur X –On fixe X à la valeur x – : loi de Y dans le graphe élagué effet (causal) de X sur Y en général (facteurs de confusion)

9 9 Imposer le traitement = élaguer le modèle causal Chirurgie Taille lithiase Résultat T Voiture R Niveau socio-culturel Age Traitement TA Résultat

10 10 Sélection des covariables: la solution dépend du modèle causal Traitement Taille lithiase Résultat T Voiture R Niveau socio-culturel Age AjusterNe pas ajuster Traitement TA Résultat V associée à T et R!!

11 11 Essai randomisé Observation Traitement Réponse Essai randomisé Randomisation Traitement Réponse U* La randomisation élague les flèches arrivant à la variable traitement…

12 12 Retour sur le paradoxe de Simpson Il ny a pas de paradoxe Théorème

13 13 Observer vs. Faire Dans les modèles de causalité, on suppose que chaque relation fonctionnelle parent-descendant représente un mécanisme stable et autonome: –Le modèle obtenu en modifiant un mécanisme sans changer les autres reste un modèle valide de la réalité (organisation modulaire) –Modèle probabiliste (bayésien): définit la probabilité dévénements et comment ces probabilités varieront avec les observations futures (modèle lui-même: statique) –Modèle de causalité: définit en outre comment varieront les probabilités après des interventions (modèle dynamique: changements possibles)

14 14 Conclusion Clarifie/simplifie (Simpson, facteurs de confusion) Conduit à expliciter les hypothèses causales sous-jacentes Formalisme pour expliciter/discuter/calculer

15 15 d-séparation dans GAO Soient X, Y, Z sous-ensembles de variables –X et Y d-séparés : tout chemin (non orienté) de X à Y contient un confluent (collider): i k j –X et Y d-séparés par Z : tout chemin (non orienté) de X à Y est bloqué par Z, i.e. contient une chaîne i z j ou une fourche i z j, ou un confluent i z* j tel que ni z* ni ses descendants ne sont dans Z

16 16 d-séparation et indépendance –d-séparation dans le graphe indépendance en probabilité : Si X et Y sont d-séparés par Z dans un GAO, alors X et Y sont indépendants conditionnellement à Z pour toute probabilité compatible avec le GAO Si X et Y sont indépendants conditionnellement à Z pour toute probabilité compatible avec un GAO, alors X et Y sont d- séparés par Z dans le GAO

17 17 d-séparation chaîne i z j ou fourche i z j: –le conditionnement sur z rend i et j indépendantes confluent i z* j: –le conditionnement sur z* (ou un descendant) rend i et j dépendantes –Exemple: A,B binaires, indépendantes C = A + B (A C B) Si C=1: B = 1 – A A et B dépendantes conditionnellement à C –biais de sélection (Berkson)

18 18 Le critère back-door On observe X, Y et des covariables Z et on veut calculer P(Y|do(X=x)) –Sil ny a pas de facteur de confusion P(Y|do(X=x)) = P(Y|X=x) (par définition!) Chemin back-door: contient une flèche vers X (affecte X) Z satisfait le critère back-door si –Z ne contient aucun descendant de X (X naffecte pas Z) –Z bloque tout chemin back-door c de X à Y (X naffecte pas Z), i.e. c contient une chaîne ou une fourche dont lélément médian est dans Z (indépendance conditionnelle) Ou: c contient un confluent dont ni lélément médian ni ses descendants ne sont dans Z (lindépendance marginale est préservée par conditionnement sur Z)

19 19 Back-door et ajustement Si Z satisfait le critère back-door pour X et Y, alors : Les covariables à inclure dans le modèle (de régression) sont celles qui permettent le calcul ci- dessus (Z: ensemble minimal satisfaisant le back-door)

20 Exemple Traitement Taille lithiase Résultat T Voiture R Niveau socio-culturel Age Traitement TA Résultat V ne bloque pas (confluent)TA descend de TTaille bloque (fourche)


Télécharger ppt "1 Statistique et Causalité Selon J. Pearl. 2 Lithiase rénale (paradoxe de Simpson) Population totale ChirurgieTechnique percutanée Succès546 (78%)578."

Présentations similaires


Annonces Google