La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Les équations de la régression logistique – Deux variables indépendantes dichotomiques Le tableau sécrit alors X 1 X 2 1 X1=1 ; X2=1 0 1 X1=0 ; X2=1 1.

Présentations similaires


Présentation au sujet: "Les équations de la régression logistique – Deux variables indépendantes dichotomiques Le tableau sécrit alors X 1 X 2 1 X1=1 ; X2=1 0 1 X1=0 ; X2=1 1."— Transcription de la présentation:

1 Les équations de la régression logistique – Deux variables indépendantes dichotomiques Le tableau sécrit alors X 1 X 2 1 X1=1 ; X2=1 0 1 X1=0 ; X2=1 1 0 X1=1 ; X2=0 0 X1=0 ; X2=0 Y=1ACEG Y=0BDFH TotalA+CC+DE+FG+H

2 Deux variables indépendantes dichotomiques X 1 X 2 1 X1=1 X2=1 0 1 X1=0 X2=1 1 0 X1=1 X2=0 0 X1=0 X2=0 Y=1ACEG Y=0BDFH TotalA+CC+DE+FG+H Avec Ici la référence est X1=0 et X2=0 Léquation

3 Deux variables indépendantes dichotomiques Ici la référence est X1=0 et X2=0 Léquation X 1 X 2 1 X1=1 X2=1 0 1 X1=0 X2=1 1 0 X1=1 X2=0 0 X1=0 X2=0 Y=1ACEG Y=0BDFH TotalA+CC+DE+FG+H

4 Deux variables indépendantes dichotomiques X 1 X 2 1 X1=1 X2=1 0 1 X1=0 X2=1 1 0 X1=1 X2=0 0 X1=0 X2=0 Y=1a1a1 b1b1 a0a0 b0b0 Y=0c1c1 d1d1 c0c0 d0d0 Totaln 11 n 01 n 10 n 00 Ici la référence est X1=0 et X2=0 Léquation

5 INTRODUCTION DE LA MESURE DE LINTERACTION X 1 X 2 1 X1=1 X2=1 0 1 X1=0 X2=1 1 0 X1=1 X2=0 0 X1=0 X2=0 Y=1ACEG Y=0BDFH TotalA+CC+DE+FG+H Avec Ici la référence est X1=0 et X2=0 Léquation

6 X 1 X 2 1 X1=1 X2=1 0 1 X1=0 X2=1 1 0 X1=1 X2=0 0 X1=0 X2=0 Y=1ACEG Y=0BDFH TotalA+CC+DE+FG+H Ici la référence est X1=0 et X2=0 Léquation INTRODUCTION DE LA MESURE DE LINTERACTION

7 X 1 X 2 1 X1=1 X2=1 0 1 X1=0 X2=1 1 0 X1=1 X2=0 0 X1=0 X2=0 Y=1ACEG Y=0BDFH TotalA+CC+DE+FG+H Ici la référence est X1=0 et X2=0 Léquation INTRODUCTION DE LA MESURE DE LINTERACTION

8 Application numérique (exemple 2.2 du site) source : Soit un échantillon de 7000 naissances. On cherche à expliquer une variable : Y « peser (=1) ou ne pas peser (Y=0) moins de 2500 grammes à la naissance » par deux variables dichotomique X1 : être (X1=1) fumeuse ou ne pas être fumeuse (X1=0) X2 : avoir (X2=1) ou non (X2=0) des antécédents de prématurité X 1 X Y= Y= Total

9 Application numérique (exemple 2.2 du site) Calculer : les valeurs des différents coefficients Calculer les différents risques estimés X 1 X Y= Y= Total

10 Deux variables indépendantes dichotomiques Avec « 00 » comme référence X 1 X Y= Y= Total Léquation sécrit alors g(X1,X2)= -4, ,4055*X1 + 1,9915*X2 + 0,2877*X1*X2

11 Deux variables indépendantes dichotomiques Avec « 00 » comme référence g(X1,X2)= -4, ,4055*X1 + 1,9915*X2 + 0,2877X1*X2)

12 Programme SAS associé (ex2) proc logistic data =ex2 descending ; class Fumeuse (ref="0") Ant (ref="0") / param=ref ; model Premat = Fumeuse Ant Fumeuse*Ant; output out=b1 predicted=probest ; weight eff ; run ; Modèle déclaré avec les interactions Lire les proportions estimées dans la table b1 de la librairie WORK

13 Lecture des sorties SAS (ex1) Partie « Parameter estimates » Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept <.0001 Fumeuse Antécédant <.0001 Interaction Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits Fumeuse Antécédant Interaction

14 La table sortie b1 PrematFumeuseAnt Probabilité estimée 11117,4% 1102,1% 1019,5% 1001,4% Les probabilités données par le modèle sont équivalentes aux proportions calculées à partir des données observées

15 Programme SAS associé (ex2) proc logistic data =ex2 descending ; class Fumeuse (ref="0") Ant (ref="0") / param=ref ; model Premat = Fumeuse Ant; output out=b1 predicted=probest ; weight eff ; run ; Modèle déclaré sans linteraction car non significative Lire les proportions estimées dans la table b2 de la librairie WORK

16 Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept <.0001 Fumeuse <.0001 Ant <.0001 Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits Fumeuse 1 vs Ant 1 vs Lecture des sorties SAS (ex2) Partie « Parameter estimates »

17 La table sortie b2 PrematFumeuseAnt Probabilité estimée 11116,7% 1102,3% 10110,3% 1001,3% Les probabilités estimées sont DIFFERENTES des proportions calculées à partir des données observées MAIS PROCHES

18 Les équations de la régression logistique Deux variables indépendantes dont une polythomique (plus de deux modalités) X 1 Z 1 Z Total Y= Y= Total Soit léchantillon de 7000 naissances. Y « peser (=1) ou ne pas peser (Y=0) moins de 2500 grammes à la naissance » par deux variables dichotomique X1 : être (X1=1) fumeuse ou ne pas être fumeuse (X1=0) X2 : avoir moins de 20 ans (Z1=1) 30 ans ou plus (Z2=1) ou entre 20 ans et 30 ans (Z1=Z2=0) SITUATION DE REFERENCE = « Non fumeuse ; âgée entre 21 et 29 ans »

19 Programme SAS associé (ex3) proc logistic data =ex3 descending ; class Fumeuse (ref="0") Age20m (ref="0") Age30p (ref="0") / param=ref ; model Premat = Fumeuse Age20m Age30p Fumeuse*Age20m Fumeuse*Age30p Age20m*Age30p ; output out=b3 predicted=probest ; weight eff ; run ;

20 Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept <.0001 x <.0001 z <.0001 z <.0001 z1x z2x Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits x z z z1x z2x

21 Parameter DF Estimate Intercept Fumeuse Age20m Age30p Fumeuse*Age20m Fumeuse*Age30p g(X1 ;Z1,Z2) = -3,68 + 1,38 X1 + 1,23 Z1 + 1,36 Z2 - 0,28 X1*Z1 -0,69 X1*Z2 Léquation sécrit Lecture des sorties SAS (ex3) Pr > ChiSq <

22 Effect Point Estimate Confidence Limits Fumeuse Age20m Age30p Fumeuse*Age20m Fumeuse*Age30p OR = e 1,3868 Le rapport entre les enfants de moins de 2500 et ceux de plus de 2500g est 4 fois plus important chez les fumeuses âgées de ans que chez les non fumeuses du même groupe dâges. mesure lassociation entre " le fait de -faible poids à la naissance (Y) -fumer pendant la grossesse (X1) -âge "20<=age<30 ans« (Z) e -0,2823 = 0,755 = 3,02/4,002 leffet modifiant de l'âge de la mère sur lassociation entre " le fait de fumer " et " le faible poids à la naissance Cet effet dinteraction est marqué par le coefficient négatif de Z 1 : -0,2813 Fumeuse * Age30p = effet négatif = avoir 30 ans diminue le risque davoir un enfant prématuré quand on est fumeuse. Leffet est significatif !!! -OR nest pas significatif. Ic compris de chacun des côté de 1 Pour mesurer lassociation entre -le " faible poids à la naissance (Y=1)« - le fait de fumer pendant la grossesse (X 1 =1 ) -l'âge de la mère est "<20 ans" : Vaut : e (1,3868*1-0,2813*1) =3,02 = OR

23 Programme SAS sans les associations entre les variables proc logistic data =ex3 descending ; class Fumeuse (ref="0") Age20m (ref="0") Age30p (ref="0") / param=ref ; model Premat = Fumeuse Age20m Age30p ; output out=b3 predicted=probest ; weight eff ; run ;

24 Standard Wald Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept <.0001 Fumeuse <.0001 Age20m <.0001 Age30p <.0001 Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits Fumeuse 1 vs Age20m 1 vs Age30p 1 vs Commenter Calculer la probabilité pour une femme fumeuse de moins de 20 ans davoir un enfant de moins de 2500 grammes daprès ce modèle 20,54% Donner léquation du modèle Comparer avec la proportion observée dans la population 20,64%


Télécharger ppt "Les équations de la régression logistique – Deux variables indépendantes dichotomiques Le tableau sécrit alors X 1 X 2 1 X1=1 ; X2=1 0 1 X1=0 ; X2=1 1."

Présentations similaires


Annonces Google