La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

+ Régression logistique Eugénie Dostie-Goulet Plan de la présentation Pourquoi une régression logistique? La régression logistique Les « odds ratio » ou.

Présentations similaires


Présentation au sujet: "+ Régression logistique Eugénie Dostie-Goulet Plan de la présentation Pourquoi une régression logistique? La régression logistique Les « odds ratio » ou."— Transcription de la présentation:

1 + Régression logistique Eugénie Dostie-Goulet Plan de la présentation Pourquoi une régression logistique? La régression logistique Les « odds ratio » ou rapports de probabilité La prédiction

2 + Les probabilités

3 + Pourquoi la régression logistique? Les cas quon étudie ne sont pas toujours linéaires (en fait, rarement) Déclarer la guerre ou non? Financer un programme ou non? Voter ou non? La régression logistique sapplique aux situations où la variable dépendante se limite à deux choix. Ce qui nous intéresse, cest de savoir si les variables indépendantes X peuvent prédire lappartenance de Y à lune ou lautre des deux catégories. Et si oui, selon quelle probabilité.

4 + Pourquoi la régression logistique? Mais pourquoi ne pas utiliser la régression MCO? Parce que celle-ci nest pas contrainte à prendre des valeurs entre 0 et 1. Effet estimé souvent sous-estimé ou exagéré Lerreur est très élevée On préfère donc utiliser une régression logistique y = p = exp(a + β 1 *x β k *xk)/(1+exp(a + β 1 *x β k *xk)) y = toujours entre 0 et 1 (probabilité)

5 + Notre étude Les données Létude électorale canadienne 2008 Lhypothèse Les Canadiens qui croient que lobéissance est plus importante que lautonomie chez les enfants sont plus susceptibles dêtre en faveur de la peine de mort Les attentes Nous nous attendons à une relation forte entre nos deux variables

6 + La régression logistique Variable dépendante: 1 = en faveur de la peine de mort 0 = contre la peine de mort Variables indépendantes Obéissance : dichotomique où 1 = obéissance pour les enfants et 0 = autonomie pour les enfants (32% sont daccord avec lobéissance) Âge : continue de 18 à 97 (moyenne = 51,7) Éducation: trois dichotomiques (élevée, moyenne, faible), avec environ le tiers des répondants dans chaque catégorie

7 + Tableau croisé CrossTable(mort,obeissance, prop.c=T, prop.r=F, prop.t=F, prop.chisq=F, chisq=T, format="SPSS") R R

8 + La régression logistique > logit=glm(mort ~ obeissance + age + edufaible + edumoyen, family=binomial("logit")) > summary(logit) R R

9 + Qualité du modèle - > logit$null.deviance - logit$deviance [1] > logit$df.null - logit$df.residual [1] 4 > dchisq(logit$null.deviance-logit$deviance, logit$df.null-logit$df.residual) [1] e-18

10 + La régression logistique > logit=glm(mort ~ obeissance + age + edufaible + edumoyen, family=binomial("logit")) > summary(logit) R R

11 + « Odds Ratio » ou Rapports de probabilité OR = e b = e = 1, R R

12 + Comment lire les rapports de probabilité? P = 0,60: diminue la probabilité de 40% P = 0,80: diminue la probabilité de 20% P = 1: 0%. Le changement dans la variable indépendante n'affecte pas la variable dépendante P = 1,40: augmente la probabilité de 40% P = 2: augmente la probabilité de 100% (c'est un rapport de 2 contre 1) P = 4,20: augmente la probabilité de 320%

13 + Coefficients et probabilité CoefficientsRapports de probabilité Constante-.47 (0.17)* Obeissance.45 (0.11)*1.57 Age-.00 (.00).99 Edufaible.88 (.13)*2.42 Edumoyen.43 (.12)*1.54

14 + Prédictions > obeissance=c(1) > age=c(mean(df$age, na.rm=T)) > edufort=c(1) > edumoyen=c(0) > edufaible=c(0) > newdata1=data.frame(obeissance, age, edufort, edumoyen, edufaible) > newdata1 > newdata1$predict=predict(logit, newdata=newdata1, type="response") > newdata1 R R

15 + Prédictions > obeissance=c(1) > age=c(mean(df$age, na.rm=T)) > edufort=c(1) > edumoyen=c(0) > edufaible=c(0) > newdata1=data.frame(obeissance, age, edufort, edumoyen, edufaible) > newdata1 > newdata1$predict=predict(logit, newdata=newdata1, type="response") > newdata1 R R obeissance age edufort edumoyen edufaible predict

16 + Prédictions > newdata2=data.frame(obeissance=1, age=seq(18,98,10), edufort=1, edumoyen=0, edufaible=0) > > newdata2$predict2=predict(logit, newdata=newdata2, type="response") > newdata2 R R


Télécharger ppt "+ Régression logistique Eugénie Dostie-Goulet Plan de la présentation Pourquoi une régression logistique? La régression logistique Les « odds ratio » ou."

Présentations similaires


Annonces Google