Les modèles à choix discrets
Appréhension Les modèles à choix discret sont utilisés lorsque l’on observe l’état de divers individus au regard des modalités d’une variable qualitative Les pionniers de ces modèles ont été Berkson (1944, 1951) Daniel L. MacFadden (1974) et de James J. Heckman (1976).
Approche de l’interprétation Odds: Considérons X les caractéristiques de l’individu (Age, sexe, taille, diplôme, …) Y la variable d’intérêt (avoir la Bac) Odds Ratio: X: variable sexe
Approche de l’interprétation Risque relatif Approche par les variables latentes
Diagnostic et analyse des résulats Les outliers:
Plan Modèles Dichotomiques Univariés
(ENF. 1 ou 0) sachant le diplôme de l’individu (DIPL (ENF ! 1 ou 0) sachant le diplôme de l’individu (DIPL ! 1 si diplôme inférieur au bac, ! 2 si niveau bac,! 3 si diplôme supérieur au bac), son âge (AGE) et son âge au carré divisé par 100 (AGE2 ! AGE2 100 ). Voici les résultats de l’estimation avec STATA, la commande vce affichant la matrice de variance-covariance des paramètres estimés. L’échantillon ne contient que des personnes d’âge compris entre 20 et 60 ans. Les variables _Idipl_1, _Idipl_2, _Idipl_3 résultent de la dichotomisation de la variable DIPL.
Exemples de variables expliquées concernées: Variables dichotomiques: avoir ou non des enfants. Être ou non salarié Avoir ou non des ambitions politiques Variables polytomiques: Situation matrimoniale niveau d’étude”
Modèles Dichotomiques Univariés Spécification du modèle: y=0 si modalité 1 et y=1 si modalité 2 Où X représente les caractéristiques observables de l’individu (exemple: âge, sexe, niveau s’instruction, revenu salarial,…)
Exemple de modélisation sous STATA On désire déterminer les facteurs qui concourent au fait d’avoir ou non un enfant sachant les caractéristique des répondants : le diplôme de l’individu (diplôme inférieur au bac, niveau bac,diplôme supérieur au bac), son âge (AGE) et son âge au carré divisé par 100)
xi: probit enf i.dipl age age2
Effets marginaux
Matrice de variance covariance Utile pour faire certains tests d’égalité entre les coefficients des modalités d’une même variable par exemple
lsens: (graphique de sensibilité et de spécificité) lroc lsens: (graphique de sensibilité et de spécificité) estat gof: (pour tester la qualité de l’ajustement) Predict phat, pr : (prédiction de la probabilité p(y=1)) Predict xb, xb : (prédiction linéaire de log(p/(1-p))) Predict score, score
Modèles polytomiques univariés ordonnés Y a plusieurs modalités que l’on peut ordonner: Par exemple: le nombre d’enfants Les quartiles par exemple de revenu Etc,
Estimation sous STATA
Différence avec le modèle univarié dichotomique Estimation des seuils justifiant le changement d’état selon les caractéristiques observables Test de brant dans le cas d’un ologit Test de régression parallèle: brant listcoef, help (estimer les odds ratio) Si le test de regression parallèle est rejeté, on estime: un modèle polytomiques univariés ordonnés généralisé: Commande: gologit2
Modèle multinomial Tester l’hypothèse d’indépendance aux alternatives non pertinentes pour iia mfx, predict(outcome(1))