Les modèles à choix discrets

Slides:



Advertisements
Présentations similaires
Corrélation Position du problème Définition covariance (X,Y) r =
Advertisements

MODELES POLYTOMIQUES.
La régression logistique: fondements et conditions d’application
Comparaison de deux moyennes observées
Les variables qualitatives
Nombre de sujets nécessaires en recherche clinique
1. Les caractéristiques de dispersion. 11. Utilité.
Scoring Séance II.
Régression -corrélation
Analyse Discriminante
Vérification des données
Régression linéaire (STT-2400) Section 3 Tests dhypothèses et lhypothèse linéaire générale Version: 26 janvier 2007.
COURS 5 Les tableaux croisés, le chi-carré et la corrélation
la statistique descriptive se compose de 3 domaines distincts :   

La Régression Multiple
Etude longitudinale d’essais multilocaux: apports du modèle mixte
Nombre de sujets nécessaires en recherche clinique
Régression linéaire simple
L’Analyse de Covariance
Corrélation et régression linéaire simple
L’Analyse de Variance 1 Généralités Le modèle Calculs pratiques
Méthodes de prévision (STT-3220)
Régression logistique Eugénie Dostie-Goulet
Commentaires sur les biais écologiques et les échelles non emboîtées
La corrélation et la régression multiple
La corrélation et la régression
La puissance statistique
La puissance statistique
La régression logistique
La corrélation et la régression
Les modèles linéaires (Generalized Linear Models, GLM)
Corrélation Principe fondamental d’une analyse de corrélation
LE CHOIX EN CONTEXTE D’INCERTITUDE
Structure discriminante (analyse discriminante)
Les analyses multivariées
Régression linéaire (STT-2400)
La régression multiple
Échantillonnage (STT-2000) Section 3 Utilisation de variables auxiliaires. Version: 8 septembre 2003.
Régression linéaire multiple : hypothèses & interprétation. Partie 2.
Régression linéaire multiple : hypothèses & interprétation
M1 2013/2014 Implémentation des procédures statistiques Introduction aux régressions linéaires.
Méthodes de Biostatistique
Les enquêtes « Patrimoine » et la mesure des inégalités Marie Cordier Cédric Houdré Catherine Rougerie.
La régression simple Michel Tenenhaus
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
Séance 8 30 novembre 2005 N. Yamaguchi
Probabilités et Statistiques Année 2010/2011
Gestion du portefeuille 07A – Modèle à facteurs
VARIABLES ET MESURES DE FREQUENCES Pr. KELLIL M 1.
1 Licence Stat-info CM1 b 2004Christophe Genolini 2.1. Vocabulaire Individu : objet étudié Population : Ensemble des individus Variable : nom donné à ce.
Evaluation des performances des tests diagnostiques en absence de Gold Standard Christophe Combescure Laboratoire de Biostatistique, IURC.
Modèle linéaire Relation entre une variable expliquée Y (par exemple le salaire), et p variables explicatives X j, j = 1, …, p (par exemple, p = 5, X 1.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :34 1 Les modèles linéaires (Generalized Linear.
Échantillonnage (STT-2000) Section 5 Types d’erreur de sondage. Version: 22 août 2003.
Régression linéaire (STT-2400)
Statistique Descriptive Les Paramètres de Tendance Centrale
Modèles d’attraction spatiale
Les normes spirométriques chez les adultes Malagasy MaSpiroGroup.
MENU 1 Modèles de choix.
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement.
ETUDES PRONOSTIQUES Pr Ganry.
Formation Black Belt Lean Six Sigma
Académie européenne des patients sur l'innovation thérapeutique Rôle et notions élémentaires des statistiques dans les essais cliniques.
29 èmes journées du développement ATM 2013 Economie informelle et développement : emploi, financement et régulations dans un contexte de crises Aline Désirée.
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
Chapitre 12 Des modeles corrélationnelles. A la fin de ce chapitre on sera capable de:  definir le but et l’utilisation des modeles correlationnelles.
Transcription de la présentation:

Les modèles à choix discrets

Appréhension Les modèles à choix discret sont utilisés lorsque l’on observe l’état de divers individus au regard des modalités d’une variable qualitative Les pionniers de ces modèles ont été Berkson (1944, 1951) Daniel L. MacFadden (1974) et de James J. Heckman (1976).

Approche de l’interprétation Odds: Considérons X les caractéristiques de l’individu (Age, sexe, taille, diplôme, …) Y la variable d’intérêt (avoir la Bac) Odds Ratio: X: variable sexe

Approche de l’interprétation Risque relatif Approche par les variables latentes

Diagnostic et analyse des résulats Les outliers:

Plan Modèles Dichotomiques Univariés

(ENF. 1 ou 0) sachant le diplôme de l’individu (DIPL (ENF ! 1 ou 0) sachant le diplôme de l’individu (DIPL ! 1 si diplôme inférieur au bac, ! 2 si niveau bac,! 3 si diplôme supérieur au bac), son âge (AGE) et son âge au carré divisé par 100 (AGE2 ! AGE2 100 ). Voici les résultats de l’estimation avec STATA, la commande vce affichant la matrice de variance-covariance des paramètres estimés. L’échantillon ne contient que des personnes d’âge compris entre 20 et 60 ans. Les variables _Idipl_1, _Idipl_2, _Idipl_3 résultent de la dichotomisation de la variable DIPL.

Exemples de variables expliquées concernées: Variables dichotomiques: avoir ou non des enfants. Être ou non salarié Avoir ou non des ambitions politiques Variables polytomiques: Situation matrimoniale niveau d’étude”

Modèles Dichotomiques Univariés Spécification du modèle: y=0 si modalité 1 et y=1 si modalité 2 Où X représente les caractéristiques observables de l’individu (exemple: âge, sexe, niveau s’instruction, revenu salarial,…)

Exemple de modélisation sous STATA On désire déterminer les facteurs qui concourent au fait d’avoir ou non un enfant sachant les caractéristique des répondants : le diplôme de l’individu (diplôme inférieur au bac, niveau bac,diplôme supérieur au bac), son âge (AGE) et son âge au carré divisé par 100)

xi: probit enf i.dipl age age2

Effets marginaux

Matrice de variance covariance Utile pour faire certains tests d’égalité entre les coefficients des modalités d’une même variable par exemple

lsens: (graphique de sensibilité et de spécificité) lroc lsens: (graphique de sensibilité et de spécificité) estat gof: (pour tester la qualité de l’ajustement) Predict phat, pr : (prédiction de la probabilité p(y=1)) Predict xb, xb : (prédiction linéaire de log(p/(1-p))) Predict score, score

Modèles polytomiques univariés ordonnés Y a plusieurs modalités que l’on peut ordonner: Par exemple: le nombre d’enfants Les quartiles par exemple de revenu Etc,

Estimation sous STATA

Différence avec le modèle univarié dichotomique Estimation des seuils justifiant le changement d’état selon les caractéristiques observables Test de brant dans le cas d’un ologit Test de régression parallèle: brant listcoef, help (estimer les odds ratio) Si le test de regression parallèle est rejeté, on estime: un modèle polytomiques univariés ordonnés généralisé: Commande: gologit2

Modèle multinomial Tester l’hypothèse d’indépendance aux alternatives non pertinentes pour iia mfx, predict(outcome(1))