La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

APPLICATION Une régression logistique sous SAS à partir de données individuelles Commenter les résultats du modèle que vous aurez choisi. Comment peut-on.

Présentations similaires


Présentation au sujet: "APPLICATION Une régression logistique sous SAS à partir de données individuelles Commenter les résultats du modèle que vous aurez choisi. Comment peut-on."— Transcription de la présentation:

1 APPLICATION Une régression logistique sous SAS à partir de données individuelles Commenter les résultats du modèle que vous aurez choisi. Comment peut-on présenter de telles résultats ? Quelques exemples : PUIS Colloque Aveiro / accès aux communication/Séance 4 / Arnaud Regnier Loillier / p

2 Comment choisir les variables indépendantes ? Des hypothèses de travail fortes (observation, …) Une revue de la littérature necessaire Ne pas choisir de variables redondantes (Par exemple : diplôme et âge à la fin des études) MAIS ATTENTION A NE PAS MULTIPLIER LE NOMBRE DE VARIABLES EXPLICATIVES

3 Comment recoder les variables indépendantes ? On peut garder une variable quantitative dans sa forme quantitative mais la relation entre la proportion (P(Y = 1)) et la variable concernée X doit être croissant e ou décroissante de manière linéaire avec lévolution de la variable. Sinon recoder la variable X en classes : ne pas multiplier le nombre des classes. Eviter des classes avec des effectifs trop faibles Comment choisir les modalités de référence ? On retient le plus souvent la classe ou modalité qui a leffectif le plus important La « norme ». Plus simple ensuite pour commenter

4 Étape 1 : Etudier la distribution des différentes variables indépendantes Étape 2 : Choisir un découpage pour chacune des variables indépendantes Étape 3 : Etudier les corrélations entre les variables indépendantes (2 à 2) Chi-2 ou corrélation Étape 4 : Etudier la relation entre chacune des variables indépendantes et la variable dépendante Statistiques descriptives Étape 5 : Elaboration du modèle de regression final Les étapes dune régression logistique et ses préalables

5 APPLICATION Dans une population de femmes de moins de 25 ans au moment de lenquête on veut comprendre quels paramètres expliquent le fait davoir ou non au moins un enfant ? Quelle est la variable dépendante dun tel modèle ? Quelles sont les variables indépendantes que vous proposez ? (Hypothèse de travail)

6 APPLICATION Pour avoir des renseignements sur lenquête ERFI et les questions posées : Le questionnaire de lenquête :

7 Créer un Dossier « C:\MASTER1 » Enregistrer les deux fichiers Sas depuis la page Internet du cours vers le dossier « C:\MASTER1 » : TABLE / Programme « Lancer » le logiciel SAS Ouvrir le programme Les étapes dune régression logistique sous SAS

8 Quelques questions préalables Quel est leffectif de léchantillon étudié ? ouvrir la table et regarder le nombre de ligne Donner lexemple dune variable pour lesquelles les regroupements sont obligatoires. regarder les « formats » sous SAS qui permettent entre autre des regroupements Quels variables semblent liées entre elles ? Expliquer ? Lancer le programme jusquà la fin de létape 3-1 et regarder les résultats dans la fenêtre OUTPUT Quelles variables semblent le plus influencer la probabilité dêtre mère ? Lancer létape 3-2 du programme. Lire les output

9 A retenir Avant toute régression logistique, il est indispensable de réaliser : Des croisements entre les différentes variables pour juger des éventuelles situations de « colinéarités » Étape 3-1 du programme SAS. Ce quil est intéressant cest de lire la probabilité associée au Chi-2 pour savoir si la dépendance est significative et dautre part la valeur du « Phi-coefficient » pour juger de lintensité de la liaison. Des croisements entre la variable à expliquer (ici mère = 1 si la personne a eu un enfant et 0 sinon) et chacune des variables explicatives supposées entrer dans le modèle Étape 3-2 du programme SAS. Cest en effectuant cet étape que lon sest par exemple rendu compte que quasiment 100% des jeunes femmes encore scolarisées navait pas denfant comme celle dont les ressources sont inférieures à 499 euros. Nous avons donc dexclure ces personnes de létude des déterminants de la fécondité avant 25 ans. Ces variables sont « trop discriminantes ». Ces deux étapes sont des préalables à la construction du modèle logistique. Chaque groupe doit retenir entre 5 et 7 variables explicatives pour le modèle logistique à réaliser.

10 Programmation dune régression logistique sous SAS (données individuelles) proc logistic data =erfi.exo4 descending ; class ma_ager (ref='20 et 21 ans') MB_PROPRI(ref='hors HLM') NBFRSR(ref='moins de 3') MC_DIPLOME (ref='Baccalauréat ou plus') coupl_2 (ref='hors couple et sans relation stable')/ param=ref ; model mere = ma_ager MC_DIPLOME NBFRSR coupl_2 MB_PROPRI ; output out=b predicted=probest ; where MC_ETACTU = '2' and BC_FOUREVMEN ne '1'; weight poidsind /normalize ; format ma_ager age. MB_propri $MB_PROP. NBFRSR fratrie. MC_DIPLOME $MC_DIPL. coupl_2 $coupl. ; run ; LE MODELE RETENU DECLARATION DES MODALITES DE REFERENCES CREATION D UNE TABLE SORTIE AVEC LA PROBILITE ESTIMEE D ETRE MERE PAR LE MODELE : Rappel : cette probabilité variait suivant les groupes Exclut les étudiantes et celles gagnat moins de 500 euros/mois

11 Travail suivant On extrait ensuite de SAS les valeurs des paramètres ou les odds ratio associé pour construire soit : Un tableau des résultats (Cf. PDF sur le désir dun troisième enfant) Un graphique des probabilités de chacune des modalités (Cf. pdf sur la fréquence des visites chez son père et sa mère)


Télécharger ppt "APPLICATION Une régression logistique sous SAS à partir de données individuelles Commenter les résultats du modèle que vous aurez choisi. Comment peut-on."

Présentations similaires


Annonces Google