La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Le traitement des données manquantes dans les enquêtes à grande é chelle Michel Rousseau, PhD Directeur de lévaluation VDPDPC.

Présentations similaires


Présentation au sujet: "Le traitement des données manquantes dans les enquêtes à grande é chelle Michel Rousseau, PhD Directeur de lévaluation VDPDPC."— Transcription de la présentation:

1 Le traitement des données manquantes dans les enquêtes à grande é chelle Michel Rousseau, PhD Directeur de lévaluation VDPDPC

2 2 Plan de la présentation Typologie Prévention Diagnostic Traitement Publication

3 3 Typologie Définition: Une donnée est considérée comme étant manquante si aucune information nest observée alors quil serait logique dy avoir une information. Problème: La plupart des méthodes danalyse statistique ont été développées pour traiter des matrices de données complètes

4 4 Typologie MAHMHNMH SujetÉlève est malade le jour du test Élève plus faible en math. ne se présente pas au test de math. OccasionÉlève est malade T2 de létude Élève ayant eu un faible score au T1 est absent au T2 ValeurÉlève oublie de répondre à un item Les garçons vont plus souvent oublier de répondre à un item

5 5 Prévention Population visée Niveau de langage Nature des informations demandées Outils de mesure Longueur des questionnaires Mise en page Procédures de correction et de saisie Facteurs humains Procédures informatisées

6 6 Diagnostic Calcul de la proportion de données manquantes Taux de participation Calcul par individu/variable Identification de la raison et du mécanisme Méthode de Little (1988)

7 7 Traitement Exemple pour illustrer les méthodes VariableMoyenneÉcart-type Coefficient de régression non- standardisé (B) Erreur-type du coefficient B Intercept514,464,65 science526,1289,31 envir0,1541,0027,655,06 plaisir0,1031,1422,274,43 ses0,2010,8225,385,77

8 8 Traitement Méthodes des cas complets – listwise deletion VariableMoyenneÉcart-type Coefficient de régression non- standardisé (B) Erreur-type du coefficient B Intercept516,217,91 envir0,3830,9223,727,70 plaisir-0,1751,0527,056,77 ses0,3560,7924,729,65

9 9 Traitement Méthodes des cas complets – pairwise deletion Variable Coefficient de régression non- standardisé (B) Erreur-type du coefficient B Intercept510,077,06 envir24,526,64 plaisir24,855,96 ses30,937,60

10 10 Traitement Méthodes dimputation Explicite Méthodes intersujets Méthodes intrasujets Méthodes inter et intra Implicite Méthodes Hot-deck et Cold-Deck

11 11 Traitement Méthodes dimputation – Moyenne de la variable VariableMoyenneÉcart-type Coefficient de régression non- standardisé (B) Erreur-type du coefficient B Intercept509,005,99 envir0,3830,8425,515,93 plaisir-0,1750,9527,005,29 ses0,3560,7233,926,89

12 12 Traitement Méthodes dimputation – Régression VariableMoyenneÉcart-type Coefficient de régression non- standardisé (B) Erreur-type du coefficient B Intercept510,745,51 envir0,3400,9026,405,45 plaisir-1,4711,0526,434,70 ses0,3590,7828,676, 15

13 13 Traitement Imputation multiple

14 14 Traitement Moyenne des coefficients de régression 12345Moyenne B 0 – Intercept510,35511,23512,80511,98511,35511,54 B 1 – envir26,9227,9023,8728,8826,4126,80 B 2 – plaisir24,2727,5625,2626,2624,9025,65 B 3 – ses26,1326,6628,1829,8027,9427,74

15 15 Traitement Variation intra-imputation Variance intra- imputation B 0 – Intercept 5,44 5,31 5,24 5,37 5,355,34 B 1 – envir5,30 4,965,30 5,14 5,275,19 B 2 – plaisir 4,77 4,67 4,87 4,78 4,734,76 B 3 – ses 5,90 6,07 5,99 6,10 6,306,07

16 16 Traitement Variation inter-imputation Variance inter- imputation B 0 – Intercept-1,19-0,311,260,44-0,190,83 B 1 – envir0,121,10-2,932,08-0,393,57 B 2 – plaisir -1,381,91-0,390,61-0,751,66 B 3 – ses -1,61-1,080,442,060,202,06

17 17 Traitement Imputation multiple Variable Coefficient de régression non- standardisé (B) Erreur-type du coefficient B Intercept511,546,34 envir26,809,47 plaisir25,656,75 ses27,748,54

18 18 Publication Reconnaître le problème Identifier les DM selon le type Présenter le % de DM pour chaque type Discuter les causes des DM Présenter la méthode de traitement utilisée Discuter des impacts de la méthode de traitement


Télécharger ppt "Le traitement des données manquantes dans les enquêtes à grande é chelle Michel Rousseau, PhD Directeur de lévaluation VDPDPC."

Présentations similaires


Annonces Google