1
Problèmes d‘Endogénéité dans les Estimations Multi-Niveaux des Inégalités Scolaires. Tarek MOSTAFA
Les données PISA 2003. Les données PISA de l’OCDE: 40 Pays, 5000 observations par pays. Données internationales comparables. L’échantillon est sélectionné en fonction de l’âge (15 à 16 ans). Evaluation du savoir (à cet âge) et non pas de la maitrise d’un sujet particulier. Richesse des données. Structure en deux niveaux (étudiant, école). En 2003, Domaine d’évaluation: Mathématiques. 3
Les données manquantes: Types de manque: Manque aléatoire. Manque non-aléatoire. Manque monotone. Solutions: Suppression des observations qui contiennent des données manquantes. Suppression de variables. Traitement des valeurs manquantes comme une modalité (variables catégoriques). Imputation ‘Hot Deck’. Imputation par les moyennes. Imputation par les régressions. Imputations multiples.
Les variables. Trois catégories de variables: Variables individuelles. Effets des pairs (agrégation des Variables individuelles au niveau de l’école). Variables pures des écoles (Proxis du financement, environnement scolaire, etc.). Choix selon la théorie économique de stratification ainsi que les études empiriques.
Modèles multi-niveaux. Le modèle général. Avec: et Après développement:
Problèmes d’endogénéité. Modèle 1: le modèle est estimé sans effets de pairs. Modèle 2: le modèle est estimé sans les caractéristiques de l’école. Modèle 3: estimation du modèle complet avec effets des pairs linéaires. Modèle 4: estimation du modèle complet avec effets des pairs non linéaires (introduction de la variance du statut social des étudiant). Les 4 modèles sont estimé après une transformation selon Mundlak.
L’approche Mundlak.
Identification et estimation. On régresse sur pour obtenir les Betas et les composantes de la variance. On régresse sur et pour obtenir . On calcul les lambdas et leur moyenne puis les deltas. On déduit la valeur de .
Les pays. La Finlande. Le Royaume Uni. L’Allemagne.
Comparaisons entre modèles. Le test d’Hausman: Modèle 1 a échoué le test, modèles 2, 3 et 4 ont passé le test. Le niveau du biais est différent selon les pays. Les résultats du modèle 1 sont surestimés, certains coefficients dans le modèle 2 sont inconsistants. Les résultats du rapport de l’OCDE PISA 2003 sont surestimés.
Résultats OCDE vs. Multi-niveaux. Variables Germany Finland UK Coefficient ESCS 17 33 31 INTMAT 10.2 30.5 13.6 DESCS 90 -2 58 DDISCL 18.6 10.4 24.7 Teacbeha -3.4 1.7 20.3 Scmatedu 11 0.2 13 Tcmorale 7.4 5 13.4 Private -66 -87 Private after controlling for ESCS and DESCS 14 16 1 Variables Germany Finland UK Coefficient ESCS 11,61 26,85 23,26 INTMAT 4,69 14,51 -1,16 DESCS 61,16 2,82 41,64 DDISCL 25,27 -0,43 10,08 Teacbeha -4,3 -1,47 -2,22 Scmatedu -0,07 0,08 2,34 Tcmorale 0,04 1,76 -1,61 Private -12,56 -18,37 22,75
Merci pour votre attention Institute of Education University of London 20 Bedford Way London WC1H 0AL Tel +44 (0)20 7612 6000 Fax +44 (0)20 7612 6126 Email info@ioe.ac.uk Web www.ioe.ac.uk 13