La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Séminaire organisé par lécole doctorale thématique PSYCEDUC et le GIRSEF Louvain-La-Neuve: 10-11 mars 2011 Lanalyse de données longitudinales: les modèles.

Présentations similaires


Présentation au sujet: "Séminaire organisé par lécole doctorale thématique PSYCEDUC et le GIRSEF Louvain-La-Neuve: 10-11 mars 2011 Lanalyse de données longitudinales: les modèles."— Transcription de la présentation:

1 Séminaire organisé par lécole doctorale thématique PSYCEDUC et le GIRSEF Louvain-La-Neuve: mars 2011 Lanalyse de données longitudinales: les modèles multiniveaux de croissance Pascal BRESSOUX Université Pierre-Mendès-France Grenoble Laboratoire des Sciences de lEducation

2 Bruxelles: De Boeck 2008 (2 e éd. Nov. 2010)

3 Analyses contextuelles et problèmes posés par les moindres carrés ordinaires

4 Données sur plusieurs « niveaux » : - Un effet-classe sur les acquis des élèves ? - Un effet-juge sur les condamnations des prévenus ? - Un effet-quartier sur la délinquance des jeunes ? - Un effet-pays sur les résultats des élèves à PISA ? - Etc. Souvent, structure hiérarchisée. Exemple : des élèves (niveau 1) dans des classes (niveau 2), etc. Modèles multiniveaux (ou modèles hiérarchiques linéaires) Nés des avancées des modèles de contexte et des modèles mixtes. But : étudier les effets de lenvironnement sur le « comportement » individuel. Principes de lanalyse multiniveau

5 Académie 1Académie 2 Ecole 1Ecole 2 Classe 1Classe 2 Ecole 3Ecole 4 Classe 3Classe 4 él. 1él. 2él. 3él. 4él. 5él. 6él. 7él. 8 Niveau 1 (élèves) Niveau 2 (classes) Niveau 3 (Ecoles) Niveau 4 (Académies) Exemple dune structure hiérarchisée à quatre niveaux … / …

6 Non-indépendance des résidus Agrégation vs désagrégation (voir aussi diapo suivante) Hétérogénéité des relations Effets aléatoires et effets fixes Problèmes posés par lanalyse de données hiérarchisées

7 Le modèle de régression par les MCO Droite de régression simple (sans distinction de classes) où i = individus (unités danalyse) et j = macro-unités (indistinctes)

8 ~ ~ Hypothèses sur les erreurs

9 Admettons maintenant quon y inclue une variable de niveau 2, quon nommera Z. Si lon raisonne sur les individus, on travaille sur des données désagrégées au niveau 1 (N = I): Estimation MCO des effets-classes (les gammas représentent des effets fixes) (N = I): Si lon raisonne sur les groupes, on travaille sur des données agrégées au niveau 2 (N = J):

10 Le modèle multiniveau

11 Au niveau 1 Au niveau 2 Equation complète Le modèle « vide » équivalant à une ANOVA avec effets aléatoires

12 Coefficient de corrélation intra-classe = mesure du degré de « ressemblance » des individus i qui appartiennent à une même macro unité j.

13 516 élèves dâge élémentaire appartenant à 24 classes. Acquis des élèves mesurés à laide dépreuves standardisées en début et en fin dannée scolaire dans la discipline du français. On cherche à savoir ce qui fait varier les acquis des élèves en cours dannée. Les scores dacquisitions des élèves ont été normalisés, centrés et réduits Un exemple : étude de la variance des acquis en français à lécole élémentaire

14 Modèle vide décomposant les parts de variance inter et intra- classes du score final en français ParamètresModèle 1 (vide) Effets fixes Constante0,007 (0,078) Effets aléatoires Variance inter-classes0,103 (0,042) Variance inter-élèves0,890 (0,057) –2 log V1434,071

15 Le modèle multiniveau à constantes aléatoires Les composants de la variance : Variance totale : Niveau 1 Niveau 2 Equation complète

16 N(0, ) ) ) Une matrice de variance-covariance des erreurs « bloc-diagonale »

17 Un exemple destimation avec constantes aléatoires Modèles expliquant le score final en français (données aménagement du temps scolaire ) ParamètresModèle 1Modèle 2 Effets fixes Constante0,007 (0,078) Score initial en français0,690 (0,031) Effets aléatoires Variance des constantes0,103 (0,042)0,096 (0,034) Variance inter-élèves0,890 (0,057)0,442 (0,028) –2 log L1434, ,083 N = 516 Le score initial (modèle 2) « nexplique » quasiment pas la variance des constantes (variance interclasses), mais il « explique » environ la moitié de la variance inter-élèves (intraclasse).

18 Le modèle multiniveau complet : constantes et pentes aléatoires Niveau 1 Niveau 2 Equation complète

19 Les composants de la variance : Variance de Y devient fonction quadratique de X

20 au niveau 2 ~ au niveau 1, e ij ~ N(0, ) Structure des erreurs

21 Un exemple destimation avec constantes et pentes aléatoires Modèles expliquant le score final en français (données aménagement du temps scolaire ) ParamètresModèle 1Modèle2Modèle 3 Effets fixes Constante0,007 (0,078) 0,008 (0,069) Score initial en français0,690 (0,031)0,690 (0,041) Effets aléatoires Niveau 2 (classes) : Variances des constantes 0,103 (0,042)0,096 (0,034)0,092 (0,033) Covariance constantes-pentes0,014 (0,014) Variance des pentes0,016 (0,011) Niveau 1 : variance inter-élèves0,890 (0,057)0,442 (0,028)0,441 (0,025) –2 log L1434, , ,525 N = 516

22 Calcul de la décroissance de la déviance avec 2 paramètres supplémentaires à estimer : D = 1084,083 – 1079,525 = 4,558 Pour atteindre p < 0,05, le Khi2 à 2 ddl devrait au moins être égal à 5,99. Il ny a donc pas dévidence ici que la relation entre le score initial et le score final varie en fonction des classes. Le tableau montre la covariance constantes-pentes. La corrélation (en fait, ici, elle nest pas significativement différente de 0) peut être calculée de la manière suivante :

23 En ce cas, le calcul de la décroissance de la déviance avec 1 paramètre supplémentaire à estimer : D = 1084,083 – 1080,548 = 3,54. On est proche alors du seuil de significativité (pour atteindre p 2,71 ; pour atteindre p 3,84). On peut contraindre la covariance constantes pentes à être nulle. Par rapport au modèle sans pentes aléatoires, il ny a alors quun seul paramètre supplémentaire à estimer. Exemple (mêmes données) : Variance des constantes = 0,094 (erreur-type = 0,033) Variance des pentes = 0,017 (erreur-type = 0,011) Variance de niveau 1 = 0,427 (erreur-type = 0,028) –2 log L = 1080,548

24 Un exemple destimation avec constantes et pentes aléatoires Modèles expliquant le score final en maths (données aménagement du temps scolaire ) ParamètresModèle 1Modèle2Modèle 3Modèle 4 Effets fixes Constante0,010 (0,072)0,003 (0,064)0,016 (0,064) Score initial en maths0,711 (0,031)0,713 (0,042) Effets aléatoires Niveau 2 (classes) : Variances des constantes 0,080 (0,036)0,077(0,028)0,077(0,029) Covariance constantes-pentes0,004 (0,013) Variance des pentes0,019 (0,012) Niveau 1 : variance inter-élèves0,920 (0,059)0,442 (0,028)0,425 (0,028) –2 log L1446, , , ,028 N = 516 (2 – 3) = 5,034 (pour 2 ddl) ; (2 – 4) = 4,962 (pour 1 ddl)

25 ATTENTION! Une question de méthode destimation : -Maximum de vraisemblance complet (ML ou FML) Ou -Maximum de vraisemblance restreint, ou résiduel (RML)

26 au niveau 1 au niveau 2 Equation complète Interaction inter-niveaux Ajoutons une variable Z de niveau 2

27 Le modèle multiniveau de croissance

28 x y y t t 1 t 2 t 3 Relation entre les scores initial et final pour un échantillon dindividus Relation entre le temps et les scores pour un individu donné

29 Classe 1 Elève 1Elève 2 mes. 1 Niveau 1 (Mesures) Niveau 2 (Elèves) Niveau 3 (Classes) Exemple dune structure hiérarchisée de croissance mes. 2mes. 3mes. 1mes. 2mes. 3 Classe 2 Elève 3Elève 4 … /…

30 Niveau 1 : Formalisation du modèle de croissance Niveau 2 : En intégrant dans une même équation : Rythme de croissance fonction aussi de Z Caractéristique qui varie avec le temps Caractéristique interindividuelle stable dans le temps Niveau initial moyen Rythme de croissance moyen Variance de Y fonction du temps (= gestion de lhétéroscédasticité des erreurs) Une mesure du déroulement du temps est nécessaire (âge, durée…)

31 Modèle très souple Fonctionne pour données non équilibrées (ne nécessite pas le même nombre de mesures par sujet) Fonctionne pour des mesures prises à différents moments et dont lespacement diffère (ne nécessite pas que tous les sujets soient mesurés au même moment). Permet de prendre en compte des environnements « macro » pour les individus: - classes, écoles, etc. pour les élèves - ateliers, usines, etc. pour les ouvriers - quartiers, villes, etc. pour les jeunes - Circonscription, canton, etc. pour les électeurs - Etc.

32 1 er exemple : Une étude empirique Lévolution des perceptions de soi dans le passage CM2-6 e Méthode Participants 62 élèves appartenant à 6 classes de CM2 en t1 et 9 classes de 6 e en t2 et t3 Matériel Echelle SPP de Harter traduite et validée par Nurra et Pansu (perceptions de soi, importance accordée aux domaines, soutien social perçu) Jugement des enseignants (score de 0 à 10 en français et en maths) Fiches de renseignements sociodémographiques (âge, sexe…)

33 Procédure Echelle SPP (perceptions de soi, importance aux domaines, soutien social perçu) passée à 3 temps. Jugement des enseignants (français + maths) récolté à 3 temps. T1: fin CM2 (mai 2005) T2 : début 6 e (octobre-novembre 2005) T3 : fin 6 e (mai 2006)

34 Quelques cas individuels de croissance Peut-on établir un modèle de tout cela?

35 Moyennes observées ,052,972,92 Evolution moyenne des perceptions de soi scolaires Une spécification linéaire semble adaptée : de toute façon, impossible de spécifier une fonction dordre plus élevé (seulement 3 points)

36 La structure des données peut être considérée comme complexe : Niveau 1 : mesures Niveau 2 : les élèves Niveau 3 : les classes de CM2 et de 6 e (structure aléatoire croisée). Variables intégrées dans le modèle : Variable TEMPS mesurée en nombre de mois (0, 6, 12) Des caractéristiques stables dans le temps (sexe, à lheure ou en avance) Des caractéristiques qui varient dans le temps (importance du domaine de lécole, jugement des enseignants, soutien des camarades)

37 Modèle à tester (différent de celui de Harter) Sentiment de compétence scolaire Soutien social perçu Jugement de lenseignant Etude de la croissance du sentiment de compétence scolaire

38 ParamètresModèle 1Modèle 2Modèle 3 Effets fixes Constante2,981 (0,074)*3,044 (0,076)*1,226 (0,298)* Temps–0,011 (0,005)*–0,073 (0,032)* Heure–0,074 (0,142) Avance0,159 (0,218) Garçon–0,065 (0,086) Soutien camarades0,035 (0,075) Jugement enseignant0,098 (0,010)* Importance de lEcole0,096 (0,044)* Temps × Soutien camarades 0,025 (0,010)* Effets aléatoires Niveau 2 : Constante Temps Cov constante*temps 0,306 (0,062)0,290 (0,060) 0,0005 (0,0003) 0,075 (0,024) 0,0000 (0,0002) Niveau 1 :0,108 (0,014)0,086 (0,014)0,099 (0,017) –2 log L (Full ML)252,93245,33171,34 Effets fixes : * p <.05

39 Epstein : Dans modèle hiérarchique de soi, les schémas de haut degré (e.g. lestime de soi) sont plus résistants aux changements que les conceptions dordre inférieur (e.g. la perception de soi dans des domaines spécifiques). Peut-on tester cette hypothèse ? Si hypothèse vraie, on devrait observer que la part de variance interindividuelle est plus forte pour lestime de soi que pour la perception de soi dans des domaines spécifiques. Certaines hypothèses pourraient facilement être testées avec les modèles multiniveaux de croissance

40 Estime de soi (Valeur propre) ScolaireConduiteApparencePhysiqueSocial Part de variance interindivid uelle (Rho) 64,9 %74,0 %69,9 %79,8 %67,1 %59,2 % Fonction de variance interindivid uelle nsTendance signif (p <.10) Augmente avec le temps nsSignif Augmente avec le temps ns Rythme de croissance moyen nssignificatif (décroît dans le temps) ns Lestime de soi mesurée avec léchelle de Rosenberg donne les valeurs suivantes : - Part de variance interindividuelle : Rho = 68,1 % - Fonction de variance interindividuelle : ns - Rythme de croissance : ns ATTENTION, il faudrait aussi tenir compte de la fidélité des mesures.

41 2 e exemple : Modèle de croissance des effets à long terme de la réduction des effectifs au CP Méthode Participants 100 classes expérimentales (8 à 12 élèves par classe dans les faits avec une moyenne égale à 10,45) 100 classes témoins (15 à 27 élèves par classe dans les faits avec une moyenne égale à 21,29). Toutes dans des milieux défavorisés (écoles en zone déducation prioritaire) Le Ministère de lEducation Nationale français a lancé en une expérimentation denvergure visant à réduire la taille des classes de CP (1 ère année élémentaire) à 10 élèves dans les zones défavorisées.

42 Les élèves ont été suivis jusquà la fin de la 2 e année élémentaire (en fait jusquau début de la 3 e année mais les scores ne peuvent pas être mis sur la même échelle que les scores précédents). Leurs acquisitions en français-lecture ont été testées 5 fois (avec items dancrage). -Début, milieu et fin CP -Début et fin CE1 (Dans les écoles témoins, ces évaluations nont porté que sur 10 élèves choisis aléatoirement.) Modèles de réponse à litem ont permis de mettre tous les scores sur une même échelle de mesure.

43 Structure des données : Niveau 1 : mesures (N t = 5433) Niveau 2 : les élèves (N i = 1163) Niveau 3 : les écoles (N j = 69) Variables intégrées dans le modèle : Variable TEMPS mesurée en nombre de mois (0, 5, 8, 12, 20) Des caractéristiques stables dans le temps (origine sociale, sexe) Des caractéristiques de niveau supérieur (ancienneté enseignant, expérimentation) 1163 élèves retenus pour les analyses (i.e. ceux qui étaient présents à la première et à la dernière évaluation).

44 Figure 1 : Evolution des résultats bruts

45 Variable d'analyse : score_francais N time Obs N Moyenne Ecart-type Minimum Maximum ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ

46 Figure 2 : Evolution des résultats bruts en fonction du groupe expérimental

47 Quelle spécification adopter? Une spécification cubique?

48 Figure 3 : Spécification cubique des résultats (sans variables de contrôle)

49 Finalement, choix pour une spécification piecewise avec deux ruptures de pente

50 ParamètresModèle 1 (inconditionnel = « vide ») Modèle 2 (inconditionnel de croissance) Effets fixes Constante0,379 (0,047)***-0,147 (0,049)** Temps 0,170 (0,002)*** (Temps – 8)*post-CP (Temps – 12)*CE1 Effets aléatoires Variance inter-écoles (niveau 3) Variance constantes Covariance Constantes/temps Variance temps 0,090 (0,027)*** 0,094 (0,027)*** Variance inter-élèves (niveau 2) Variance constantes Covariance Constantes/temps Variance temps 0,335 (0,037)*** 0,703 (0,035)*** Variance intra-élèves (niveau 1)2,370 (0,051)***0,610 (0,013)*** –2 log L (déviance)20760, ,46 N t = 5433 (mesures) N i = 1163 (élèves) N j = 69 (écoles) Modèle 2 inconditionnel de croissance : Variance totale = 0, , ,610 = 1,407 Variance inter-écoles = 0,094/1,407 = 0,0688 (6,88 % de la variance totale) Variance inter-élèves = 0,703/1,407 = 0,4996 (49,96 % de la variance totale) Variance intra-élèves = 0,610/1,407 = 0,4336 (43,36 % de la variance totale)

51 ParamètresModèle 3Modèle 4 Effets fixes Constante-0,684 (0,049)***-0,683 (0,056)*** Temps0,323 (0,003)***0,323 (0,004)*** (Temps – 8)*post-CP-0,304 (0,009)***-0,305 (0,007)*** (Temps – 12)*CE10,097 (0,009)***0,098 (0,008)*** Effets aléatoires Variance inter-écoles (niveau 3) Variance constantes Covariance Constantes/temps Variance temps 0,090 (0,026)*** 0,144 (0,037)*** -0,0052 (0,0017)** 0,0005 (0,0001)*** Variance inter-élèves (niveau 2) Variance constantes Covariance Constantes/temps Variance temps 0,749 (0,036)*** 0,791 (0,041)*** -0,0062 (0,0016)*** 0,0011 (0,0001)*** Variance intra-élèves (niveau 1)0,379 (0,013)***0,282 (0,007)*** –2 log L (déviance)12907, ,15 N t = 5433 (mesures) N i = 1163 (élèves) N j = 69 (écoles) Modèle 3 : Variance totale = 0, , ,379 = 1,218 Variance inter-écoles = 0,090/1,218 = 0,0739 (7,39 % de la variance totale) Variance inter-élèves = 0,749/1,218 = 0,6149 (61,49 % de la variance totale) Variance intra-élèves = 0,379/1,218 = 0,3112 (31,12 % de la variance totale)

52 ParamètresModèle 5 Effets fixes Constante-0,361 (0,141)* Temps0,297 (0,007)*** (Temps – 8)*post-CP-0,243 (0,014)*** (Temps – 12)*CE10,067 (0,014)*** Profession du père (référence = cadre sup.) Agriculteur/artisan-0,399 (0,175)* Prof. intermédiaire-0,1575 (0,151) Employé-0,319 (0,143)* Ouvrier-0,556 (0,127)*** Autre-0,602 (0,128)*** Fille0,240 (0,053)*** CP réduit0,023 (0,097) ns Ancienneté CP0,006 (0,006) ns Temps*CP réduit0,0295 (0,0075)*** (Temps – 8)*post-CP*CP réduit-0,0641 (0,0154)*** (Temps – 12)*CE1*CP réduit0,0225 (0,0158) ns Temps*Ancienneté CP0,0019 (0,0005)*** (Temps – 8)*post-CP*Ancienneté CP-0,0050 (0,0011)*** (Temps – 12)*CE1*Ancienneté CP0,0034 (0,0011)** Effets aléatoires Variance inter-écoles (niveau 3) Variance constantes Covariance Constantes/temps Variance temps 0,140 (0,037)*** -0,0054 (0,0017)** 0,0005 (0,0001)*** Variance inter-élèves (niveau 2) Variance constantes Covariance Constantes/temps Variance temps 0,751 (0,039)*** -0,0065 (0,0015)*** 0,0011 (0,0001)*** Variance intra-élèves (niveau 1)0,277 (0,007)*** –2 log L (déviance)12353,10

53 Figure 4 : Evolution des scores de français selon le groupe expérimental ou contrôle (la figure est tirée du modèle 5)

54 Pour explorer dautres possibilités de ce genre de modèles

55 Figure 5 : Evolution des scores de français selon la catégorie socioprofessionnelle du père Les pentes sont parallèles pendant les périodes de scolarisation. Les défavorisés « perdent » par rapport aux favorisés durant la période de vacances.

56 Figure 6 : Evolution de leffet de lancienneté sur les score de français

57 MERCI POUR VOTRE ATTENTION

58 … « Qui sassemble se ressemble » - Destin commun (partage dun même environnement) - interactions (influence mutuelle) « Qui se ressemble sassemble »… - Eventuelle sélection par les écoles - Eventuel choix des parents - Ségrégation spatiale en cas de carte scolaire « Similarité » des individus au sein des contextes

59 Illustration du biais dagrégation (Cf. observations classes DEP 95 : Relation entre jugement des enseignants et scores des élèves) Corrélation (toutes classes confondues) = 0,28 (p = 0,003). Corrélation inter-classes = –0,77 (p = 0,002). Corrélation médiane intra-classes = 0,73. Approche par la régression :

60 Lestimation de la part de variance inter-groupes Simulation…

61 GroupeNombres aléatoiresMoyenneEcart-type Total ρ = 0,059 (Proc ANOVA). Donc, part de variance inter-groupes = 5,9 % Données issues de tables de nombres aléatoires, groupées dans des macro- unités (extrait de Wonnacott & Wonnacott, 1991, p. 867)

62 Droites de régression avec constantes aléatoires

63 Droites de régression avec constantes et pentes aléatoires

64 Fonction de la variance interindividuelle de la perception de soi scolaire

65 Effet du soutien des camarades sur le sentiment de compétence scolaire (Soutien faible = M – 1s ; soutien moyen = M ; soutien fort = M + 1s)


Télécharger ppt "Séminaire organisé par lécole doctorale thématique PSYCEDUC et le GIRSEF Louvain-La-Neuve: 10-11 mars 2011 Lanalyse de données longitudinales: les modèles."

Présentations similaires


Annonces Google