Séminaire organisé par l’école doctorale thématique PSYCEDUC et le GIRSEF Louvain-La-Neuve: 10-11 mars 2011 L’analyse de données longitudinales: les modèles.

Séminaire organisé par l’école doctorale thématique PSYCEDUC et le GIRSEF Louvain-La-Neuve: mars 2011 L’analyse de données longitudinales: les modèles multiniveaux de croissance Pascal BRESSOUX Université Pierre-Mendès-France Grenoble Laboratoire des Sciences de l’Education

Bruxelles: De Boeck 2008 (2e éd. Nov. 2010)

Analyses contextuelles et problèmes posés par les moindres carrés ordinaires

Principes de l’analyse multiniveau
Modèles multiniveaux (ou modèles hiérarchiques linéaires) Nés des avancées des modèles de contexte et des modèles mixtes. But : étudier les effets de l’environnement sur le « comportement » individuel. Données sur plusieurs « niveaux » : - Un effet-classe sur les acquis des élèves ? - Un effet-juge sur les condamnations des prévenus ? - Un effet-quartier sur la délinquance des jeunes ? - Un effet-pays sur les résultats des élèves à PISA ? - Etc. Souvent, structure hiérarchisée. Exemple : des élèves (niveau 1) dans des classes (niveau 2), etc.

Exemple d’une structure hiérarchisée à quatre niveaux
Académie 1 Académie 2 Niveau 4 (Académies) Ecole 1 Ecole 2 Ecole 3 Ecole 4 Niveau 3 (Ecoles) … / … Classe 1 Classe 2 Classe 3 Classe 4 Niveau 2 (classes) él. 1 él. 2 él. 3 él. 4 él. 5 él. 6 él. 7 él. 8 Niveau 1 (élèves)

Problèmes posés par l’analyse de données hiérarchisées
Non-indépendance des résidus Agrégation vs désagrégation (voir aussi diapo suivante) Effets aléatoires et effets fixes Hétérogénéité des relations

Droite de régression simple (sans distinction de classes)
Le modèle de régression par les MCO où i = individus (unités d’analyse) et j = macro-unités (indistinctes) Droite de régression simple (sans distinction de classes)

Hypothèses sur les erreurs
~ ~

Admettons maintenant qu’on y inclue une variable de niveau 2, qu’on nommera Z.
Si l’on raisonne sur les individus, on travaille sur des données désagrégées au niveau 1 (N = I): Si l’on raisonne sur les groupes, on travaille sur des données agrégées au niveau 2 (N = J): Estimation MCO des effets-classes (les gammas représentent des effets fixes) (N = I):

Le modèle multiniveau

Le modèle « vide » équivalant à une ANOVA avec effets aléatoires
Au niveau 1 Au niveau 2 Equation complète

Coefficient de corrélation intra-classe
= mesure du degré de « ressemblance » des individus i qui appartiennent à une même macro unité j.

Un exemple : étude de la variance des acquis en français à l’école élémentaire
516 élèves d’âge élémentaire appartenant à 24 classes. Acquis des élèves mesurés à l’aide d’épreuves standardisées en début et en fin d’année scolaire dans la discipline du français. On cherche à savoir ce qui fait varier les acquis des élèves en cours d’année. Les scores d’acquisitions des élèves ont été normalisés, centrés et réduits

Modèle vide décomposant les parts de variance inter et intra-classes du score final en français
Paramètres Modèle 1 (vide) Effets fixes Constante 0,007 (0,078) Effets aléatoires Variance inter-classes 0,103 (0,042) Variance inter-élèves 0,890 (0,057) –2 log V 1434,071

Le modèle multiniveau à constantes aléatoires
Equation complète Les composants de la variance : Variance totale :

Une matrice de variance-covariance des erreurs « bloc-diagonale »
)  N(0, ) Une matrice de variance-covariance des erreurs « bloc-diagonale » )

Un exemple d’estimation avec constantes aléatoires
Modèles expliquant le score final en français (données aménagement du temps scolaire ) Paramètres Modèle 1 Modèle 2 Effets fixes Constante 0,007 (0,078) Score initial en français 0,690 (0,031) Effets aléatoires Variance des constantes 0,103 (0,042) 0,096 (0,034) Variance inter-élèves 0,890 (0,057) 0,442 (0,028) –2 log L 1434,071 1084,083 N = 516 Le score initial (modèle 2) « n’explique » quasiment pas la variance des constantes (variance interclasses), mais il « explique » environ la moitié de la variance inter-élèves (intraclasse).

Le modèle multiniveau complet : constantes et pentes aléatoires
Equation complète

Les composants de la variance :
Variance de Y devient fonction quadratique de X

Structure des erreurs au niveau 2 ~ au niveau 1, eij ~ N(0, )

Un exemple d’estimation avec constantes et pentes aléatoires
Modèles expliquant le score final en français (données aménagement du temps scolaire ) Paramètres Modèle 1 Modèle2 Modèle 3 Effets fixes Constante 0,007 (0,078) 0,008 (0,069) Score initial en français 0,690 (0,031) 0,690 (0,041) Effets aléatoires Niveau 2 (classes) : Variances des constantes 0,103 (0,042) 0,096 (0,034) 0,092 (0,033) Covariance constantes-pentes 0,014 (0,014) Variance des pentes 0,016 (0,011) Niveau 1 : variance inter-élèves 0,890 (0,057) 0,442 (0,028) 0,441 (0,025) –2 log L 1434,071 1084,083 1079,525 N = 516

Calcul de la décroissance de la déviance avec 2 paramètres supplémentaires à estimer :
Pour atteindre p < 0,05, le Khi2 à 2 ddl devrait au moins être égal à 5,99. Il n’y a donc pas d’évidence ici que la relation entre le score initial et le score final varie en fonction des classes. Le tableau montre la covariance constantes-pentes. La corrélation (en fait, ici, elle n’est pas significativement différente de 0) peut être calculée de la manière suivante :

On peut contraindre la covariance constantes pentes à être nulle
On peut contraindre la covariance constantes pentes à être nulle. Par rapport au modèle sans pentes aléatoires, il n’y a alors qu’un seul paramètre supplémentaire à estimer. Exemple (mêmes données) : Variance des constantes = 0,094 (erreur-type = 0,033) Variance des pentes = 0,017 (erreur-type = 0,011) Variance de niveau 1 = 0,427 (erreur-type = 0,028) –2 log L = 1080,548 En ce cas, le calcul de la décroissance de la déviance avec 1 paramètre supplémentaire à estimer : D = 1084,083 – 1080,548 = 3,54. On est proche alors du seuil de significativité (pour atteindre p < 0,10 ; Khi2 à 1 ddl > 2,71 ; pour atteindre p < 0,05 ; le Khi2 à 1 ddl > 3,84).

∆(2 – 3) = 5,034 (pour 2 ddl) ; ∆(2 – 4) = 4,962 (pour 1 ddl)
Un exemple d’estimation avec constantes et pentes aléatoires Modèles expliquant le score final en maths (données aménagement du temps scolaire ) Paramètres Modèle 1 Modèle2 Modèle 3 Modèle 4 Effets fixes Constante 0,010 (0,072) 0,003 (0,064) 0,016 (0,064) Score initial en maths 0,711 (0,031) 0,713 (0,042) Effets aléatoires Niveau 2 (classes) : Variances des constantes 0,080 (0,036) 0,077(0,028) 0,077(0,029) Covariance constantes-pentes 0,004 (0,013) Variance des pentes 0,019 (0,012) Niveau 1 : variance inter-élèves 0,920 (0,059) 0,442 (0,028) 0,425 (0,028) –2 log L 1446,170 10079,990 10074,956 10075,028 N = 516 ∆(2 – 3) = 5,034 (pour 2 ddl) ; ∆(2 – 4) = 4,962 (pour 1 ddl)

ATTENTION! Une question de méthode d’estimation :
Maximum de vraisemblance complet (ML ou FML) Ou Maximum de vraisemblance restreint, ou résiduel (RML)

Interaction inter-niveaux
Ajoutons une variable Z de niveau 2 au niveau 1 au niveau 2 Interaction inter-niveaux Equation complète

Le modèle multiniveau de croissance

Relation entre le temps et les scores pour un individu donné
Relation entre les scores initial et final pour un échantillon d’individus y             x Relation entre le temps et les scores pour un individu donné y  t t t3 t

Exemple d’une structure hiérarchisée de croissance
Classe 1 Classe 2 Niveau 3 (Classes) Elève 1 Elève 2 Elève 3 Elève 4 Niveau 2 (Elèves) … /… mes. 1 mes. 2 mes. 3 mes. 1 mes. 2 mes. 3 Niveau 1 (Mesures)

Formalisation du modèle de croissance
Une mesure du déroulement du temps est nécessaire (âge, durée…) Formalisation du modèle de croissance Niveau 1 : Niveau initial moyen Niveau 2 : Caractéristique qui varie avec le temps Caractéristique interindividuelle stable dans le temps Rythme de croissance moyen En intégrant dans une même équation : Rythme de croissance fonction aussi de Z Variance de Y fonction du temps (= gestion de l’hétéroscédasticité des erreurs)

Modèle très souple Fonctionne pour données non équilibrées (ne nécessite pas le même nombre de mesures par sujet) Fonctionne pour des mesures prises à différents moments et dont l’espacement diffère (ne nécessite pas que tous les sujets soient mesurés au même moment). Permet de prendre en compte des environnements « macro » pour les individus: classes, écoles, etc. pour les élèves ateliers, usines, etc. pour les ouvriers quartiers, villes, etc. pour les jeunes Circonscription, canton, etc. pour les électeurs Etc.

1er exemple : Une étude empirique
L’évolution des perceptions de soi dans le passage CM2-6e Méthode Participants 62 élèves appartenant à 6 classes de CM2 en t1 et 9 classes de 6e en t2 et t3 Matériel Echelle SPP de Harter traduite et validée par Nurra et Pansu (perceptions de soi, importance accordée aux domaines, soutien social perçu) Jugement des enseignants (score de 0 à 10 en français et en maths) Fiches de renseignements sociodémographiques (âge, sexe…)

Procédure Echelle SPP (perceptions de soi, importance aux domaines, soutien social perçu) passée à 3 temps. Jugement des enseignants (français + maths) récolté à 3 temps. T1: fin CM2 (mai 2005) T2 : début 6e (octobre-novembre 2005) T3 : fin 6e (mai 2006)

Peut-on établir un modèle de tout cela?
Quelques cas individuels de croissance Peut-on établir un modèle de tout cela?

Evolution moyenne des perceptions de soi scolaires
Moyennes observées 6 12 3,05 2,97 2,92 Une spécification linéaire semble adaptée : de toute façon, impossible de spécifier une fonction d’ordre plus élevé (seulement 3 points) Evolution moyenne des perceptions de soi scolaires

La structure des données peut être considérée comme complexe :
Niveau 1 : mesures Niveau 2 : les élèves Niveau 3 : les classes de CM2 et de 6e (structure aléatoire croisée). Variables intégrées dans le modèle : Variable TEMPS mesurée en nombre de mois (0, 6, 12) Des caractéristiques stables dans le temps (sexe, à l’heure ou en avance) Des caractéristiques qui varient dans le temps (importance du domaine de l’école, jugement des enseignants, soutien des camarades)

Etude de la croissance du sentiment de compétence scolaire
Modèle à tester (différent de celui de Harter) Jugement de l’enseignant Sentiment de compétence scolaire Soutien social perçu

Paramètres Modèle 1 Modèle 2 Modèle 3 Effets fixes Constante 2,981 (0,074)* 3,044 (0,076)* 1,226 (0,298)* Temps –0,011 (0,005)* –0,073 (0,032)* Heure –0,074 (0,142) Avance 0,159 (0,218) Garçon –0,065 (0,086) Soutien camarades 0,035 (0,075) Jugement enseignant 0,098 (0,010)* Importance de l’Ecole 0,096 (0,044)* Temps × Soutien camarades 0,025 (0,010)* Effets aléatoires Niveau 2 : Cov constante*temps 0,306 (0,062) 0,290 (0,060) 0,0005 (0,0003) 0,075 (0,024) 0,0000 (0,0002) Niveau 1 : 0,108 (0,014) 0,086 (0,014) 0,099 (0,017) –2 log L (Full ML) 252,93 245,33 171,34 Effets fixes : * p < .05

Certaines hypothèses pourraient facilement être testées avec les modèles multiniveaux de croissance
Epstein : Dans modèle hiérarchique de soi, les schémas de haut degré (e.g. l’estime de soi) sont plus résistants aux changements que les conceptions d’ordre inférieur (e.g. la perception de soi dans des domaines spécifiques). Peut-on tester cette hypothèse ? Si hypothèse vraie, on devrait observer que la part de variance interindividuelle est plus forte pour l’estime de soi que pour la perception de soi dans des domaines spécifiques.

Estime de soi (Valeur propre)
Scolaire Conduite Apparence Physique Social Part de variance interindividuelle (Rho) 64,9 % 74,0 % 69,9 % 79,8 % 67,1 % 59,2 % Fonction de variance interindividuelle ns Tendance signif (p < .10) Augmente avec le temps Signif Rythme de croissance moyen significatif (décroît dans le temps) L’estime de soi mesurée avec l’échelle de Rosenberg donne les valeurs suivantes : Part de variance interindividuelle : Rho = 68,1 % Fonction de variance interindividuelle : ns Rythme de croissance : ns ATTENTION, il faudrait aussi tenir compte de la fidélité des mesures.

2e exemple : Modèle de croissance des effets à long terme de la réduction des effectifs au CP
Le Ministère de l’Education Nationale français a lancé en une expérimentation d’envergure visant à réduire la taille des classes de CP (1ère année élémentaire) à 10 élèves dans les zones défavorisées. Méthode Participants 100 classes expérimentales (8 à 12 élèves par classe dans les faits avec une moyenne égale à 10,45) 100 classes témoins (15 à 27 élèves par classe dans les faits avec une moyenne égale à 21,29). Toutes dans des milieux défavorisés (écoles en zone d’éducation prioritaire)

Les élèves ont été suivis jusqu’à la fin de la 2e année élémentaire (en fait jusqu’au début de la 3e année mais les scores ne peuvent pas être mis sur la même échelle que les scores précédents). (Dans les écoles témoins, ces évaluations n’ont porté que sur 10 élèves choisis aléatoirement.) Leurs acquisitions en français-lecture ont été testées 5 fois (avec items d’ancrage). Début, milieu et fin CP Début et fin CE1 Modèles de réponse à l’item ont permis de mettre tous les scores sur une même échelle de mesure.

1163 élèves retenus pour les analyses (i. e
1163 élèves retenus pour les analyses (i.e. ceux qui étaient présents à la première et à la dernière évaluation). Structure des données : Niveau 1 : mesures (Nt = 5433) Niveau 2 : les élèves (Ni = 1163) Niveau 3 : les écoles (Nj = 69) Variables intégrées dans le modèle : Variable TEMPS mesurée en nombre de mois (0, 5, 8, 12, 20) Des caractéristiques stables dans le temps (origine sociale, sexe) Des caractéristiques de niveau supérieur (ancienneté enseignant, expérimentation)

Figure 1 : Evolution des résultats bruts

Variable d'analyse : score_francais N
N time Obs N Moyenne Ecart-type Minimum Maximum ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ

Figure 2 : Evolution des résultats bruts en fonction du groupe expérimental

Quelle spécification adopter? Une spécification cubique?

Figure 3 : Spécification cubique des résultats (sans variables de contrôle)

Finalement, choix pour une spécification piecewise avec deux ruptures de pente

Modèle 2 inconditionnel de croissance :
Variance totale = 0, , ,610 = 1,407 Variance inter-écoles = 0,094/1,407 = 0,0688 (6,88 % de la variance totale) Variance inter-élèves = 0,703/1,407 = 0,4996 (49,96 % de la variance totale) Variance intra-élèves = 0,610/1,407 = 0,4336 (43,36 % de la variance totale) Paramètres Modèle 1 (inconditionnel = « vide ») Modèle 2 (inconditionnel de croissance) Effets fixes Constante 0,379 (0,047)*** -0,147 (0,049)** Temps 0,170 (0,002)*** (Temps – 8)*post-CP (Temps – 12)*CE1 Effets aléatoires Variance inter-écoles (niveau 3) Variance constantes Covariance Constantes/temps Variance temps 0,090 (0,027)*** 0,094 (0,027)*** Variance inter-élèves (niveau 2) 0,335 (0,037)*** 0,703 (0,035)*** Variance intra-élèves (niveau 1) 2,370 (0,051)*** 0,610 (0,013)*** –2 log L (déviance) 20760,97 14951,46 Nt = 5433 (mesures) Ni = 1163 (élèves) Nj = 69 (écoles)

Modèle 3 : Variance totale = 0,090 + 0,749 + 0,379 = 1,218
Variance inter-écoles = 0,090/1,218 = 0,0739 (7,39 % de la variance totale) Variance inter-élèves = 0,749/1,218 = 0,6149 (61,49 % de la variance totale) Variance intra-élèves = 0,379/1,218 = 0,3112 (31,12 % de la variance totale) Paramètres Modèle 3 Modèle 4 Effets fixes Constante -0,684 (0,049)*** -0,683 (0,056)*** Temps 0,323 (0,003)*** 0,323 (0,004)*** (Temps – 8)*post-CP -0,304 (0,009)*** -0,305 (0,007)*** (Temps – 12)*CE1 0,097 (0,009)*** 0,098 (0,008)*** Effets aléatoires Variance inter-écoles (niveau 3) Variance constantes Covariance Constantes/temps Variance temps 0,090 (0,026)*** 0,144 (0,037)*** -0,0052 (0,0017)** 0,0005 (0,0001)*** Variance inter-élèves (niveau 2) 0,749 (0,036)*** 0,791 (0,041)*** -0,0062 (0,0016)*** 0,0011 (0,0001)*** Variance intra-élèves (niveau 1) 0,379 (0,013)*** 0,282 (0,007)*** –2 log L (déviance) 12907,32 12468,15 Nt = 5433 (mesures) Ni = 1163 (élèves) Nj = 69 (écoles)

Paramètres Modèle 5 Effets fixes Constante -0,361 (0,141)* Temps 0,297 (0,007)*** (Temps – 8)*post-CP -0,243 (0,014)*** (Temps – 12)*CE1 0,067 (0,014)*** Profession du père (référence = cadre sup.) Agriculteur/artisan -0,399 (0,175)* Prof. intermédiaire -0,1575 (0,151) Employé -0,319 (0,143)* Ouvrier -0,556 (0,127)*** Autre -0,602 (0,128)*** Fille 0,240 (0,053)*** CP réduit 0,023 (0,097) ns Ancienneté CP 0,006 (0,006) ns Temps*CP réduit 0,0295 (0,0075)*** (Temps – 8)*post-CP*CP réduit -0,0641 (0,0154)*** (Temps – 12)*CE1*CP réduit 0,0225 (0,0158) ns Temps*Ancienneté CP 0,0019 (0,0005)*** (Temps – 8)*post-CP*Ancienneté CP -0,0050 (0,0011)*** (Temps – 12)*CE1*Ancienneté CP 0,0034 (0,0011)** Effets aléatoires Variance inter-écoles (niveau 3) Variance constantes Covariance Constantes/temps Variance temps 0,140 (0,037)*** -0,0054 (0,0017)** 0,0005 (0,0001)*** Variance inter-élèves (niveau 2) 0,751 (0,039)*** -0,0065 (0,0015)*** 0,0011 (0,0001)*** Variance intra-élèves (niveau 1) 0,277 (0,007)*** –2 log L (déviance) 12353,10

Figure 4 : Evolution des scores de français selon le groupe expérimental ou contrôle (la figure est tirée du modèle 5)

Pour explorer d’autres possibilités de ce genre de modèles

Les pentes sont parallèles pendant les périodes de scolarisation
Les pentes sont parallèles pendant les périodes de scolarisation. Les défavorisés « perdent » par rapport aux favorisés durant la période de vacances. Figure 5 : Evolution des scores de français selon la catégorie socioprofessionnelle du père

Figure 6 : Evolution de l’effet de l’ancienneté sur les score de français

MERCI POUR VOTRE ATTENTION

« Similarité » des individus au sein des contextes
« Qui se ressemble s’assemble »… Eventuelle sélection par les écoles Eventuel choix des parents Ségrégation spatiale en cas de carte scolaire … « Qui s’assemble se ressemble » - Destin commun (partage d’un même environnement) - interactions (influence mutuelle)

Illustration du biais d’agrégation
(Cf. observations classes DEP 95 : Relation entre jugement des enseignants et scores des élèves) Corrélation (toutes classes confondues) = 0,28 (p = 0,003). Corrélation inter-classes = –0,77 (p = 0,002). Corrélation médiane intra-classes = 0,73. Approche par la régression :

L’estimation de la part de variance inter-groupes
Simulation…

Donc, part de variance inter-groupes = 5,9 %
Données issues de tables de nombres aléatoires, groupées dans des macro-unités (extrait de Wonnacott & Wonnacott, 1991, p. 867) Groupe Nombres aléatoires Moyenne Ecart-type 1 2 3 4 5 6 7 8 9 10 57.30 57.20 53.70 47.20 51.10 55.40 41.20 55.70 35.70 51.80 20.49 31.05 26.18 30.76 25.36 38.27 29.23 31.00 29.16 23.71 Total 50.63 28.50 ρ = 0,059 (Proc ANOVA). Donc, part de variance inter-groupes = 5,9 %

Droites de régression avec constantes aléatoires

Droites de régression avec constantes et pentes aléatoires

Fonction de la variance interindividuelle de la perception de soi scolaire

Effet du soutien des camarades sur le sentiment de compétence scolaire
(Soutien faible = M – 1s ; soutien moyen = M ; soutien fort = M + 1s)

Séminaire organisé par l’école doctorale thématique PSYCEDUC et le GIRSEF Louvain-La-Neuve: 10-11 mars 2011 L’analyse de données longitudinales: les modèles.

Présentations similaires

Présentation au sujet: "Séminaire organisé par l’école doctorale thématique PSYCEDUC et le GIRSEF Louvain-La-Neuve: 10-11 mars 2011 L’analyse de données longitudinales: les modèles."— Transcription de la présentation:

Présentations similaires

Notre projet

Feed-back

Entrer

S'autoriser via un réseau social:

Séminaire organisé par l’école doctorale thématique PSYCEDUC et le GIRSEF Louvain-La-Neuve: 10-11 mars 2011 L’analyse de données longitudinales: les modèles.

Présentations similaires

Présentation au sujet: "Séminaire organisé par l’école doctorale thématique PSYCEDUC et le GIRSEF Louvain-La-Neuve: 10-11 mars 2011 L’analyse de données longitudinales: les modèles."— Transcription de la présentation:

Présentations similaires

Notre projet

Feed-back