Séminaire organisé par l’école doctorale thématique PSYCEDUC et le GIRSEF Louvain-La-Neuve: 10-11 mars 2011 L’analyse de données longitudinales: les modèles.

Slides:



Advertisements
Présentations similaires
Corrélation Position du problème Définition covariance (X,Y) r =
Advertisements

ANOVA à un facteur (Rehailia)
Christèle Robert-Granié et Jean-Louis Foulley* INRA- Station dAmélioration Génétique des Animaux, Toulouse ; *INRA-Station de Génétique Quantitative et.
Comparaison des données de ventes : Données internes, GERS, IMS/SDM-XPONENT Mai 2007.
La régression logistique: fondements et conditions d’application
C1 Bio-statistiques F. KOHLER
Inférence statistique
Comparaison de plusieurs moyennes observées
Les TESTS STATISTIQUES
Régression ou corrélation
Tests de comparaison de pourcentages
Comparaison de plusieurs moyennes Analyse de variance
Les TESTS STATISTIQUES
Comparaison de plusieurs moyennes Analyse de variance
Régression -corrélation
Laboratoire Inter-universitaire de Psychologie Cours 6
Laboratoire Inter-universitaire de Psychologie
Lanalyse des effets du quartier sur le développement des jeunes: le jeu des échelles Éric Robitaille, Anne-Marie Séguin et Eric Lacourse LAPoSTe – Laboratoire.
Alain Barsamian Études de graphisme et de structures
Expériences contrôlées Quasi-expériences Études de cas
Chapitre 2 Les indices.
Laboratoire des Sciences de l’Education
L’ÉDUCATION EN FINLANDE

La Régression Multiple
Etude longitudinale d’essais multilocaux: apports du modèle mixte
Analyse de la variance : ANOVA à un facteur
Régression linéaire simple
L’Analyse de Variance 2 L’ANOVA 2 fixe à r répétitions
L’Analyse de Covariance
Corrélation et régression linéaire simple
L’Analyse de Variance 1 Généralités Le modèle Calculs pratiques
ELEMENTS DE COURS 1. LERIDON H., TOULEMON L. (1997) – Démographie. Approche Statistiques et dynamique des populations. Paris, Economica. 2. FALISSARD.
L’organisation pédagogique d’une séance
Séminaire du CRIE – Université de Sherbrooke : 2 avril 2009 Perspectives multiniveaux dans la recherche en éducation Pascal BRESSOUX Université Pierre-Mendès-France.
Jugement des enseignants et estime de soi des élèves
Modeles Lineaires.
Effet Pygmalion et Théorie de l’Autodétermination 2 études en EPS
Toutes les variables étaient mesurées au niveau intervalle et sans erreur Toutes les variables étaient mesurées au niveau intervalle et sans erreur ->
La corrélation et la régression multiple
La corrélation et la régression
Le test t.
La régression logistique
La corrélation et la régression
Les modèles linéaires (Generalized Linear Models, GLM)
Corrélation Principe fondamental d’une analyse de corrélation
Le comportement des coûts Chapitre 3
Structure discriminante (analyse discriminante)
Les analyses multivariées
La régression multiple
Chapitre 5 Prévisions.
Régression linéaire multiple : hypothèses & tests. Partie 3.
Méthodes de Biostatistique
Méthodes de Biostatistique
Heg Haute école de gestion de Neuchâtel Gestionnaire d'exception Procédures stockées PL/SQL.
Développement du capital humain chez des élèves de 15 ans issus de milieux socio-économiques défavorisés Colloque CSCE-CRSH 2006 Lucie DeBlois, professeure.
Howell Chap. 11: ANOVA. Du monde connu au monde inconnu Du test t à l’analyse de varianceDu test t à l’analyse de variance Trouvez des nouveaux noms pour.
Equations d’estimation généralisées: GEE
M2 Sciences des Procédés - Sciences des Aliments
Séance 8 30 novembre 2005 N. Yamaguchi
Chapitre 12 Régression linéaire simple et corrélation linéaire
Probabilités et Statistiques Année 2010/2011
Notions de coûts et prise de décision
Méthode des moindres carrés (1)
Evaluation des performances des tests diagnostiques en absence de Gold Standard Christophe Combescure Laboratoire de Biostatistique, IURC.
Régression linéaire (STT-2400)
Le modèle de régression linéaire Claude Marois © 2010.
1 L2 STE. Test du χ2 d’adéquation/conformité: Il s'agit de juger de l'adéquation entre une série de données statistiques et une loi de probabilité définie.
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement.
ETUDES PRONOSTIQUES Pr Ganry.
Transcription de la présentation:

Séminaire organisé par l’école doctorale thématique PSYCEDUC et le GIRSEF Louvain-La-Neuve: 10-11 mars 2011 L’analyse de données longitudinales: les modèles multiniveaux de croissance Pascal BRESSOUX Université Pierre-Mendès-France Grenoble Laboratoire des Sciences de l’Education

Bruxelles: De Boeck 2008 (2e éd. Nov. 2010)

Analyses contextuelles et problèmes posés par les moindres carrés ordinaires

Principes de l’analyse multiniveau Modèles multiniveaux (ou modèles hiérarchiques linéaires) Nés des avancées des modèles de contexte et des modèles mixtes. But : étudier les effets de l’environnement sur le « comportement » individuel. Données sur plusieurs « niveaux » : - Un effet-classe sur les acquis des élèves ? - Un effet-juge sur les condamnations des prévenus ? - Un effet-quartier sur la délinquance des jeunes ? - Un effet-pays sur les résultats des élèves à PISA ? - Etc. Souvent, structure hiérarchisée. Exemple : des élèves (niveau 1) dans des classes (niveau 2), etc.

Exemple d’une structure hiérarchisée à quatre niveaux Académie 1 Académie 2 Niveau 4 (Académies) Ecole 1 Ecole 2 Ecole 3 Ecole 4 Niveau 3 (Ecoles) … / … Classe 1 Classe 2 Classe 3 Classe 4 Niveau 2 (classes) él. 1 él. 2 él. 3 él. 4 él. 5 él. 6 él. 7 él. 8 Niveau 1 (élèves)

Problèmes posés par l’analyse de données hiérarchisées Non-indépendance des résidus Agrégation vs désagrégation (voir aussi diapo suivante) Effets aléatoires et effets fixes Hétérogénéité des relations

Droite de régression simple (sans distinction de classes) Le modèle de régression par les MCO où i = individus (unités d’analyse) et j = macro-unités (indistinctes) Droite de régression simple (sans distinction de classes)

Hypothèses sur les erreurs ~ ~

Admettons maintenant qu’on y inclue une variable de niveau 2, qu’on nommera Z. Si l’on raisonne sur les individus, on travaille sur des données désagrégées au niveau 1 (N = I): Si l’on raisonne sur les groupes, on travaille sur des données agrégées au niveau 2 (N = J): Estimation MCO des effets-classes (les gammas représentent des effets fixes) (N = I):

Le modèle multiniveau

Le modèle « vide » équivalant à une ANOVA avec effets aléatoires Au niveau 1 Au niveau 2 Equation complète

Coefficient de corrélation intra-classe = mesure du degré de « ressemblance » des individus i qui appartiennent à une même macro unité j.

Un exemple : étude de la variance des acquis en français à l’école élémentaire 516 élèves d’âge élémentaire appartenant à 24 classes. Acquis des élèves mesurés à l’aide d’épreuves standardisées en début et en fin d’année scolaire dans la discipline du français. On cherche à savoir ce qui fait varier les acquis des élèves en cours d’année. Les scores d’acquisitions des élèves ont été normalisés, centrés et réduits

Modèle vide décomposant les parts de variance inter et intra-classes du score final en français Paramètres Modèle 1 (vide) Effets fixes Constante 0,007 (0,078) Effets aléatoires Variance inter-classes 0,103 (0,042) Variance inter-élèves 0,890 (0,057) –2 log V 1434,071

Le modèle multiniveau à constantes aléatoires Equation complète Les composants de la variance : Variance totale :

Une matrice de variance-covariance des erreurs « bloc-diagonale » )  N(0, ) Une matrice de variance-covariance des erreurs « bloc-diagonale » )

Un exemple d’estimation avec constantes aléatoires Modèles expliquant le score final en français (données aménagement du temps scolaire 1997-98) Paramètres Modèle 1 Modèle 2 Effets fixes Constante 0,007 (0,078) Score initial en français 0,690 (0,031) Effets aléatoires Variance des constantes 0,103 (0,042) 0,096 (0,034) Variance inter-élèves 0,890 (0,057) 0,442 (0,028) –2 log L 1434,071 1084,083 N = 516 Le score initial (modèle 2) « n’explique » quasiment pas la variance des constantes (variance interclasses), mais il « explique » environ la moitié de la variance inter-élèves (intraclasse).

Le modèle multiniveau complet : constantes et pentes aléatoires Equation complète

Les composants de la variance : Variance de Y devient fonction quadratique de X

Structure des erreurs au niveau 2 ~ au niveau 1, eij ~ N(0, )

Un exemple d’estimation avec constantes et pentes aléatoires Modèles expliquant le score final en français (données aménagement du temps scolaire 1997-98) Paramètres Modèle 1 Modèle2 Modèle 3 Effets fixes Constante 0,007 (0,078) 0,008 (0,069) Score initial en français 0,690 (0,031) 0,690 (0,041) Effets aléatoires Niveau 2 (classes) : Variances des constantes 0,103 (0,042) 0,096 (0,034) 0,092 (0,033) Covariance constantes-pentes 0,014 (0,014) Variance des pentes 0,016 (0,011) Niveau 1 : variance inter-élèves 0,890 (0,057) 0,442 (0,028) 0,441 (0,025) –2 log L 1434,071 1084,083 1079,525 N = 516

Calcul de la décroissance de la déviance avec 2 paramètres supplémentaires à estimer : Pour atteindre p < 0,05, le Khi2 à 2 ddl devrait au moins être égal à 5,99. Il n’y a donc pas d’évidence ici que la relation entre le score initial et le score final varie en fonction des classes. Le tableau montre la covariance constantes-pentes. La corrélation (en fait, ici, elle n’est pas significativement différente de 0) peut être calculée de la manière suivante :

On peut contraindre la covariance constantes pentes à être nulle On peut contraindre la covariance constantes pentes à être nulle. Par rapport au modèle sans pentes aléatoires, il n’y a alors qu’un seul paramètre supplémentaire à estimer. Exemple (mêmes données) : Variance des constantes = 0,094 (erreur-type = 0,033) Variance des pentes = 0,017 (erreur-type = 0,011) Variance de niveau 1 = 0,427 (erreur-type = 0,028) –2 log L = 1080,548 En ce cas, le calcul de la décroissance de la déviance avec 1 paramètre supplémentaire à estimer : D = 1084,083 – 1080,548 = 3,54. On est proche alors du seuil de significativité (pour atteindre p < 0,10 ; Khi2 à 1 ddl > 2,71 ; pour atteindre p < 0,05 ; le Khi2 à 1 ddl > 3,84).

∆(2 – 3) = 5,034 (pour 2 ddl) ; ∆(2 – 4) = 4,962 (pour 1 ddl) Un exemple d’estimation avec constantes et pentes aléatoires Modèles expliquant le score final en maths (données aménagement du temps scolaire 1997-98) Paramètres Modèle 1 Modèle2 Modèle 3 Modèle 4 Effets fixes Constante 0,010 (0,072) 0,003 (0,064) 0,016 (0,064) Score initial en maths 0,711 (0,031) 0,713 (0,042) Effets aléatoires Niveau 2 (classes) : Variances des constantes 0,080 (0,036) 0,077(0,028) 0,077(0,029) Covariance constantes-pentes 0,004 (0,013) Variance des pentes 0,019 (0,012) Niveau 1 : variance inter-élèves 0,920 (0,059) 0,442 (0,028) 0,425 (0,028) –2 log L 1446,170 10079,990 10074,956 10075,028 N = 516 ∆(2 – 3) = 5,034 (pour 2 ddl) ; ∆(2 – 4) = 4,962 (pour 1 ddl)

ATTENTION! Une question de méthode d’estimation : Maximum de vraisemblance complet (ML ou FML) Ou Maximum de vraisemblance restreint, ou résiduel (RML)

Interaction inter-niveaux Ajoutons une variable Z de niveau 2 au niveau 1 au niveau 2 Interaction inter-niveaux Equation complète

Le modèle multiniveau de croissance

Relation entre le temps et les scores pour un individu donné Relation entre les scores initial et final pour un échantillon d’individus y             x Relation entre le temps et les scores pour un individu donné y  t1 t2 t3 t

Exemple d’une structure hiérarchisée de croissance Classe 1 Classe 2 Niveau 3 (Classes) Elève 1 Elève 2 Elève 3 Elève 4 Niveau 2 (Elèves) … /… mes. 1 mes. 2 mes. 3 mes. 1 mes. 2 mes. 3 Niveau 1 (Mesures)

Formalisation du modèle de croissance Une mesure du déroulement du temps est nécessaire (âge, durée…) Formalisation du modèle de croissance Niveau 1 : Niveau initial moyen Niveau 2 : Caractéristique qui varie avec le temps Caractéristique interindividuelle stable dans le temps Rythme de croissance moyen En intégrant dans une même équation : Rythme de croissance fonction aussi de Z Variance de Y fonction du temps (= gestion de l’hétéroscédasticité des erreurs)

Modèle très souple Fonctionne pour données non équilibrées (ne nécessite pas le même nombre de mesures par sujet) Fonctionne pour des mesures prises à différents moments et dont l’espacement diffère (ne nécessite pas que tous les sujets soient mesurés au même moment). Permet de prendre en compte des environnements « macro » pour les individus: classes, écoles, etc. pour les élèves ateliers, usines, etc. pour les ouvriers quartiers, villes, etc. pour les jeunes Circonscription, canton, etc. pour les électeurs Etc.

1er exemple : Une étude empirique L’évolution des perceptions de soi dans le passage CM2-6e Méthode Participants 62 élèves appartenant à 6 classes de CM2 en t1 et 9 classes de 6e en t2 et t3 Matériel Echelle SPP de Harter traduite et validée par Nurra et Pansu (perceptions de soi, importance accordée aux domaines, soutien social perçu) Jugement des enseignants (score de 0 à 10 en français et en maths) Fiches de renseignements sociodémographiques (âge, sexe…)

Procédure Echelle SPP (perceptions de soi, importance aux domaines, soutien social perçu) passée à 3 temps. Jugement des enseignants (français + maths) récolté à 3 temps. T1: fin CM2 (mai 2005) T2 : début 6e (octobre-novembre 2005) T3 : fin 6e (mai 2006)

Peut-on établir un modèle de tout cela? Quelques cas individuels de croissance Peut-on établir un modèle de tout cela?

Evolution moyenne des perceptions de soi scolaires Moyennes observées 6 12 3,05 2,97 2,92 Une spécification linéaire semble adaptée : de toute façon, impossible de spécifier une fonction d’ordre plus élevé (seulement 3 points) Evolution moyenne des perceptions de soi scolaires

La structure des données peut être considérée comme complexe : Niveau 1 : mesures Niveau 2 : les élèves Niveau 3 : les classes de CM2 et de 6e (structure aléatoire croisée). Variables intégrées dans le modèle : Variable TEMPS mesurée en nombre de mois (0, 6, 12) Des caractéristiques stables dans le temps (sexe, à l’heure ou en avance) Des caractéristiques qui varient dans le temps (importance du domaine de l’école, jugement des enseignants, soutien des camarades)

Etude de la croissance du sentiment de compétence scolaire Modèle à tester (différent de celui de Harter) Jugement de l’enseignant Sentiment de compétence scolaire Soutien social perçu

Paramètres Modèle 1 Modèle 2 Modèle 3 Effets fixes Constante 2,981 (0,074)* 3,044 (0,076)* 1,226 (0,298)* Temps –0,011 (0,005)* –0,073 (0,032)* Heure –0,074 (0,142) Avance 0,159 (0,218) Garçon –0,065 (0,086) Soutien camarades 0,035 (0,075) Jugement enseignant 0,098 (0,010)* Importance de l’Ecole 0,096 (0,044)* Temps × Soutien camarades 0,025 (0,010)* Effets aléatoires Niveau 2 : Cov constante*temps 0,306 (0,062) 0,290 (0,060) 0,0005 (0,0003) 0,075 (0,024) 0,0000 (0,0002) Niveau 1 : 0,108 (0,014) 0,086 (0,014) 0,099 (0,017) –2 log L (Full ML) 252,93 245,33 171,34 Effets fixes : * p < .05

Certaines hypothèses pourraient facilement être testées avec les modèles multiniveaux de croissance Epstein : Dans modèle hiérarchique de soi, les schémas de haut degré (e.g. l’estime de soi) sont plus résistants aux changements que les conceptions d’ordre inférieur (e.g. la perception de soi dans des domaines spécifiques). Peut-on tester cette hypothèse ? Si hypothèse vraie, on devrait observer que la part de variance interindividuelle est plus forte pour l’estime de soi que pour la perception de soi dans des domaines spécifiques.

Estime de soi (Valeur propre) Scolaire Conduite Apparence Physique Social Part de variance interindividuelle (Rho) 64,9 % 74,0 % 69,9 % 79,8 % 67,1 % 59,2 % Fonction de variance interindividuelle ns Tendance signif (p < .10) Augmente avec le temps Signif Rythme de croissance moyen significatif (décroît dans le temps) L’estime de soi mesurée avec l’échelle de Rosenberg donne les valeurs suivantes : Part de variance interindividuelle : Rho = 68,1 % Fonction de variance interindividuelle : ns Rythme de croissance : ns ATTENTION, il faudrait aussi tenir compte de la fidélité des mesures.

2e exemple : Modèle de croissance des effets à long terme de la réduction des effectifs au CP Le Ministère de l’Education Nationale français a lancé en 2002-2003 une expérimentation d’envergure visant à réduire la taille des classes de CP (1ère année élémentaire) à 10 élèves dans les zones défavorisées. Méthode Participants 100 classes expérimentales (8 à 12 élèves par classe dans les faits avec une moyenne égale à 10,45) 100 classes témoins (15 à 27 élèves par classe dans les faits avec une moyenne égale à 21,29). Toutes dans des milieux défavorisés (écoles en zone d’éducation prioritaire)

Les élèves ont été suivis jusqu’à la fin de la 2e année élémentaire (en fait jusqu’au début de la 3e année mais les scores ne peuvent pas être mis sur la même échelle que les scores précédents). (Dans les écoles témoins, ces évaluations n’ont porté que sur 10 élèves choisis aléatoirement.) Leurs acquisitions en français-lecture ont été testées 5 fois (avec items d’ancrage). Début, milieu et fin CP Début et fin CE1 Modèles de réponse à l’item ont permis de mettre tous les scores sur une même échelle de mesure.

1163 élèves retenus pour les analyses (i. e 1163 élèves retenus pour les analyses (i.e. ceux qui étaient présents à la première et à la dernière évaluation). Structure des données : Niveau 1 : mesures (Nt = 5433) Niveau 2 : les élèves (Ni = 1163) Niveau 3 : les écoles (Nj = 69) Variables intégrées dans le modèle : Variable TEMPS mesurée en nombre de mois (0, 5, 8, 12, 20) Des caractéristiques stables dans le temps (origine sociale, sexe) Des caractéristiques de niveau supérieur (ancienneté enseignant, expérimentation)

Figure 1 : Evolution des résultats bruts

Variable d'analyse : score_francais N   N time Obs N Moyenne Ecart-type Minimum Maximum ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 0 1163 1163 -0.7470158 1.1387861 -3.6658400 3.5490100 5 1163 1095 1.0424832 0.9507920 -1.4529400 5.8454600 8 1163 999 1.8025968 1.0972123 -2.5008300 5.7569900 12 1163 1013 1.9704838 1.1691808 -0.9668000 5.7569900 20 1163 1163 2.8968559 1.1230747 -0.3306000 6.3903300 ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ

Figure 2 : Evolution des résultats bruts en fonction du groupe expérimental

Quelle spécification adopter? Une spécification cubique?

Figure 3 : Spécification cubique des résultats (sans variables de contrôle)

Finalement, choix pour une spécification piecewise avec deux ruptures de pente

Modèle 2 inconditionnel de croissance : Variance totale = 0,094 + 0,703 + 0,610 = 1,407 Variance inter-écoles = 0,094/1,407 = 0,0688 (6,88 % de la variance totale) Variance inter-élèves = 0,703/1,407 = 0,4996 (49,96 % de la variance totale) Variance intra-élèves = 0,610/1,407 = 0,4336 (43,36 % de la variance totale) Paramètres Modèle 1 (inconditionnel = « vide ») Modèle 2 (inconditionnel de croissance) Effets fixes   Constante 0,379 (0,047)*** -0,147 (0,049)** Temps 0,170 (0,002)*** (Temps – 8)*post-CP (Temps – 12)*CE1 Effets aléatoires Variance inter-écoles (niveau 3) Variance constantes Covariance Constantes/temps Variance temps 0,090 (0,027)*** 0,094 (0,027)*** Variance inter-élèves (niveau 2) 0,335 (0,037)*** 0,703 (0,035)*** Variance intra-élèves (niveau 1) 2,370 (0,051)*** 0,610 (0,013)*** –2 log L (déviance) 20760,97 14951,46 Nt = 5433 (mesures) Ni = 1163 (élèves) Nj = 69 (écoles)

Modèle 3 : Variance totale = 0,090 + 0,749 + 0,379 = 1,218 Variance inter-écoles = 0,090/1,218 = 0,0739 (7,39 % de la variance totale) Variance inter-élèves = 0,749/1,218 = 0,6149 (61,49 % de la variance totale) Variance intra-élèves = 0,379/1,218 = 0,3112 (31,12 % de la variance totale) Paramètres Modèle 3 Modèle 4 Effets fixes   Constante -0,684 (0,049)*** -0,683 (0,056)*** Temps 0,323 (0,003)*** 0,323 (0,004)*** (Temps – 8)*post-CP -0,304 (0,009)*** -0,305 (0,007)*** (Temps – 12)*CE1 0,097 (0,009)*** 0,098 (0,008)*** Effets aléatoires Variance inter-écoles (niveau 3) Variance constantes Covariance Constantes/temps Variance temps 0,090 (0,026)*** 0,144 (0,037)*** -0,0052 (0,0017)** 0,0005 (0,0001)*** Variance inter-élèves (niveau 2) 0,749 (0,036)*** 0,791 (0,041)*** -0,0062 (0,0016)*** 0,0011 (0,0001)*** Variance intra-élèves (niveau 1) 0,379 (0,013)*** 0,282 (0,007)*** –2 log L (déviance) 12907,32 12468,15 Nt = 5433 (mesures) Ni = 1163 (élèves) Nj = 69 (écoles)

Paramètres Modèle 5 Effets fixes   Constante -0,361 (0,141)* Temps 0,297 (0,007)*** (Temps – 8)*post-CP -0,243 (0,014)*** (Temps – 12)*CE1 0,067 (0,014)*** Profession du père (référence = cadre sup.) Agriculteur/artisan -0,399 (0,175)* Prof. intermédiaire -0,1575 (0,151) Employé -0,319 (0,143)* Ouvrier -0,556 (0,127)*** Autre -0,602 (0,128)*** Fille 0,240 (0,053)*** CP réduit 0,023 (0,097) ns Ancienneté CP 0,006 (0,006) ns Temps*CP réduit 0,0295 (0,0075)*** (Temps – 8)*post-CP*CP réduit -0,0641 (0,0154)*** (Temps – 12)*CE1*CP réduit 0,0225 (0,0158) ns Temps*Ancienneté CP 0,0019 (0,0005)*** (Temps – 8)*post-CP*Ancienneté CP -0,0050 (0,0011)*** (Temps – 12)*CE1*Ancienneté CP 0,0034 (0,0011)** Effets aléatoires Variance inter-écoles (niveau 3) Variance constantes Covariance Constantes/temps Variance temps 0,140 (0,037)*** -0,0054 (0,0017)** 0,0005 (0,0001)*** Variance inter-élèves (niveau 2) 0,751 (0,039)*** -0,0065 (0,0015)*** 0,0011 (0,0001)*** Variance intra-élèves (niveau 1) 0,277 (0,007)*** –2 log L (déviance) 12353,10

Figure 4 : Evolution des scores de français selon le groupe expérimental ou contrôle (la figure est tirée du modèle 5)

Pour explorer d’autres possibilités de ce genre de modèles

Les pentes sont parallèles pendant les périodes de scolarisation Les pentes sont parallèles pendant les périodes de scolarisation. Les défavorisés « perdent » par rapport aux favorisés durant la période de vacances. Figure 5 : Evolution des scores de français selon la catégorie socioprofessionnelle du père

Figure 6 : Evolution de l’effet de l’ancienneté sur les score de français

MERCI POUR VOTRE ATTENTION

« Similarité » des individus au sein des contextes « Qui se ressemble s’assemble »… Eventuelle sélection par les écoles Eventuel choix des parents Ségrégation spatiale en cas de carte scolaire … « Qui s’assemble se ressemble » - Destin commun (partage d’un même environnement) - interactions (influence mutuelle)

Illustration du biais d’agrégation (Cf. observations classes DEP 95 : Relation entre jugement des enseignants et scores des élèves) Corrélation (toutes classes confondues) = 0,28 (p = 0,003). Corrélation inter-classes = –0,77 (p = 0,002). Corrélation médiane intra-classes = 0,73. Approche par la régression :

L’estimation de la part de variance inter-groupes Simulation…

Donc, part de variance inter-groupes = 5,9 % Données issues de tables de nombres aléatoires, groupées dans des macro-unités (extrait de Wonnacott & Wonnacott, 1991, p. 867) Groupe Nombres aléatoires Moyenne Ecart-type 1 2 3 4 5 6 7 8 9 10 39 65 76 45 45 19 90 69 64 61 73 71 23 70 90 65 97 60 12 11 72 20 47 33 84 51 67 47 97 19 75 17 25 69 17 17 95 21 78 58 37 48 79 88 74 63 52 06 34 30 02 89 08 16 94 85 53 83 29 95 87 18 15 70 07 37 79 49 12 38 98 83 71 70 15 89 09 39 59 24 10 08 58 07 04 76 62 16 48 68 47 90 56 37 31 71 82 13 50 41 57.30 57.20 53.70 47.20 51.10 55.40 41.20 55.70 35.70 51.80 20.49 31.05 26.18 30.76 25.36 38.27 29.23 31.00 29.16 23.71 Total 50.63 28.50 ρ = 0,059 (Proc ANOVA). Donc, part de variance inter-groupes = 5,9 %

Droites de régression avec constantes aléatoires

Droites de régression avec constantes et pentes aléatoires

Fonction de la variance interindividuelle de la perception de soi scolaire

Effet du soutien des camarades sur le sentiment de compétence scolaire (Soutien faible = M – 1s ; soutien moyen = M ; soutien fort = M + 1s)