Université Paul Verlaine - Metz Ecole Doctorale PIEMES Les modèles d’équations structurales : théorie et applications avec LISREL Jean-Luc Kop Université Nancy 2 jean-luc.kop@univ-nancy2.fr
PLAN Présentation générale La régression multiple avec LISREL Les pistes causales avec LISREL La logique des MES Le modèle de mesure (analyse factorielle) Le modèle complet
Les modèles d’équations structurales (MES) permettent de modéliser les relations existant entre un ensemble de variables à partir d’une représentation théorique intègrent la régression, les pistes causales et les analyses factorielles permettent d’introduire des variables latentes et donc de tenir compte des erreurs de mesure
ORIGINES Jöreskog (1973) Keesing (1972) Wiley (1973) Modèle JKW Premier logiciel : LISREL (Jöreskog & Sörbom) Autres logiciels : AMOS, SePath, Mplus, EQS, MX
MODE OPERATOIRE de LISREL LISREL = Linear Structural RELationships
La régression multiple avec LISREL Exemple VD = salaire (annuel, brut, en k$) VI = expérience (en mois) niveau d’études (en années)
La régression multiple avec LISREL Matrice de corrélations salact exp nivetud -------- -------- -------- salact 1.00 exp -0.10 1.00 nivetud 0.66 -0.26 1.00 Matrice de covariances salact exp nivetud -------- -------- -------- salact 291.58 exp -181.15 10828.48 nivetud 32.54 -77.00 8.32
RAPPEL
La régression multiple avec LISREL Programme SIMPLIS regression avec deux VI observed variables salact exp nivetud means : 34.42 96.47 13.49 covariance matrix 291.58 -181.15 10828.48 32.54 -77.00 8.32 sample size 474 relationships const exp nivetud -> salact end of problem
La régression multiple avec LISREL Résultats salact = - 20.97 + 0.012*exp + 4.02*nivetud (3.10) (0.0058) (0.21) -6.77 2.03 19.06 Errorvar.= 162.89, R² = 0.44 Résultats standardisés (options SC) Regression Matrix Y on X (Standardized) exp nivetud -------- -------- salact 0.07 0.68
Les pistes causales Analyse en pistes causales (path analysis) S. Wright (1920-30) Simon, Blalock, Boudon Plusieurs variables explicatives et plusieurs variables expliquées
Les pistes causales spécification du réseau de relations entre variables Exemple
Les pistes causales âge = variable exogène (plusieurs sont possibles) variable endogène = variable au moins influencée par une autre satisfaction = variable endogène ultime ei = variables résiduelles modèles récursifs = une seule piste entre deux variables (effets réciproques modèles non récursifs) modèle saturé = toutes les pistes possibles
Les équations autonomie = b21 × âge + e2 revenu = b31 × âge + b32 × autonomie + e3 satisfaction = b41 × âge + b42 × autonomie + b43 × revenu + e4
Calcul des paramètres revenu = b31 × âge + b32 × autonomie + e3 On multiplie par l’âge revenu × âge = b31 × (âge)² + b32 × (autonomie × âge) + e3 × âge Espérances mathématiques E(revenu x âge) = rrevenu, âge E(âge²) = 1 E(autonomie x âge) = rautonomie, âge E(e3 × âge) = 0 rrevenu, âge = b31 + b32 × rautonomie, âge
Calcul des paramètres revenu = b31 × âge + b32 × autonomie + e3 On multiplie par l’autonomie ……. rautonomie, revenu = b31 × rautonomie, âge + b32 Système de deux équations à deux inconnues rrevenu, âge = b31 + b32 × rautonomie, âge rautonomie, revenu = b31 × rautonomie, âge + b32
Les pistes causales avec LISREL Programme SIMPLIS Pistes causales de la satisfaction au travail observed variables age autonom revenu satis correlation matrix 1 0.28 1 0.63 0.38 1 0.38 0.74 0.64 1 sample size 472 relationships age autonom revenu -> satis age –> autonom age autonom -> revenu path diagram end of problem
Les pistes causales avec LISREL Résultats (équations) autonom = 0.28*age, Errorvar.= 0.92 , R² = 0.078 (0.044) (0.060) 6.32 15.33 revenu = 0.22*autonom + 0.57*age, Errorvar.= 0.56 , R² = 0.44 (0.036) (0.036) (0.036) 6.15 15.83 15.33 satis = 0.58*autonom + 0.47*revenu - 0.078*age, Errorvar.= 0.30 , R² = 0.70 (0.027) (0.034) (0.032) (0.019) 21.42 13.85 -2.39 15.33
Les pistes causales avec LISREL Résultats (graphique)
Les pistes causales avec LISREL eautonomie = 0.92 ; l’âge n’explique que 8% (0.28² * 100) de l’autonomie effet direct de l’âge sur la satisfaction : -0.08 effet indirect de l’âge sur la satisfaction : par l’intermédiaire de l’autonomie (0.28 * 0.58 = 0.16) ; par l’intermédiaire du revenu (0.57 * 0.47 = 0.27) ; par l’intermédiaire de l’autonomie et du revenu (0.28 * 0.22 * 0.47 = 0.03)
Les pistes causales avec LISREL effet indirect de l’âge sur la satisfaction : 0.16 + 0.27 + 0.03 = 0.46 effet total de l’âge sur la satisfaction = effet direct (-0.08) + effet indirect (0.46) = 0.38 (N.B. râge, satisfaction = 0.38)
Les pistes causales avec LISREL Effets directs et indirects syntaxe LISREL : options EF Total and Indirect Effects Total Effects of X on Y age -------- autonom 0.28 (0.04) 6.32 revenu 0.63 17.59 satis 0.38 8.91 Indirect Effects of X on Y autonom - - revenu 0.06 (0.01) 4.41 satis 0.46 11.42 Total Effects of Y on Y autonom revenu satis -------- -------- -------- autonom - - - - - - revenu 0.22 - - - - 6.15 satis 0.69 0.47 - - (0.03) (0.03) 22.08 13.85 Largest Eigenvalue of B*B' (Stability Index) is 0.590 Indirect Effects of Y on Y revenu - - - - - - satis 0.10 - - - - (0.02) 5.62
Autre exemple 1708 étudiants évaluent : Stringer, M., & Irwing, P. (1998). Students’ evaluations of teaching effectiveness: a structural modelling approach. British Journal of Educational Psychology, 68, 409-426 1708 étudiants évaluent : qualité formelle de l’enseignement (qual) feedback donné par l’enseignant (feedback) intégration de l’enseignement (integ) charge de travail (charge) stimulation int. / apprentissage (stimul) évaluation globale de l’enseignement (global)
Autre exemple Matrice de corrélations
Le modèle théorique des auteurs
Résultats
La logique des MES ✔ tester des hypothèses qui découlent d’une théorie concernant les relations de dépendances et/ou d'interdépendances entre des variables observées et/ou des variables latentes ; ✔ à partir des relations (exprimées en termes de variances-covariances) entre des variables manifestes ; ✔ par l'intermédiaire de la manipulation de paramètres.
La logique des MES
Trois types de paramètres Paramètres fixés Paramètres contraints Paramètres libres
ξ X η Y Les différents types de variables Variables Latentes Manifestes Exogènes ξ X Modèle Structural (théories nomologiques) Endogènes η Y Modèle de mesure (Théories définitoires)
Les 8 matrices du modèle de base
Exemple : la matrice Γ Qual Charge libre Feedback libre Integ libre Stimul fixé à 0 Globale libre
L’estimation des paramètres libres Moindres carrés non pondérés (ULS) Moindres carrés généralisés (GLS) Maximum de vraisemblance
Nombre de degrés de liberté du modèle p = nombre de variables exogènes manifestes q = nombre de variables endogènes manifestes t = nombre de paramètres estimés (libres)
Théorie En résumé Paramètres ∑(Θ) ∑ Matrice théorique Matrice observée ???? Adéquation ?????
Le modèle de mesure (analyse factorielle) Exemple Lance, C.E., Mallard, A.G., & Michalos, A.C. (1995). Tests of the causal directions of global-life facet satisfaction relationships. Social Indicators Research, 34, 69-92. Mesure de la satisfaction de 400 personnes relativement à différents domaines : santé, revenu, relations familiales, travail, amis, logement, conjoint, loisirs, religion, transports, éducation
Matrice de corrélations entre les variables
Différents modèles théoriques possibles
Différents modèles théoriques possibles
Différents modèles théoriques possibles
Différents modèles théoriques possibles
Différents modèles théoriques possibles
Comment tester le modèle à deux facteurs indépendants ?
Modèle de mesure x = λxξ + δ xi = λi1ξ1 + λi2ξ2 + …. + λinξn + δi
Modèle de mesure (développement matriciel) X = Λx ξ + δ
Test du modèle à deux facteurs indépendants Matrice factorielle (Λ)
Test du modèle à deux facteurs indépendants Matrice de corrélations entre les facteurs Φ
Test du modèle à deux facteurs indépendants Matrice de covariances entre les parties résiduelles (Θδ)
Les 3 matrices du modèle de mesure
Programme Simplis lance et al 1995 : 2 facteurs independants Observed Variables sante revenu famille travail amis logement conjoint loisirs religion transp educ latent variables mat immat Correlation Matrix …….. Sample Size = 400 relationships immat -> sante famille amis conjoint loisirs religion educ mat -> revenu travail logement transp set the covariance between mat and immat to zero path diagram lisrel output rs mi End of Problem
ADEQUATION du MODELE Goodness of Fit Statistics Degrees of Freedom = 44 Minimum Fit Function Chi-Square = 171.17 (P = 0.00) Normal Theory Weighted Least Squares Chi-Square = 154.81 (P = 0.00)
Un modèle défendable
Le modèle complet : un exemple fictif
Les trois équations du modèle complet Modèle de mesure pour les variables exogènes (X) Modèle de mesure pour les variables endogènes (Y) Modèle structural
Modèle de mesure sur x
Modèle de mesure sur x Matrice de covariances des erreurs des variables x
Modèle de mesure sur y
Modèle structural
Le modèle complet
Le modèle complet : les 8 matrices
Programme Simplis Modele complet sur donnees fictives Observed Variables Y1 Y2 Y3 Y4 X1 X2 X3 X4 X5 X6 X7 Covariance Matrix from file fictif.cov Latent Variables ETA1 ETA2 KSI1 KSI2 KSI3 Sample Size 100 Relationships KSI1 -> X1 X2 X3 KSI2 -> X3 X4 X5 KSI3 -> X6 X7 ETA1 -> Y1 Y2 ETA2 -> Y3 Y4 KSI1 -> ETA1 ETA2 KSI2 -> ETA1 KSI3 -> ETA2 ETA1 -> ETA2 ETA2 -> ETA1 Let the Error Covariance between ETA1 and ETA2 free Lisrel output RS SS SC Path Diagram End of Problem
Exemple fictif : matrice de covariances
EXEMPLE sur données réelles On dispose des 9 variables suivantes, observées dans un échantillon de 200 enfants : - niveau d'aspiration scolaire (ASPSCO) - niveau d'aspiration professionnelle (ASPPRO) - réussite scolaire dans les matières verbales (RSVERB) - réussite scolaire en mathématiques (RSMATH) - revenu de la famille (REVENU) - niveau d'éducation du père (EDPERE) - niveau d'éducation de la mère (EDMERE) - aptitude verbale (APTVERB) - aptitude numérique (APTNUM) On veut montrer (modèle théorique) que la réussite de l’enfant dépend du background familial, des aptitudes et du niveau d'aspiration ; ce dernier dépendant lui-même du background familial et des aptitudes
EXEMPLE sur données réelles Matrice de variances-covariances aspsco 1.024 asppro .792 1.077 Rsverb 1.027 .919 1.844 rsmath .756 .697 1.244 1.286 revenu .567 .537 .876 .632 .852 educpere.445 .424 .677 .526 .518 .670 educmere.434 .389 .635 .498 .475 .545 .716 aptverb .580 .564 .893 .716 .546 .422 .373 .851 aptnum .491 .499 .888 .646 .508 .389 .339 .629 .871 aspsco asppro rsverb rsmath revenu edpere edmere aptverb aptnum
EXEMPLE sur données réelles Le modèle de mesure aptitude -> aptverb aptnum aspire -> aspsco asppro reussite -> rsverb rsmath famille -> revenu educpere educmere
EXEMPLE sur données réelles Le modèle structural famille -> aspire reussite aptitude -> aspire reussite aspire -> reussite
EXEMPLE sur données réelles Le modèle théorique initial
Comment présenter les résultats de MES ? Boomsma, A. (2000). Reporting analyses of covariance structures. Structural Equation Modeling, 7(3), 461-482. Jackson, D.L., Gillaspy, J.A. & Purc-Stephenson R. (2009). Reporting practices in confirmatory factor analysis: an overview and some recommendations. Psychological Methods, 14, 6-23. McDonald, R. P., & Ringo Ho, Moon-Ho (2002). Principles and practice in reporting structural equation analyses. Psychological Methods, 7(1), 64-82. Raykov, T., Tomer, A., & Nesselroade, J. R. (1991). Reporting structural equation modeling results in Psychology and Aging: Some proposed guidelines. Psychology and Aging, 6(4), 499-503. Tabachnick, B.G. & Fidell, (2007). Using multivariate statistics (5th ed.). Boston : Pearson International Edition. http://davidakenny.net/kenny.htm
Médiation et modération http://davidakenny.net/kenny.htm Baron, R. M., & Kenny, D. A. (1986). The moderator-mediator variable distinction in social psychological research: Conceptual, strategic and statistical considerations. Journal of Personality and Social Psychology, 51, 1173-1182. Edwards, J. R., & Lambert L. S. (2007). Methods for integrating moderation and mediation: A general analytical framework using moderated path analysis. Psychological Methods, 12, 1-22. MacKinnon, D. P., Fairchild, A. J., & Fritz, M. S. (2007). Mediation analysis. Annual Review of Psychology, 58, 593-614. Muller, D., Judd, C. M., & Yzerbyt, V. Y. (2005). When moderation is mediated and mediation is moderated. Journal of Personality and Social Psychology, 89, 852-863.