La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Michel Tenenhaus tenenhaus@hec.fr Analyse factorielle confirmatoire, Modèle de causalité (Path analysis) et Modélisation d’équations structurelles.

Présentations similaires


Présentation au sujet: "Michel Tenenhaus tenenhaus@hec.fr Analyse factorielle confirmatoire, Modèle de causalité (Path analysis) et Modélisation d’équations structurelles."— Transcription de la présentation:

1 Michel Tenenhaus tenenhaus@hec.fr
Analyse factorielle confirmatoire, Modèle de causalité (Path analysis) et Modélisation d’équations structurelles sur variables latentes Michel Tenenhaus

2 Analyse factorielle confirmatoire
Exemple Kendall

3 Modèle de causalité (Path analysis, Equations simultanées)

4 Modèle de relations structurelles sur variables latentes

5 Modélisation de relations de causalité sur variables latentes
Approche confirmatoire Reconstituer les covariances et valider un modèle Covariance-based SEM - AMOS (SPSS) - Proc CALIS (SAS) ECSI Path model for a“ Mobile phone provider” Approche exploratoire Estimer les variables latentes et estimer les équations de régression Component-based SEM - PLS-Graph XLSTAT-PLSPM GSCA

6 I. Analyse Factorielle Confirmatoire
Les données de Long (J. Scott Long : Confirmatory Factor Analysis, SAGE Publications, 1986) chefs de famille de la région de Hennepin, Illinois - PSY67 = Désordres psychologiques 1967 PHY67 = Désordres psycho-physiologiques 1967 PSY71 = Désordres psychologiques 1971 PHY71 = Désordres psycho-physiologiques 1971

7 Les données sont les covariances entre les variables manifestes :

8 Le 1er modèle spécifié par Long
theta13 theta24 theta11 theta22 theta33 theta44 Résidus D1 D2 D3 D4 1 1 1 1 Variables manifeste PSY67 PHY67 PSY71 PHY71 L11 L21 L32 L42 Variables latentes XSI1 phi11 XSI2 phi22 phi12

9 Étude du 1er modèle spécifié
Les équations factorielles PSY67 = 11 1 + 1 PHY67 = 21 1 + 2 PSY71 = 12 2 + 3 PHY71 = 22 2 + 4 Covariances sur la population Matrice  Les 13 paramètres du modèle 11, 21, 12, 22 11 = Var(1) , 22 = Var(2) , 12 = Cov(1, 2) 11 = Var(1) , 22 = Var(2) , 33 = Var(3) , 44 = Var(4) 13 = Cov(1, 3) , 24 = Cov(2, 4) Modèle identifiable Les paramètres () du modèle peuvent s’exprimer de manière unique en fonction de la matrice des covariances vérifiant le modèle : C.N. : Nb de paramètres  q(q+1)/2.

10 Modèle identifiable  ()   Si 1  2 , (1)  (2)
Espace des paramètres admissibles Espace des () suivant le modèle Si 1  2 , (1)  (2) Espace de tous les  possibles

11 Étude du 1er modèle spécifié
Décomposition de la covariance Les équations factorielles Les paramètres du modèle 11, 21, 12, 22 11 = Var(1) , 22 = Var(2) , 12 = Cov(1, 2) 11 = Var(1) , 22 = Var(2) , 33 = Var(3) , 44 = Var(4) 13 = Cov(1, 3) , 24 = Cov(2, 4)

12 2e modèle de Long (identifiable)
Normalisation des variables latentes Var(1) = 11 = 1 , Var(2) = 22 = 1 Stabilité des saturations au cours du temps PSY67,1 = PSY71,2 PHY67,1 = PHY71,2 Indépendance entre les résidus 13 = Cov(1, 3) = 0 24 = Cov(2, 4) = 0

13 Le 2e modèle (identifiable) spécifié par Long
theta11 theta22 theta33 theta44 D1 D2 D3 D4 1 1 1 1 PSY67 PHY67 PSY71 PHY71 L11 L21 L11 L21 1 1 XSI1 XSI2 phi12 Le nombre de paramètres (7) est inférieur au nombres de variances et covariances (10) : Nombre de degrés de liberté = 3.

14 Étude du 2e modèle spécifié
Les équations factorielles Décomposition de la covariance Les paramètres du modèle 11, 21 12 = Cov(1, 2) 11 = Var(1) , 22 = Var(2) , 33 = Var(3) , 44 = Var(4)

15 Calcul de la matrice des covariances théoriques (modèle 2)
Les équations factorielles PSY67 = 1 1 + 1 PHY67 = 2 1 + 2 PSY71 = 1 2 + 3 PHY71 = 2 2 + 4 Les covariances Les 7 paramètres du modèle 1, 2, Var(h) = 1, 12 = Cov(1, 2), i = Var(i) Modèle identifiable : les paramètres s’expriment de manière unique en fonction des covariances. C.S.: 1 bloc  3 VM 2 blocs et +  2 VM par bloc

16 Estimation et validation du modèle
Notations - q = Nombre de variables manifestes - n = Nombre d’observations (règle courante : n > 10*(nb de paramètres)) -  = Matrice des covariances au niveau de la population - S = Matrice des covariances observées - C = Matrice des covariances calculées à l’aide du modèle Maximum de vraisemblance En supposant les données multinormales le maximum de vraisemblance conduit à rechercher les paramètres du modèle minimisant la fonction F(S,C) = Trace(SC-1) - q + Ln(det C) - Ln(det S)  FMIN Tests de validation du modèle - Si le modèle étudié est exact : Chi-Square = CMIN = (n-1)FMIN  2(dlM) - dlM = Nb de covariances - Nb de paramètres du modèle M - Modèle accepté si p-value  ou bien si Chi-Square/dlM  2 à 5 - Modèle accepté si RMSEA  , toléré jusqu’à 0.08 Augmente avec n !!! Dépend très peu de n

17 Estimation du modèle S C  ()      2 = CMIN=(n-1)FMIN
Espace des paramètres admissibles Espace des () suivant le modèle Espace de tous les  possibles

18 Résultats des estimations des paramètres avec AMOS
.52 .22 .40 .16 D1 D2 D3 D4 1 1 1 1 PSY67 PHY67 PSY71 PHY71 1.24 .30 1.24 .30 1.00 1.00 XSI1 XSI2 Modèle 2 de LONG Chi-Square = DF = 3 .67 P-Value = .000 Chi-Square/df = 7.525 RMSEA = .104 p-value = .010

19 Matrice des covariances et des corrélations observées et reconstituées à l’aide du modèle 2
Exemple : Var(PHY71) = Var(.30XSI2 + D4) = .302Var(XSI2) + Var(D4) = = .25  .247

20 Ecart dû à l’approximation de la réalité par le modèle
Soit  la matrice des covariances calculée au niveau de la population et C0 la matrices des covariances calculées à l’aide du modèle minimisant la fonction F(,C0) = Trace(C0-1) - q + Ln(det C0) - Ln(det  )  FMIN0 Si le modèle est exact, FMIN0 = 0.

21 Ecart dû à l’approximation de la réalité
par le modèle S population FMIN C C0 FMIN0 () Espace des paramètres admissibles Espace des () suivant le modèle Espace de tous les  possibles

22 Loi du khi-deux non centrée

23 Estimation de  = (n-1)FMIN0
Loi générale de CMIN = (n-1)FMIN (Le modèle étudiée n’est pas nécessairement le bon) CMIN suit une loi du khi-deux non centrée à dlM degrés de liberté et de paramètre de non centralité  =(n-1)FMIN0. Estimation de  = (n-1)FMIN0 Estimation de FMIN0 Favorise les modèles avec beaucoup de paramètres (CMIN et dlM petits)

24 Validation du modèle à l’aide du RMSEA (Root Mean Square Error of Approximation)
Le RMSEA mesure la « distance » entre la matrice des covariances calculées C0 à l’aide du modèle M et la matrice des covariances sur la population  : Ne dépend pas de n. Corrigé pour le nombre de paramètres. FMIN0 = Trace(C0-1) - q + Ln(det C0) - Ln(det  )

25 Utilisation pratique du RMSEA
Le RMSEA est estimé par Le modèle est accepté si le RMSEA estimé est inférieur à 0.05 ou, à la limite, à 0.08.

26 RMSEA S population C C0  ()        FMIN FMIN0
Espace des paramètres admissibles Espace des () suivant le modèle Espace de tous les  possibles

27 Utilisation pratique du RMSEA
Les programmes fournissent : - Intervalle de confiance à 90% du RMSEA - Niveau de signification du test H0 : RMSEA  0.05 Le test sur le Khi-deux est très exigeant puisqu’il correspond en fait au test H0 : RMSEA = 0

28 Utilisation de la Proc CALIS
data long1 (type=corr); input _type_ $ _name_ $ v1-v4 ; label v1 ='PSY67' v2 ='PHY67' v3 ='PSY71' v4 ='PHY71'; cards; N STD CORR V CORR V CORR V CORR V ;

29 Utilisation de la Proc CALIS
proc calis covariance corr residual modification ; lineqs v1 = L11 f1 + d1, v2 = L21 f1 + d2, v3 = L11 f2 + d3, v4 = L21 f2 + d4; std d1 = theta1, d2 = theta2, d3 = theta3, d4 = theta4, f1 = 1, f2 = 1; cov f1 f2 = phi12; var v1-v4; run;

30 Résultat de la Proc CALIS pour le modèle 2
RMSEA Estimate RMSEA 90% Lower Confidence Limit RMSEA 90% Upper Confidence Limit Résultat de AMOS pour le modèle 3 RMSEA LO HI PCLOSE Conclusion L’hypothèse H0 : RMSEA  est rejetée puisque : (1) l’intervalle de confiance du RMSEA est au-dessus de 0.05, (2) Niveau de signification du test = = « Proba. (H0 vraie) »  Le modèle 2 n’est pas accepté.

31 Le modèle correspondant à l’indépendance entre les VM :
Deux modèles extrêmes Le modèle saturé : Ce modèle contient autant de paramètres que de données : [q(q+1)/2]. Ce modèle présente 0 degré de liberté. [Il reconstitue parfaitement la matrice des covariances : FMIN=0] Le modèle correspondant à l’indépendance entre les VM : Toutes les variables manifestes sont indépendantes entre elles. Les seuls paramètres à estimer sont les variances des VM. Ce modèle présente le nombre maximum de degrés de liberté. [C’est le modèle avec le plus de contraintes possibles]

32 Le modèle est accepté si CFI  0.9
Indices de Validation basés sur la comparaison au modèle de l’indépendance : Bentler Comparative Fit Index (CFI) CFI compare le modèle étudié au modèle correspondant au cas de l’indépendence entre les variables manifestes : Le modèle est accepté si CFI  0.9

33 Le modèle est accepté si :
Bentler-Bonnet Non-Normed Fit Index (NNFI) équivalent au Tucker-Lewis Index (TLI) Le modèle est accepté si : NNFI  0.9 ou même 0.95

34 Le modèle est accepté si : GFI et AGFI  0.9
Goodness-of-Fit Index (GFI) Adjusted Goodness-of-Fit Index (AGFI) Le modèle est accepté si : GFI et AGFI  0.9

35 Root Mean Square Residual (RMR)
Standardized RMR à comparer à .10.

36 Akaike Information Criterion (AIC) calculé dans AMOS
ECVI

37 Amélioration du modèle Utilisation des indices de modification
Les indices de modification mesurent la diminution du khi-deux obtenue en ajoutant une flèche (simple ou double) sur le schéma fléché. Rank Order of the 5 Largest Modification Indices Row Column Chi-Square Pr > ChiSq d d <.0001 d d <.0001 d d <.0001 SAS AMOS Modification Indices Covariances: M.I. Par Change D2 <=> D D2 <=> D

38 3e modèle : Utilisation de la Proc CALIS
proc calis covariance corr residual modification outstat = a; lineqs v1 = L11 f1 + d1, v2 = L21 f1 + d2, v3 = L11 f2 + d3, v4 = L21 f2 + d4; std d1 = theta1, d2 = theta2, d3 = theta3, d4 = theta4, f1 = 1, f2 = 1; cov f1 f2 = phi12, d2 d4 = theta24; var v1-v4; run;

39 Résultats du 3e modèle visualisés avec AMOS Coefficients standardisés
(écart-type = .047)

40 Estimation des variables latentes
Résultat de l’option OUTSTAT de la Proc CALIS _NAME_ v v v v4 f f Chaque variable latente est estimée par régression multiple de la variable latente théorique sur toutes les variables manifestes centrées : - XSI1 = 0.529*PSY *PHY *PSY *PHY71 - XSI2 = 0.072*PSY *PHY *PSY *PHY71

41 II. Analyse factorielle confirmatoire du second ordre (analyse de tableaux multiples)
Facteurs du 1er ordre Facteur du 2e ordre

42 Résultats visualisés avec AMOS (Coefficients non standardisés)

43 Résultats visualisés avec AMOS (Coefficients standardisés)

44 Estimation des variables latentes
- XSI1 = 0.365*PSY *PHY *PSY *PHY71 - XSI2 = 0.090*PSY *PHY *PSY *PHY71 - XSI = 0.220*PSY *PHY *PSY *PHY71 On peut aussi estimer chaque facteur du premier ordre comme combinaison linéaire de ses variables manifestes : - en prenant le fragment du facteur de 2e ordre XSI correspondant à chaque bloc (style AFM), - par régression du facteur du second ordre XSI sur chaque bloc (style ACG ou Mode B de l’approche PLS), - par régression PLS de XSI sur chaque bloc (chaque variable manifeste est pondérée par sa covariance avec XSI).

45 III. Autres méthodes d’estimation
Unweighted Least Squares (ULS) Fonction minimisée : F = 0.5*||S – C||2 Generalized Least Squares (GLS) * Fonction minimisée : F = 0.5*||I - S-1C||2 ‘ Scale free ’ Least Squares (SLS) Fonction minimisée : F = 0.5*||{diag(S)}-1(S - C)||2 Asymptotically distribution-free (ADF) * Fonction minimisée : * Chi-Square = (n-1)F  2(ddl) si le modèle étudié est exact.

46 IV. Les modèles de causalité (Path models)
Récursif vs non récursif X1 X2 Y1 Y2 D1 D2 1 X1 X2 Y1 Y2 D1 D2 1 Modèle récursif Modèle non récursif Erreurs non corrélées Pas de boucles

47 Modèles de causalité (Path models)
Récursif vs non récursif D1 D1 1 1 X1 Y1 X1 Y1 1 D2 1 D2 X2 Y2 X2 Y2 Modèle partiellement récursif Modèle non récursif - Bow-Free pattern - Considéré comme récursif - Bow pattern - Considéré comme non récursif

48 Modèles identifiables
Les modèles récursifs sont identifiables. Les conditions pour qu’un modèle non récursif soit identifiable sont complexes : voir Kline chapitre 9.

49 Un exemple de modèle de causalité
Engagement sentimental d’une personne avec son partenaire - C. E. Rusbult : Commitment and satisfaction in romantic associations: A test of the investment model. Journal of Experimental Social Psychology, 1980 - L. Hatcher : A step-by-step approach to using the SAS system for factor analysis and structural equation modeling. SAS Institute, 1994 Variables observées sur 240 individus : - Commitment - Satisfaction - Rewards - Costs - Investment size - Alternative value

50 Description des variables
Commitment : the subject’s intention to maintain a current romantic relationship Satisfaction : the subject’s emotional response to the current relationship Investment size : the amount of time and effort that the subject has put into the current relationship Alternative value : perceived attractiveness of the subject’s alternatives to the current relationship Rewards : the subject’s perceptions of the number of good things associated with the current relationship Costs : the subject’s perceptions of the number of bad things associated with the current relationship

51 Le modèle

52 Les données

53 Résultats (non standardisés)
1.57 Rewards 1.43 .74 e2 1 -.78 Satisfaction -.43 .39 1.98 1.04 Costs Commitment -.95 1 1.62 -.41 .48 e1 2.43 .93 -.52 Investments Chi-square = DF = 4 p-value = .000 -1.15 Chi-square/DF = 9.347 3.50 RMSEA = .187 Alternatives p-value (RSMEA) = .000

54 Résultats (standardisés)

55 Résultats

56 Modèle révisé 1

57 Résultats pour le modèle 1

58 Modèle révisé 2

59 Résultats modèle 2

60 Modèle révisé 2 : résultats standardisés
Rewards .35 e2 -.44 Satisfaction -.32 .30 .53 R2 =.61 Costs Commitment -.41 .21 -.15 R2 = .70 -.19 e1 .32 .35 -.42 Investments Chi-square = 1.123 DF = 2 p-value = .570 -.39 Chi-square/DF = .562 RMSEA = .000 Alternatives p-value (RSMEA) = .726

61 Exemple Illness (Kline)
Corrélations et écarts-types, n = 373 Problème avec les écarts-types !

62 Le modèle de Roth D1 1 Fitness Exercice D2 1 Illness Hardiness Stress
Modèle de Roth en trait continu. Vérifier que les autres liaisons sont non significatives.

63 Utilisation de AMOS sur le modèle saturé
Résultats non standardisés e1 1 Fitness .22 e2 -.44 Exercice 1 .03 .08 Illness -.20 -75.61 -.01 -.12 .27 Hardiness -.39 Stress 1 e3

64 Résultats standardisés
e1 Fitness .39 e2 -.26 Exercice .03 .08 Illness -.11 -.03 -.01 -.07 .29 Hardiness -.22 Stress e3

65 Résultats modèle saturé
CMIN Model NPAR CMIN DF P CMIN/DF Default model 15 .000 Saturated model Independence model 5 10 16.550 Regression Weights: Estimate S.E. C.R. P Fitness <--- Exercice .217 .026 8.249 *** Hardiness .079 .046 1.719 .086 Stress -.393 .089 -4.427 -.014 .055 -.261 .794 -.198 .099 -1.993 Illness -.442 .087 -5.067 .271 .045 6.000 .032 .048 .663 .507 -.121 -1.530 .126 Covariances Estimate S.E. C.R. P Exercice <--> Hardiness -.578 .563 Variances: Estimate S.E. C.R. P Exercice 13.638 *** Hardiness e1 83.307 e3 e2

66 Effet direct, indirect et total
Direct Effects Total Effects Hardiness Exercice Fitness Stress .079 .217 .000 -.409 -.057 -.198 Illness -.267 -.080 -.496 .271 Hardiness Exercice Fitness Stress .079 .217 .000 -.393 -.014 -.198 Illness -.121 .032 -.442 .271 Pas d’effet direct de Exercice sur Illness Indirect Effects Hardiness Exercice Fitness Stress .000 -.016 -.043 Illness -.146 -.112 -.054 Mais peut-être un effet indirect

67 Exemple : effets de Exercice sur Illness
Illness = .032*Exercice -.442*Fitness *Stress -.121*Hardiness Fitness = .217*Exercice +.079*Hardiness Stress = -.198*Fitness -.014*Exercice -.393*Hardiness = -.198*(.217*Exercice) -.014*Exercice -.393*Hardiness = -.057*Exercice -.393*Hardiness Illness =.032*Exercice -.442*(.217*Exercice *Hardiness) +.271*(-.057*Exercice *Hardiness) -.121*Hardiness = .032*Exercice -.096*Exercice *Exercice *Hardiness = .032*Exercice -.112*Exercice -.267*Hardiness = -.080*Exercice *Hardiness Effet direct Effet indirect Effet total

68 Utilisation du Bootstrap sur des données individuelles et sur des données résumées par leurs moyennes et leur matrice de variances/covariances Les paramètres du modèle peuvent être validés en utilisant le Bootstrap : - Sur des données individuelles sans hypothèse de loi de probabilité - Sur des données résumées par leurs moyennes et leur matrice de variances/covariances en supposant des distributions multinormales avec les moyennes et variances/covariances observées sur les données étudiées. AMOS génère N vecteurs des moyennes et N matrices de variances/covariances : parametric bootstrap.

69 Résultats du parametric bootstrap

70 V. Modélisation de relations de causalité sur variables latentes (SEM)
Engagement sentimental d’une personne avec son partenaire Des blocs de variables manifestes sont observées sur 240 individus pour décrire les variables latentes suivantes : - Commitment - Satisfaction - Rewards - Costs - Investment size - Alternative value

71 Exemple de blocs Investment Size
Please rate each of the following items to indicate the extent to which you agree or disagree with each statement. Use a response scale in which 1 = Strongly Disagree and 7 = Strongly Agree. 1. I have invested a great deal of time in my current relationship. 2. I have invested a great deal of energy in my current relationship. 3. I have invested a lot of my personal resources (e.g., money) in developing my current relationship. 4. My partner and I have developed a lot of mutual friends which I might lose if we were to break up.

72 Exemple de blocs Satisfaction
1. I am satisfied with my current relationship. 2. My current relationship comes close to my ideal relationship. 3. I am more satisfied with my relationship than is the average person. 4. I feel good about my current relationship.

73 Exemple de blocs Alternative value
1. There are plenty of other attractive people around for me to date if I were to break up with my current partner. 2. It would be attractive for me to break up with my current partner and date someone else. 3. It would be attractive for me to break up with my partner and “play the field” for a while.

74 Validation de l’outil de mesure par Analyse Factorielle Confirmatoire
Variances des variables latentes fixées à 1

75 Validation de l’uni-dimensionalité d’un bloc
Validité convergente La corrélation entre chaque variable manifeste et sa variable latente doit être supérieure à 0.7 en valeur absolue

76 Validation de l’uni-dimensionalité d’un bloc
AVE (Average Variance Explained) De et Var() = 1, on déduit : Règle : AVE > 50%

77 Validation de l’uni-dimensionalité d’un bloc
Indice de concordance (Composite Reliability) De et Var() = 1, on déduit : Pour interpréter cet indice, il faut supposer tous les j > 0. Règle : IC > .70

78 Variables manifestes mono-factorielles

79 Validité discriminante
1) Une variable manifeste doit être plus corrélée à sa propre variable latente qu’aux autres variables latentes 2) Chaque variable latente doit mieux expliquer ses propres variables manifestes que chaque autre variable latente :

80 Le modèle de Rusbult Commitment v1 e1 1 v2 e2 v3 e3 Rewards v8 e8 v9 e9 v10 e10 Satisfaction v5 e5 v6 e6 v7 e7 Costs v11 e11 v12 e12 v13 e13 Investments v14 e14 v15 e15 v16 e16 Alternatives v17 e17 v18 e18 v19 e19 d1 d2 F1 F3 F2 F4 F5 F6 Modèle identifiable: - Modèle de mesure identifiable - Modèle de causalité au niveau des variables latentes identifiable Variances des variables latentes à estimer. Pour chaque VL, une VM a un coefficient de régression fixé à 1.

81 Estimation du modèle de Rusbult Utilisation de la Proc CALIS
proc calis covariance corr residual modification ; lineqs v1 = lv1f1 f1 + e1, v2 = lv2f1 f1 + e2, v3 = f1 + e3, . v17 = lv17f6 f6 + e17, v18 = f6 + e18, v19 = lv19f6 f6 + e19, f1 = pf1f2 f2 + pf1f5 f5 + pf1f6 f6 + d1, f2 = pf2f3 f3 + pf2f4 f d2; std e1-e3 = vare1-vare3, e5-e19 = vare5-vare19, f3-f6 = varf3-varf6, d1-d2 = vard1-vard2; cov f3 f4 = covf3f4, f3 f5 = covf3f5, f3 f6 = covf3f6, f4 f5 = covf4f5, f4 f6 = covf4f6, f5 f6 = covf5f6; var v1 v2 v3 v5-v19; run; Indétermination levée en fixant à 1 un coefficient de régression d’une variable manifeste par bloc Les variances de F1 et F2 dépendent des autres paramètres du modèle.

82 Estimation du modèle : résultats standardisés
F1 F2 F3 F4 F5 F6 Chi-square = DF = 124 p-value = .000 Chi-square/DF = 1.748 RMSEA = .056 p-value = .208

83 Estimation des équations structurelles
Les équations structurelles non standardisées Latent Variable Equations with Estimates f = *f *f *f6 Std Err pf1f pf1f pf1f6 t Value d1 f = *f *f d2 Std Err pf2f pf2f4 t Value Non significatif L’engagement (F1) ne dépend pas significativement des alternatives (F6).

84 Estimation des équations structurelles
Les équations structurelles standardisées Latent Variable Equations with Standardized Estimates f = *f *f *f d1 pf1f pf1f pf1f6 f = *f *f d2 pf2f pf2f4

85 Estimation du modèle 2 F3 F4 F2 F1 F5 F6 Chi-square = 217.573 DF = 125
p-value = .000 Chi-square/DF = 1.745 RMSEA = .056 p-value = .218 F3 F4 F2 F1 F5 F6

86 Utilisation des indices de modification pour rechercher de nouveaux liens de causalité entre les variables latentes Rank Order of the 5 Largest Modification Indices (dépendante) (indépendante) Row Column Chi-Square Pr > ChiSq f2 <===== f <.0001 v f v f v f v f La satisfaction dépend aussi des investissements dans la relation.

87 Estimation du modèle 3 Tous les indices de modification entre
Chi-square = DF = 124 p-value = .000 Chi-square/DF = 1.472 RMSEA = .045 p-value = .731 Tous les indices de modification entre variables latentes sont maintenant inférieurs à 4

88 Utilisation du Bootstrap pour tester les paramètres du modèles
Modèle de causalité décrivant les causes et les conséquences de la satisfaction client Modèle complet en bleu et rouge, modèle simplifié en rouge Image Loyalty Customer Expectation Customer Perceived value satisfaction . Perceived Complaints quality

89 Customer satisfaction
L’outil de mesure pour l’industrie de la téléphonie mobile : Exemples de variables latentes et manifestes Customer expectation Customer satisfaction a) Overall satisfaction b) Fulfilment of expectations c) How well do you think “ your mobile phone provider” compares with your ideal mobil phone provider ?

90 L’outil de mesure pour l’industrie de la téléphonie mobile : Exemples de variables latentes et manifestes Customer loyalty a) If you would need to choose a new mobile phone provider how likely is it that you would choose “your provider” again ? b) Let us now suppose that other mobile phone providers decide to lower fees and prices, but “your mobile phone provider” stays at the same level as today. At which level of difference (in %) would you choose another phone provider ? c) If a friend or colleague asks you for advice, how likely is it that you would recommend “your mobile phone provider” ? Et ainsi de suite pour les autres variables latentes ...

91 Étude du modèle complet avec AMOS

92 Étude du modèle complet avec AMOS
Computation of degrees of freedom Number of distinct sample moments = 300 Number of distinct parameters to be estimated = 60 Degrees of freedom = = 240 Iteration limit reached (1000 iterations) Chi-square = Degrees of freedom = 240 Probability level = 0.000 This solution is not admissible. The following variable has negative variance. d3 ( )

93 Étude du modèle simplifié avec AMOS (Résultats sur les variables réduites)
Chi-Square = 271 DF = 128 Chi-Square /DF = 2.12 RMSEA = .067 p-value (RMSEA<=0.05) = .007

94 Utilisation du Bootstrap pour valider les paramètres du modèle standardisé

95 Poids des variables pour l’estimation des variables latentes
CUEX CUEX CUEX PERQ PERQ PERQ3 f f f f f PERQ PERQ PERQ PERQ PERV PERV CUSA1 CUSA CUSA CUSL CUSL CUSL3

96 VI. Analyse multi-groupes
Comparer un modèle sur G populations Exemple (Byrne) : 1159 prof. de classe élémentaire 388 prof. de classe intermédiaire 1384 prof. de classe secondaire QUESTION Le modèle est-il invariant au niveau des variances des VL, des covariances et des coefficients de régression VM-VL ?

97 Modèle sans contraintes
Elémentaire

98 Modèle sans contraintes
Intermédiaire

99 Modèle sans contraintes
Secondaire

100 Modèle avec contraintes
Ecriture des contraintes : AMOS permet de nommer automatiquement les paramètres contraints.

101 Modèle avec contraintes
Elémentaire

102 Modèle avec contraintes
Intermédiaire

103 Modèle avec contraintes
Secondaire

104 Test de l’invariance du modèle
Comparer le modèle sans contraintes (M1) et le modèle avec contraintes (M2) Test sur le modèle sans contraintes M1 : Hypothèse H0 Les covariances sont égales sur les 3 groupes. Les variances des VL sont égales sur les 3 groupes. Les coefficients de régression VM-VL sont égaux sur les 3 groupes.

105 Comparaison de deux modèles emboités
Calcul du Khi-deux global Population g Global pour G populations

106 Comparaison de deux modèles emboités
Statistique utilisée Nombre de degrés de liberté dl (modèle) = Nb de covariances – Nb de paramètres du modèle Modèle 1 : 3*20*21/2 – 3*(20 var. rés coef. Reg var VL + 5 cov) = 495 Modèle 2 : 3*20*21/2 – (3*20 var. rés coef. Reg var VL + 5 cov) = 545

107 Comparaison de deux modèles emboités
Règle de décision On rejette le modèle avec contraintes M2 (hypothèse H0) au profit du modèle sans contrainte M1 au risque  de se tromper si Application Rejet de H0

108 CONCLUSION Covariance-based SEM représente la principale demande en analyse des données des chercheurs en sciences « soft » : Marketing, Stratégie, Sciences politiques, Psychologie, Sociologie,… Cov-SEM, l’approche PLS et la régression PLS permettent de modéliser les liens de causalité entre blocs de variables. Cov-SEM est une méthode confirmatoire : elle permet de valider les hypothèses du chercheur.

109 Références L. Hatcher : A step-by-step approach to using the SAS system for factor analysis and structural equation modeling, SAS Institute, 1994 J. Scott Long : Confirmatory Factor Analysis, SAGE Publications, 1983 Covariance structure models, J.L. Arbuckle & W. Wothke : Amos 4.0 Users’ guide, SmallWaters Corp., 1999

110 Schumaker & Lomax : A beginner’s guide to SEM Lawrence Erlbaum Associates, Mahwah (NJ), 1996 Byrne, BM : SEM with AMOS: Basic Concepts Applications and programming Lawrence Erlbaum Associates, Mahwah (NJ), 2001 Kaplan D. : Structural equation modeling SAGE, 2000 Rex B. Kline : Principles and practice of structural equation modeling The Guilford Press, New York, 2005 Kenneth A. Bollen : Structural equations with latent variables, Wiley, 1989

111 Annexe Modélisation des équations structurelles
Variables latentes : Modèle structurel (Modèle interne):

112 Modélisation des équations structurelles
Modèle de mesure (Modèle externe) : VM VL VM VL Endogenous Exogenous

113 Modélisation des équations structurelles
Intégration des modèles structurel et de mesure : Forme réduite Pas de corrélation entre les résidus , , .

114 Modélisation des équations structurelles
Matrice de covariance des variables manifestes : Cov. des VL ex. Covariance des résidus des éq. struct. Covariance des résidus du modèle de mesure Modèle externe Modèle interne

115 Modélisation des équations structurelles
Méthode du Maximum de Vraisemblance : S = Matrice des covariances observées des VM Minimiser F = Trace(SC-1) - q + Ln(det C) - Ln(det S)

116 Modélisation des équations structurelles
Calcul des écarts-types des paramètres :


Télécharger ppt "Michel Tenenhaus tenenhaus@hec.fr Analyse factorielle confirmatoire, Modèle de causalité (Path analysis) et Modélisation d’équations structurelles."

Présentations similaires


Annonces Google