Analyse de la variance à effets mixtes Michel Tenenhaus
Exemple 4 (Milliken & Johnson) Rythmes cardiaques Rythme cardiaque pour trois groupes de traitements et quatre instants de mesure - Facteurs fixes : Traitement, Temps - Facteur aléatoire : Sujet(Traitement)
Extrait des données
Moyennes des rythmes cardiaques par produit et par instant
Les modèles Modèle 1 Yijk = + i + j + ij + sk(i) + ijk Produit Temps * Sujet (Produit) Résidu Effets fixes Effets aléatoires avec : - sk(i) ~ N(0, s2) s2 = Variance inter-sujets - ijk ~ N(0, 2) 2 = Variance intra-sujets Les aléas sont indépendants. Les variances peuvent dépendre du traitement. La variance intra-sujets peut dépendre du traitement et du temps.
Modèle 2 Yijk = + i + j + ij + ijk avec : Produit Temps * Résidu avec : - i.k = (i1k, i2k, i3k, i4k ) ~ N(0, ) - Les i.k sont indépendants entre eux. La matrice de covariance peut dépendre du traitement. L’utilisateur doit choisir le type de la matrice .
Quelques types de matrice
Quelques types de matrice (suite) etc...
Modèle 3 Yijk = + i + j + ij + sk(i) + ijk avec : Produit Temps Sujet (Produit) Résidu Produit * Temps avec : - sk(i) ~ N(0, s2) - ijk ~ AR(1) (*) (*) ijk = i(j-1)k + aijk , où les aijk suivent une loi N(0, a2) et sont indépendants entre eux.
Étude du modèle 1 Yijk = + i + j + ij + sk(i) + ijk Produit Temps * Sujet (Produit) Résidu avec : - sk(i) ~ N(0, s2) - ijk ~ N(0, 2) + indépendance Dans le modèle 1, les corrélations entre les mesures sont positives.
Le modèle 1 est un modèle 2 avec de type « compound symmetry » et covariance positive Yijk = + i + j + ij + sk(i) + ijk Produit Temps * Sujet (Produit) Résidu est de type « Compound Symmetry » avec covariance positive.
Formulaire Modèle : Estimation : (Utiliser Method = REML) y = X + Zu + avec : u ~ N(0, G), ~ N(0, R), et Cov(u, ) = 0 Il est préférable qu’un facteur aléatoire ait au moins 5 modalités. Sinon, passer en fixe. - Var(y) = V = ZGZ´ + R - y ~ N(X, V) Estimation : (Utiliser Method = REML) 1) Les matrices G et R sont estimées par maximum de vraisemblance restreint.
Formulaire (suite) Modèle : Test : Statistique utilisée : y = X + Zu + avec : u ~ N(0, G), ~ N(0, R), et Cov(u, ) Test : H0 : K + Mu = 0 (Inférerence : Large / étroite) Statistique utilisée :
Calcul de par la méthode de Satterthwaite (Méthode par défaut de SPSS) - Permet de retrouver les résultats du GLM pour le test d’un contraste. Le ddl du dénominateur ne dépend pas du nom de l’effet aléatoire. - Permet de généraliser l’approche de Satterthwaite aux modèles mixtes.
Etude du modèle 1 Yijk = + i + j + ij + sk(i) + ijk Produit Temps * Sujet (Produit) Résidu Utilisation de SPSS
Résultats Modèle 1
Résultats Modèle 1 (suite)
Résultats Modèle 1 (suite)
Résultats Modèle 1 (Proc Mixed de SAS) Estimated V Matrix for sujet(produit) 1 1 Row Col1 Col2 Col3 Col4 1 33.0789 25.8016 25.8016 25.8016 2 25.8016 33.0789 25.8016 25.8016 3 25.8016 25.8016 33.0789 25.8016 4 25.8016 25.8016 25.8016 33.0789 Estimated V Correlation Matrix for sujet(produit) 1 1 1 1.0000 0.7800 0.7800 0.7800 2 0.7800 1.0000 0.7800 0.7800 3 0.7800 0.7800 1.0000 0.7800 4 0.7800 0.7800 0.7800 1.0000
Résultats Modèle 1 (suite)
Résultats Modèle 1 (SAS) Solution for Random Effects Std Err Effect sujet produit Estimate Pred DF t Value Pr > |t| sujet(produit) 1 1 2.5397 2.1708 63 1.17 0.2464 sujet(produit) 2 1 5.8091 2.1708 63 2.68 0.0095 sujet(produit) 3 1 0.9049 2.1708 63 0.42 0.6782 sujet(produit) 4 1 0.4379 2.1708 63 0.20 0.8408 sujet(produit) 5 1 -3.9993 2.1708 63 -1.84 0.0701 sujet(produit) 6 1 3.0067 2.1708 63 1.39 0.1709 sujet(produit) 7 1 -5.1669 2.1708 63 -2.38 0.0203 sujet(produit) 8 1 -3.5322 2.1708 63 -1.63 0.1087 sujet(produit) 1 2 2.3061 2.1708 63 1.06 0.2921 sujet(produit) 2 2 1.8391 2.1708 63 0.85 0.4001 sujet(produit) 3 2 -7.0352 2.1708 63 -3.24 0.0019 sujet(produit) 4 2 1.6055 2.1708 63 0.74 0.4623 sujet(produit) 5 2 -0.2627 2.1708 63 -0.12 0.9041 sujet(produit) 6 2 1.3720 2.1708 63 0.63 0.5296 sujet(produit) 7 2 -0.2627 2.1708 63 -0.12 0.9041 sujet(produit) 8 2 0.4379 2.1708 63 0.20 0.8408 sujet(produit) 1 3 0.0292 2.1708 63 0.01 0.9893 sujet(produit) 2 3 -4.6415 2.1708 63 -2.14 0.0364 sujet(produit) 3 3 14.2747 2.1708 63 6.58 <.0001 sujet(produit) 4 3 5.1669 2.1708 63 2.38 0.0203 sujet(produit) 5 3 -1.1385 2.1708 63 -0.52 0.6018 sujet(produit) 6 3 -8.1445 2.1708 63 -3.75 0.0004 sujet(produit) 7 3 -1.6055 2.1708 63 -0.74 0.4623 sujet(produit) 8 3 -3.9409 2.1708 63 -1.82 0.0742 = 0 = 0 = 0
Résultats Modèle 1 (suite)
Comparaison des moyennes Modèle : T1 T2 T3 T4 Estimation de 11 - 31 : Test : H0 :
Comparaison entre AX23 et Contrôle en T1 Syntaxe SPSS MIXED rythme BY sujet_diff produit temps /CRITERIA = CIN(95) MXITER(100) MXSTEP(5) SCORING(1) SINGULAR(0.000000000001) HCONVERGE(0, ABSOLUTE) LCONVERGE(0, ABSOLUTE) PCONVERGE(0.000001, ABSOLUTE) /FIXED = produit temps produit*temps | SSTYPE(3) /METHOD = REML /TEST = 'mu11 vs mu31' produit 1 0 -1 produit*temps 1 0 0 0 0 0 0 0 -1 0 0 0 /PRINT = SOLUTION TESTCOV /RANDOM sujet_diff | COVTYPE(VC) . Résultats
Comparaison de deux modèles imbriqués Modèle M1 Modèle M0 : cas particulier de M1 Les paramètres de M0 ne sont pas sur leurs frontières de définition. Test LRT (Likelihood Ratio Test) : où = Nb de paramètres de M1 - Nb de paramètres de M0. Utiliser plutôt « Method = ML »
Test d’un effet aléatoire Test sur le modèle à un effet aléatoire : H0 : s2 = 0 Statistique utilisée : G2 = [-2Log L(Modèle sans effet)] - [-2Log L(Modèle à un effet)] Calcul du niveau de signification : NS = 0.5Prob(2(0) G2) + 0.5Prob(2(1) G2) (2(0) = 0 avec la probabilité 1) La correction réduit le niveau de signification du test LRT usuel.
Application Avec effet sujet Sans effet sujet G2 = [-2Log L(Modèle sans effet)] - [-2Log L(Modèle à un effet)] = 595.511 – 515.437 = 80.074 NS = 0.5Prob(2(0) G2) + 0.5Prob(2(1) G2) = 0.5*Prob(2(1) 80) = 0.000
Recherche d’une tendance polynomiale On exprime le vecteur des moyennes en fonction de polynômes orthogonaux : Constante Linéaire Quadratique Q0, Q1, Q2, Q3 forment une base orthonormée. Cubique
Construction des contrastes orthogonaux On exprime le vecteur des moyennes en fonction des polynômes orthogonaux : Contrastes orthogonaux : Tests : H0 : 1 = 2 = 3 = 4 <==> H0 : 1 = 2 = 3 = 0 H0 : Tendance linéaire <==> H0 : 1 0, 2 = 3 = 0 H0 : Tendance quadratique <==> H0 : 2 0, 3 = 0
Recherche de tendances - AX23 : Quadratique - BWW9 : Linéaire - Contrôle : Constante
Recherche de tendance quadratique pour AX23 Modèle : Tests :
Recherche de tendance quadratique pour AX23 Code SPSS : MIXED rythme BY sujet_diff produit temps /CRITERIA = CIN(95) MXITER(100) MXSTEP(5) SCORING(1) SINGULAR(0.000000000001) HCONVERGE(0, ABSOLUTE) LCONVERGE(0, ABSOLUTE) PCONVERGE(0.000001, ABSOLUTE) /FIXED = produit temps produit*temps | SSTYPE(3) /METHOD = REML /TEST = 'ax23,contraste qua.' temps 1 -1 -1 1 produit*temps 1 -1 -1 1 0 0 0 0 0 0 0 0 /TEST = 'ax23,contraste cub.' temps 1 -3 3 -1 produit*temps 1 -3 3 -1 0 0 0 0 0 0 0 0 /RANDOM sujet_diff | COVTYPE(VC) . Résultats : ==> Validation de la tendance quadratique
Étude du modèle 2 Yijk = + i + j + ij + ijk Produit Temps * Résidu avec des i.k = (i1k, i2k, i3k, i4k ) ~ N(0, ) ou N(0, i) et indépendants entre eux Il faut préciser le type de la matrice de covariance .
de type UN (UNSTRUCTURED)
Résultats SPSS : de type « UNSTRUCTURED »
Estimated R Correlation Matrix for sujet(produit) 1 1 Row Col1 Col2 Col3 Col4 1 1.0000 0.8280 0.8255 0.6445 2 0.8280 1.0000 0.8373 0.7223 3 0.8255 0.8373 1.0000 0.8346 4 0.6445 0.7223 0.8346 1.0000
de type CS (COMPOUND SYMMETRY)
Résultats SPSS : de type « CS »
de type AR(1) (Auto-régressif d’ordre 1)
de type AR(1) (Auto-régressif d’ordre 1) Estimated R Correlation Matrix for sujet(produit) 1 1 Row Col1 Col2 Col3 Col4 1 1.0000 0.8207 0.6735 0.5527 2 0.8207 1.0000 0.8207 0.6735 3 0.6735 0.8207 1.0000 0.8207 4 0.5527 0.6735 0.8207 1.0000
de type CS hétérogène par temps
Résultats SPSS
Résultats SPSS
Modèle 3 Yijk = + i + j + ij + sk(i) + ijk Produit Temps Sujet (Produit) Résidu Produit * Temps avec sk(i)~ N(0, s2) et ijk~ AR(1). Syntaxe SPSS MIXED rythme BY produit temps sujet_diff /CRITERIA = CIN(95) MXITER(100) MXSTEP(5) SCORING(1) SINGULAR(0.000000000001) HCONVERGE(0, ABSOLUTE) LCONVERGE(0, ABSOLUTE) PCONVERGE(0.000001, ABSOLUTE) /FIXED = produit temps produit*temps | SSTYPE(3) /METHOD = REML /PRINT = SOLUTION TESTCOV /RANDOM sujet_diff | COVTYPE(VC) /REPEATED = temps | SUBJECT(sujet_diff) COVTYPE(AR1) .
Estimated R Correlation Matrix for sujet(produit) 1 1 Row Col1 Col2 Col3 Col4 1 1.0000 0.5017 0.2517 0.1263 2 0.5017 1.0000 0.5017 0.2517 3 0.2517 0.5017 1.0000 0.5017 4 0.1263 0.2517 0.5017 1.0000
Choix du type de matrice Critère d’Akaike AIC = - 2 (Res) Log likelihood + 2d où d = nombre de paramètres du modèle définissant (Covariance parameters) Critère de Schwartz (BIC) BIC = - 2 (Res) Log likelihood + dLog(n) - For REML, the value of n is chosen to be total number of cases minus number fixed effect parameters and d is number of covariance parameters. - For ML, the value of n is total number of cases and d is number of fixed effect parameters plus number of covariance parameters. On recherche minimisant le BIC.
Calcul des critères d’Akaike et de Schwarz pour le modèle 3 Critère d’Akaike d =Nombre de paramètres de = 3 AIC = - 2 (Res) Log likelihood + 2d = 482.7 + 6 = 488.7 Critère de Schwarz (BIC) n = 96 – 12 = 84 et d = 3 BIC = - 2 (Res) Log likelihood + dLog(n) = 482.693 + 3Log(84) = 495.985
Choix du meilleur modèle
Modèle 4 Yk(i) = (Yi1k, Yi2k, Yi3k, Yi4k) ~ N(i, ) avec : i = (i1, i2, i3, i4) et Test : H0 : LM = 0 H1 : LM 0 Statistique : - Calcul des niveaux de signification plus précis qu’avec l’approche univariée, et même exact si min(rang L, rang M) 2. - Pas de données manquantes.
Transformation de Rao m = Nombre de groupes, v = N – m avec : p = rang (M), q = rang (L) m = Nombre de groupes, v = N – m r = v – (p – q + 1)/2, u = (pq –2)/4 t = si p2 + q2 –5 > 0, = 1 sinon. Lorsque l’hypothèse H0 est vraie, F suit approximativement une loi F(pq, rt–2u). La loi est exacte si le minimum de (p, q) est inférieur ou égal à 2.
Les données
Test de l’effet « Produit »
Test de l’effet « Produit » Syntaxe SPSS GLM rythme1 rythme2 rythme3 rythme4 BY produit /METHOD = SSTYPE(3) /INTERCEPT = EXCLUDE /CRITERIA = ALPHA(.05) /LMATRIX = "Effet Produit" produit -1 1 0; produit -1 0 1 /MMATRIX = "Moyenne" rythme1 .25 rythme2 .25 rythme3 .25 rythme4 .25 /DESIGN = produit .
Test de l’effet « Temps »
GLM rythme1 rythme2 rythme3 rythme4 BY produit /METHOD = SSTYPE(3) /INTERCEPT = EXCLUDE /CRITERIA = ALPHA(.05) /LMATRIX = "Moyenne Produit" produit 1/3 1/3 1/3 /MMATRIX = "rythme 2 - rythme 1 " rythme1 -1 rythme2 1 rythme3 0 rythme4 0; "rythme 3 - rythme 1 " rythme1 -1 rythme2 0 rythme3 1 rythme4 0; "rythme 4 - rythme 1 " rythme1 -1 rythme2 0 rythme3 0 rythme4 1 /DESIGN = produit .
Test de l’interaction « Produit*Temps »
Test de l’interaction « Produit*Temps » GLM rythme1 rythme2 rythme3 rythme4 BY produit /METHOD = SSTYPE(3) /INTERCEPT = EXCLUDE /CRITERIA = ALPHA(.05) /LMATRIX = « Effet produit" produit -1 1 0; produit -1 0 1 /MMATRIX = "rythme 2 - rythme 1 " rythme1 -1 rythme2 1 rythme3 0 rythme4 0; "rythme 3 - rythme 1 " rythme1 -1 rythme2 0 rythme3 1 rythme4 0; "rythme 4 - rythme 1 " rythme1 -1 rythme2 0 rythme3 0 rythme4 1 /DESIGN = produit .
Comparaison GLM multivarié / MIXED - Les F de Rao conduisent à des résultats exacts car Min(rang L, rang M) 2. - Comparaisons inter-sujets : GLM multivarié = MIXED Comparaisons intra-sujets : GLM multivarié MIXED
Utilisation de la commande « Repeated Measures » de SPSS
Résultats SPSS
Résultats SPSS
Conclusion : Pour la commande MIXED Estimation de la structure de covariance entre les données. Estimation correcte des effets fixes et aléatoires. Inférence large et étroite. Possibilité de variances hétérogènes Les résultats justes (au niveau univarié) de la Proc GLM sont retrouvés avec la Proc MIXED. Comparaisons multiples inter-sujets basées sur des moyennes ajustées estimées au niveau de la population. Possibilité de données manquantes.