Analyse de la variance à deux facteurs (données déséquilibrées) Michel Tenenhaus
2 Exemple 3 (Searle) Première germination de trois variétés de carotte dans deux types de terre Nombre de jours pour la première germination de carotte
3 Analyse de la variance à deux facteurs (Données déséquilibrées) Données : Si les effectifs n ij reflètent les tailles des populations et sont choisis a priori, on peut en tenir compte dans les tests.
4 Modèle additif vs modèle avec interaction Modèle additif : La différence entre les terres ne dépend pas de la variété. Modèle avec interaction : La différence entre les terres dépend de la variété. Ici le modèle avec interaction semble préférable (à cause de la case (2,2)).
5 Les tests sur les facteurs (Données déséquilibrées) Test sur A (Type I pour A placé en premier) : Test sur A (Type III) :
6 Test sur A (Type I) Test sur A (Type I) :
7 RESULTATS SPSS
8 Estimation du modèle de rang plein
9 Contraste pour le test sur A (Type I)
10 Contraste pour le test sur A (Type I)
11 UNIANOVA jour BY terre variete /METHOD = SSTYPE(3) /INTERCEPT = INCLUDE /CRITERIA = ALPHA(.05) /LMATRIX "terre type I" terre variete terre*variete /PRINT = PARAMETER TEST(LMATRIX) /CRITERIA = ALPHA(.05) /DESIGN = terre variete terre*variete.
12
13 Test sur A (Type III) Test sur A (Type III, indépendant de lordre des facteurs) :
14 UNIANOVA jour BY terre variete /METHOD = SSTYPE(3) /INTERCEPT = INCLUDE /CRITERIA = ALPHA(.05) /LMATRIX "terre type 3" terre 3 -3 terre*variete /PRINT = PARAMETER TEST(LMATRIX) /CRITERIA = ALPHA(.05) /DESIGN = terre variete terre*variete. Syntaxe SPSS
15 Résultats
16 RESULTATS SPSS pour les tests de type III
17
18 Tests sur le facteur B Test sur B (Type I, B placé en premier) : Test sur B (Type III) :
19 Test sur B (Type I) : Résultats
20 Tests sur linteraction A*B Test sur A*B (A*B placé en dernier pour le Type I ou Type III) :
21 Les différents types de somme des carrés Modèle : Y = + 1 (A 1 -A 2 ) + 1 (B 1 -B 3 ) + 2 (B 2 -B 3 ) + 11 (A 1 -A 2 )*(B 1 -B 3 ) + 12 (A 1 -A 2 )*(B 2 -B 3 ) + Somme des carrés : S(A, B) = Somme des carrés expliquée par A 1 -A 2 et B 1 -B 3, B 2 -B 3 Type I : A : S(A) B : S(A, B) - S(A) A*B : S(A, B, A*B) - S(A, B) Type II : A : S(A, B) - S(B) B : S(A, B) - S(A) A*B : S(A, B, A*B) - S(A, B) Type III : A : S(A, B, A*B) - S(B, A*B) B : S(A, B, A*B) - S(A, A*B) A*B : S(A, B, A*B) - S(A, B)
22 Estimation et comparaison des moyennes Modèle avec interaction : Estimation des i. : Pour des données déséquilibrées :
23 Comparaison des moyennes marginales Méthode de Tukey Facteur Variété
24 Comparaison des moyennes marginales Méthode de Sidak (Variante de REGWQ) Facteur Variété Aucune différence significative.
25 Calcul des moyennes estimées Estimated Marginal Means Variete
26 Comparaison des moyennes estimées Méthode de Sidak Facteur Variété Les variétés 1 et 2 sont différentes (p =.013).
27 Comparaison des moyennes Modèle avec interaction : Linteraction est significative. Il faut donc comparer les sols à variété fixée. Exemple : H 0 : 11 = 21 H 0 : = 0
28 Syntaxe SPSS UNIANOVA jour BY terre variete /LMATRIX = "terre1 vs terre2 at V1" terre -1 1 terre*variete /METHOD = SSTYPE(1) /INTERCEPT = INCLUDE /PRINT = PARAMETER TEST(LMATRIX) /CRITERIA = ALPHA(.05) /DESIGN = terre variete terre*variete.
29 Comparaison des moyennes 11 vs 21 (utilisation des moyennes estimées)
30 B (Variété) 123 A (Terre) Le cas des cases vides Utilisation des sommes de carrés de type IV Test sur Terre : Test sur Variété : Test sur Terre*Variété : Dépend du codage de variété
31 Vérification Case (2,2) supprimée
32 Résultats
33 Modèle estimé
34 Moyennes des cases estimées
35 Contrastes associés aux tests réalisés par SPSS
36 Test « Intercept » Pour L1 = 1 :
37 Test « Terre » Pour L2 = 1 : Test « Variété » Pour L4 = 1 et L5 = 0 : Pour L4 = 0 et L5 = 1 : Test « Terre*Variété » Pour L7 = 1 :