Analyse de la variance à effets mixtes

Slides:



Advertisements
Présentations similaires
Mais vous comprenez qu’il s’agit d’une « tromperie ».
Advertisements

Le Nom L’adjectif Le verbe Objectif: Orthogram
ORTHOGRAM PM 3 ou 4 Ecrire: « a » ou « à » Référentiel page 6
Reporting de la Cellule Nationale Droit dOption Situation au 31 décembre 2011.
Licence pro MPCQ : Cours
Présentation de la circonscription Année 2011/2012 Jeudi 24 novembre 2011.
Additions soustractions
Distance inter-locuteur
1 Plus loin dans lutilisation de Windows Vista ©Yves Roger Cornil - 2 août
11 Bienvenue Entrez le nom du groupe ou projet ici mardi, 17 novembre 2009.
Les numéros 70 –
Les numéros
Les identités remarquables
Le, la, les words Possessive Adjectives MINE!!. 2 My in french is mon, ma,mes... Le word/ begins with a vowel: Mon La word: Ma Les word: Mes.
Calcul mental 3ème 2 Septembre 2010
LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.
Données statistiques sur le droit doption au 31/01 8 février 2012.
LA RÉGRESSION MULTIPLE
Analyse de la variance à un facteur
Analyse de la variance à deux facteurs (données déséquilibrées) Michel Tenenhaus.
1 Analyse de la variance multivariée Michel Tenenhaus.
Modèle Linéaire Généralisé (Proc Genmod)
Correspondances en Onco-Urologie - Vol. III - n° 3 – juillet-août-septembre VESSIE Daprès James ND et al., N Engl J Med 2012;366:16:
La relève et le sondage sur la tarification et les revenus Une présentation de François Gauthier.
Révision (p. 130, texte) Nombres (1-100).
La législation formation, les aides des pouvoirs publics
1 7 Langues niveaux débutant à avancé. 2 Allemand.
COTE DIVOIRE IMAGES DES ATROCITES COMMISES PAR ALASSANE DRAMANE OUATARA, SORO GUILAUMES ET LEURS HOMMES 1.
SERABEC Simulation sauvetage aérien avec un Hercule C130. Départ de St-Honoré le 4 octobre Durée de vol 3 heures. Premier vol en Hercule pour les.
Relations entre élastométrie, marqueurs biologiques et ponction biopsie hépatique chez 67 patients Sénégalais avec charge virale VHB ≥3.2 log UI/mL.
La méthodologie………………………………………………………….. p3 Les résultats
Structure(djs)TéléphoneFax ADRA R049,96,03,21 CHLEF027,77,22,66 /77,49, LAGHOUAT029,90,41,08029,90,42,47 OUM EL BOUAGHI032,42,16,26032,42,45,32.
Le Concours de Conaissance III Francais I fevrier 2013.
Jack Jedwab Association détudes canadiennes Le 27 septembre 2008 Sondage post-Olympique.
Le soccer & les turbans Sondage mené par lAssociation détudes canadiennes 14 juin 2013.
Présentation générale
L’indicateur de développement humain
GRAM 1 CE2 Je sais transformer une phrase affirmative en phrase négative.
Le drapeau canadien comme symbole de fierté nationale : une question de valeurs partagées Jack Jedwab Association détudes canadiennes 28 novembre 2012.
Session 7 1 IST/VIH/SIDA.
Le Concours de Conaissance Francais I novembre 2012.
Si le Diaporama ne s'ouvre pas en plein écran Faites F5 sur votre clavier.
Titre : Implémentation des éléments finis sous Matlab
Les nombres.
LES NOMBRES PREMIERS ET COMPOSÉS
CLL11 : chlorambucil (CLB) versus CLB + rituximab (R)
Logiciel gratuit à télécharger à cette adresse :
Les chiffres & les nombres
1.Un rang de données multicolores 2. Deux permutations des n premiers entiers 3. b permutations des k premiers entiers 4. Choix de n points dans [0,1]
RACINES CARREES Définition Développer avec la distributivité Produit 1
Systèmes mécaniques et électriques
DUMP GAUCHE INTERFERENCES AVEC BOITIERS IFS D.G. – Le – 1/56.
La statistique descriptive
Année universitaire Réalisé par: Dr. Aymen Ayari Cours Réseaux étendus LATRI 3 1.
Titre : Implémentation des éléments finis en Matlab
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
1 INETOP
Influenza: le modèle épidémiologique belge 29 Mai 2009
Aire d’une figure par encadrement
P.A. MARQUES S.A.S Z.I. de la Moussière F DROUE Tél.: + 33 (0) Fax + 33 (0)
Les fondements constitutionnels
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
1/65 微距摄影 美丽的微距摄影 Encore une belle leçon de Macrophotographies venant du Soleil Levant Louis.
Certains droits réservés pour plus d’infos, cliquer sur l’icône.
Nom:____________ Prénom: ___________
LES COURSES SUR PISTE.
Annexe Résultats provinciaux comparés à la moyenne canadienne
Commission paritaire de suivi des opérations de reclassement repositionnement dans le cadre du droit d’option Statistiques novembre 2010.
La formation des maîtres et la manifestation de la compétence professionnelle à intégrer les technologies de l'information et des communications (TIC)
Transcription de la présentation:

Analyse de la variance à effets mixtes Michel Tenenhaus

Exemple 4 (Milliken & Johnson) Rythmes cardiaques Rythme cardiaque pour trois groupes de traitements et quatre instants de mesure - Facteurs fixes : Traitement, Temps - Facteur aléatoire : Sujet(Traitement)

Extrait des données

Moyennes des rythmes cardiaques par produit et par instant

Les modèles Modèle 1 Yijk =  + i + j + ij + sk(i) + ijk Produit Temps * Sujet (Produit) Résidu Effets fixes Effets aléatoires avec : - sk(i) ~ N(0, s2) s2 = Variance inter-sujets - ijk ~ N(0, 2) 2 = Variance intra-sujets Les aléas sont indépendants. Les variances peuvent dépendre du traitement. La variance intra-sujets peut dépendre du traitement et du temps.

Modèle 2 Yijk =  + i + j + ij + ijk avec : Produit Temps * Résidu avec : - i.k = (i1k, i2k, i3k, i4k ) ~ N(0, ) - Les i.k sont indépendants entre eux. La matrice de covariance  peut dépendre du traitement. L’utilisateur doit choisir le type de la matrice .

Quelques types de matrice 

Quelques types de matrice  (suite) etc...

Modèle 3 Yijk =  + i + j + ij + sk(i) + ijk avec : Produit Temps Sujet (Produit) Résidu Produit * Temps avec : - sk(i) ~ N(0, s2) - ijk ~ AR(1) (*) (*) ijk =  i(j-1)k + aijk , où les aijk suivent une loi N(0, a2) et sont indépendants entre eux.

Étude du modèle 1 Yijk =  + i + j + ij + sk(i) + ijk Produit Temps * Sujet (Produit) Résidu avec : - sk(i) ~ N(0, s2) - ijk ~ N(0, 2) + indépendance Dans le modèle 1, les corrélations entre les mesures sont positives.

Le modèle 1 est un modèle 2 avec  de type « compound symmetry » et covariance positive Yijk =  + i + j + ij + sk(i) + ijk Produit Temps * Sujet (Produit) Résidu est de type « Compound Symmetry » avec covariance positive.

Formulaire Modèle : Estimation : (Utiliser Method = REML) y = X + Zu +  avec : u ~ N(0, G),  ~ N(0, R), et Cov(u, ) = 0 Il est préférable qu’un facteur aléatoire ait au moins 5 modalités. Sinon, passer en fixe. - Var(y) = V = ZGZ´ + R - y ~ N(X, V) Estimation : (Utiliser Method = REML) 1) Les matrices G et R sont estimées par maximum de vraisemblance restreint.

Formulaire (suite) Modèle : Test : Statistique utilisée : y = X + Zu +  avec : u ~ N(0, G),  ~ N(0, R), et Cov(u, ) Test : H0 : K + Mu = 0 (Inférerence : Large / étroite) Statistique utilisée :

Calcul de  par la méthode de Satterthwaite (Méthode par défaut de SPSS) - Permet de retrouver les résultats du GLM pour le test d’un contraste. Le ddl du dénominateur ne dépend pas du nom de l’effet aléatoire. - Permet de généraliser l’approche de Satterthwaite aux modèles mixtes.

Etude du modèle 1 Yijk =  + i + j + ij + sk(i) + ijk Produit Temps * Sujet (Produit) Résidu Utilisation de SPSS

Résultats Modèle 1

Résultats Modèle 1 (suite)

Résultats Modèle 1 (suite)

Résultats Modèle 1 (Proc Mixed de SAS) Estimated V Matrix for sujet(produit) 1 1 Row Col1 Col2 Col3 Col4 1 33.0789 25.8016 25.8016 25.8016 2 25.8016 33.0789 25.8016 25.8016 3 25.8016 25.8016 33.0789 25.8016 4 25.8016 25.8016 25.8016 33.0789 Estimated V Correlation Matrix for sujet(produit) 1 1 1 1.0000 0.7800 0.7800 0.7800 2 0.7800 1.0000 0.7800 0.7800 3 0.7800 0.7800 1.0000 0.7800 4 0.7800 0.7800 0.7800 1.0000

Résultats Modèle 1 (suite)

Résultats Modèle 1 (SAS) Solution for Random Effects Std Err Effect sujet produit Estimate Pred DF t Value Pr > |t| sujet(produit) 1 1 2.5397 2.1708 63 1.17 0.2464 sujet(produit) 2 1 5.8091 2.1708 63 2.68 0.0095 sujet(produit) 3 1 0.9049 2.1708 63 0.42 0.6782 sujet(produit) 4 1 0.4379 2.1708 63 0.20 0.8408 sujet(produit) 5 1 -3.9993 2.1708 63 -1.84 0.0701 sujet(produit) 6 1 3.0067 2.1708 63 1.39 0.1709 sujet(produit) 7 1 -5.1669 2.1708 63 -2.38 0.0203 sujet(produit) 8 1 -3.5322 2.1708 63 -1.63 0.1087 sujet(produit) 1 2 2.3061 2.1708 63 1.06 0.2921 sujet(produit) 2 2 1.8391 2.1708 63 0.85 0.4001 sujet(produit) 3 2 -7.0352 2.1708 63 -3.24 0.0019 sujet(produit) 4 2 1.6055 2.1708 63 0.74 0.4623 sujet(produit) 5 2 -0.2627 2.1708 63 -0.12 0.9041 sujet(produit) 6 2 1.3720 2.1708 63 0.63 0.5296 sujet(produit) 7 2 -0.2627 2.1708 63 -0.12 0.9041 sujet(produit) 8 2 0.4379 2.1708 63 0.20 0.8408 sujet(produit) 1 3 0.0292 2.1708 63 0.01 0.9893 sujet(produit) 2 3 -4.6415 2.1708 63 -2.14 0.0364 sujet(produit) 3 3 14.2747 2.1708 63 6.58 <.0001 sujet(produit) 4 3 5.1669 2.1708 63 2.38 0.0203 sujet(produit) 5 3 -1.1385 2.1708 63 -0.52 0.6018 sujet(produit) 6 3 -8.1445 2.1708 63 -3.75 0.0004 sujet(produit) 7 3 -1.6055 2.1708 63 -0.74 0.4623 sujet(produit) 8 3 -3.9409 2.1708 63 -1.82 0.0742  = 0  = 0  = 0

Résultats Modèle 1 (suite)

Comparaison des moyennes Modèle : T1 T2 T3 T4 Estimation de 11 - 31 : Test : H0 :

Comparaison entre AX23 et Contrôle en T1 Syntaxe SPSS MIXED rythme BY sujet_diff produit temps /CRITERIA = CIN(95) MXITER(100) MXSTEP(5) SCORING(1) SINGULAR(0.000000000001) HCONVERGE(0, ABSOLUTE) LCONVERGE(0, ABSOLUTE) PCONVERGE(0.000001, ABSOLUTE) /FIXED = produit temps produit*temps | SSTYPE(3) /METHOD = REML /TEST = 'mu11 vs mu31' produit 1 0 -1 produit*temps 1 0 0 0 0 0 0 0 -1 0 0 0 /PRINT = SOLUTION TESTCOV /RANDOM sujet_diff | COVTYPE(VC) . Résultats

Comparaison de deux modèles imbriqués Modèle M1 Modèle M0 : cas particulier de M1 Les paramètres  de M0 ne sont pas sur leurs frontières de définition. Test LRT (Likelihood Ratio Test) : où  = Nb de paramètres de M1 - Nb de paramètres de M0. Utiliser plutôt « Method = ML »

Test d’un effet aléatoire Test sur le modèle à un effet aléatoire : H0 : s2 = 0 Statistique utilisée : G2 = [-2Log L(Modèle sans effet)] - [-2Log L(Modèle à un effet)] Calcul du niveau de signification : NS = 0.5Prob(2(0)  G2) + 0.5Prob(2(1)  G2) (2(0) = 0 avec la probabilité 1) La correction réduit le niveau de signification du test LRT usuel.

Application Avec effet sujet Sans effet sujet G2 = [-2Log L(Modèle sans effet)] - [-2Log L(Modèle à un effet)] = 595.511 – 515.437 = 80.074 NS = 0.5Prob(2(0)  G2) + 0.5Prob(2(1)  G2) = 0.5*Prob(2(1)  80) = 0.000

Recherche d’une tendance polynomiale On exprime le vecteur des moyennes en fonction de polynômes orthogonaux : Constante Linéaire Quadratique Q0, Q1, Q2, Q3 forment une base orthonormée. Cubique

Construction des contrastes orthogonaux On exprime le vecteur des moyennes  en fonction des polynômes orthogonaux : Contrastes orthogonaux : Tests : H0 : 1 = 2 = 3 = 4 <==> H0 : 1 = 2 = 3 = 0 H0 : Tendance linéaire <==> H0 : 1  0, 2 = 3 = 0 H0 : Tendance quadratique <==> H0 : 2  0, 3 = 0

Recherche de tendances - AX23 : Quadratique - BWW9 : Linéaire - Contrôle : Constante

Recherche de tendance quadratique pour AX23 Modèle : Tests :

Recherche de tendance quadratique pour AX23 Code SPSS : MIXED rythme BY sujet_diff produit temps /CRITERIA = CIN(95) MXITER(100) MXSTEP(5) SCORING(1) SINGULAR(0.000000000001) HCONVERGE(0, ABSOLUTE) LCONVERGE(0, ABSOLUTE) PCONVERGE(0.000001, ABSOLUTE) /FIXED = produit temps produit*temps | SSTYPE(3) /METHOD = REML /TEST = 'ax23,contraste qua.' temps 1 -1 -1 1 produit*temps 1 -1 -1 1 0 0 0 0 0 0 0 0 /TEST = 'ax23,contraste cub.' temps 1 -3 3 -1 produit*temps 1 -3 3 -1 0 0 0 0 0 0 0 0 /RANDOM sujet_diff | COVTYPE(VC) . Résultats : ==> Validation de la tendance quadratique

Étude du modèle 2 Yijk =  + i + j + ij + ijk Produit Temps * Résidu avec des i.k = (i1k, i2k, i3k, i4k ) ~ N(0, ) ou N(0, i) et indépendants entre eux Il faut préciser le type de la matrice de covariance .

 de type UN (UNSTRUCTURED)

Résultats SPSS :  de type « UNSTRUCTURED »

Estimated R Correlation Matrix for sujet(produit) 1 1 Row Col1 Col2 Col3 Col4 1 1.0000 0.8280 0.8255 0.6445 2 0.8280 1.0000 0.8373 0.7223 3 0.8255 0.8373 1.0000 0.8346 4 0.6445 0.7223 0.8346 1.0000

 de type CS (COMPOUND SYMMETRY)

Résultats SPSS :  de type « CS »

 de type AR(1) (Auto-régressif d’ordre 1)

 de type AR(1) (Auto-régressif d’ordre 1) Estimated R Correlation Matrix for sujet(produit) 1 1 Row Col1 Col2 Col3 Col4 1 1.0000 0.8207 0.6735 0.5527 2 0.8207 1.0000 0.8207 0.6735 3 0.6735 0.8207 1.0000 0.8207 4 0.5527 0.6735 0.8207 1.0000

 de type CS hétérogène par temps

Résultats SPSS

Résultats SPSS

Modèle 3 Yijk =  + i + j + ij + sk(i) + ijk Produit Temps Sujet (Produit) Résidu Produit * Temps avec sk(i)~ N(0, s2) et ijk~ AR(1). Syntaxe SPSS MIXED rythme BY produit temps sujet_diff /CRITERIA = CIN(95) MXITER(100) MXSTEP(5) SCORING(1) SINGULAR(0.000000000001) HCONVERGE(0, ABSOLUTE) LCONVERGE(0, ABSOLUTE) PCONVERGE(0.000001, ABSOLUTE) /FIXED = produit temps produit*temps | SSTYPE(3) /METHOD = REML /PRINT = SOLUTION TESTCOV /RANDOM sujet_diff | COVTYPE(VC) /REPEATED = temps | SUBJECT(sujet_diff) COVTYPE(AR1) .

Estimated R Correlation Matrix for sujet(produit) 1 1 Row Col1 Col2 Col3 Col4 1 1.0000 0.5017 0.2517 0.1263 2 0.5017 1.0000 0.5017 0.2517 3 0.2517 0.5017 1.0000 0.5017 4 0.1263 0.2517 0.5017 1.0000

Choix du type de matrice  Critère d’Akaike AIC = - 2 (Res) Log likelihood + 2d où d = nombre de paramètres du modèle définissant  (Covariance parameters) Critère de Schwartz (BIC) BIC = - 2 (Res) Log likelihood + dLog(n) - For REML, the value of n is chosen to be total number of cases minus number fixed effect parameters and d is number of covariance parameters. - For ML, the value of n is total number of cases and d is number of fixed effect parameters plus number of covariance parameters. On recherche  minimisant le BIC.

Calcul des critères d’Akaike et de Schwarz pour le modèle 3 Critère d’Akaike d =Nombre de paramètres de  = 3 AIC = - 2 (Res) Log likelihood + 2d = 482.7 + 6 = 488.7 Critère de Schwarz (BIC) n = 96 – 12 = 84 et d = 3 BIC = - 2 (Res) Log likelihood + dLog(n) = 482.693 + 3Log(84) = 495.985

Choix du meilleur modèle

Modèle 4 Yk(i) = (Yi1k, Yi2k, Yi3k, Yi4k) ~ N(i, ) avec : i = (i1, i2, i3, i4) et Test : H0 : LM = 0 H1 : LM  0 Statistique : - Calcul des niveaux de signification plus précis qu’avec l’approche univariée, et même exact si min(rang L, rang M)  2. - Pas de données manquantes.

Transformation de Rao m = Nombre de groupes, v = N – m  avec : p = rang (M), q = rang (L) m = Nombre de groupes, v = N – m r = v – (p – q + 1)/2, u = (pq –2)/4 t = si p2 + q2 –5 > 0, = 1 sinon. Lorsque l’hypothèse H0 est vraie, F suit approximativement une loi F(pq, rt–2u). La loi est exacte si le minimum de (p, q) est inférieur ou égal à 2.

Les données

Test de l’effet « Produit »

Test de l’effet « Produit » Syntaxe SPSS GLM rythme1 rythme2 rythme3 rythme4 BY produit /METHOD = SSTYPE(3) /INTERCEPT = EXCLUDE /CRITERIA = ALPHA(.05) /LMATRIX = "Effet Produit" produit -1 1 0; produit -1 0 1 /MMATRIX = "Moyenne" rythme1 .25 rythme2 .25 rythme3 .25 rythme4 .25 /DESIGN = produit .

Test de l’effet « Temps »

GLM rythme1 rythme2 rythme3 rythme4 BY produit /METHOD = SSTYPE(3) /INTERCEPT = EXCLUDE /CRITERIA = ALPHA(.05) /LMATRIX = "Moyenne Produit" produit 1/3 1/3 1/3 /MMATRIX = "rythme 2 - rythme 1 " rythme1 -1 rythme2 1 rythme3 0 rythme4 0; "rythme 3 - rythme 1 " rythme1 -1 rythme2 0 rythme3 1 rythme4 0; "rythme 4 - rythme 1 " rythme1 -1 rythme2 0 rythme3 0 rythme4 1 /DESIGN = produit .

Test de l’interaction « Produit*Temps »

Test de l’interaction « Produit*Temps » GLM rythme1 rythme2 rythme3 rythme4 BY produit /METHOD = SSTYPE(3) /INTERCEPT = EXCLUDE /CRITERIA = ALPHA(.05) /LMATRIX = « Effet produit" produit -1 1 0; produit -1 0 1 /MMATRIX = "rythme 2 - rythme 1 " rythme1 -1 rythme2 1 rythme3 0 rythme4 0; "rythme 3 - rythme 1 " rythme1 -1 rythme2 0 rythme3 1 rythme4 0; "rythme 4 - rythme 1 " rythme1 -1 rythme2 0 rythme3 0 rythme4 1 /DESIGN = produit .

Comparaison GLM multivarié / MIXED - Les F de Rao conduisent à des résultats exacts car Min(rang L, rang M)  2. - Comparaisons inter-sujets : GLM multivarié = MIXED Comparaisons intra-sujets : GLM multivarié  MIXED

Utilisation de la commande « Repeated Measures » de SPSS

Résultats SPSS

Résultats SPSS

Conclusion : Pour la commande MIXED Estimation de la structure de covariance entre les données. Estimation correcte des effets fixes et aléatoires. Inférence large et étroite. Possibilité de variances hétérogènes Les résultats justes (au niveau univarié) de la Proc GLM sont retrouvés avec la Proc MIXED. Comparaisons multiples inter-sujets basées sur des moyennes ajustées estimées au niveau de la population. Possibilité de données manquantes.