Situation d ’usage: Une VI à deux niveaux ou plus

Slides:

Advertisements

Présentations similaires

Mais vous comprenez qu’il s’agit d’une « tromperie ».

Advertisements

Comparaison d’une moyenne observée à une moyenne théorique

Corrélation Position du problème Définition covariance (X,Y) r =

ANOVA à un facteur (Rehailia)

Calcul mental Calcul mental Année scolaire Classe de …

Introduction aux statistiques

Les numéros 70 –

C1 Bio-statistiques F. KOHLER

Comparaison de deux moyennes observées

Inférence statistique

Comparaison d'une distribution observée à une distribution théorique

Comparaison de plusieurs moyennes observées

Comparaison de plusieurs moyennes Analyse de variance

Nombre de sujets nécessaires en recherche clinique

Proposition d’organisation temporelle des modules STI en BTS CRSA,

1. Les caractéristiques de dispersion. 11. Utilité.

CONFORMITE d’une distribution expérimentale à une distribution théorique Professeur Pascale FRIANT-MICHEL > Faculté de Pharmacie

Méthodologie d’élaboration TP - ISI

LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.

Comparaison de plusieurs moyennes Analyse de variance

Régression -corrélation

Laboratoire Inter-universitaire de Psychologie Cours 6

1 Analyse de la variance multivariée Michel Tenenhaus.

Situation d ’usage: Une VI à deux niveaux ou plus

Vérification des données

L’OUTIL STATISTIQUE.

Les principaux résumés de la statistique

Statistiques Séance 9 – 6 décembre 2005 N. Yamaguchi.

La Régression Multiple

L’inférence statistique

Analyse de la variance : ANOVA à un facteur

Nombre de sujets nécessaires en recherche clinique

Statistiques Pour chaque question Noter le numéro de la question

Les chiffres & les nombres

Corrélation et régression linéaire simple

L’Analyse de Variance 1 Généralités Le modèle Calculs pratiques

1.Un rang de données multicolores 2. Deux permutations des n premiers entiers 3. b permutations des k premiers entiers 4. Choix de n points dans [0,1]

Une observation par cellule facteurs fixes versus facteurs aléatoires.

Analyse de la covariance

Analyse de la variance multivariée

L’analyse de variance factorielle

La corrélation et la régression multiple

La corrélation et la régression

Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte.

L’analyse de variance.

La régression logistique

Lanalyse de la covariance. X y ANOVA Lanalyse de la covariance y X ANOVA.

L’analyse de variance à mesures répétées

La statistique descriptive

La corrélation et la régression

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.

Les modèles linéaires (Generalized Linear Models, GLM)

Corrélation Principe fondamental d’une analyse de corrélation

Test de signification d’une ANOVA à deux critères de classification: sans réplication, modèle I, plan factoriel Tester CMeffet sur CMerreur... … mais,

Les maths en francais 7ième année.

Analyse factorielle de variance: Principes d’expérimentation

ORGANIGRAMME-MÉTHODES STATISTIQUES-COMPARAISONS DE MOYENNES

Méthodes de Biostatistique

Méthodologie expérimentale : l’analyse des données

1 Introduction à la théorie des tests. 2 Plan I- choix entre 2 paramètres de tendance centrale Choix entre 2 proportions pour un caractère qualitatif.

Howell Chap. 11: ANOVA. Du monde connu au monde inconnu Du test t à l’analyse de varianceDu test t à l’analyse de variance Trouvez des nouveaux noms pour.

N. Yamaguchi1 Statistiques Séance 6 – 16 Nov 2005.

Séance 8 30 novembre 2005 N. Yamaguchi

ATELIERS STATISTIQUES

Test de signification d’une ANOVA à deux critères de classification: sans réplication, modèle I, plan factoriel Tester CMeffet sur CMerreur... … mais,

Comparaison de plusieurs moyennes observées

Tests relatifs aux variables qualitatives: Tests du Chi-deux.

Tests relatifs aux variables qualitatives: Tests du Chi-deux.

Transcription de la présentation:

Anova pour devis intra sujets: mesures répétées ou sujets appariés (Randomized Block Anova) Situation d ’usage: Une VI à deux niveaux ou plus Les niveaux peuvent être qualitatifs ou quantitatifs Les sujets ou les blocs sont échantillonnés au hasard Le même sujet est soumis à tous les niveaux de la VI, ou K sujets sont assignés au hasard aux niveaux de la VI

BLOCS M1 M2 M3 S1 = s4 = s7 S2 = s5 = s8 S3 = s6 = s9 S10 = s13= s16 Bloc 1 Bloc 2 Bloc 3 M1 M2 M3 S1 = s4 = s7 S2 = s5 = s8 S3 = s6 = s9 S10 = s13= s16 S11 = s14 = s17 S12 = s15 = s18 S19 = s22= s25 S20 = s23 = s26 S21= s24 = s27

Devis inter groupe, vs devis intra sujets ° sn G2 Intra groupe Inter ANOVA F= variabilité inter groupe variabilité intra groupe M1 s1 s2 s3 ° sn M2 Inter sujets Intra ANOVA F= variabilité intra sujets variabilité inter sujets

Postulats:(approche univariée) Anova pour devis intra sujets: mesures répétées ou sujets appariés (Randomized Block Anova) Postulats:(approche univariée) Échantillonnage au hasard Mesures répétées Indépendance des observations dans chaque niveau de la VI Symétrie composée (compound symetry) ou homogénéité variance/ covariance. Se reflète par des corrélations homogènes entre les moments pris deux à deux ou par des variances et des covariances homogènes. La sphéricité (sphericity) se reflète par des variances homogènes des scores de différences entre tous les moments de mesure. On vérifie un des 2. Symétrie composée plus exigeant. Le postulat de symétrie composée ou de sphéricité est nécessaire si plus de 2 moments Normalité des distributions à chaque niveau de la VI

Variance, covariance et corrélation Variance=  (X-X)2 / N-1, i.e. somme des écarts de chaque donnée par rapport à la moyenne covariance =  (X-X)(Y-Y) / N-1, somme des écarts à la moyenne du produit des deux variables. Jusqu’à quel point 2 variables varient ensembles. Calcul de la corrélation: r = cova xy / sx sy Le fait de diviser la covariance par les écart-types permet d’avoir un r qui varie de –1 à +1

Bartlett et Mauchly (SPSS) Mauchly: effectue un test de sphéricité sur les variances des scores de différences. Si significatif: variances hétérogènes. Pour des échantillons petits, il a tendance à ne pas être significatif (erreur de type II) et pour de grand échantillons, il a tendance à être significatif même si l’ampleur des différences est petite (erreur de type II) Bartlett: test que la matrice de corrélation est une matrice d’identité, i.e. que les variables (ici les moments) en jeu ne sont pas corrélées entre elles. Peu utile pour la symétrie composite car les moments peuvent être corrélés mais de façon homogène.

Homogénéité variances/covariances Matrice variances/covariances 2,5 3,8 6,9 5,4 3,8 3,8 2,9 4,2 5,1 4,9 6,9 4,2 3,8 4,7 2,7 5,4 5,1 4,7 5,1 3,0 3,8 4,9 2,7 3,0 4,1 Souvent, seule la moitié du bas est présentée. Variances sont sur la diagonale

Homogénéité des corrélations Matrice de corrélations 1 0,8 0,9 0,4 0,8 0,8 1 0,2 0,1 0,9 0,9 0,2 1 0,7 0,7 0,4 0,1 0,7 1 0,0 0,8 0,9 0,7 0,0 1 Homogénéité: aucune corrélation dont l’écart est plus grand que 0,50 à 0,60 (règle empirique)

Variances des scores de différences Ce que teste le Mauchly

Corrections Si le postulat n’est pas rencontré, les degrés de liberté du F doivent être corrigés par Huynh-Feldt, Geisser-Greenhouse ou Lower-bound = degré de liberté de l’effet =1 degré du dénominateur = n-1 (n=nombre de sujets). Si avec les 3 le résultat de l’anova demeure significatifs, pas de problème. Si divergence, prendre le moins sévère : Huynh Feldt Si l’anova est non significative, non rejet de Ho ou utilisation d’une autre approche(ex: transformation, contrastes ou Manova)

Force de l’association Facteur intra sujets (moments) eta carré(partiel) Somme des carrés intra (within subj) Somme des carrés intra + erreur (intra)

Comparaisons a posteriori et a priori Dans SPSS, le menu contraste a posteriori n’est pas disponible. On peut faire des comparaisons via les contrastes, dans le menu « contrastes ». Cette avenue permet aussi de calculer le eta carré de chaque contraste. Possible aussi dans le menu « Options » en sélectionnant « compare main effects » puis Bonferroni. Cela donne toutes les comparaisons possibles entre les moments de mesures. Le eta carré de chaque comparaison est ici plus difficile à calculer.

Calcul des eta carré des contrastes Dans SPSS les éta carré par contraste sont calculés sur des sommes de carrés partiels. Leur total dépasse 100%. Pour calculer le éta semi partiel: 1)allez dans la feuille excel (calcul du eta carré à partir de SPSS) 2) dans la plage de calcul prévue lorsque l’on a les sommes de carrés, entrer les sommes de carrés de chaque contraste. 3)la somme de carré total s’obtient par l’addition de la somme des carrés de l’effet dans l’analyse global au tableau « test of withhin subjects effects », et de la somme des carrés de l’erreur, dans ce même tableau.

entrer les sommes de carrés de chaque contraste.

somme des carrés de l’erreur,

Influence du dosage d’huile de poisson dans la réduction du cholestérol L’objectif de cette étude est de comparer l’effet cumulatif de dosages d’huile de poisson administrés en capsule. Les sujets reçoivent durant une semaine, 100 mg, puis la seconde semaine, 200 mg, puis 300, 400 et finalement 500. L’hypothèse est qu’il y aura diminution linéaire du cholestérol en fonction des dosages

Postulats Normalité des distributions: pour les cinq dosages, les coefficients d’asymétrie/erreur-type sont < 2 ainsi que les degrés d’aplatissement, sauf pour le 5e dosage

Vérification de l’effet de non normalité par un non paramétrique Friedman Test

Postulats Symétrie composite (pour info. Non nécessaire si test sphéricité est utilisé) Homogénéité des variances: le rapport de la plus grande à la plus petite est inférieure à 4 (2,48) les corrélations sont homogènes: l’écart entre la plus grande et la plus petite corrélation n’est pas plus grand que 0,5.

Postulats covariances Variances Corrélation

Postulats Sphéricité: le test de Mauchley n’est pas significatif (les variances des scores de différences sont homogènes)

Postulats

Résultats Total= 2679,6 Eta2= 2449,2/ 2679,6= 91,40

Résultats L’analyse de variance montre que l’effet dosage est significatif : p<0,000: F= 85,04 (4,32) Comme les postulats étaient rencontrées, le p régulier a été pris au lieu du p sévère. L’effet dosage explique 91,4% de la variance totale.

Résultats: contrastes Somme des carrés des erreurs: =230.400

Interprétation Les contrastes linéaires et quadratiques sont significatifs, même après ajustement (Bonferonni Holm) pour le nombre de contrastes): (F(1,8) 190,22 = p<.0000 et F (1,8)= 89,17, p=.008, cependant que le contraste linéaire explique 75% de la variance alors que le quadratique n’en n’explique que 3%. Les deux autres contrastes expliquent aussi peu de variance (9% et 3%) Il semble donc que la diminution soit linéaire mais le fait que la tendance quadratique soit significative révèle que le cholesterol chute plus rapidement après le cumul des trois premiers dosages. La composante cubique et quartique souligne que la tendance n’est pas purement linéaire mais connaît des plateaux.

Devoir Écrire texte pour données Hypothèse Postulats Tableau des moyennes et écart-types Résultats de l’Anova: F (x,y)=xxx, p<.000 Comparaisons a priori (contraste polynomiaux ou autres) ou post hoc. Donnez les F et les p et les eta carrés Interprétez les données en fonction de votre étude

Analyse de variance factorielle à mesures répétées (Split-splot anova) But: vérifier les effets conjugués d ’une ou plusieurs VI inter sujets et d ’une ou plusieurs VI intra sujets. Situation d ’usage: 1- 2 VI avec 2 niveaux ou + 2- sur la VI intra sujet: si le même sujet mesuré plusieurs fois; 1 bloc =1 sujet, si plusieurs sujets dans un bloc, nombre de sujets dans le bloc= nombre de niveaux de la VI intra et les sujets y sont assignés aléatoirement

Analyse de variance factorielle à mesures répétées (Split-splot anova) Situation d ’usage: si blocs: sujets sélectionnés aléatoirement et blocs assignés aléatoirement aux niveaux de la VI inter. S1 S3 S6 S5 S10 S9 S8 S11 S12 S2 S4 S7 bloc1 bloc3 bloc4 bloc2 VI inter grp 1 grp 2 VI intra T0 T1 T2

Analyse de variance factorielle à mesures répétées (Split-splot anova) Situation d ’usage: 3- la VI inter sujets; nature contrôlé (i.e. groupe expérimental vs groupe contrôle) ou niveaux prédéterminés d ’une variable naturelle (ex: niveaux d ’anxiété, groupes d ’âge) 4- sujets répartis aléatoirement dans les niveaux de la VI inter ou choisis aléatoirement dans les niveaux de la variable naturelle, et soumis à tous les niveaux de la VI intra.

Analyse de variance factorielle à mesures répétées (Split-splot anova) Postulats: indépendance des sujets normalité dans chaque cellule homogénéité des variances inter cellule. symétrie composée (sphéricité) inter cellule

Postulats normalité dans chaque cellule Vérifier la normalité dans chaque cellule du plan factoriel homogénéité des variances inter cellule Prendre la plus grande et la plus petite variance des cellules du plan factoriel Symétrie composé inter cellule Dans SSPSS le Mauchly et le Box.

Stratégies d ’analyse du devis factoriel répété Non Sign. stop Faire Post hoc Effet temps ou Groupe significatif OUI NON A POSTERIORI Anova globale significative INTÉRACTION A PRIORI Comparer groupes dans le temps Dans chaque Moment: Tests t, anova Ancova Comparer les temps dans les groupes Anova répt. et contrastes dans chaque groupe Si un groupe non signif. Comparer les autres Comparer le changement dans le temps entre les groupes Anova simple sur Scores de contrastes ou scores de différences

Stratégies d ’analyse du devis factoriel répété A posteriori Hypothèse sur l ’effet principal temps SPSS: tableau within subject effects Hypothèse sur l ’effet principal groupe SPSS: tableau between subject effects Hypothèse sur l ’effet d ’interaction groupe X temps. SPSS: interaction temps X groupe dans tableau within

Stratégies d ’analyse du devis factoriel répété Si interaction non significative, stop. Si effet global temps significatif, comparaisons post-hoc. Si effet groupe significatif, comparer les groupes. Si les 2 significatifs + interaction, accent sur interaction car l ’objectif premier du devis factoriel répété est de montrer qu'un groupe se comporte différemment de l ’autre selon le temps.

Stratégies d ’analyse du devis factoriel répété Interaction significative: analyse des effets simples. Doit être guidée par les hypothèses de recherche. Comparer groupes dans le temps Comparer les temps dans les groupes Comparer le changement dans le temps entre les groupes

Comparer groupes dans le temps Faire tests t ou anova dans chaque moment. Si anova, faire post hoc. Inconvénient: si différences en T3, cela peut être dû aux différences en T2. Ancova: faire ancova en T2 avec T1 en covariable puis en T3 avec T1 et T2 en covariable. Faire contrastes par la suite entre les groupes.

anova anova anova ancova ancova anova ancova

Comparer le changement dans le temps entre les groupes Comparer les temps dans les groupes Anova répétée dans chaque groupe puis faire des tests t entre les moments. Rapporter où sont les différences dans chacun. Peut être long si plusieurs groupes et moments de mesure. Anova répétée puis faire analyses de tendances (ou autres contrastes) dans chaque groupe et vérifier dans lesquels elles sont significatives. Si un groupe n’a pas de tendance il est donc différent des autres. Comparer les autres Si tendance linéaire significative dans chaque groupe, faire une anova simple pour comparer les groupes sur les scores de tendance linéaire puis post hoc. Colonne de contrastes linéaire: si 3 moments, prendre le score de chaque sujet à chaque moment et faire (score 1*1)+ (score 2*0)+ (score 3*-1) Ex: (3*1)+(5*0)+(6*-1)=-3 Quadratique: (3*1)+(5*-2)+(6*1)=-1 À faire dans spss Comparer le changement dans le temps entre les groupes

Lin. Quad.

Analyse de tendance, matrice de coefficients de contrastes Ordre des coefficients 1 2 3 4 5 6 Nombre de conditions 2: linéaire 3: linéaire et quadratique 4: linéaire, et cubique 5: linéaire, 6: linéaire, 1 -1 1 0 -1 1 -2 1 -3 -1 1 3 -1 3 -3 1 1 -1 -1 1 -2 -1 0 1 2 2 -1 -2 -1 2 -1 2 0 -2 1 -5 -3 -1 1 3 5 5 -1 -4 -4 -1 5 -5 7 4 -4 -7 5 Tirée de « Contrast Analysis, Rosenthal & Rosnow, 1993, p.92. Cambridge University Press.

Comparer le changement dans le temps entre les groupes Autres contrastes: Choisir les contrastes désirés (ou scores de différences) en fonction du graphe de l’interaction. Si par exemple on veut comparer le moment 1 aux 2 autres puis le 2 au 3 on crée 2 colonnes de contrastes: 1 vs 2 et 3= sujet 1: (score M1*2)+(score M2*-1)+(score M3*-1), faire anova simple pour comparer groupes sur la colonne ainsi créée. 2 vs 3 (score M1*0)+(score M2*1)+(score M3*-1), faire anova simple pour comparer groupes sur la colonne ainsi créée

Stratégies d ’analyse du devis factoriel répété A PRIORI Comparer le changement dans le temps entre les groupes Comparer groupes dans le temps Comparer les temps dans les groupes Dans chaque Moment: Tests t, anova Ancova Anova simple sur Scores de contrastes ou score de différence contrastes dans chaque groupe

Influence de la fréquence de consommation de cannabis sur la performance en statistique On veut vérifier si les consommations suivantes améliorent ou nuisent à l’exécution de tests t: pas de joint durant 4 jours (groupe 3), 1xjour (groupe 2), et 2xjour (groupe 1) On affecte aléatoirement 5 sujets par groupe et à chaque jour, ils ont 10 tests « t » à faire en 10 minutes, 10 minutes après la dernière consommation. Les consommations doivent se faire entre 14:00 et 16:00 et le test a ensuite lieu. La VD est le nombre de tests t fait en 10 minutes Hypothèse: le groupe sans joint (3) devrait avoir une plus grande amélioration de la performance durant les 3 jours que le groupe à 1 joint (2) et celui à 2 (1), et le groupe à 1 devrait être meilleur que le groupe à 2.

Postulats Les distributions sont relativement normales (les indices d’aplatissement et d’asymétrie sont dans les limites de =-2 Les variances ne sont pas homogènes (rapport de 11.47: .896/.08) Le test de Mauchley n’est pas significatif à cause du petit nombre de sujets Le test de Box n’est pas significatif

Anova global L’effet principal temps est significatif: F (3,36)= 14,665, p<000, eta carré = 39,75% de la variance intra totale. L’ interaction temps par groupe est aussi significative: F(6,36)=5,113, p=.001 et explique 31,5% de la variance intra totale.

On voit que les tendances linéaire et quadratique sont significatives F(1,12)=18,7 et 14,5 pour des eta carré de 23,85% et 24,67. On voit de plus que l’interaction groupe par tendance linéaire est significative, F(2,12)=9,58, P=0.003, pour un eta carré de 24,29% et aucune des autres interactions ne le sont.

L’effet principal groupe n’est pas significatif: F(1,12)=3,462, p=0,65 Comme l’hypothèse portait sur l’interaction et que l’interaction groupe par tendance linéaire est significative, nous allons regarder si les groupes diffèrent sur cette tendance.

Analyse de l’interaction Comparaison des tendances linéaires entre les trois groupes Anova simple sur les scores de tendances linéaire (-3xt1)+)(-1xt2)+(1xt3)+(3xt4) Contrastes entre les trois groupes sur les scores de tendances

Anova simple sur tendance linéaire

Eta carré: 113,223/184,128=,615

Interprétation On voit que le groupe consommant 0 joint (g3) présente une tendance linéaire + et significativement (p= .001) différente de celle du groupe à 2 joints (g1) qui elle est négative. Par contre, le groupe à 0 joint (g3) ne présente pas une tendance linéaire plus forte que celle du groupe à 1 joint (g2): p=.286. Enfin, le groupe à 2 joints (g1) présente une tendance significativement différente (p=009) de celle du groupe à 1 joint(g2). La comparaison du groupe 3 avec le 1 explique 57% de la variance de la tendance linéaire alors que la comparaison de 1 avec 2 en explique 31%. Alors que l’efficacité du groupe à 0 joint augmente au fil des jours, celle du groupe à 1 joint augmente et semble plafonner du jour 2 au jour 4, alors que celle du groupe à 2 joints, se met à descendre plus pas que le jour 1.