Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 1 Comparaisons multiples Ce qu’elles sont Le problème de l’ajustement de Quand les utiliser? Tests statistiques qui contrôlent e Estimation de l’effet du traitement
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 2 Comparaisons multiples: définition Comparaison des paires des différents traitements On peut comparer les moyennes, les médianes, les variances, etc.. Pour les moyennes, on les utilise après l’ANOVA dans tous les cas, H 0 est que les groupes comparés ne sont pas différent Expérimental (N) Expérimental (N+ P) Rendement Fréquence CC NN N+P c : N N : N+P C : N+P Témoin
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 3 Y Y X1X1 X2X2 X3X3 X4X4 X5X5 X1X1 X2X2 X3X3 X4X4 X5X5 Planifiée Non-planifiée Types de comparaisons planifiée (a priori): indépendant des résultats de l’ANOVA; la théorie prédit quels traitements devraient être différents non planifié (a posteriori): dépend des résultats de l’ANOVA Tests de signification sont très différents d’un type à l’autre
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 4 Comparaison planifiée (a priori): niveau de catécholamine chez les poissons stressés Les comparaisons sont déterminées par l’expérimentateur préalablement, sont basées sur des théories et ne dépendent pas des résultats de l’ANOVA. Prédiction à partir de la théorie: le niveau de catécholamine augmentera au-dessus du niveau de base seulement quand le seuil de PA O2 = 30 torr sera atteint donc, on compare seulement les traitements au-dessus et en-dessous de 30 torr (N T = 12). PA O 2 (torr) [Catéholamine] Seuil prédit
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 5 Comparaison non-planifiée (a posteriori): niveau de catécholamine chez les poissons stressés Les comparaisons sont déterminées à partir des résultats de l’ANOVA Prédiction à partir de la théorie: le niveau de catécholamine augmente quand PA O2 augmente. Donc, les comparaisons entre n’importe quelle paire sont justifiées (N T = 21) Relation prédite PA O 2 (torr) [Catécholamine]
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 6 Le problème: le contrôle de l’erreur Pour un nombre de comparaisons k, la probabilité d’accepter H 0 (pas de différences) est: (1- k pour 4 traitements, (1 - ) k = (0.95) 6 =.735, alors ( e ) = Alors on s’attendrait à rejeter H 0 pour au moins une paire 27% des fois. Et ce, même si tous les traitements sont identiques. Nombre de traitements =.05 ( e )
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 7 Contrôle de l’erreur au niveau nominal en ajustant pour le nombre de comparaisons Pour maintenir e au niveau nominal , nous avons besoin d’ajuster pour chaque comparaison par le nombre total de comparaisons. De cette manière, e devient indépendant du nombre de comparaisons. Nombre de traitements nominal =.05 ( e )
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 8 Contrôle de l’erreur au niveau nominal en utilisant des tests statistiques modifiés Utiliser le test statistque S pour la comparaison de paires dont la distribution dépend du nombre total de comparaisons N T de manière à ce que p(S) augmente quand N T augmente Valeur de la statistique (S) Probabilité (p) S, N T = 1 S N T = 2 S, N T = 3
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 9 Quand utilise-t-on les comparaisons multiples Seulement une fois H 0 rejetée (résultat de l’ANOVA)... …l’ANOVA est plus robuste et fiable que les comparaisons multiples. Alors, si les résultats de l’ANOVA suggèrent d’accepter H 0, on ne doit pas faire de comparaisons multiples. Il n’y a pas de concensus universel sur la méthode à utiliser pour les comparaisons multiples Les résultats peuvent varier selon la méthode utilisée... …alors prudence!
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 10 Contrôle de e par l’ajustement des individuels
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 11 Contrôle de e par l’ajustement des individuels p est la probabilité associée au test de t de la différence entre 1 paire de moyennes, k est le nombre total de comparaisons
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 12 Exemple: Variation temporelle de la taille des esturgeons (ANOVA type II) Prédiction: la construction d’un barrage entraînera la perte des esturgeons de grande taille. Test: comparer la taille des esturgeons avant et après la construction du barrage H 0 : la taille moyenne est la même pour toutes les années Année FKLNGTH Construction du barrage
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 13 Exemple (Lab 4): Variation tempporelle de la taille des esturgeons (résultats de l’ANOVA) Conclusion: on rejette H 0
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 14 Résultats des comparaisons multiples Année FKLNGTH Construction du barrage
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 15 Contrôle de e par l’utilisation de tests statistiques modifiés
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 16 Faire un choix Tukey, GT2 Essayer différentes méthodes. Si des résultats similaires sont obtenus vous êtes en terrain sûr Si des résultats différents sont obtenus, c’est peut-être causé par: –un test trop conservateur/libéral –la puissance du test Si les comparaisons sont significatives en utilisant Bonferroni (conservateur), vous êtes corrects Si les comparaisons restent non significatives en uilisant Sidak (conservateur), vous êtes corrects
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 17 Estimation de l’effet du traitement (ANOVA type I seulement!!) La question n’est pas seulement de savoir si des traitements sont différents mais de combien ils diffèrent Par exemple, quelle serait l’effet d’une variation de température de 4º C sur le taux de croissance de la truite? Comme la moyenne de chaque traitement a une certaine précision, l’estimation de l’effet aussi en aura une. Température de l’eau (ºC) Taux de croissance (cm/day) Effet estimé Intervalle des effets possibles
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 18 L’estimation de l’effet d’un traitement: intervalle de confiance pour la moyenne de groupes en utilisant CM erreur L’utilisation de CM erreur provenant du tableau d’ANOVA comme estimation de la variance de chaque traitement permet de calculer l’intervalle de confiance pour la moyenne des traitements
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 19 Estimation de l’effet des traitements: intervalle de confiance pour la moyenne des groupes en utilisant la variance à l’intérieur d’un groupe Utiliser l’écart-type s i pour chaque traitement (groupe)
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 20 Calcul d’IC multiples pour la moyenne de chaque traitement Pour un groupe, =.05, c’est- à-dire que 5% des fois, la vraie moyenne sera à l’extérieur de l’IC estimé. Alors, si on calcule plusieurs IC, on doit ajuster e, par exemple, en utilisant ’ = /k de Bonferonni, on aurait: