La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:09 1 Comparaison de deux échantillons Principes.

Présentations similaires


Présentation au sujet: "Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:09 1 Comparaison de deux échantillons Principes."— Transcription de la présentation:

1 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 1 Comparaison de deux échantillons Principes de base Comparaison des paramètres de deux populations: moyennes, variances et médianes Tests appariés Analyse de puissance

2 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 2 Comparaison entre deux échantillons Le nombre de groupes comparés = 2 on peut comparer plusieurs statistiques de ces groupes: moyennes, variances, médianes, etc… Fréquence Témoin Traitement s2Cs2C s2Ts2T

3 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 3 Un exemple Deux groupes (1, 2) ayant des moyennes qui diffèrent par. Quelle est la probabilité p dobserver une telle différence si les deux moyennes sont égales (H 0 )? Fréquence Groupe 2 Groupe 1

4 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 4 Un exemple (suite) Si H 0 est vraie, la statistique t sera distribuée comme le t de Student: Probabilité (p) t Fréquence Groupe 2 Groupe 1

5 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 5 Un exemple (suite) Pour les deux groupes, supposons que t = 2.01 Quelle est la probabilité dobtenir un t dau moins 2.01 si les deux moyennes sont égales (H 0 )? Comme p est faible, il est improbable que H 0 soit vrai. On rejette donc H Probabilité t = 2.01 Fréquence Groupe 2 Groupe 1

6 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 6 Comparaisons de 2 échantillons: échantillons indépendants Lorsquil ny a pas de corrélation ou dappariement entre les observations (sujets) des deux groupes. Ex: Poids à 6 mois de porcelets engraissés en suivant deux régimes différents. Régime

7 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 7 Comparaisons de deux échantillons: échantillons appariés Dans les échantillons appariés, les observations (sujets) dans un groupes forment des paires avec les observations (sujets) de lautre groupe. Ex: Le poids à six mois de porcelets ayant la même mais soumis à deux régimes différents. Régime Truies

8 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 8 Comparaison de deux échantillons: le groupe contrôle vs groupe traité Deux champs de maïs, un témoin et un fertilisé avec de lazote. Prédiction biologique: la fertilisation avec lazote augmente le rendement H 0 : T C (unilatéral) Rendement Frequence Témoin Traitement

9 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 9 Comparaison de moyennes: le test de t Calculer la différence entre les deux moyennes H 0 (unilatéral) Calculer t et le p correspondant: Rendement Fréquence Témoin Traitement

10 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 10 Que sont les degrés de liberté? l Le nombre de degrés de liberté est leffectif moins le nombre de paramètres.

11 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 11 Pourquoi se soucier du nombre de degrés de liberté? La distribution des statistiques dépend du nombre de degrés de liberté. Donc, selon le nombre de degrés de liberté, la même valeur de la statistique peut sera convertie en probabilités différentes t Probabilité 8 dl 1 dl

12 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 12 Comparaison de deux moyennes: le test U de Mann-Whitney On veut comparer le rendement du groupe témoin et du groupe traitement. Chacun des groupe contient 4 champs (ch.) (réplicats) Calculer la somme des rangs (R C, R T ) pour chacun des groupes. H 0 : R C = R T Calculer U et le p correspondant

13 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 13 Comparaison de moyennes: tests paramétriques (P) vs tests non- paramétriques (NP) *si les conditions dapplication sont respectées

14 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 14 Indépendance Observations sont souvent dépendantes lorsque corrélées dans le temps ou lespace. Ex: mesures des éléments nutritifs en amont et en aval dune source ponctuelle de pollution sur un cours deau. Site amont Site aval

15 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 15 Pourquoi insister sur lindépendance? Si les observations ne sont pas indépendantes, on surestime le nombre de degrés de … … la conversion de la statistique en valeur de p sera biaisée … … et on sousestimera p.

16 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 16 Procédure générale si N >20 pour chaque échantillon tester la normalité tester lhomoscedasticité si les deux échantillons sont distribués normalement et que les variances sont égales, utiliser le test de t (variance commune) si les deux échantillons sont distribués normalement mais que les variances sont inégales, utiliser le test approximatif de Welch (variance séparées) si un ou les deux échantillons ne sont pas distribués normalement, essayer de transformer les données ou utiliser le test de U de Mann-Whitney.

17 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 17 Procédures générales N<10 pour chaque groupe Utiliser le test de U de Mann-Whitney 10

18 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 18 Comparaison de la taille moyenne des esturgeons de la rivière Saskatchewan Sortie dun test de t fait avec SYSTAT:

19 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 19 Comparaison de la taille moyenne des esturgeons de la rivière Saskatchewan Sortie dun test de Mann-Whitney (SYSTAT)

20 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 20 Vérification de la normalité Faire un graphique des probabilités normales si, à loeil, cest linéaire, ça va si on est pas certain, faire le test de Lilliefors

21 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 21 La distribution cumulative normale Laire sous les courbes des fonctions de densité des probabilités normales et distribution cumulative normale % 50.00% 68.27% F Distribution normale Didtribution cumulative normale

22 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 22 Valeurs Z Valeurs Z Transformation des pourcentages cumulés en valeurs Z Normal equivalent deviates Cumulative percent

23 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 23 Courbes des probabilités normales Exemples de distributions de fréquences et leurs distributions cumulées A: Normale; B: mélange égal des deux distributions normales; C: Étirée vers la gauche; D: Étirée vers la droitet; E: Platykurtique; F: Leptokurtique. NED A B CD EF

24 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 24 Exemple: Taille des esturgeons des sites The Pas et Cumberland Diagrammes de probabilités normales pour les longueurs à la fourche à The Pas et Cumberland sont:

25 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 25 Exemple: Taille des esturgeons (suite) Sortie SYSTAT dun test Lilliefors: normalité des longueurs à The Pas KOLMOGOROV-SMIRNOV ONE SAMPLE TEST USING STANDARD NORMAL VARIABLE N-OF-CASES MAXDIF LILLIEFORS PROBABILITY (2-TAIL) FKLNGTH

26 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 26 Égalité des variances (homoscédasticité): le test de F Si les variances sont égales, alors s 2 C = s 2 T H 0 (ratio F): Ce test est très sensible à une déviation de la normalité Rendement Fréquence Témoin Traitement s2Cs2C s2Ts2T

27 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 27 Égalité des variances (homoscédasticité), utilisation du test de Levene Si les variances sont égales, alors: s 2 C = s 2 T H 0 (Levene): Ce test est plus robuste à une déviation de la normalité Rendement Fréquence Témoin Traitement s2Cs2C s2Ts2T

28 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 28 Comparaison de médianes: le test des médianes Calculer la médiane M pour les deux échantillons Classer chaque observation (plus grande ou plus petite que M) afin de créer un tableau 2X2 Faire un 2 ou un test de G, pour tester lindépendance Rendement Fréquence Témoin Traitement M

29 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 29 Tests sur des échantillons appariés Utilisés quand il y a corrélation entre les observations des deux échantillons. Par exemple, le poids de rats avant et après un traitement H 0 (unilatéral): utiliser un test de t pour échantillons appariés

30 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 30 Test de t pour échantillons appariés vs test de t pour échantillons indépendants En présence de corrélation, un test de t pour échantillons appariés est beaucoup plus puissant. Lerreur-type des différences moyennes entre les paires est habituellement plus petite que lerreur-type de la différence entre les deux moyennes Sil ny a pas de corrélation, un test de t pour échantillons appariés est moins puissant (N représente le nombre de paires et non le nombre dobservations). S 2 b = 8.67, S 2 a = 21.58, S 2 W = 2.81

31 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 31 Test de t pour échantillons appariés vs test de t pour échantillons indépendants: effet de lâge sur la largeur du visage

32 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 32 Puissance: calcul de leffectif requis À partir de, d un estimé de la variance commune s p 2 et de la différence quon veut détecter, on peut calculer n min, leffectif minimal requis Fréquence Éch. 1 Éch. 2

33 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 33 Puissance: calcul de la différence minimale détectable À partir de, dun estimé de la variance commune s p 2 et de leffectif n, on peut calculer min, la différence minimale détectable Fréquence Éch. 1 Éch. 2

34 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 34 Puissance: calcul de la puissance dun test (a priori) À partir de n, et dun estimé de la variance commune s p 2 on peut calculer t (1) et utiliser la distribution de t pour trouver (1- la puissance du test. Fréquence Éch. 1 Éch. 2

35 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 35 Puissance: calcul de la puissance dun test (a posteriori) Si on accepte H0, on peut estimer la puissance du test. À partir de d n, et dun estimé de la variance commune s p 2 on peut calculer le de la distribution de F non centrale. Fréquence Éch. 1 Éch. 2

36 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 36 Calcul de la puissance à partir de Calcul de la puissance à partir de Pour un test de t, 1 =1, 2 = 2(n-1). À partir de et, on peut trouver 1- dans tableaux ou graphiques (voir Zar (1996), Appendix Figure B.1) 1- 2 décroissant 1 = 1 = = =.01) =.05)

37 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 37 Exemple: Puissance dune comparaison de 2 moyennes Quelle est la probabilité de détecter une différence de 1.01 si (2)=.05? … et... Quelle est la probabilité de détecter une différence de 1.01 si (2)=.05? … et...

38 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 38 Calcul de la puissance à partir de Calcul de la puissance à partir de Si =.01 et =2.21, 1- = 0.78 dans la figure Donc, la probabilité dune erreur de type II est environ décroissant 1 = 1 = = =.01) =.05)

39 Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :09 39 Quizz Dans quelles conditions utiliseriez vous un test de t pour échantillons appariés au lieu dun test de t pour échantillons indépendants? Dans quelles conditions utiliseriez vous un test de t à variances séparées vs à variance commune?


Télécharger ppt "Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:09 1 Comparaison de deux échantillons Principes."

Présentations similaires


Annonces Google