La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 1 Messages 1er décembre: date limite pour.

Présentations similaires


Présentation au sujet: "Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 1 Messages 1er décembre: date limite pour."— Transcription de la présentation:

1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 1 Messages 1er décembre: date limite pour premier jet Question 5% Protocole: 10% Données: 5% Analyse: 60% (choix, interprétation, conditions d’application) Conclusion biologique 10% Style: 10%

2 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 2 Tableaux de contingence et modèles log- linéaires Types de questions L’hypothèse nulle Tests d’indépendance Subdivision des tableaux de contingence Séries statistiques multiples et modèles log-linéaires

3 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 3 Types de question: extrinsèques Le sex ratio des chevreuils du Parc de la Gatineau est il 50:50? Les fréquences phénotypiques et génotypiques pour un trait sont-elles à l’équilibre Hardy-Weinberg? Les résultats de Mendel lors de ses expériences sur les pois ont-ils été « améliorés »?

4 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 4 Types de questions: intrinsèques La composition spécifique des communautés de plantes est-elle la même au pied et au sommet du Mont King? Le taux de parasitisme est-il le même chez les ombles arctique mâles et femelles?

5 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 5 Qualité d’ajustement à une distribution théorique (extrinsèque) Mesure de la distance entre la distribution observée et attendue selon H 0 2030405060 0 10 20 30 Fréquence Observée Attendue Longueur à la fourche

6 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 6 Principe des tests d’ajustement Si les deux distributions (observée et attendue) sont plus différentes que ce que l’on s’attendait en prenant en considération la précision de la mesure, on doit rejeter l’hypothèse nulle. Observée Attendue 0 20 30 Fréquence 2030405060 0 10 20 30 Rejeter H 0 Accepter H 0 Longueur à la fourche

7 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 7 Tests d’ajustement à une distribution théorique: Chi-carré (    Utilisé sur des données de fréquence par catégories Les fréquences observées sont comparées à des valeurs attendues théoriquement. Fréquence Catégorie/classe Observée Attendue

8 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 8 Comment traduire  2 en p? Comparer à la distribution  2 avec n -1 degrés de liberté Si p est inférieur au niveau  désiré, il faut rejeter l’hypothèse nulle. 05101520  2 (dl = 5) 0 0.2 0.3 Probabilité  2 = 8.5, p = 0.31 accepter p =  = 0.05 ** sauf pour les expériences de Mendel

9 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 9 Tests d’ajustement à une distribution théorique: test du rapport du log de vraisemblance ou test de G Similaire à  2, donne généralement des résultats similaires Dans certains cas, G est plus conservateur (c’est-à- dire que les p obtenues sont plus élevées). Fréquence Catégorie/classe Observée Attendue

10 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 10  2 versus la distribution de  2 ou G Pour  2 et G, les valeurs de p sont calculés à partir de la distribution de  2. mais quand n diminue, les deux distributions s’éloignent de celle de  2. 05101520  2 /  2 /G (dl = 5) 0 0.2 0.3 Probabilité  2 /G, n très petit  2 /G, n petit 

11 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 11 Conditions d’application (  2 et G) n plus grand que 30 fréquences attendues sont au moins 5 test est assez robuste sauf quand il n’y a que deux catégories (dl = 1) pour 2 catégories, X 2 et G surestiment  2, menant au rejet de l’hypothèse nulle avec une probabilité supérieure à  le test devient libéral

12 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 12 Que faire si n est trop petit, qu’il n’y a que 2 catégories, etc.? augmenter n si n > 2, combiner des catégories si possible utiliser un facteur de correction utiliser un autre test

13 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 13 Corrections quand il n’y a que 2 catégories pour 2 catégories, X 2 et G surestiment  2, menant au rejet de l’hypothèse nulle avec une probabilité supérieure à  le test devient libéral Ajustement pour continuité: s’obtient en ajoutant 0.5 aux fréquences observées (Yates) Ajustement de Williams: consiste à diviser la statistique (G ou  2 ) par:

14 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 14 Modèles log-linéaires: Types de questions (intrinsèques) Impliquent 2 (ou plus) variables discontinues ayant chacune 2 catégories ou plus Var. dépendante: nombre d’observations (fréquences observées) dans chaque catégorie éprouvent l’absence d’indépendance Résultats des tests sur l’efficacité de deux aérosols (1,2) contre la tavelure.

15 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 15 Types de questions Est-ce que la composition en espèces de communautés d’oiseaux diffère entre habitats? 2 variables discontinues: espèce et type d’habitat H 0 : la proportion d’individus de chaque espèce est indépendante (c’est-à-dire environ la même) de l’habitat)

16 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 16 Composantes du test statistique Hypothèse nulle Observations (fréquences observées) Statistique (Chi-carré ou G) Conditions d’application

17 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 17 L’hypothèse nulle H 0 : les observations sont indépendantes H 0 : les fréquences relatives des observations de la variable A sont indépendantes de celles de la variable B. Il n’y a pas d’interaction. L’hypothèse nulle est toujours intrinsèque!

18 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 18 H 0 acceptée H 0 : la proportion de pommiers infectés vs les non-infectés est la même pour les deux aérosols. accepter H 0. Proportion de pommiers infectés Aérosol 2 Aérosol 1

19 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 19 H 0 rejetée H 0 : la proportion des pommiers infectés vs les non-infectés est la même pour les deux aérosols. rejeter H 0. Proportion de pommiers infectés Aérosol 2 Aérosol 1

20 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 20 La procédure générale On ajuste 2 modèles: une avec terme d’interaction et l’autre sans terme d’interaction On évalue la qualité d’ajustement des deux modèles On évalue la diminution de qualité d’ajustement si on n’inclue pas le terme d’intéraction (selon H0 il n ’y a pas d’interaction). Modèle 1 (avec interaction) Modèle 2 (sans interaction)  GOF (e.g.   2 ) Accepter H 0 (  petit) Rejeter H 0 (  grand)

21 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 21 Tableaux à deux critères H 0 et ajustement Modèle contient une constante, deux effets principaux, et une interaction Indépendance implique que la qualité d’ajustement n ’est pas accrue par la présence du terme d interaction Sans interaction Avec interaction Accepter H 0 Qualité d’ajustement Rejeter H 0  GOF

22 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 22 Tableau à 2 catégories: signification du modèle général Le modèle tente de prédire les fréquences observées dans chaque catégorie. Alors, si toutes les fréquences sont égales, un modèle approprié serait:

23 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 23 Tableau à 2 critères de classification: signification du modèle général Si N est différent d’un traitement à l’autre, il y aura un effet du traitement Alors, un modèle plus approprié incluerait l’effet du traitement: p 1 = 60/90 = 0.67 p 2 = 30/90 = 0.33

24 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 24 Tableau à 2 critères de classification: signification du modèle général Si le nombre total de pommiers infectés est différent du nombre de pommiers sains, il y aura un effet du niveau d’infection Alors, un modèle plus approprié qui inclurait l’effet du traitement et du niveau d’infection serait: N = 90, p 1 = 60/90 = 0.67 p 2 = 30/90 = 0.33 p i = 30/90 = 0.33 p non i = 60/2 = 0.67

25 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 25 Tableau à 2 critères de classification: signification du modèle général La fréquence attendue dans la cellule (ij) est: la taille de l’interaction est donnée par: N = 90, p 1 = 60/90 = 0.67 p 2 = 30/90 = 0.33 p i = 30/90 = 0.33 p non i = 60/2 = 0.67

26 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 26 Tests d’indépendance : le Chi-carré (    Calculer la fréquence attendue pour chacune des cellules du tableau. Calculer la somme des différences au carré entre la fréquence observée et celle attendue Fréquence Catégorie/classe Observé Attendu

27 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 27 Tests de l’indépendance:statistique G, rapport du log de vraisemblance Semblable au  2, les résultats sont similaires dans certains cas, G est plus conservateur, c’est-à-dire qu’il donne des valeurs de p plus élevées Fréquence Catégorie/classe Observé Attendu

28 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 28 Exemple: le rapport des sexes de canards eider dans différents habitats de la Baie d’Hudson Les valeurs inscrites au tableau sont les valeurs observées (fréquences brutes) des mâles et des femelles pour les différents habitats

29 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 29 Calcul de fréquences attendues À partir de l’hypothèse nulle intrinsèque calculer les probabilités d’appartenir à chacune des cellules du tableau si les données étaient indépendantes Diviser le nombre total d’observations d’après ces probabilités p(A) = 64/160 =.40; p(mâle) = 97/160 =. 6105 p(A, mâle) si H 0 = p(A)p(mâle) =.2425 p(A, mâle) si H 0 = p(A)p(mâle) =.2425 f(A, mâle) = p(A, mâle) X 160 = 38.8 f(A, mâle) = p(A, mâle) X 160 = 38.8

30 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 30 Conditions d’application (  2 et G) n est plus grand que 30 fréquences attendues > 5 ce test est assez robuste sauf quand il n’y a que 2 catégories (dl = 1) quand il n’y a que 2 catégories, X 2 et G surestiment  2, menant au rejet de H 0 avec une probabilité >  le test est libéral

31 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 31 Que faire si n est trop petit, qu’il n’y a que 2 catégories, etc.? augmenter n si n > 2, combiner des catégories utiliser un facteur de correction utiliser un autre test

32 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 32 Exemple: Combiner des catégories Avec trois catégories d’habitats, la fréquence attendue, pour 2 cellules, est trop petite alors, on combine l’habitat B et C

33 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 33 Corrections pour 2 catégories Quand il n’y a que 2 catégories, X 2 et G surestiment  2, le test est libéral. H 0 est rejetée avec une probabilité >  Ajustement pour la continuité: ajouter 0.5 aux fréquences observées Ajustement de Williams: consiste à diviser la statistique (G ou  2 ) par: q = 1 + (k 2 - 1)/(6n(k-1))

34 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 34 Division de tableaux Lorsque H 0 est rejetée, vous voudrez savoir quelle catégorie est apparemment responsable la procédure générale est de produire le plus grand sous-tableau homogène commencer avec le plus petit tableau homogène, ajouter ensuite des lignes ou des colonnes jusqu’à ce que H 0 soit rejetée

35 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 35 Division des tableaux FemelleMâle A Total 160 64 9763 3034 B805525 C16124 Habitat Interaction significative

36 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 36 Division des tableaux FemelleMâle A Total 160 64 9763 3034 B805525 C16124 Habitat Interaction significative

37 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 37 Division des tableaux FemelleMâle A Total 160 64 9763 3034 B805525 C16124 Habitat Pas d’interaction significative

38 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 38 Division de tableaux FemelleMâle A Total 160 64 9763 3034 B805525 C16124 Habitat Conclusion: les habitats B et C sont homogènes et sont différents de A

39 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 39 Conclusion Les tableaux de contingence sont l’une des méthodes d’analyse les plus communes Ils permettent d’effectuer des tests robustes d’indépendance (chi-carré ou G)... … si l’effectif est suffisant et les fréquences attendues ne sont pas trop petites

40 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 40 Tableau à plusieurs critères de classification et modèles log-linéaires L’interaction entre plusieurs variables simultanément doit être considérée analogue à l ’ANOVA à plusieurs critères de classification

41 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 41 Tableaux à deux critères : H 0 et ajustement Sans interaction Avec interaction Accepter H 0 Qualité d’ajustement Rejeter H 0  GOF Modèle contient une constante, deux effets principaux, et une interaction Indépendance implique que la qualité d’ajustement n ’est pas accrue par la présence du terme d interaction

42 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 42 Tableaux à plusieurs critères et modèles loglinéaires Pour un tableau à trois critères, le modèle contient une constante, 3 termes principaux, 3 interactions du à 2 termes et une interaction à trois termes. Indépendance implique que la qualité d’ajustement n’est pas diminuée lorsque un terme d’interaction est enlevé. Sans interaction Avec interaction Qualité d’ajustement  GOF

43 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 43 Tableau à plusieurs critères de classification et modèles loglinéaires Effets de la température (H,B) et de l’humidité (H,B) sur le rendement de plantes il n’y a pas d’interaction à 3 termes puisque l’interaction entre le rendement et la température ne dépends pas de l’humidité Fréquence Classe de rendement Humidité Température H B HB Bas rendement Haut rendement

44 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 44 Tableau à plusieurs critères de classification et modèles loglinéaires Effets de la température (H,B) et de l’humidité (H,B) sur le rendement de plantes présence d’interaction à 3 termes puisque l’effet de la température sur le rendement dépends de l’humidité Fréquence Classe de rendement Humidité Température H B HB Bas rendement Haut rendement

45 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 45 Marche à suivre Tester les interactions de plus grand ordre en comparant l’ajustement du modèle complet et celui dont les interactions ont été enlevées. Si ces interactions ne sont pas significatives, tester les interactions d’ordre inférieur individuellement (c’est-à- dire: en incluant les autres) Si l’interaction est significative, tester séparément dans chacune des catégories du (des) facteur(s) impliqués.

46 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 46 Exemple: le rapport des sexes de l’esturgeon dans la rivière Saskatchewan Quel est le “meilleur” modèle qui peut s’ajuster à ces données? Est-ce que le rapport des sexes est fonction du site? De l’année? De l’interaction Site*Année?

47 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 47 Questions/hypothèses nulles Est-ce que la rapport des sexes varie avec les années? H 0 : (  ) ij = 0 Est-ce que la rapport des sexes varie avec le site? H 0 : (  ) ik = 0 Est-ce que la rapport des sexes varie avec les combinaisons (année,site)? H 0 : (  ) ijk = 0

48 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 48 Ajustement d’un modèle log-linéaire avec SYSTAT Tester l’interaction à 3 termes en spécifiant le modèle qui contient les 7 termes Conclusion: accepter H 0 Analysis of Deviance Table Poisson model Response: FREQUENC Terms added sequentially (first to last) Df Deviance Resid. Df Resid. Dev Pr(Chi) NULL 7 109.0931 TEMP 1 0.00000 6 109.0931 0.9999998 LIGHT 1 0.00000 5 109.0931 0.9999999 INFECTED 1 6.26638 4 102.8268 0.0123050 TEMP:LIGHT 1 0.00000 3 102.8268 0.9999987 TEMP:INFECTED 1 76.00717 2 26.8196 0.0000000 LIGHT:INFECTED 1 25.73563 1 1.0840 0.0000004 TEMP:LIGHT:INFECTED 1 1.08396 0 0.0000 0.2978126

49 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 49 Les résidus dans les tableaux de contingence et les modèles loglinéaires La différence entre les fréquences observées et attendues une valeur résiduelle pour chacune des cellules du tableau si le modèle est bon, les valeurs des résidus devraient être petites et ne pas montrer de patrons évident

50 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 50 Puissance et effectif Une hypothèse extrinsèque qui prédit les fréquences ou les proportions attendues: La taille de l ’effet est calculée par: Fréquence Catégorie/classe Observé Attendu

51 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 51 Calculer la puissance à partir de w Pour un   w et N donnés, on peut lire 1-  sur des figures appropriées (e.g. Cohen (1988), Tables 7-3.) 1-  Decreasing N   =.05.1.2.3.4  =.01 w

52 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 52 Puissance: un exemple Hypothèse biologique: couleur du plumage de l’oie blanche déterminée par un locus avec 2 allèles, aa = blanc, Aa, AA = bleu. Donc un croisement Aa X Aa devrait donner un rapport 1 (AA): 2(Aa): 1(aa). so 1 -  = 1.00

53 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 53 Puissance: un exemple (suite) H 0 accepté, taille de l ’effet est Du tableau, Donc, > 84% chances d ’une erreur de type II, la probabilité de détecter un effet d ’une taille de.076 est très petite.

54 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 54 Puissance et effectif Calculer les proportion attendues p 0,ij selon H 0 d’indépendance La taille de l ’effet est: Dl = (R-1)(C-1)=

55 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 55 Puissance: un exemple Structure d’âge de deux populations de souris. Donc, environ 15% d ’une erreur de type II. Proportions, N = 140


Télécharger ppt "Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-05-07 14:51 1 Messages 1er décembre: date limite pour."

Présentations similaires


Annonces Google