Cours 8 Stat IV: Khi2 Désign experimental. BIO 3500 – Hiver 2017 6 mars BIO 3500 – Hiver 2017
Aujourd’hui Tables de contingence Khi-carré ( ) Design expérimental
Khi-carré (χ2) et tables de contingence
Khi-carré Permet de faire des tests d’hypothèses lorsque les deux variables sont qualitatives. On se sert de données exprimées en terme de fréquences.
C’est quoi une fréquence? Le nombre d'observations se trouvant dans une classe (p.ex., nb de loups ayant le poil roux) Fréquence absolue (le nombre d’observations) Fréquence relative (la proportion des observations) 8 4 0.6 0.3 A B C A B C Fréquence absolue Fréquence relative
Test d’hypothèses khi-carré Association entre deux variables qualitatives! H0: La variable A et la variable B sont indépendantes H0: pi = pj = p ou p = 1/nb de classes H1: La variable A et la variable B ne sont pas indépendantes H0: pi ≠ pj
Exemple simple Hypothèse: le sex-ratio d’une population est de 50:50 Données: sexe à la naissance de 10 000 enfants Résultats: Fréquences observées de 5185 garçons et 4815 filles
Exemple simple Hypothèse: le sex-ratio d’une population est de 50:50 Données: sexe à la naissance de 10 000 enfants Résultats: Fréquences observées de 5185 garçons et 4815 filles Analyse: Fréquence attendue (théorique) selon l’hypothèse 5000 vs 5000
Exemple (suite) Calcul du Khi-carré: # Degrés de liberté = n – 1, où n correspond au nombre de classes. Ici 2 - 1 = 1 degré de liberté
Khi-carré: seuil critique alpha=0.05 Zone de rejet de H0
Khi-carré et ses degrés de liberté
Exemple (suite) p = 0.0002 Que veux dire p? Conclusion: Rejet de l’hypothèse nulle Acceptation de l’hypothèse alternative avec une probabilité p de faire une erreur: Le sex-ratio humain à la naissance n’est pas 50:50, car il y a une prédominance de mâles.
Exemple II La fréquence des sexes des cerfs de Virginie est- elle la même dans différents secteurs? H0: La fréquence des sexes des cerfs de Virginie est la même dans différents secteurs H1: La fréquence des sexes des cerfs de Virginie diffère dans différents secteurs
Quelle est la fréquence des femelles dans les cantons de l’Est? Table de contingence Quelle est la fréquence des femelles dans les cantons de l’Est?
Khi-carré: étape 1 Somme des lignes et des colonnes
Khi-carré: étape 2 Calculé la fréquence attendue de chaque cellule Pour chaque cellule: Somme ligne *somme colonne Abondance totale (N) Ex: mâles attendus à Anticosti = 97*64/160=38.8 mâles à Anticosti
Khi-carré: étape 2 – autrement dit Probabilité qu’il soit mâle est 97/160 = 0.606 Probabilité qu’il soit d’Anticosti 64/160 = 0.4 Probabilité qu’il soit mâle et d’Anticosti 0.606*0.4 = 0.2425 Fréquence attendue/théorique: Probabilité * Fréquence totale = .24 * 160 = 38.8 mâles à Anticosti
Khi-carré: étape 3 Mâles Femelles Anticosti 38.8 25.2 Cantons de l'Est 48.5 31.5 Laurentides 9.7 6.3 Khi2=(30-38.8) 2/38.8 + (34-25.2) 2/25.2 + (55-48.5) 2/48.5 + (25-31.5) 2/31.5 + (12-9.7) 2/9.7 + (4-6.3) 2/6.3 = 8.67
Khi-carré: étape 3 Khi2= 8.67 Degrés de liberté = (n-1)(m-1) Mâles Femelles Anticosti 38.8 25.2 Cantons de l'Est 48.5 31.5 Laurentides 9.7 6.3 Khi2= 8.67 Degrés de liberté = (n-1)(m-1) Dans l’exemple présent: (3-1)(2-1) = 2 p= 0.0131 .... on rejette?
Note sur le degrés de liberté Dans un test de Khi-carré, le nombre de degrés de liberté est égal au nombre de classes dans l’analyse moins un. Si on test la relation entre deux variables catégoriques (ex. région vs sexe des cerfs) le nombre de degrés de liberté devient (n-1)(m-1) Où n est le nombre de catégories d’une des variables et m le nombre de catégories de l’autre.
Effectifs requis Le test du Khi-carré nécessite des effectifs raisonnables dans chacune des catégories (pas moins de 5 observations par cellule) Lorsqu’il n’y a que 4 cases (2X2) avec un petit effectif, il est préférable d’utiliser le test exact de Fisher. On ne verra pas ce test dans le cours, mais sachez que JMP le fait automatiquement.
Erreurs courantes Les statistiques du khi‑carré doivent être calculées à partir des fréquences observées, jamais de leurs proportions ou de leurs pourcentages.
Design expérimental
La vision falsificationniste de la science (Karl Popper) La méthode scientifique ne permet pas de conclure qu'une idée est vraie, mais elle permet de découvrir quelles idées sont fausses. C'est en rejetant les visions du monde erronées et en en formulant de nouvelles que le progrès scientifique se fait.
Qualités d'une hypothèse scientifique Elle doit être testable (possible d'amasser des observations empiriques pour la mettre à l'épreuve). Elle doit être falsifiable (possible d'amasser des observations empiriques qui pourraient permettre de la rejeter) Idéalement, elle doit être à la fois universelle (permettre d'expliquer le plus grand nombre possible de phénomènes) et parcimonieuse (être la plus simple possible)
Et l’écologie? L’écologie est-elle une science? Peut-on réellement tester des phénomènes ou faisons- nous face à une multitude d’idiosincraties? c-à-d, des cas particuliers non généralisables? Après tout, nous étudions des organismes uniques, dans des lieux uniques, aux conditions environnementales et biotiques constamment changeantes… ex: changements climatiques, espèces invasives?
Processus scientifique Question? Désign pour répondre à la question Récolte des données Analyses des données Interprétation
Certaines difficultés Récolter des données pour réellement répondre à la question. En biologie, particulièrement en écologie Beaucoup de variations que l’on doit « éliminer » ou « contrôler » pour trouver le signal. Chaque organisme est génétiquement unique, à un endroit aux conditions environnementales uniques. Les réponses s’appliquent-elles en dehors des systèmes étudiés?
Certaines difficultés - exemple Déterminer l’effet du phosphore sur la croissance des algues (TP ce pm!). Que pourrait-on faire?
Certaines difficultés - exemple Déterminer l’effet du phosphore sur la croissance des algues (TP ce pm!). Que pourrait-on faire? Labo vs Terrain Est-ce éthique? En chimie, on peut mélanger des produits à notre guise, en écologie (et encore plus en psycho, socio, etc…) on ne peut pas tout faire.
Réplication vs pseudoréplication Déterminer l’effet du phosphore sur la croissance des algues. Labo : 2 aquariums une avec [P]++, une avec [P]-- Pas de réplication!
Réplication vs pseudoréplication Déterminer l’effet du phosphore sur la croissance des algues. Labo : 2 aquariums une avec [P]++, une avec [P]-- Labo : 8 aquariums quatre sous la lampe a avec [P]++, quatre sous la lampe b avec une [P]-- Pseudoréplication: observe-t-on l’effet de la lampe ou l’effet de la [P]?
Réplication vs pseudoréplication Déterminer l’effet du phosphore sur la croissance des algues. Labo : 8 aquariums quatre sous la lampe a, quatre sous la lampe b. On assigne aléatoirement le traitement [P]++ à 2 aquariums sous la lampe a et deux sous la lampe b. Réplication! Si l’on remarque une augmentation de la croissance avec l’augmentation de [P], ça s’applique en nature?
Labo vs terrain Déterminer l’effet du phosphore sur la croissance des algues. Labo : 8 aquariums -> [P]++ vs [P]-- [N]++ [N]-- [P]-- [P]++
Labo vs terrain Déterminer l’effet du phosphore sur la croissance des algues. Labo : 8 aquariums -> [P]++ vs [P]-- Terrain [N]++ [N]-- [P]-- [P]++
Labo vs terrain Déterminer l’effet du phosphore sur la croissance des algues. Labo : 8 aquariums -> [P]++ vs [P]-- Terrain : Covariation de variables environnementales, adaptation locale des organismes, augmentation de la prédation, épuisement d’une resource auxilliaire, etc… Dans la nature, le contrôle est difficile, voir impossible
Labo vs terrain Déterminer l’effet du phosphore sur la croissance des algues. Labo vs terrain Sur le terrain, les vrais contrôles (réplications) sont difficiles, voir impossibles. Il est donc difficile d’isoler l’effet d’une variable indépendamment des autres. Ce qu’on observe dans le labo peut être isolé et compris, mais est-ce que ça s’applique dans la nature? Après tout, il est là notre véritable intérêt.
Exercice Question: Déterminer l’effet de l’augmentation de la température moyenne annuelle sur la croissance de deux variétés de blé. Labo: vous avez 15 chambres de croissances pouvant contenir 30 pots chaque. Terrain: vous avez accès à 10 champs dans plusieurs municipalités. Protocole et tests statistiques à utiliser!
Les prochains cours La semaine prochaine, article 4 et autres familles de statistiques. Article 4: Est-ce que chaque partie remplit bien son rôle? Titre, résumé, introduction, méthodes, résultats, discussion En point par point. Dans 2 semaines, révision des stats pour l’examen, exemple de questions à répondre en classe.