Cours 8 Stat IV: Khi2 Désign experimental. BIO 3500 – Hiver 2017

Slides:



Advertisements
Présentations similaires
Introduction aux statistiques
Advertisements

Les liens entre les variables et les tests d’hypothèse
Problème Autre formulation :
1 L2 STE. Test du χ2 d’adéquation/conformité: Il s'agit de juger de l'adéquation entre une série de données statistiques et une loi de probabilité définie.
Outils Statistiques Damien Van Gysel CHU de Nice
Atelier 1 Le problème du surpoids sur géogébra. Etude de la prévalence du surpoids: (document Ressources pour la classe de terminale) Situation: On souhaite.
« Objectifs BAC » : Savoir différencier les tables de mobilité brute avec les tables de destinée et les tables de recrutement Savoir lire une table de.
Généralisation de la comparaison de moyennes par Analyse de la variance (ANOVA)
Introduction La génétique initiée par Gregor Mendel (génétique mendelienne), a pour objectif: Comprendre le déterminisme et la transmission des caractères.
Utilisation du logiciel EduStat © Analyse classique d’items L’examen du rapport.
O ij BrunChâtainRouxBlond Total Marron Noisette Vert Bleu Total Dans cet exemple,
Notions de statistiques et d’analyse de données
V Suite géométrique : 1°) Définition : un+1
Suites ordonnées ou mettre de l’ordre
Corrélation et régression linéaire simple
Rédiger un protocole expérimental en physique-chimie en cycle 4
Chapitre 1 Généralités sur les données
Valeurs de toutes les différences observables sous H0
Les distributions en classes
Comparaison de deux pourcentages.
AVANT 1990 Situation des pays dans le monde, analysée par la Banque Mondiale Classement basé sur le PIB par habitant.
CHAPITRE 1 : CONDITIONS DU MILIEU, RESPIRATION ET RÉPARTITION
Plan la séance 12 L’analyse multivariée et la présentation des données
Loi Normale (Laplace-Gauss)
4°) Intervalle de fluctuation :
LES INDICATEURS DE SANTE INDICATEURS DE SANTE Pr. KELLIL M.
Une grande partie des données que nous serons amenés cette année à étudier sera exprimée en unités monétaires. Or, nous le savons, il existe un phénomène.
Mesures de Variation, Coefficient Multiplicateur, Taux de Variation
Epidémiologie analytique
La Conclusion.
Projet de recherche L’homéostasie du corps humains
Plans d’experiences : plans de melanges
et discussion de l'article 2
Technologies de l’intelligence d’affaires Séance 11
Cours 9 Autres types de Statistiques. Article 4 BIO 3500 – Hiver 2017
Technologies de l’intelligence d’affaires Séance 12
Révision et preparation à l’examen
Risque d’erreur de 1ère espèce : α
Scénario Quatre hipsters entrent en collision un dans l'autre dans un ascenseur plein de personnes. En conséquence ils laissent tomber leurs téléphones.
4.5 Tests D’hypothèses sur une proportion
4.4 Tests D’hypothèses sur une moyenne
Introduction aux statistiques Intervalles de confiance
Formules de calculs et Fonctions. Structure des formules de calcul Commencez toujours votre calcul par le signe =, ensuite sans laisser d’espaces, placez.
Statistique. Probabilite ou risque Le risque c’est le pourcentage des valeurs qu’on neglige plus le risqué augmente plus on neglige des valeurs Hypothese.
Statistique Cours #2 et #3 Avons-nous des conditions gagnantes? Prise de décision à partir d’inférence.
Statistiques Sociales LC4
POL1803: Analyse des techniques quantitatives
Kamel Bourenane ESSC Univers vivant L’écologie Kamel Bourenane ESSC.
Calculs des incertitudes Lundi 30 Avril 2018 Master de Management de la Qualité, de la Sécurité et de l’Environnement.
 1____Probabilité  2______variables aléatoires discrètes et continues  3______loi de probabilités d’une v a  4_______les moyens et les moyens centraux.
Présentation de la base Frantext
La méthode scientifique
Calcul de probabilités
Rappel (3): les étapes des tests statistiques
Énumération des Microorganismes
P LAMBOLEZ Partie maths V GILLOT Partie anglais
2.4 La loi de vitesse d’une réaction chimique
Test 2.
On lance 100 fois de suite une pièce de monnaie.
L’ÉCOLOGIE * Définition de l’écologie * Définition de l’écosystème * C’est quoi la biocénose et le biotope ? * La relation entre la biocénose et le biotope.
La démarche scientifique
Programme d’appui à la gestion publique et aux statistiques
Conception cartographique
Exercice 1 : On admet qu’il naît automatiquement 49% de filles parmi les naissances annuelles en France. Le directeur d’une maternité qui a 200.
Utiliser le modèle log-linéaire pour mettre au jour la structure du lien entre les deux variables d’un tableau de contingence : un exemple d’application.
Les méthodes quantitatives en éducation
Tests d’hypothèses paramétriques 1 Cours Statistiques Chapitre 9.
Récapitulation du jour 2ème
TP N°1 : GUI en NetBeans Module R & C Université de Jijel
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES.
Transcription de la présentation:

Cours 8 Stat IV: Khi2 Désign experimental. BIO 3500 – Hiver 2017 6 mars BIO 3500 – Hiver 2017

Aujourd’hui Tables de contingence Khi-carré ( ) Design expérimental

Khi-carré (χ2) et tables de contingence

Khi-carré Permet de faire des tests d’hypothèses lorsque les deux variables sont qualitatives. On se sert de données exprimées en terme de fréquences.

C’est quoi une fréquence? Le nombre d'observations se trouvant dans une classe (p.ex., nb de loups ayant le poil roux) Fréquence absolue (le nombre d’observations) Fréquence relative (la proportion des observations) 8 4 0.6 0.3 A B C A B C Fréquence absolue Fréquence relative

Test d’hypothèses khi-carré Association entre deux variables qualitatives! H0: La variable A et la variable B sont indépendantes H0: pi = pj = p ou p = 1/nb de classes H1: La variable A et la variable B ne sont pas indépendantes H0: pi ≠ pj

Exemple simple Hypothèse: le sex-ratio d’une population est de 50:50 Données: sexe à la naissance de 10 000 enfants Résultats: Fréquences observées de 5185 garçons et 4815 filles

Exemple simple Hypothèse: le sex-ratio d’une population est de 50:50 Données: sexe à la naissance de 10 000 enfants Résultats: Fréquences observées de 5185 garçons et 4815 filles Analyse: Fréquence attendue (théorique) selon l’hypothèse 5000 vs 5000

Exemple (suite) Calcul du Khi-carré: # Degrés de liberté = n – 1, où n correspond au nombre de classes. Ici 2 - 1 = 1 degré de liberté

Khi-carré: seuil critique alpha=0.05 Zone de rejet de H0

Khi-carré et ses degrés de liberté

Exemple (suite) p = 0.0002 Que veux dire p? Conclusion: Rejet de l’hypothèse nulle Acceptation de l’hypothèse alternative avec une probabilité p de faire une erreur: Le sex-ratio humain à la naissance n’est pas 50:50, car il y a une prédominance de mâles.

Exemple II La fréquence des sexes des cerfs de Virginie est- elle la même dans différents secteurs? H0: La fréquence des sexes des cerfs de Virginie est la même dans différents secteurs H1: La fréquence des sexes des cerfs de Virginie diffère dans différents secteurs

Quelle est la fréquence des femelles dans les cantons de l’Est? Table de contingence Quelle est la fréquence des femelles dans les cantons de l’Est?

Khi-carré: étape 1 Somme des lignes et des colonnes

Khi-carré: étape 2 Calculé la fréquence attendue de chaque cellule Pour chaque cellule: Somme ligne *somme colonne Abondance totale (N) Ex: mâles attendus à Anticosti = 97*64/160=38.8 mâles à Anticosti

Khi-carré: étape 2 – autrement dit Probabilité qu’il soit mâle est 97/160 = 0.606 Probabilité qu’il soit d’Anticosti 64/160 = 0.4 Probabilité qu’il soit mâle et d’Anticosti 0.606*0.4 = 0.2425 Fréquence attendue/théorique: Probabilité * Fréquence totale = .24 * 160 = 38.8 mâles à Anticosti

Khi-carré: étape 3 Mâles Femelles Anticosti 38.8 25.2 Cantons de l'Est 48.5 31.5 Laurentides 9.7 6.3 Khi2=(30-38.8) 2/38.8 + (34-25.2) 2/25.2 + (55-48.5) 2/48.5 + (25-31.5) 2/31.5 + (12-9.7) 2/9.7 + (4-6.3) 2/6.3 = 8.67

Khi-carré: étape 3 Khi2= 8.67 Degrés de liberté = (n-1)(m-1) Mâles Femelles Anticosti 38.8 25.2 Cantons de l'Est 48.5 31.5 Laurentides 9.7 6.3 Khi2= 8.67 Degrés de liberté = (n-1)(m-1) Dans l’exemple présent: (3-1)(2-1) = 2 p= 0.0131 .... on rejette?

Note sur le degrés de liberté Dans un test de Khi-carré, le nombre de degrés de liberté est égal au nombre de classes dans l’analyse moins un. Si on test la relation entre deux variables catégoriques (ex. région vs sexe des cerfs) le nombre de degrés de liberté devient (n-1)(m-1) Où n est le nombre de catégories d’une des variables et m le nombre de catégories de l’autre.

Effectifs requis Le test du Khi-carré nécessite des effectifs raisonnables dans chacune des catégories (pas moins de 5 observations par cellule) Lorsqu’il n’y a que 4 cases (2X2) avec un petit effectif, il est préférable d’utiliser le test exact de Fisher. On ne verra pas ce test dans le cours, mais sachez que JMP le fait automatiquement.

Erreurs courantes Les statistiques du khi‑carré doivent être calculées à partir des fréquences observées, jamais de leurs proportions ou de leurs pourcentages.

Design expérimental

La vision falsificationniste de la science (Karl Popper) La méthode scientifique ne permet pas de conclure qu'une idée est vraie, mais elle permet de découvrir quelles idées sont fausses. C'est en rejetant les visions du monde erronées et en en formulant de nouvelles que le progrès scientifique se fait.

Qualités d'une hypothèse scientifique Elle doit être testable (possible d'amasser des observations empiriques pour la mettre à l'épreuve). Elle doit être falsifiable (possible d'amasser des observations empiriques qui pourraient permettre de la rejeter) Idéalement, elle doit être à la fois universelle (permettre d'expliquer le plus grand nombre possible de phénomènes) et parcimonieuse (être la plus simple possible)

Et l’écologie? L’écologie est-elle une science? Peut-on réellement tester des phénomènes ou faisons- nous face à une multitude d’idiosincraties? c-à-d, des cas particuliers non généralisables? Après tout, nous étudions des organismes uniques, dans des lieux uniques, aux conditions environnementales et biotiques constamment changeantes… ex: changements climatiques, espèces invasives?

Processus scientifique Question? Désign pour répondre à la question Récolte des données Analyses des données Interprétation

Certaines difficultés Récolter des données pour réellement répondre à la question. En biologie, particulièrement en écologie Beaucoup de variations que l’on doit « éliminer » ou « contrôler » pour trouver le signal. Chaque organisme est génétiquement unique, à un endroit aux conditions environnementales uniques. Les réponses s’appliquent-elles en dehors des systèmes étudiés?

Certaines difficultés - exemple Déterminer l’effet du phosphore sur la croissance des algues (TP ce pm!). Que pourrait-on faire?

Certaines difficultés - exemple Déterminer l’effet du phosphore sur la croissance des algues (TP ce pm!). Que pourrait-on faire? Labo vs Terrain Est-ce éthique? En chimie, on peut mélanger des produits à notre guise, en écologie (et encore plus en psycho, socio, etc…) on ne peut pas tout faire.

Réplication vs pseudoréplication Déterminer l’effet du phosphore sur la croissance des algues. Labo : 2 aquariums une avec [P]++, une avec [P]-- Pas de réplication!

Réplication vs pseudoréplication Déterminer l’effet du phosphore sur la croissance des algues. Labo : 2 aquariums une avec [P]++, une avec [P]-- Labo : 8 aquariums quatre sous la lampe a avec [P]++, quatre sous la lampe b avec une [P]-- Pseudoréplication: observe-t-on l’effet de la lampe ou l’effet de la [P]?

Réplication vs pseudoréplication Déterminer l’effet du phosphore sur la croissance des algues. Labo : 8 aquariums quatre sous la lampe a, quatre sous la lampe b. On assigne aléatoirement le traitement [P]++ à 2 aquariums sous la lampe a et deux sous la lampe b. Réplication! Si l’on remarque une augmentation de la croissance avec l’augmentation de [P], ça s’applique en nature?

Labo vs terrain Déterminer l’effet du phosphore sur la croissance des algues. Labo : 8 aquariums -> [P]++ vs [P]-- [N]++ [N]-- [P]-- [P]++

Labo vs terrain Déterminer l’effet du phosphore sur la croissance des algues. Labo : 8 aquariums -> [P]++ vs [P]-- Terrain [N]++ [N]-- [P]-- [P]++

Labo vs terrain Déterminer l’effet du phosphore sur la croissance des algues. Labo : 8 aquariums -> [P]++ vs [P]-- Terrain : Covariation de variables environnementales, adaptation locale des organismes, augmentation de la prédation, épuisement d’une resource auxilliaire, etc… Dans la nature, le contrôle est difficile, voir impossible

Labo vs terrain Déterminer l’effet du phosphore sur la croissance des algues. Labo vs terrain Sur le terrain, les vrais contrôles (réplications) sont difficiles, voir impossibles. Il est donc difficile d’isoler l’effet d’une variable indépendamment des autres. Ce qu’on observe dans le labo peut être isolé et compris, mais est-ce que ça s’applique dans la nature? Après tout, il est là notre véritable intérêt.

Exercice Question: Déterminer l’effet de l’augmentation de la température moyenne annuelle sur la croissance de deux variétés de blé. Labo: vous avez 15 chambres de croissances pouvant contenir 30 pots chaque. Terrain: vous avez accès à 10 champs dans plusieurs municipalités. Protocole et tests statistiques à utiliser!

Les prochains cours La semaine prochaine, article 4 et autres familles de statistiques. Article 4: Est-ce que chaque partie remplit bien son rôle? Titre, résumé, introduction, méthodes, résultats, discussion En point par point. Dans 2 semaines, révision des stats pour l’examen, exemple de questions à répondre en classe.