La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

écologie et analyse de données

Présentations similaires


Présentation au sujet: "écologie et analyse de données"— Transcription de la présentation:

1 écologie et analyse de données
Séminaire en écologie et analyse de données Cours III Article 1 et Stat II: comparaison de moyennes 23 janvier BIO 3500 – Hiver 2017

2 Au jour d’en ce jour Travail de session Discussion article 1
Stats II – test de t

3 Sujet de recherche (équipe de 3-4)
Doit être un sujet scientifique en écologie (écologie des populations, écologie comportementale, évolution, écologie, aménagement et conservation de la faune et de la flore, éco-toxicologie, etc.) Exemples: La variation de la population du Lynx au Québec est-elle due à la variation de la population de sa proie préférée, le lièvre d'Amérique? Activités saisonnières et sélection d'habitat par la tortue ponctuée (Clemmys guttata). L'influence du ratio azote : phosphore sur la prolifération de cyanobactéries dans les lacs. Comparaison entre les méthodes chimiques et biologiques pour le contrôle des populations de Capnodis tenebrionis, un coléoptère s’attaquant aux arbres fruitiers. Adaptation du mélèze laricin au pH acide des tourbières. Effet de la diversité floristique des jardins sur la diversité des abeilles sauvages en ville.

4 Travail de session: les étapes
1) Résumé du sujet de recherche et envoi de l’article cible (20 février) 2) Exposés oraux am et pm (3 avril formatif; 10 avril évaluatif). Réservez vous la date du 24 avril am et pm pour compléter les oraux au besoin. 3) Rapport de recherche (24 avril)

5 Résumé du sujet de recherche
Le 20 février, vous devez me remettre un résumé d’une demi à une page sur le sujet de votre recherche (par courriel).Vous devez également me faire parvenir une version pdf de votre article cible. J’approuverai ou non le sujet et l’article cible et vous ferai parvenir la decision et des commentaires par courriel. Nom de fichier: ResumeRapport_Boivin_Trump_Gretzky.pdf

6 Rapport de recherche DATE DE REMISE: le 24 avril en format électronique + l’article cible FORMAT: Le travail doit être fait à l'ordinateur et m'être remis par courriel. Il doit respecter le format suivant : 12 points, police régulière (ligne simple) Marges de 2.5 cm tout autour Respectez les maximums spécifiés: soyez direct, économe et efficace! Vous devez avoir fait approuver votre sujet Modifications: Si après le début de vos recherches vous rencontrez des difficultés et aimeriez modifier votre sujet (le rendre plus pointu ou plus général), vous pouvez le faire sans problème (pas besoin d'approbation – assurez-vous que l’article cible est bel et bien un article de recherche). Si par contre vous désirez changer de sujet totalement, vous devrez faire approuver le nouveau sujet avant le 14 mars. Commencez vos recherches tôt pour ne pas avoir de surprises!

7 Rapport de recherche Sections du travail: Présentation (1er page)
Description (résumé) du sujet (½-1 page) Synthèse de l'article-cible (1 page) Critique de l'article-cible (1 page) Références Copie de l'article-cible

8 Présentation Première page : Noms et codes permanents des étudiants.
Sujet de recherche.

9 2. Résumé Deuxième page Résumez en 1 page maximum le sujet de recherche Décrire le sujet choisi. Pourquoi est-ce un sujet important en écologie ? Résumez les grandes lignes de la littérature choisie dans son ensemble (pas un article après l'autre). Soulevez les arguments principaux et les oppositions s'il y en a. Citez les articles, minimum de 5 références sur le sujet dont 3 articles de recherche!

10 Sections 3 et 4 Choisir 1 article-cible parmi vos 3 (ou 4-5) dans votre liste bibliographique (le même doit être utilisé pour les sections 3 et 4). L'article-cible doit être un article de recherche : ne pas utiliser les articles de type 'commentaire' ou 'note brève' ou 'synthèse‘ ou autres comme article-cible (par contre ce type d'article peut figurer dans votre liste). Si votre article cible n’est pas un article de recherche, une pénalité de 40% vous sera attribuée. L'article-cible doit être récent (2000 ou plus).

11 Synthèse de l'article-cible
Troisième page (une page) Répondez dans vos mots (pas de plagiat directement de l'article) aux questions suivantes (pour votre article-cible seulement) Quelle est la problématique traitée dans l'article? (ce qui n'est pas connu et que l'article vise à examiner) Selon les auteurs, pourquoi est-il important de faire cette étude? (justification de l'étude) Quelles sont les étapes principales des méthodes utilisées pour examiner cette problématique? (ce que les auteurs ont fait dans cette étude, mais sans entrer dans les détails) Quel est le résultat principal de cette étude : expliquez ce qui est maintenant connu qui ne l'était pas avant.

12 Critique de l'article-cible
Quatrième page (1 à 1½ page) Pour chacune des sections suivantes, donnez soit une critique positive ou négative par rapport à ce que l'on a vu et verra en classe à propos de la fonction de chaque partie d'un article de recherche. Ne vous contentez pas de répéter de qui a été décrit en classe à propos de la fonction de chaque partie, mais expliquez pourquoi vous trouvez que votre commentaire rapporte un point fort ou faible en faisant référence directement au contenu de l'article-cible. Titre Résumé Introduction Méthodes (seulement les méthodes d’échantillonnage; croyez-vous qu’il peut y avoir un biais?) Résultats, incluant la partie statistique Discussion

13 Bibliographie Liste bibliographique de 5 références (minimum) portant sur votre sujet, dont au moins 3 articles provenant d'un périodique avec comité de lecture (français ou anglais). Le but est d'obtenir des références qui traitent toutes du même sujet.

14 Évaluation (20%) 4% Présentation du sujet de recherche
8% Synthèse de l'article-cible : 2 points par question 6% Critique de l'article-cible : 1 point par section 2% Liste bibliographique : La liste bibliographique inclut le bon nombre et type de documents. Les documents portent bien sur le sujet de recherche choisi par l'étudiant. Le format des citations respecte celui demandé et est exempt d'erreurs. Total = 20% de la note finale pour ce cours

15 Orale Vous utiliserez l'ensemble de vos articles lors de votre exposé oral en fin de session. Celui-ci ne doit pas être une répétition de votre travail écrit!

16 Exposé oral; directives générales
Format: vous devez préparer un exposé oral de 15 minutes ainsi qu’une présentation « Powerpoint » (ou autre) pour l’accompagner. Il y aura une période de questions par la suite. Vous serez évalués sur la clarté de votre présentation et votre maîtrise du sujet (capacité à répondre aux questions).

17 Exposé oral; directives générales
Structure: 1) Introduction sur votre sujet (du général au particulier) 2) Résumé des 3 articles de votre travail écrit: pour chacun… la problématique et justification les méthodes les résultats et conclusions principales 3) Synthèse des avancées liées aux 3 articles et conclusion. Vous confrontez les résultats des 3 articles en contrastant leurs différences et/ou ressemblances Prises ensembles, comment ces études ont permis d’avancer les connaissances sur votre sujet?

18 Exposé oral; directives générales
Vous ferez l’oral deux fois. La première fois sera formative (mais vous devrez participer!): 3 avril (am et pm). La deuxième fois sera évaluative: 10 avril (am et pm)! En pm, les présentations se feront au SB- R440 Pourquoi? Parce que présenter de la science ne se réussit souvent pas du premier coup. Réservez votre date du 24 avril pour compléter les oraux si nécessaire.

19 Évaluation (Orale – 20%) 5% Qualité de la présentation graphique
Je ne vous demande pas d'être des artistes, mais d'être clair! 15% Présentation du sujet de recherche Intro/mise en contexte: 3% Résumé de chacun des 3 articles: 3% chaque Synthèse des 3 articles et ouverture: 3% Des pénalités s’appliqueront si les membres ne participent pas de façon équivalente (-3/20). Également, de façon individuel, des pénalités s’appliqueront si vous n’êtes pas présent à TOUTES les présentations formatives ET évaluatives (-4/20). Votre participation est importante. Je m’attend à ce que tous démontrent qu’ils suivent en posant des questions et donnant des commentaires Total = 20% de la note finale pour ce cours

20 Power point Évitez les animations – problèmes de compatibilité entre les ordinateurs Dupliquez plutôt les diapositives.

21 Power point Balance espace/information: ne pas trop charger les diapositives. Le texte devrait se lire rapidement et devrait accompagner l'information orale, pas la remplacer. Attention de ne pas utiliser tout l'espace sur les diapositives; le texte au bas de l'écran peut être difficile à voir pour les gens assis derrière. Taille de police: ne pas utiliser plus petit que 20 points.

22 Power point Choix de couleurs et animations: la sobriété est de mise. Les couleurs rouge et verte peuvent être difficiles à distinguer pour plusieurs personnes. Nombre de diapositives: environ une par minute

23 Au jour d’en ce jour Travail de session Discussion article 1
Stats II – test de t

24 Article 1 Vous m’avez envoyé les résumés par courriel? Vous l’avez lu?
Vous l’avez compris? Vous vous êtes endormi?

25 Perturbation Perturbation: Évènement qui détruit/tue une partie de la biomasse Primaire: La vie repart à zéro. Des idées? Secondaire: Il reste des organismes vivants.

26 Perturbation Perturbation: Évènement qui détruit/tue une partie de la biomasse Primaire: La vie repart à zéro. Ex. Éruption volcanique, feu très intense, retrait d’un glacier Secondaire: Il reste des organismes vivants. Ex. Épidémie d’insecte, feu de faible intensité, chablis, coupe forestière

27 Perturbation Tordeuse des bourgeons de l’épinette (Choristoneura fumiferana) Mange principalement du sapin!

28 Perturbation - tordeuse
Dernière épidémie ( ) -> ~200 millions de m3 de bois, ce qu’on extrait en 8 ans, ~ 50 milliards de kg de bois! En papier de toilette, cela représente la quantité utilisée par la population du Québec en 500 ans…

29 Perturbation - tordeuse
source: journallehavre.ca,

30 CPRS! Coupe avec protection de la régénération et des sols
Protège les jeunes arbres lors de la coupe

31 CPRS! L’industrie ne veut pas les feuillus intolérants

32 CPRS! Feuille d’ombre vs feuille de lumière
Pétiole plus long, plus pâle, plus mince D’autres éléments liés au maintien hydrique

33 Discussion de l’article
En groupe de 3-4, minutes: Questions sur le contenu de l’article Quelle est la question de recherche? Quelle est l’hypothèse? En quoi est-elle différente de ce qui a été fait avant? Quelles sont les réponses obtenues? Avez-vous trouvé l’article bien écrit? Les figures bien faites? Qu’est-ce que vous n’avez pas compris? Aidez vous à comprendre! Des points qui pourraient remettre les résultats en cause

34 Au jour d’en ce jour Travail de session Discussion article 1
Stats II – test de t

35

36 Objectifs des stastiques
Distribution des poids de 200 poissons du lac à Deux Étages Si ces 200 poissons ont été mesurés dans un lac, que peut-on dire à propos des poissons de ce lac? Mais on ne les a pas tous mesurés...

37 Objectifs des statistiques
Statistiques descriptives: décrire un ensemble de données sous forme: de graphiques, de tableaux de fréquence, de moyennes, médianes, modes, variances Statistiques inférentielles: inférer l’état d’une population à partir des résultats obtenus sur un échantillon Impliquent des tests d’hypothèses BASÉES SUR LES PROBABILITÉS

38 Probabilité Qu’est-ce qu’une probabilité? Une carte = 1/52
Une sorte = 0.25 = 13/52 Une couleur = 0.50 = 26/52 Joker = 0 Une carte = 1

39 Probabilité La probabilité d’un événement (ou valeur) est une mesure de la chance de voir cet événement se réaliser désignée par p (ou P) un événement impossible p = 0 un événement certain p = 1 À noter: plus le nombre d’observations est grand, plus la probabilité observée (empirique) se rapprochera de sa réelle probabilité (espérance) Une carte = 1/52 Une sorte = 0.25 = 13/52 Une couleur = 0.50 = 26/52 Joker = 0 Une carte = 1

40 Probabilité Espérance/probabilité aux cartes: Jeu classique de 52 cartes Une carte précise (ex. 8 de pic)? Une sorte (ex. trèfle)? Une couleur? Joker? N’importe quel carte? Une carte = 1/52 Une sorte = 0.25 = 13/52 Une couleur = 0.50 = 26/52 Joker = 0 Une carte = 1

41 Probabilité Jouons à pile ou face!
Statistique binomiale (pas à l’examen)

42 Les étapes du test d’hypothèses
Poser une hypothèse à vérifier Récolter des observations Déduire la distribution de l’hypothèse Calculer la probabilité d’obtenir ces observations si l’hypothèse posée est correcte Tirer une conclusion sur l’hypothèse posée en fonction de la probabilité calculée  Si la probabilité est très faible : je rejette l’hypothèse Mêmes étapes pour tous les types de tests

43 Test t La plus simple des statistiques inférentielles Sert à comparer
Une moyenne à une moyenne théorique Est-ce que le brassin 10b de Guinness a un pourcentage d’alcool de 5.2%? Deux moyennes Est-ce que les hommes et les femmes ont la même taille? Deux moyennes non-indépendantes (échantillons appariés) Est-ce que l’on est plus où moins endormis après un cours de stats qu’avant?

44 Test t S’applique lorsque l’on tente de déterminer l’effet d’une variable explicative (nominale contenant une ou deux catégories) sur une variable numérique. Ex: Est-ce que la longévité des femmes diffère entre Rosemont et Villeray? Ex: Est-ce que le taux d’homicide diffère entre les villes de grandes tailles aux USA et en Russie? Pour ces 2 exemples: Quels sont les variables explicatives et réponses, les observations, les échantillons et les populations statistiques?

45 Qui est Student? William Gossett Statisticien de Guinness

46 Les étapes du test d’hypothèses
Poser une hypothèse à vérifier Récolter des observations Déduire la distribution de l’hypothèse Calculer la probabilité d’obtenir ces observations si l’hypothèse posée est correcte Tirer une conclusion sur l’hypothèse posée en fonction de la probabilité calculée  Si la probabilité est très faible : je rejette l’hypothèse Mêmes étapes pour tous les types de tests

47 1- Poser une hypothèse Hypothèse nulle (H0):
Hypothèse du statut quo Maintenue jusqu’à preuve du contraire Hypothèse d’égalité dans la majorité des cas Hypothèse alternative (H1): Hypothèse qu’on voudrait démontrer (dans la majorité des cas) Acceptation conditionnelle au rejet de H0 Seule alternative possible à H0

48 1- Poser une hypothèse Hypothèse nulle (H0):
Ex. H0: μ= 22 Hypothèse alternative (H1): Ex. H1: μ ≠ 22 NOTE: les hypothèses sous formes mathématiques s’écrivent avec les symboles des populations, non pas des échantillons.

49 1- Poser une hypothèse Pour le test de t, l’hypothèse peut être:
Bilatérale: pas de direction dans la différence attendue Unilatérale: direction dans la différence attendue IMPORTANT: un test unilatéral permet de découvrir une relation dans une seule direction

50 1- Poser une hypothèse Définir notre question: Les hommes et les femmes adultes ont-ils la même taille? Quelles sont les variables explicative et réponse, les observations, l’échantillon et la population statistique? Les hypothèses? Unilatérales ou bilatérales? Test de t de comparaison de deux moyennes!

51 1- Poser une hypothèse (bilatérale)
Définir notre question: Les hommes et les femmes adultes ont-ils la même taille? Hypothèse nulle: Les hommes et les femmes ont la même taille en moyenne H0 : µf = µm Hypothèse alternative: Les hommes et les femmes n’ont pas la même taille en moyenne H1 : µf ≠ µm

52 1- Poser une hypothèse Définir notre question: Les hommes sont-ils plus grands que les femmes? Les hypothèses? Unilatérales ou bilatérales?

53 1- Poser une hypothèse (unilatérale)
Définir notre question: Les hommes sont-ils plus grands que les femmes? Hypothèse nulle: Les hommes sont plus petits ou de la même taille que les femmes H0 : Hypothèse alternative: Les hommes sont plus grands que les femmes H1 :

54 1- Poser une hypothèse Définir notre question: Est-ce que le brassin de Guinness no. 10b a un taux d’alcool de 4.2% alc/vol? Quelles sont les variables explicative et réponse, les observations, l’échantillon et la population statistique? Les hypothèses? Unilatérales ou bilatérales? Test de t de comparaison à une moyenne théorique!

55 1- Poser une hypothèse (bilatérale)
Définir notre question: Est-ce que le brassin de Guinness no. 10b a un taux d’alcool de 4.2% alc/vol? Hypothèse nulle: Le brassin de Guinness no. 10b a un taux d’alcool de 4.2% alc/vol H0 : Hypothèse alternative: Le brassin de Guinness no. 10b n’a pas un taux d’alcool de 4.2% alc/vol H1 :

56 1- Poser une hypothèse Définir notre question: Est-on plus endormi après un cours de stats sur les tests de t qu’avant le cours? Quelles sont les variables explicative et réponse, les observations, l’échantillon et la population statistique? Les hypothèses? Unilatérales ou bilatérales? Test de t de comparaisons de deux moyennes appariées!

57 1- Poser une hypothèse (unilatérale)
Définir notre question: Est-on plus endormi après un cours de stats sur les tests de t qu’avant le cours? Hypothèse nulle: Les étudiants sont endormis de façon égale ou moindre après qu’avant un cours de stats sur le test t H0 : Hypothèse alternative: Les étudiants sont plus endormis après qu’avant un cours de stats sur le test t H1 :

58 1- Poser une hypothèse En équipe, trouver une question de recherche et poser des hypothèses pour les situations suivantes: Test de comparaison de deux moyennes. Test de comparaison d’une moyenne à une valeur théorique. Test de comparaison de moyennes appariées. Faites moi venir à votre table pour confirmer si ça fonctionne.

59 1b- Déterminer le seuil d’acceptabilité
L’erreur α (type I) La probabilité de se tromper en rejetant H0 -> celle-ci ne sera jamais zéro! En écologie: α=0.05 (convention), α=0.01, α=0.001 Ça dépend de la question! Il faut se souvenir de ce que signifie ce seuil et ne pas l’appliquer bêtement ex: p=0.051 vs p=0.049

60 Les étapes du test d’hypothèses
Poser une hypothèse à vérifier Récolter des observations Déduire la distribution de l’hypothèse Calculer la probabilité d’obtenir ces observations si l’hypothèse posée est correcte Tirer une conclusion sur l’hypothèse posée en fonction de la probabilité calculée  Si la probabilité est très faible : je rejette l’hypothèse

61 2- Récolter des observations
Notre échantillon à partir duquel on va devoir inférer (d’où le nom de statistique inférentielle) l’état de la population! Il doit être le plus représentatif de la population possible (non-biaisé, aléatoire, etc...)

62 2- Récolter des observations
Pour le test de t, on a besoin de déterminer/calculer à partir de(s) l’échantillon(s) n = nombre (s) d’observations s = écart-type (s) X = moyenne (s)

63 Les étapes du test d’hypothèses
Poser une hypothèse à vérifier Récolter des observations Déduire la distribution de l’hypothèse Calculer la probabilité d’obtenir ces observations si l’hypothèse posée est correcte Tirer une conclusion sur l’hypothèse posée en fonction de la probabilité calculée  Si la probabilité est très faible : je rejette l’hypothèse

64 3- Déduire la distribution de l’hypothèse
À partir de H0 et de l’information contenue dans l’échantillon on construit la distribution théorique permettant de calculer les probabilités La distribution théorique représente toutes les évènements que l’on peut observé si H0 est vrai et permet de calculer la probabilité de chacun de ces évènements

65 3- Déduire la distribution de l’hypothèse
Dans le cas du test de t: À partir de l’écart-type (s) et de la taille de l’échantillon (n), on peut bâtir la distribution des moyennes attendues compte tenu de H0 Notez que l’écart-type de l’échantillon (s) est une estimation de l’écart-type de la population (σ)

66 3- Déduire la distribution de l’hypothèse

67 3- Déduire la distribution de l’hypothèse
Définir notre question: Est-ce que le brassin de Guinness no. 10b a un taux d’alcool de 4.2% alc/vol? Hypothèse nulle: Le brassin de Guinness no. 10b a un taux d’alcool de 4.2% alc/vol H0 : Hypothèse alternative: Le brassin de Guinness no. 10b n’a pas un taux d’alcool de 4.2% alc/vol H1 :

68 3- Déduire la distribution de l’hypothèse
Si H0 : Et si l’on connaît l’écart-type (tel qu’estimé à partir de l’échantillon) et la taille de l’échantillon, on peut bâtir la distribution.

69 3- Déduire la distribution de l’hypothèse
1-Crée une population virtuelle de taille infinie (ici ) possédant une moyenne égale à celle de H0 et possédant l’écart-type tel qu’estimé à partir de l’échantillon. Ex:

70 3- Déduire la distribution de l’hypothèse
2-Échantillonner cette distribution une infinité de fois (ici 100 000) en utilisant le même « n » que la taille de l’échantillon CONCLUSION? n=10 n=200

71 3- Déduire la distribution de l’hypothèse
Moyenne des moyennes = moyenne de la population Indépendamment de n n=10 n=200

72 3- Déduire la distribution de l’hypothèse
La taille de l’échantillon augmente la précision de l’estimation de la moyenne (plus faible écart-type de l’estimation des moyennes) s=0.063 n=10 s=0.014 n=200

73 3- Déduire la distribution de l’hypothèse
La taille de l’échantillon augmente la précision de l’estimation de la moyenne (plus faible écart-type de l’estimation des moyennes) s=0.063 n=10 Distribution de t s=0.014 n=200

74 3- Déduire la distribution de l’hypothèse
Et ça fonctionne même si la distribution dans la population originale est asymétrique s=0.063 n=10 Distribution de t s=0.014 n=200

75 Les étapes du test d’hypothèses
Poser une hypothèse à vérifier Récolter des observations Déduire la distribution de l’hypothèse Calculer la probabilité d’obtenir ces observations si l’hypothèse posée est correcte Tirer une conclusion sur l’hypothèse posée en fonction de la probabilité calculée  Si la probabilité est très faible : je rejette l’hypothèse

76 4- Calculer la probabilité
La distribution t est symétrique Mais sa forme exacte dépend de la taille de l'échantillon (n) Elle est plus aplatie que la distribution normale À mesure que la taille de échantillon augmente, la distribution t tend à se confondre avec la distribution normale

77 4- Calculer la probabilité
La loi de Student (distribution de t) nous permet une estimation non-biaiséé (i.e. juste) des probabilités d’une loi normale à partir des estimations de μ et σ. Une distribution normale correspond à la distribution de probabilité d’une variable dont la courbe est parfaitement symétrique, unimodale et en forme de cloche. Elle est caractérisée complètement par 2 paramètres: sa moyenne sa variance ou écart-type

78 4- Calculer la probabilité
Comme la distribution de t est une approximation de la loi normale, il est facile de calculer la probabilité des données sont contenues par 3 écarts-types moyenne contient 95% des données

79 4- Calculer la probabilité
10/13/2017 4- Calculer la probabilité Concernant la loi normale: Les raisons qui expliquent son rôle central sont bien plus historiques et mathématiques que biologiques. Il y a très peu de variables en ecologie qui soient distribuées normalement. Cependant, la distribution des moyennes tend vers la normalité. Faire l’exemple au tableau des trois courbes La distribution de la population Moyenne = μ Écart type = σ Les distributions d'échantillons Moyenne = x barre Écart type = s Cette propriété est intéressante parce que, en réalité, on ne travaille que sur un seul échantillon, et la moyenne de celui-ci sert à faire l'approximation de la moyenne de la population qui, habituellement, est inconnue

80 4- Calculer la probabilité
H0 = Probable?

81 4- Calculer la probabilité
H0 = Probable? Non, plus la moyenne observée est loin de la moyenne théorique de la population (H0), plus la probabilité que l’échantillon provienne d’une telle population est faible

82 4- Calculer la probabilité
10/13/2017 4- Calculer la probabilité 1. Calculer la valeur de la statistique t = signal / bruit = différence entre les groupes variabilité entre les groupes Faire l’exemple au tableau des trois courbes La distribution de la population Moyenne = μ Écart type = σ Les distributions d'échantillons Moyenne = x barre Écart type = s Cette propriété est intéressante parce que, en réalité, on ne travaille que sur un seul échantillon, et la moyenne de celui-ci sert à faire l'approximation de la moyenne de la population qui, habituellement, est inconnue

83 4- Calculer la probabilité
10/13/2017 4- Calculer la probabilité 1. Calculer la valeur de la statistique t = signal / bruit = différence entre les groupes variabilité entre les groupes 2. Calculer la probabilité (p) à partir de la statistique (t) et du nombre de dégrés de liberté (k) Jadis/naguère: à partir d’une table De nos jours: un ordinateur le fait à votre place! Degré de liberté (k) -> k influence la valeur de p k = n-1 Faire l’exemple au tableau des trois courbes La distribution de la population Moyenne = μ Écart type = σ Les distributions d'échantillons Moyenne = x barre Écart type = s Cette propriété est intéressante parce que, en réalité, on ne travaille que sur un seul échantillon, et la moyenne de celui-ci sert à faire l'approximation de la moyenne de la population qui, habituellement, est inconnue

84 4- Calculer la probabilité
10/13/2017 4- Calculer la probabilité La probabilité est obtenue sous le format Ex: p=0.01 ou p=0.53 p représente la probabilité de se tromper en rejetant H0 pour H1 Autrement dit, c’est le probabilité que H0 soit vrai en rejetant H0 Le seuil alpha (α), tel que décidé à l’étape 1, représente la probabilité maximale de se tromper que l’on est prêt à accepter (seuil d’acceptabilité) Faire l’exemple au tableau des trois courbes La distribution de la population Moyenne = μ Écart type = σ Les distributions d'échantillons Moyenne = x barre Écart type = s Cette propriété est intéressante parce que, en réalité, on ne travaille que sur un seul échantillon, et la moyenne de celui-ci sert à faire l'approximation de la moyenne de la population qui, habituellement, est inconnue

85 4- Calculer la probabilité
Jadis/naguère: Déterminer la valeur de t critique à l’aide d’une table de t ex: k=8 , alpha=0.05, test bilatéral

86 4- Calculer la probabilité
Jadis/naguère: Déterminer la valeur de t critique à l’aide d’une table de t ex: k=8 , alpha=0.05, test bilatéral tcrit= 2.306

87 4- Calculer la probabilité
Jadis/naguère: Déterminer la valeur de t critique à l’aide d’une table de t ex: k=8 , alpha=0.05, test bilatéral unilatéral tcrit= 2.306 tcrit= 1.895

88 4- Calculer la probabilité
tcrit= 1.895 tcrit= tcrit= 2.306 Unilatéral Bilatéral

89 4- Calculer la probabilité
Jadis/naguère: Déterminer la valeur de t critique à l’aide d’une table de t ex: k=11 , alpha=0.01, test unilatéral tcrit= ?

90 4- Calculer la probabilité
Jadis/naguère: Déterminer la valeur de t critique à l’aide d’une table de t ex: k=11 , alpha=0.01, test unilatéral tcrit= 2.718

91 4- Calculer la probabilité
Jadis/naguère: Déterminer p à partir de la valeur de t calculée ex: k=9 , t = 5.7, test bilatéral p<0.001

92 4- Calculer la probabilité
Jadis/naguère: Déterminer p à partir de la valeur de t calculée ex: k=3 , t = 2.78, test unilatéral p=??

93 4- Calculer la probabilité
Jadis/naguère: Déterminer p à partir de la valeur de t calculée ex: k=3 , t = 2.78, test unilatéral p=0.05

94 Les étapes du test d’hypothèses
Poser une hypothèse à vérifier Récolter des observations Déduire la distribution de l’hypothèse Calculer la probabilité d’obtenir ces observations si l’hypothèse posée est correcte Tirer une conclusion sur l’hypothèse posée en fonction de la probabilité calculée  Si la probabilité est très faible : je rejette l’hypothèse

95 5-Tirer une conclusion De nos jours: Est-ce que la probabilité calculée (p) est inférieure au seuil α ? Si oui, on rejette H0 Si non, on ne rejette pas H0 α (p) est la probabilité de se tromper en rejettant H0

96 5-Tirer une conclusion Jadis/naguère (et à l’examen): Est-ce que la valeur de t calculée (t) est supérieur au t critique? Si oui, on rejette H0 Si non, on ne rejette pas H0 Si t calculé est supérieur au t critique, automatiquement le p calculé est inférieur au seuil alpha

97 Test t - des exemples Sert à comparer
Une moyenne à une moyenne théorique Deux moyennes Deux moyennes non-indépendantes (échantillons appariés) k = n-1

98 Ex.1 : Guinness Question: Est-ce que le brassin de Guinness no. 10b a un taux d’alcool de 4.2% alc/vol? α= 0.05 Hypothèse nulle: Le brassin de Guinness no. 10b a un taux d’alcool de 4.2% alc/vol H0 : Hypothèse alternative: Le brassin de Guinness no. 10b n’a pas un taux d’alcool de 4.2% alc/vol H1 :

99 Ex.1 : Guinness Observation: 4.2%, 4.7%, 4.3%, 4.5%, 4.3% n=? k=?

100 Ex.1 : Guinness Observation: 4.2%, 4.7%, 4.3%, 4.5%, 4.3% n=5
k=4 (n-1) x=4.4% s=0.2%

101 Ex.1 : Guinness ex: k=4 , alpha=0.05, test bilatéral tcrit= 2.776

102 Ex.1 : Guinness t = 2.236 tcrit= 2.776 On rejette H0?

103 Ex.1 : Guinness t = 2.236 tcrit= 2.776 On rejette H0? NON!
Et si on augmentait le n?

104 Test t - des exemples Sert à comparer
Une moyenne à une moyenne théorique Deux moyennes Deux moyennes non-indépendantes (échantillons appariés) k = n-2

105 ex.2: Tailles hommes vs femmes
Définir notre question: Les hommes et les femmes adultes ont-ils la même taille? α= 0.05 Hypothèse nulle: Les hommes et les femmes ont la même taille en moyenne H0 : Hypothèse alternative: Les hommes et les femmes n’ont pas la même taille en moyenne H1 :

106 ex.2: Tailles hommes vs femmes
Définir notre question: Les hommes adultes sont-ils plus grands que les femmes? α= 0.05 Hypothèse nulle: Les hommes sont plus petits ou de la même taille que les femmes H0 : Hypothèse alternative: Les hommes sont plus grands que les femmes H1 :

107 ex.2: Tailles hommes vs femmes
Observation f (m): 1.65, 1.57, 1.77, 1.69 Observation m (m): 1.67, 1.79, 1.83, 1.87 nf=4 ; nm=4 k=6 (n-2 pour les comparaisons de deux moyennes) xf=1.67m ; xm= 1.79m sf=0.0833m ; sm=0.0864m

108 ex.2: Tailles hommes vs femmes
nf=4 ; nm=4 xf=1.67m ; xm= 1.79m sf=0.0833m ; sm=0.0864m

109 ex.2: Tailles hommes vs femmes
ex: k=6 , alpha=0.05, test bi et unilatéral tcrit_u= tcrit_b= 2.447

110 ex.2: Tailles hommes vs femmes
tcrit_u=-1.943 tcrit_b=2.447 -2 -1.943 -2.447 2.447

111 ex.2: Tailles hommes vs femmes
tcrit_u= rejette H0 tcrit_b=2.447 non-rejet H0 -2 -1.943 -2.447 2.447

112 Test t - des exemples Sert à comparer
Une moyenne à une moyenne théorique Deux moyennes Deux moyennes non-indépendantes (échantillons appariés) k = n-1 Écart-type des différences

113 ex.3: Avant/après stats Définir notre question: Est-on plus endormi après un cours de stats sur les tests de t qu’avant le cours? Hypothèse nulle: Les étudiants sont endormis de façon égale ou moindre après qu’avant un cours de stats sur le test t H0 : Hypothèse alternative: Les étudiants sont plus endormis après qu’avant un cours de stats sur le test t H1 :

114 ex.3: Avant/après stats Sommeil: avant – après = différence 2 3 4 5 3
6 -3 1 -2

115 ex.3: Avant/après stats Sommeil: avant – après = différence 2 3 4 5 3
6 -3 1 -2 D= -7/7 = -1 s=1.633

116 ex.3: Avant/après stats n=7 D=-1 s=1.633

117 ex.3: Avant/après stats t=-1.62, k=6 p=0.075, on ne rejette pas H0

118

119 Conditions d’application
Indépendance des échantillons Échantillons aléatoires simples Normalité de la distribution Égalité des variances

120 Récapitulatif Pose nos hypothèses (H0 et H1), test bilatéral ou unilatéral? Détermine la valeur t critique en fonction du seuil α Calcul t pour notre échantillon Compare le t calculé au t critique Prend une décision statistique de rejeter H0 ou non

121 Décisions statistiques
Nous ne pouvons pas dire si H0 est vrai ou faux. Nous pouvons seulement dire avec quelle probabilité les observations dans un échantillon sont compatibles avec l’hypothèse nulle. Il y a toujours un risque d’erreur.

122 Décisions statistiques
Les tests statistiques sont des outils puissants et importants, mais ils peuvent amener à des erreurs dans une conclusion parce qu'ils sont basés sur des échantillons et non sur des populations entières.

123 Erreur du type 1 (α) La probabilité de rejeter H0 quand H0 est vraie.
Souvent en écologie on fixe α à 0,05

124 Erreur du type II (β) La probabilité de ne pas rejeter H0 quand H1 est vraie. En générale on ne peut pas fixer β dans un test. Il varie selon l’effectif, la variance et la différence entre H0 et H1.

125 Deux types d’erreurs lors d’une décision statistique
le processus décisionnel du test d’hypothèse Réalité (inconnu) Décision Ho vrai Ho fausse Rejet de Ho Erreur de première espèce (type I) P=α Décision correcte Puissance statistique Non-rejet de Ho Décision correcte P=1- α Erreur de seconde espèce (type II) Deux types d’erreurs lors d’une décision statistique

126 Puissance =1 - β Puissance d’un test
Probabilité de rejeter H0 quand H1 est vraie Puissance =1 - β

127 Vous avez dix minutes go!
Activité Groupes de 5 ou 6 (voisins proches) Donner un cas où l’on peut utiliser un test d’hypothèses de comparaison de moyennes De quel type de test s’agit-il? Donner vos hypothèses nulles et alternatives S’agit-il d’un test unilatéral ou bilatéral? Que concluez-vous si la valeur de t dépasse le t critique? Vous avez dix minutes go!


Télécharger ppt "écologie et analyse de données"

Présentations similaires


Annonces Google