La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

L’erreur standard et les principes fondamentaux du test de t

Présentations similaires


Présentation au sujet: "L’erreur standard et les principes fondamentaux du test de t"— Transcription de la présentation:

1 L’erreur standard et les principes fondamentaux du test de t
Qu’est-ce que l’erreur-type Principes du test de t Utilisation du test de t pour tester des hypothèses Conditions d’application Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :21

2 Définition de l’erreur-type
plus petite Représente la moyenne des déviations de la statistique si l’expérience était répétée plusieurs fois dans des conditions identiques. C’est une mesure de la précision d’un estimé peut être calculée pour toute statistique par exemple: la moyenne, la variance, la pente d’une régression etc... Nombre d’essais Erreur-type plus grande Valeur de la statistique Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :21

3 Exemple: erreur-type de la moyenne
Histogramme représentant les moyennes mi pour N = 1400 échantillons (longueur des ailes de 5 mouches) erreur-type de la moyenne (ETM) est donnée par: 200 150 Fréquence 100 50 40 42 44 46 48 50 52 Longueur de l’aile (mm x 0.1) Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :21

4 Comment calculer une erreur-type
Manière difficile: répéter l’expérience de nombreuses fois pour chaque essai, calculer un estimé de la statistique voulue calculer la valeur absolue de la moyenne des déviations des observations par rapport à la moyenne obtenue pour tous les essais Manière plus simple: ouvrir un livre de statistiques Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :21

5 30 Principe du test de t mA mo 20 Accepter H0 Si les valeurs observées dévient plus des valeurs attendues que ce qui est probable compte-tenu de la précision des mesures, on doit rejeter l’hypothèse nulle Fréquence 30 mA mo 20 Rejeter H0 10 Observée Attendue 20 30 40 50 60 Longueur Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :21

6 Pourquoi corriger pour la précision?
30 Accepter H0 me mo 20 Trois raisons peuvent expliquer de grandes différences entre les valeurs observées et prédites: (1) des mesures imprécises, (2) l’hypothèse est fausse ou (3) combinaison de (1) et (2). Alors avant de conclure que l’hypothèse est fausse on doit d’abord éliminer (1) et (3). 10 Fréquence 30 me mo Rejeter H0 20 10 Observations Prédite Vraie distribution 20 30 40 50 60 Longueur Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :21

7 Principe du test de t Si la différence entre les valeurs observées et prédites est plus grande que la précision de la mesure, alors quelque chose ne va pas. Si la différence entre les valeurs observées et les valeurs prédites par l’hypothèse nulle est plus grande que l’erreur type alors on doit rejeter l’hypothèse nulle. Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :21

8 Composantes du test de t
L’hypothèse nulle (H0) Observations Statistique (t) Conditions d’application Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :21

9 Test d’une hypothèse extrinsèque
30 mT Accepter H0 20 Tester si la moyenne d’un échantillon est égale à une valeur théorique mT en calculant: on compare la valeur de t obtenue à la valeur critique de la distribution du t de Student avec n-1 degrés de liberté 10 30 mT Rejeter H0 20 10 Observations Prédite Vraie distribution 20 30 40 50 60 Longueur Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :21

10 Exemple: taux de croissance de la truite
20 30 lT 10 l (mm/m) Utiliser des relations déjà observées entre des taux de croissance (l) et le pH afin de prédire l pour un lac dont le pH = 4.5 L’hypothèse nulle H0: Comparer la valeur prédite de l ( = l T) avec la moyenne des valeurs observées dans des lacs dont le pH = 4.5 Accepter H0 3 4 5 6 7 pH 15 lT 10 Fréquence 5 Prédite Observée 6 8 10 12 14 l Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :21

11 Puissance et effectif pour tests sur la moyenne d’un échantillon
d = | m1 - m0| But: détecter une différence d’au moins d entre la moyenne prédite m0 et la moyenne de l’échantillon (m1) Calculer nmin, l’effectif minimum pour détecter d avec une niveau a et une puissance de 1-b, à partir d’un estimé de la variance s2. Fréquence m1 m0 X Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :21

12 Puissance et effectif pour tests sur la moyenne d’un échantillon
dmin = |m1 - m0| Quelle est la différence minimale pouvant être détectée (dmin) au niveau a avec une puissance 1-b compte-tenu de la variance estimée s2? Fréquence m1 m0 X Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :21

13 Puissance et effectif pour tests sur la moyenne d’un échantillon
dmin = |m1 - m0| Supposons qu’on accepte H0. Quelle est la puissance du test? À partir de a, d, n et s2, calculer t b(1)n, et utiliser valeur critiques de t pour trouver b approximativement, ou faire une approximation de t b(1),n par Z b(1) Fréquence m1 m0 X Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :21

14 Estimer b à partir des valeurs critiques de t
À partir de n, et t, on peut estimer b et donc 1 - b. Ex:. si n = 2 et t = 2.1, alors .05 < b < .10, so .90 < 1- b < .95. Alternativement, estimer b par donc 1 - b = .983, ce qui surestime Pour valeur exacte utiliser fonction SYSTAT: tcf(t ,n) 1 - b = .915 Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :21

15 Test d’une hypothèse intrinsèque
Taille Fréquence Deux populations (1, 2) dont la taille moyenne (m1, m2) diffère par m1- m2. Si H0: d = 0 (que les deux moyennes sont égales) est vraie, la distribution de la statistique t est:: Probabilité -3 -2 -1 1 2 3 Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :21

16 Exemple (suite) Taille Fréquence
Pour les deux populations supposons que t = 2.01 Quelle est la probabilité d’obtenir une valeur aussi grande si H0 (que les 2 moyennes sont égales) est vraie? Comme p est petit, c’est peu probable que H0 soit vraie Alors, on rejette H0. -3 -2 -1 1 2 3 Probabilité t = 2.01 Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :21

17 Inférence: Comment traduire p en une conclusion?
Si p < 0.05, on rejette l’hypothèse nulle…. … mais garder p en tête! donner la valeur de p et pas seulement si c’est “significatif” (ou non) souvenez que p < 0.05 est arbitraire! Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :21

18 Conditions d’application
p est calculé en assumant que t suit la distribution bien connue du t de Student (ts) Ceci est vrai seulement si les données sont distribuées normalement. Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :21

19 La distribution de t vs la distribution du t de Student (ts)
Le calcul de p assume que p(t) = p(ts) mais à mesure que les données s’éloignent de la normalité, la différence entre les deux augmente alors, les valeur de p estimées sont incorrectes 5 10 15 20 Valeur de la statistique (dl = 5) 0.2 0.3 Probabilité (p) t, données loin de la normalité t, données plus près de la normalité ts Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :21

20 Que faire si les données ne sont pas distribuées normalement?
Traduction de t en p est incorrecte mais le biais est petit spécialement quand l’effectif est grand (Théorème de la limite centrale) alors, utiliser votre gros bon sens…inquiétez vous seulement quand p est près du niveau a désiré. Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :21

21 Que faire si les données ne sont pas distribuées normalement et p est près de a?
augmenter la taille de l’échantillon transformer les données utiliser un test non paramétrique qui ne requiert pas que les données soient distribuées normalement Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :21

22 Transformations des données
Habituellement, on utilise des fonctions mathématiques simples comme: log(X), racine carrée(X), arcsin(X) le choix est basé sur le principe essai-erreur il existe des algorithmes qui permettent de simplifier la tâche, par exemple les transformations de Box et Cox. problème 1: trouver la transformation adéquate est parfois très difficile problème 2: certaines données ne peuvent pas être normalisées Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :21


Télécharger ppt "L’erreur standard et les principes fondamentaux du test de t"

Présentations similaires


Annonces Google