L’erreur standard et les principes fondamentaux du test de t

Slides:



Advertisements
Présentations similaires
Comparaison d’une moyenne observée à une moyenne théorique
Advertisements

Les tests d’hypothèses (I)
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Inférence statistique
Comparaison de deux moyennes observées
Inférence statistique
Comparaison d'une distribution observée à une distribution théorique
Comparaison de plusieurs moyennes observées
Tests non paramétriques
Régression ou corrélation
Les Tests dhypothèses. 1)Définition Un test cest une méthode qui permet de prendre une décision à partir des résultats dun échantillon.
Les tests d’hypothèses
Tests de comparaison de moyennes
Méthodes de Biostatistique
L’inférence statistique
Régression linéaire simple
La corrélation et la régression
Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte.
Le test t.
La puissance statistique
La puissance statistique
La corrélation et la régression
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Les modèles linéaires (Generalized Linear Models, GLM)
Analyse de variance à un critère de classification (ANOVA)
Corrélation Principe fondamental d’une analyse de corrélation
Comparaison de deux échantillons
Test de signification d’une ANOVA à deux critères de classification: sans réplication, modèle I, plan factoriel Tester CMeffet sur CMerreur... … mais,
ANOVA à critères multiples
ORGANIGRAMME-MÉTHODES STATISTIQUES-COMPARAISONS DE MOYENNES
Théorème de la limite centrale l’inférence statistique
ANALYSE DE DONNEES TESTS D’ASSOCIATION
Cédric LAOUENAN 20/11/2008 Tests statistiques Cédric LAOUENAN 20/11/2008
Lien entre deux variables
Régression linéaire simple
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 1 Comparaisons multiples Ce qu’elles sont.
Concepts fondamentaux: statistiques et distributions
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :52 1 Comparaisons multiples Ce qu’elles sont.
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Tests d’ajustement à une distribution théorique
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :51 1 Messages 1er décembre: date limite pour.
Analyse de variance à un critère de classification (ANOVA)
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05 Asymétrie fluctuante.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :44 1 Epistémologie, méthode scientifique et.
Révision des concepts fondamentaux
1.  On souhaite comparer deux traitements dans le cadre d’un essai randomisé sur les lombosciatiques :  corticoïdes par infiltrations  placebo  Critère.
Test de signification d’une ANOVA à deux critères de classification: sans réplication, modèle I, plan factoriel Tester CMeffet sur CMerreur... … mais,
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :18 Bootstrap et permutations.
Quelques commentaires sur les tests statistiques
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :36 1 Tableaux de contingence et modèles log-
Analyse de variance à un critère de classification (ANOVA)
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :34 1 Les modèles linéaires (Generalized Linear.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 1 GLM Exemples.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Comparaison de deux échantillons Principes.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :37 1 Régression linéaire simple et corrélation.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :46 1 Devoir 3 (aa) on vous demande de déterminer.
University of Ottawa - Bio 4118 – Applied Biostatistics © Antoine Morin and Scott Findlay 24/07/2015 2:29 PM Bootstrap et permutations.
University of Ottawa - Bio 4118 – Applied Biostatistics © Antoine Morin and Scott Findlay 13/08/2015 6:59 PM Bootstrap et permutations.
1 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Problème des groupes Un amphi de 200 élèves : loi normale moyenne X et écart type s –Un élève :
Probabilités et statistique MQT-1102
Chapitre 4 Concepts fondamentaux Les composantes d’un test statistique Les hypothèses nulles en statistiques Le sens de p Inférence: comment traduire p.
ECHANTILLONAGE ET ESTIMATION
Comparaison de plusieurs moyennes observées
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Distributions d’échantillonnage pour des proportions
Académie européenne des patients sur l'innovation thérapeutique Rôle et notions élémentaires des statistiques dans les essais cliniques.
Introduction aux statistiques Intervalles de confiance
Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
Transcription de la présentation:

L’erreur standard et les principes fondamentaux du test de t Qu’est-ce que l’erreur-type Principes du test de t Utilisation du test de t pour tester des hypothèses Conditions d’application Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-15 10:21

Définition de l’erreur-type plus petite Représente la moyenne des déviations de la statistique si l’expérience était répétée plusieurs fois dans des conditions identiques. C’est une mesure de la précision d’un estimé peut être calculée pour toute statistique par exemple: la moyenne, la variance, la pente d’une régression etc... Nombre d’essais Erreur-type plus grande Valeur de la statistique Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-15 10:21

Exemple: erreur-type de la moyenne Histogramme représentant les moyennes mi pour N = 1400 échantillons (longueur des ailes de 5 mouches) erreur-type de la moyenne (ETM) est donnée par: 200 150 Fréquence 100 50 40 42 44 46 48 50 52 Longueur de l’aile (mm x 0.1) Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-15 10:21

Comment calculer une erreur-type Manière difficile: répéter l’expérience de nombreuses fois pour chaque essai, calculer un estimé de la statistique voulue calculer la valeur absolue de la moyenne des déviations des observations par rapport à la moyenne obtenue pour tous les essais Manière plus simple: ouvrir un livre de statistiques Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-15 10:21

30 Principe du test de t mA mo 20 Accepter H0 Si les valeurs observées dévient plus des valeurs attendues que ce qui est probable compte-tenu de la précision des mesures, on doit rejeter l’hypothèse nulle Fréquence 30 mA mo 20 Rejeter H0 10 Observée Attendue 20 30 40 50 60 Longueur Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-15 10:21

Pourquoi corriger pour la précision? 30 Accepter H0 me mo 20 Trois raisons peuvent expliquer de grandes différences entre les valeurs observées et prédites: (1) des mesures imprécises, (2) l’hypothèse est fausse ou (3) combinaison de (1) et (2). Alors avant de conclure que l’hypothèse est fausse on doit d’abord éliminer (1) et (3). 10 Fréquence 30 me mo Rejeter H0 20 10 Observations Prédite Vraie distribution 20 30 40 50 60 Longueur Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-15 10:21

Principe du test de t Si la différence entre les valeurs observées et prédites est plus grande que la précision de la mesure, alors quelque chose ne va pas. Si la différence entre les valeurs observées et les valeurs prédites par l’hypothèse nulle est plus grande que l’erreur type alors on doit rejeter l’hypothèse nulle. Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-15 10:21

Composantes du test de t L’hypothèse nulle (H0) Observations Statistique (t) Conditions d’application Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-15 10:21

Test d’une hypothèse extrinsèque 30 mT Accepter H0 20 Tester si la moyenne d’un échantillon est égale à une valeur théorique mT en calculant: on compare la valeur de t obtenue à la valeur critique de la distribution du t de Student avec n-1 degrés de liberté 10 30 mT Rejeter H0 20 10 Observations Prédite Vraie distribution 20 30 40 50 60 Longueur Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-15 10:21

Exemple: taux de croissance de la truite 20 30 lT 10 l (mm/m) Utiliser des relations déjà observées entre des taux de croissance (l) et le pH afin de prédire l pour un lac dont le pH = 4.5 L’hypothèse nulle H0: Comparer la valeur prédite de l ( = l T) avec la moyenne des valeurs observées dans des lacs dont le pH = 4.5 Accepter H0 3 4 5 6 7 pH 15 lT 10 Fréquence 5 Prédite Observée 6 8 10 12 14 l Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-15 10:21

Puissance et effectif pour tests sur la moyenne d’un échantillon d = | m1 - m0| But: détecter une différence d’au moins d entre la moyenne prédite m0 et la moyenne de l’échantillon (m1) Calculer nmin, l’effectif minimum pour détecter d avec une niveau a et une puissance de 1-b, à partir d’un estimé de la variance s2. Fréquence m1 m0 X Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-15 10:21

Puissance et effectif pour tests sur la moyenne d’un échantillon dmin = |m1 - m0| Quelle est la différence minimale pouvant être détectée (dmin) au niveau a avec une puissance 1-b compte-tenu de la variance estimée s2? Fréquence m1 m0 X Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-15 10:21

Puissance et effectif pour tests sur la moyenne d’un échantillon dmin = |m1 - m0| Supposons qu’on accepte H0. Quelle est la puissance du test? À partir de a, d, n et s2, calculer t b(1)n, et utiliser valeur critiques de t pour trouver b approximativement, ou faire une approximation de t b(1),n par Z b(1) Fréquence m1 m0 X Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-15 10:21

Estimer b à partir des valeurs critiques de t À partir de n, et t, on peut estimer b et donc 1 - b. Ex:. si n = 2 et t = 2.1, alors .05 < b < .10, so .90 < 1- b < .95. Alternativement, estimer b par donc 1 - b = .983, ce qui surestime Pour valeur exacte utiliser fonction SYSTAT: tcf(t ,n) 1 - b = .915 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-15 10:21

Test d’une hypothèse intrinsèque Taille Fréquence Deux populations (1, 2) dont la taille moyenne (m1, m2) diffère par m1- m2. Si H0: d = 0 (que les deux moyennes sont égales) est vraie, la distribution de la statistique t est:: Probabilité -3 -2 -1 1 2 3 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-15 10:21

Exemple (suite) Taille Fréquence Pour les deux populations supposons que t = 2.01 Quelle est la probabilité d’obtenir une valeur aussi grande si H0 (que les 2 moyennes sont égales) est vraie? Comme p est petit, c’est peu probable que H0 soit vraie Alors, on rejette H0. -3 -2 -1 1 2 3 Probabilité t = 2.01 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-15 10:21

Inférence: Comment traduire p en une conclusion? Si p < 0.05, on rejette l’hypothèse nulle…. … mais garder p en tête! donner la valeur de p et pas seulement si c’est “significatif” (ou non) souvenez que p < 0.05 est arbitraire! Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-15 10:21

Conditions d’application p est calculé en assumant que t suit la distribution bien connue du t de Student (ts) Ceci est vrai seulement si les données sont distribuées normalement. Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-15 10:21

La distribution de t vs la distribution du t de Student (ts) Le calcul de p assume que p(t) = p(ts) mais à mesure que les données s’éloignent de la normalité, la différence entre les deux augmente alors, les valeur de p estimées sont incorrectes 5 10 15 20 Valeur de la statistique (dl = 5) 0.2 0.3 Probabilité (p) t, données loin de la normalité t, données plus près de la normalité ts Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-15 10:21

Que faire si les données ne sont pas distribuées normalement? Traduction de t en p est incorrecte mais le biais est petit spécialement quand l’effectif est grand (Théorème de la limite centrale) alors, utiliser votre gros bon sens…inquiétez vous seulement quand p est près du niveau a désiré. Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-15 10:21

Que faire si les données ne sont pas distribuées normalement et p est près de a? augmenter la taille de l’échantillon transformer les données utiliser un test non paramétrique qui ne requiert pas que les données soient distribuées normalement Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-15 10:21

Transformations des données Habituellement, on utilise des fonctions mathématiques simples comme: log(X), racine carrée(X), arcsin(X) le choix est basé sur le principe essai-erreur il existe des algorithmes qui permettent de simplifier la tâche, par exemple les transformations de Box et Cox. problème 1: trouver la transformation adéquate est parfois très difficile problème 2: certaines données ne peuvent pas être normalisées Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-15 10:21