Chapitre 4 Concepts fondamentaux Les composantes d’un test statistique Les hypothèses nulles en statistiques Le sens de p Inférence: comment traduire p.

Slides:



Advertisements
Présentations similaires
Comparaison d’une moyenne observée à une moyenne théorique
Advertisements

D.Gile statscrit1 LUTILISATION DES STATISTIQUES INFERENTIELLES DANS LA RECHERCHE : REFLEXIONS CRITIQUES
Risques d’erreur statistique et test statistique
Test statistique : principe
Les tests d’hypothèses (I)
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Inférence statistique
Comparaison de deux moyennes observées
Inférence statistique
Comparaison de deux pourcentages observés
Comparaison de plusieurs moyennes observées
Tests non paramétriques
Les TESTS STATISTIQUES
Tests de comparaison de pourcentages
Nombre de sujets nécessaires en recherche clinique
Les TESTS STATISTIQUES
Les Tests dhypothèses. 1)Définition Un test cest une méthode qui permet de prendre une décision à partir des résultats dun échantillon.
Les tests d’hypothèses
Tests de comparaison de moyennes
Méthodes de Biostatistique
L’inférence statistique
Analyse de la variance : ANOVA à un facteur
Nombre de sujets nécessaires en recherche clinique
Régression linéaire simple
Groupe 1: Classes de même intervalle
Objectifs du chapitre 12: Interprétation des résultats
DEA Perception et Traitement de l’Information
Justification et opérationnalisation des hypothèses
Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte.
Le test t.
La puissance statistique
La puissance statistique
La corrélation et la régression
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Corrélation Principe fondamental d’une analyse de corrélation
Comparaison de deux échantillons
Analyse factorielle de variance: Principes d’expérimentation
Objectifs du chapitre 8: Puissance statistique
Tests d’hypothèses.
ORGANIGRAMME-MÉTHODES STATISTIQUES-COMPARAISONS DE MOYENNES
ANALYSE DE DONNEES TESTS D’ASSOCIATION
Cédric LAOUENAN 20/11/2008 Tests statistiques Cédric LAOUENAN 20/11/2008
Test d'hypothèse pour des proportions:
Lien entre deux variables
STATISTIQUES DESCRIPTIVES
ANOVA à 1 facteur en groupes de mesure indépendants
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 1 Comparaisons multiples Ce qu’elles sont.
Concepts fondamentaux: statistiques et distributions
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Tests d’ajustement à une distribution théorique
L’erreur standard et les principes fondamentaux du test de t
Révision des concepts fondamentaux
1.  On souhaite comparer deux traitements dans le cadre d’un essai randomisé sur les lombosciatiques :  corticoïdes par infiltrations  placebo  Critère.
Quelques commentaires sur les tests statistiques
University of Ottawa - Bio 4118 – Applied Biostatistics © Antoine Morin and Scott Findlay 13/08/2015 6:59 PM Bootstrap et permutations.
Analyse des données. Plan Lien entre les statistiques et l’analyse des données Propagation des erreurs Ajustement de fonctions.
1 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Problème des groupes Un amphi de 200 élèves : loi normale moyenne X et écart type s –Un élève :
Probabilités et statistique MQT-1102
Comparaison de plusieurs moyennes observées
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Académie européenne des patients sur l'innovation thérapeutique Rôle et notions élémentaires des statistiques dans les essais cliniques.
Introduction aux statistiques Intervalles de confiance
UED SIM – Département OLCI Année Arts & Métiers ParisTech CER ANGERS Probabilités et statistiques Cours n° 2.
Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
23/05/2016 Déterminer la taille des échantillons notion sous-jacente : puissance d'un test Claire Chabanet fonction F4, étendre l'écran configurer le diaporama,
Transcription de la présentation:

Chapitre 4 Concepts fondamentaux Les composantes d’un test statistique Les hypothèses nulles en statistiques Le sens de p Inférence: comment traduire p en une conclusion? Types d’erreurs dans les tests statistiques Tests unilatéraux et bilatéraux La puissance

Concepts map

Question biologique VS hypothèse nulle (statistique) Apprendre à traduire une question biologique en hypothèse statistique (H 0 ) La taille des hommes et des femmes diffère t-elle? La taille moyenne des hommes et des femmes est la même. La structure d’âge d’une population d’esturgeons change-t-elle après la construction d’un barrage? La distribution en âge (fréquences) est indépendante de la période.

Le sens de p Informel: la probabilité que l’hypothèse nulle soit vraie Vraie définition: la probabilité d’observer des données qui diffèrent autant de la valeur prédite par l’hypothèse nulle lorsque: les données sont récoltées correctement toutes les conditions d’application du test sont rencontrées

Rejeter ou ne pas rejeter? La décision de rejeter ou d’accepter l’hypothèse nulle est basée sur p. Le seuil de décision est arbitraire. On doit toujours garder en tête la valeur de p obtenue.

La statistique p est estimé en se basant sur la distribution de la statistique choisie Si la distribution est connue, on peut calculer la probabilité d’obtenir une valeur pour cette statistique aussi grande (ou petite) ou égale à la valeur calculée si H 0 était vraie, c’est-à- dire: p

Un exemple (1) Deux échantillons (1, 2) dont les moyennes diffèrent par la quantité  Quelle est la probabilité d’observer cette différence si H 0 stipule que les deux moyennes sont égales? Fréquence Éch. 2 Éch. 1

Un exemple (2) Si H 0 est vraie, alors la distribution attendue de la statistique t est: Fréquence Éch. 2 Éch Probabilité (p) t

Un exemple (3) On observe t=2.1 alors que la valeur attendue (selon H 0 ) est t=0.0 Quelle est la probabilité d’obtenir une valeur au moins aussi grande si H 0 (les deux moyennes sont égales) est vraie? Comme p est petit, il est improbable que H 0 soit vraie. Alors, on rejette H Probabilité (p) t=2.1 Fréquence Éch. 2 Éch. 1

Inférence: comment traduire p en une conclusion? Si p < 0.05, rejeter l’hypothèse nulle Mais… toujours garder la valeur de p à l’esprit Accompagner les résultats significatifs (ou non) de la valeur de p correspondante Ne pas oublier, la “convention” p < 0.05 est arbitraire!

Types d’erreur dans les tests statistiques 2 types: – une hypothèse nulle qui est vraie peut être rejetée – une hypothèse nulle qui est fausse peut être acceptée Erreur de type I (  ): la probabilité de rejeter une hypothèse nulle qui serait vraie Erreur de type II (  ) : la probabilité d’accepter une hypothèse nulle qui serait fausse.

Erreurs d’inférence Réalité Conclusion H 0 vraieH 0 fausse Accepter H 0 Rejeter H 0 pas d’erreur   Seuil de significativité (généralement fixé à 5%)

Les hypothèses nulles des tests bilatéraux et unilatéraux Bilatéral: deux zones de rejet de H 0 de taille  /2 Unilatéral: une zone de rejet de H 0 de taille  Probabilité Probabilité t 1-    t

Test bilatéral: exemple Pas de différence entre les populations H 0 :  1 -  2 = 0 Comme H 0 est bilatérale, H 0 sera rejetée si  1 -  2 > 0 ou si  1 -  2 < Probabilité Fréquence Éch. 2 Éch. 1

Test unilatéral: exemple La taille moyenne de la population 1 est inférieure à celle de la population 2 H 0 :  1 -  2  0 Comme H 0 est unilatérale, H 0 sera rejetée seulement si  1 -  2 > Probabilité Fréquence Éch. 2 Éch. 1

Test unilatéral vs bilatéral Dans certaines situations, un test unilatéral sera plus puissant qu’un test bilatéral Pour cette raison, il faut toujours spécifier H 0 avant l’analyse! Probabilité 2 3   Probabilité

Paramètres en inférence statistique Réalité Conclusion H 0 vraieH 0 fausse Accepter H 0 Rejeter H 0 pas d’erreur   Taux d’erreur de type ! (  Puissance (1 - taux d’erreur de type II = 1-  ) Effectif (N) Taille de l ’effet (  ) Chacun de ces paramètres est une fonction des trois autres, si on en connaît trois on peut calculer le quatrième

La puissance La puissance est la probabilité de rejeter une hypothèse nulle quand celle-ci est fausse, c’est-à-dire 1-  La puissance ne peut être calculée que si l’hypothèse alternative est spécifiée. Donc, la puissance dépend de l’hypothèse alternative. Des tests puissants peuvent détecter de petites différences, des tests peu puissants ne peuvent détecter que des grandes différences

La puissance: exemple (1) La distribution attendue des moyennes de la longueur des ailes d’un échantillon de 5 mouches provenant de populations normales est définie par  et  =1,74. La courbe du centre représente l’hypothèse nulle, H 0 :  =45,5. Les courbes de chaque côté représentent les hypothèses alternatives,  =37 ou  =54. Les lignes verticales délimitent la zone de rejet (5%) de l’hypothèse nulle H 1 :  =37H 0 :  =45,5H 1 :  =54

La puissance: exemple (2) H 0 :  =  0 H 1 :  =  1  1 =54  1 =53  1 =50  1 =48,5  =0,0096  =0,0018  0 =45,5  =0,2676  =0,5948 Augmentation de l’erreur de type II (β) quand l’hypothèse alternative H 1 s’approche de l’hypothèse nulle H 0

Taille de l’effet (1) H 0 présume de la valeur d’un paramètre Si H 0 est que 2 moyennes sont égales, cela implique que la différence entre les deux moyennes (  ) est 0 Fréquence Éch. 2 Éch. 1

Taille de l’effet (2) Comme H 0 présume de l’absence d’un phénomène,  quantifie le degré d’existence de ce phénomène Si H 0 est fausse, elle est fausse à un certain degré, quantifié par , la taille de l’effet Fréquence Éch. 2 Éch. 1

Analyse de puissance 1- Puissance vs α/δ/N Souvent faite après un test, lorsque N et la taille de l’effet (  ) sont connus et que H 0 a été acceptée On peut calculer 1-  (la puissance du test) pour une valeur d’  Si 1-  est faible, le taux d’erreur de type II est grand et il est fort possible qu’on ait accepté une H 0 fausse Fréquence Éch. 2 Éch. 1

Analyse de puissance 2- N vs α/δ/Puissance Une certaine taille d’effet (  ) est attendue (expérience préliminaire) et on fixe  et 1-  À partir de  et  on peut calculer l’effectif minimum (N min ) requis Exercice très utile dans la planification des expériences Fréquence Pré-Éch. 2 Pré-Éch. 1

Analyse de puissance 3- δ vs α/N/Puissance Compte-tenu de  -  et N, quelle est la taille minimale de l ’effet détectable (  min )? Si  min est grande, seules de très grosses déviations de H 0 seront détectées Il faut être TRÈS prudent de ne PAS conclure qu’il n’y a pas de différence même si on accepte H 0 X Fréquence Ech 2 Ech 1

Puissance: effet de la taille de l’échantillon La courbe de puissance pour tester H 0 :  = 45,5 H 1 :  45,5 pour N = 5 et N = 35 Pour une longueur d’aile donnée, la probabilité de rejeter une hypothèse nulle qui serait fausse (puissance) augmente quand N augmente.  ,5  0 Longueur de l’aile ( x 0,1 mm) Puissance (1-  ) N = 5 N = 35

Pourquoi se soucier de la puissance? Deux échantillons avec la même moyenne et la même variance mais dont N diffère pour le premier cas, la puissance est grande: p<0.05, alors on rejette H 0 pour le deuxième cas, la puissance est petite: p>0.05, alors on accepte H 0 Taille Fréquence   Taille Fréquence   N = 200 N = 30

Conclusions sur la puissance Si la taille de l’échantillon est petite, la puissance des tests est faible. À moins de connaître la puissance d’une analyse, la décision d’accepter l’hypothèse nulle est difficilement interprétable! Si la puissance est élevée, le rejet de l’hypothèse nulle est probable même si les écarts entre les valeurs observées et attendues à partir de l’hypothèse nulle sont petits (et peut-être sans signification biologique)!

Inférence statistique: problèmes et limites Problème 1: de très nombreuses hypothèse nulles sont peu vraisemblables a priori… … leur rejet n’est donc pas très informatif! Traitement Rendement Traitement 1 Traitement 2 Témoin

Inférence statistique: problèmes et limites Problème 2: le seuil de décision α (0.05) est arbitraire et peut être beaucoup trop conservateur ou libéral quant à la signification biologique… t Probabilté Seuil raisonnable pour la décision?

Inférence statistique: problèmes et limites Problème 3: pour une taille donnée d’effet, p varie avec (n)… … on peut donc presque toujours rejeter H 0 si l’échantillon est très grand, même si l’effet est trivial. Effectif (n) Erreur de type I 0.05 Gros effet Petit effet

Inférence statistique: problèmes et limites Problème 4: p est la probabilité d’observer une statistique (t) au moins aussi extrême si H 0 est vraie… … mais souvent la distribution réelle de la statistique t ne suit pas exactement la distribution présumée lorsque l’hypothèse nulle est vraie. t Probabilté présumée réelle

Rappel sur les conditions d’application p est calculé en assumant que t suit la distribution bien connue du t de Student (t s ) Ceci est vrai seulement si les données sont distribuées normalement

Distribution réelle de t vs distribution du t de Student (t s ) Le calcul de p assume que p(t) = p(t s ) Mais, à mesure que les données s’éloignent de la normalité, la différence entre les deux augmente Alors, les valeur de p estimées sont incorrectes t, données loin de la normalité t  données plus près de la normalité tsts Probabilité (p)

Que faire si les données ne sont pas distribuées normalement? Traduction de t en p est incorrecte Mais le biais est petit spécialement quand l’effectif est grand (théorème de la limite centrale) Alors, utilisez votre bon sens… inquiétez vous seulement quand p est près du niveau α désiré

Que faire si les données ne sont pas distribuées normalement et si p est près de α? Augmenter la taille de l’échantillon Transformer les données Utiliser un test non paramétrique qui ne requiert pas que les données soient distribuées normalement

Transformation des données Habituellement, on utilise des fonctions mathématiques simples: log(X), racine carrée(X), arcsin(X) Le choix est basé sur le principe essai-erreur Il existe des algorithmes qui permettent de simplifier la tâche, par exemple les transformations de Box et Cox Problème 1: trouver la transformation adéquate est parfois très difficile Problème 2: certaines données ne peuvent pas être normalisées

Conclusions sur l’inférence statistique Évitez d’éprouver des hypothèse nulles triviales Faites une distinction entre la signification statistique et la signification biologique (ou autre) Rapportez toujours la taille de l’effet, peu importe la signification statistique Considérez l’emploi de permutations ou de reéchantillonnage pour générer la distribution de votre statistique