PRINCIPE DES TESTS D’HYPOTHÈSE 1. Notion de test 2. Notion d’hypothèse 3. Choix d’une statistique 4. Définir une règle de décision 5. Choix du risque 6. Types de test
Notion de test statistique Un test statistique sert à répondre à une question Un exemple Masse corporelle à la naissance = trait d’histoire de vie, lié à d’autres traits démographiques. La masse corporelle des chevreuils à la naissance est-elle influencée par l’habitat ? X = masse corporelle de chevreuils X1 : en forêt de feuillus : n1 = 50 X2 : en forêt de résineux : n2 = 50 Les différence observée est-elle réelle ou liée au hasard? Pour le savoir on estime la probabilité que les résultats obtenus soient dus au hasard.
Etapes de la création d’un test Notion de test statistique Etapes de la création d’un test A priori 1. choix des hypothèses de travail 2. choix d’une statistique S = variable de décision 3. définition d’une règle de décision = zone de rejet A posteriori 4. calcul de s, valeur de S dans l’échantillon 5. décision 6. commentaire (risques) 7. interprétation
Notion d’hypothèse Deux types d’hypothèses H0 : hypothèse nulle Ha : hypothèse alternative C’est l’hypothèse qu’on veut tester il n’y a pas d ’influence de l’environnement: μ1 = μ2 C’est l’hypothèse qu’on retient si H0 est rejetée il existe une influence de l’environnement: μ1 ≠ μ2
Choix d’une statistique Une statistique est une variable aléatoire S = variable de décision Choix en fonction de : * la question posée * la nature des données : type de variable, effectif de l’échantillon * la puissance des tests disponibles
Définir une règle de décision Zone de la statistique où on décide de rejeter Ho car P(observer les données)/Ho est faible On acceptera H0 si Sobs est supérieur à Smin et inférieur à Smax Sobs S Smin Smax E(S) On rejetera H0 si Sobs est inférieur à Smin ou supérieur à Smax Sobs zone de rejet : |S | > 3
Choix du risque Risque de première espèce supposons : = P(rejeter Ho / Ho vraie) Nécessite de connaître la distribution de S sous Ho supposons : Alors, sous Ho :
Choix du risque Risque de première espèce Smin Smax E(S) P(Smin<S<Smax) = 1 - et donc = P(S>Smax)+ P(S<Smin) = P(rejeter H0/H0 vraie) = P (|S | >3 / S ~ N(0,2) )
Choix du risque = 0,0668 Risque de première espèce Exemple de calcul = 0,0668 En pratique on prend un risque = 0,05
Choix du risque Risque de deuxième espèce β = P(accepter H0/H1 vraie) Smax vraie distribution sous H0 Smin 1-β est la puissance du test
Choix du risque Risque de deuxième espèce Exemple de calcul Supposons : m1 - m2 =5 Sous H0 En réalité
Choix du risque Risque de deuxième espèce Exemple de calcul b = P (S ≤ 3 / S ~ N(5,2) ) = 0,1949 : c’est beaucoup! b = P (ε ≤ -1) = 1- P (ε ≤ 1) = 1- 0,8051 En pratique on ne connaît pas
Choix du risque b varie en fonction de a - 4 3 2 H a H o b a - 1 1 2 3 1 2 3 4 5 6 7 8 9
b varie en fonction de Ha Choix du risque b varie en fonction de Ha - 4 3 2 1 a 5 6 7 8 9 b H o Le risque de ne pas détecter une hypothèse alternative augmente lorsque Ha est proche de Ho.
Choix du risque b varie en fonction de n Lorsque n augmente, la variance de S diminue : et diminuent
Test unilatéral / bilatéral Types de test Test unilatéral / bilatéral = 0,05 a/2 a/2 a -4 -3 -2 -1 0 1 2 3 4 -4 -3 -2 -1 0 1 2 3 4 u’’ u’
Conclusion décision Ho acceptée Ho rejetée réel Ho vraie 1-a a 1-b (puissance) Ho fausse b - a : fixé - b : non connu explicitement (Ha non explicite) b augmente lorsque a diminue b augmente lorsque Ha est proche de Ho a et b diminuent lorsque n augmente