Statistique II Chapitre 3: Tests d’hypothèses Pr. Abdelkrim EL MOUATASIM Site internet : www.el-mouatasim.webs.com
La différence entre une estimation et un test d’hypothèses Estimation : On suppose inconnu le paramètre de la population et on cherche à l’estimer au moyen d’une statistique définie à partir d’un échantillon aléatoire. Test d’hypothèses : On suppose au départ que l’on a une certaine connaissance de la valeur du paramètre et on essaie d’en vérifier la véracité. Cette valeur constitue l’hypothèse de base.
Définitions * Hypothèse statistique : C’est un énoncé (une affirmation) concernant les caractéristiques (valeurs des paramètres, forme de la distribution des observations) d’une population * Test d’hypothèses : C’est une démarche qui a pour but de fournir une règle de décision permettant, sur la base des résultats d’échantillon, de faire un choix entre deux hypothèses statistiques.
Développer les hypothèses nulle et alternative Les tests d’hypothèses permettent de déterminer si une affirmation au sujet de la valeur d’un paramètre de la population doit être rejetée L’hypothèse nulle est une hypothèse sur la valeur d’un paramètre de la population. Elle est notée H0. C’est l’hypothèse qui sera rejetée uniquement s’il y a suffisamment d’évidence contre elle: H0: m=30 30 est la valeur paramétrique hypothétique
Développer les hypothèses nulle et alternative L’hypothèse alternative correspond à l’opposé de ce qui est établi dans l’hypothèse nulle. Elle est notée Ha ou H1 ou H’. C’est l’hypothèse qui sera acceptée si H0 est rejetée. Hypothèses simples: H0: m =30 Ha: m = 20 Hypothèses composées: H0 : μ = 30 Ha : μ > 30 ou Ha : μ < 30 ou Ha : μ 30 H0 : μ 30 ou H0 : μ ≤ 30 Ha : μ < 30 Ha : μ > 30
Développer les hypothèses nulle et alternative Tester les hypothèses de recherche L’hypothèse de recherche correspond à l’hypothèse alternative On ne peut pas conclure que l’hypothèse de recherche est vraie si les données de l’échantillon ne permettent pas de rejeter l’hpothèse nulle Exemple: nouveau moteur qui fait plus de kilomètres par litre d’essence, m : nombre moyen de kilomètres par litre H0: m ≤24 Ha: m>24 Nouvelle affirmation, hypothèse alternative
Développer les hypothèses nulle et alternative Tester la validité d’une affirmation L’affirmation d’un manufacturier est habituellement formulée comme l’hypothèse nulle. On cherche à vérifier si les données de l’échantillon permettent de rejeter l’hypothèse nulle. On accorde ainsi le bénéfice du doute au manufacturier On conclut que l’affirmation du manufacturier est fausse si les données de l’échantillon permettent de refuter l’hypothèse nulle Exemple: Producteur de boisson non alcoolisée prétend que les bouteilles de 2 litres contiennent en moyenne au moins 2,028 litres H0: m ≥ 2,028 Ha: m 2,028
Développer les hypothèses nulle et alternative Tests d’hypothèses dans un contexte de prise de décision Un décideur peut avoir à choisir entre deux actions, l’une associée à l’hypothèse nulle et l’autre à l’hypothèse alternative Par exemple, sur la base d’un échantillon de pièces, un inspecteur de contrôle de qualité doit décider s’il accepte ou refuse un lot de pièces qui vient d’êre livré Supposons que les critères de qualité d’une pièce particulière correspondent à une longueur moyenne de 2 pouces. Si la longueur moyenne est supérieure ou inférieure à 2 pouces, les pièces poseront problème dans le processus d’assemblage. Dans ce cas, on peut formuler: H0: m=2 (On donne le bénéfice du doute au manufacturier) Ha: m 2
Rejeter H0 ? Ou ne pas rejeter H0 ? Règle de décision Quelle conclusion tirer? Rejeter H0 ? Ou ne pas rejeter H0 ? On rejette H0 si la statistique estimée à partir de l’échantillon est éloignée de la valeur du paramètre supposée dans H0 (valeur hypothétique). On rejette H0 lorsque l'écart entre la valeur hypothétique du paramètre et la valeur de la statitstique est grand, ce qui signifie que l'écart n'est pas uniquement dû au hasard de l’échantillonnage.
Exemple: Metro EMS Une compagnie de service ambulancier dessert la grande région de Québec. Elle opère 20 unités médicales mobiles. Son objectif de service est de répondre aux appels d’urgence en un temps moyen de 12 minutes ou moins. Le directeur des services médicaux veut formuler un test d’hypothèses basé sur un échantillon de temps de réponse aux urgences afin de vérifier si l’objectif de temps de service moyen de 12 minutes est atteint ou non.
Exemple: Metro EMS Formulation de test d’hypothèses Hypothèses Conclusion et Action H0: Le service d’urgence rencontre son objectif, donc aucun changement est nécessaire Ha: Le service d’urgence ne rencontre pas son objectif, donc il faut s’ajuster où = le temps moyen de réponse pour la population des appels d’urgence
Zones de rejet (régions critiques) La région critique d’un test est l’ensemble des valeurs possibles de la statistique provenant de l’échantillon aléatoire qui entraînent le rejet de H0 au niveau de signification a. La région critique est définie à partir d’une valeur critique On calcule une statistique à partir de l’échantillon et on la compare avec la valeur critique afin de vérifier si la statistique calculée à partir de l’échantillon se trouve dans la région critique. Si oui, on rejettera H0.
Zones de rejet (régions critiques) Test unilatéral inférieur Valeur(s) z critiques a H0: m ³ m0 ou H0: m =m0 H1: m < m0 Test unilatéral supérieur a H0: m £ m0 ou H0: m =m0 H1: m > m0 Test bilatéral a/2 H0: m = m0 H1: m ¹ m0 Régions de rejet
Région critique Pour les tests d'hypothèses sur une moyenne par exemple, il existe deux façons de se situer par rapport à la région critique: On compare la statistique à la valeur z critique za (test par la statistique z) On calcule une valeur critique et on rejette l’hypothèse nulle selon le type de région critique et la position de par rapport à ( Test par la méthode des valeurs critiques)
Statistique de test z connu s inconnu Tests unilatéraux concernant la moyenne d’une population: cas des grands échantillons(n > 30) Hypothèses H0: ou H0: = Ha: Statistique de test z connu s inconnu Règle de rejet (de décision) au seuil de signification a Rejeter H0 si z > z zest la valeur z critique: valeur comparée à la statistique de test z pour déterminer si H0 doit être rejetée au seuil de signification a
Statistique de test z connu inconnu Tests unilatéraux concernant la moyenne d’une population: cas des grands échantillons(n > 30) Hypothèses H0: ou H0: = Ha: Statistique de test z connu inconnu Règle de rejet (de décision) au seuil de signification a Rejeter H0 si z < -z -z est la valeur z critique: valeur comparée à la statistique de test pour déterminer si H0 doit être rejetée au seuil de signification a
Statistique de test connu inconnu Tests bilatéraux concernant la moyenne d’une population: cas des grands échantillons(n > 30) Hypothèses H0: Ha: Statistique de test connu inconnu Règle de rejet (de décision) Rejeter H0 si |z| > z
Test unilatéral à droite : Tests sur la moyenne: Calcul des valeurs critiques cas des grands échantillons(n > 30) Test bilatéral : Test unilatéral à droite : Test unilatéral à gauche : H0: m = m0 H1: m ¹ m0 H0: m £ m0 ou H0: m=m0 H1: m > m0 H0: m ³ m0 ou H0: m=m0 H1: m < m0 Si s inconnu , utiliser s
Exemple: Metro EMS- test par la statistique z Soit n = 40, = 13,25 minutes, s = 3,2 minutes (L’écart-type de l’échantillon s peut être utilisé pour estimer l’écart-type de la population .) Puisque 2,47 > 1,645, on rejette H0. Conclusion: Nous sommes confiants à 95% que Metro EMS ne rencontre pas son objectif de réponse de 12 minutes; le service devrait donc être amélioré
Exemple: Dentifrice Brille La chaîne de production du dentifrice Brille est conçue pour remplir les tubes de dentifrice de poids moyen de 6 onces. Les données disponibles ont montré que l’écart-type est 0,2 onces. Régulièrement, on choisit 30 tubes au hasard pour vérifier si le processus de remplissage fonctionne adéquatement. Si l’échantillon ne supporte pas l’hypothèse que la moyenne de remplissage pour la population est de 6 onces, le procédé est arrêté et ajusté.
Exemple: Dentifrice Brille Un test d’hypothèse sur la moyenne de la population peut aider à déterminer si le procédé de remplissage fonctionne tel que planifié. Hypothèses H0: Ha: Règle de rejet (de décision) En supposant un niveau de signification a de 0,05: Rejeter H0 si |z| > 1,96
Exemple: Dentifrice Brille Supposons qu’un échantillon de 30 tubes de dentifrice fournisse une moyenne échantillonnale de 6,1 onces. Puisque n = 30, = 6,1 onces, s = 0,2 onces Puisque 2,74 > 1,96, on rejette H0. Conclusion: On est confiant à 95% que le poids de remplissage moyen des tubes de dentifrice n’est pas 6 onces. Ajuster le mécanisme de remplissage
Étapes d’un test d’hypothèses Déterminez les hypothèses nulle et alternative appropriées à l’étude Sélectionnez la statistique de test qui sera utilisée pour décider du rejet ou du non rejet de l’hypothèse nulle Spécifiez le seuil de signification du test Utilisez pour définir la règle de rejet qui indique les valeurs de la statistique de test qui conduiront au rejet de H0 Collectez les données d’échantillon et calculez la valeur de la statistique de test
Étapes d’un test d’hypothèses 6a- Comparez la statistique z avec za (ou za/2 si le test est bilatéral) OU 6b- Comparer avec la valeur critique (ou avec et si le test est bilatéral) (Test par valeur critique) 7- Appliquer la règle de décision pour déterminer si H0 doit être rejetée
Tests sur la moyenne d’une population: cas de petits échantillons (n < 30) Statistique de test inconnu Cette statistique de test t suit une distribution du t avec (n - 1) degrés de liberté, en supposant que la population suit une loi normale et que s est inconnu. (Dans le cas où s connu, on utilise la statistique z) Règle de rejet Unilatéral Bilatéral Ha: > Rejeter H0 si t > t Ha: < Rejeter H0 si t < -t Ha: Rejeter H0 si |t| > t
Tests sur la moyenne d’une population (n < 30) Calcul des valeurs critiques, s inconnu Test bilatéral : Test unilatéral à droite : Test unilatéral à gauche : Si on suppose que la population suit une loi normale et σ est inconnu
Note Pour un petit échantillon, s connu, et une population qui suit une loi normale, on utilise les mêmes approches que pour les grands échantillons
Test d’hypothèses paramétriques usuels Exemple : Le boucher M. Simon affirme qu'il vend en moyenne 86 kg de bœuf par jour. Un employé de la boucherie pense que son patron exagère et veut démontrer que la boucherie vend moins de bœuf que le patron le prétend. Pour un échantillon de 20 jours choisis au hasard, on trouve qu'on y a vendu en moyenne 81 kg de bœuf par jour. En supposant que les ventes quotidiennes de bœuf obéissent à une loi normale d’écart type 10 kg et en utilisant un seuil de signification a = 0,05, doit-on rejeter l'affirmation du patron ?
Solution H0: m=86 H1: m<86 On calcule la statistique: On compare cette statistique avec la valeur critique -z0,05=-1,64 Puisque -2,23 est plus petite que -1,64, on rejette l'hypothèse nulle et l'affirmation que le patron vend 86 kg de boeuf par jour
Test d’hypothèses paramétriques Avant le règlement de leur conflit de travail, les policiers de la ville de Charlesbourg effectuaient en moyenne 20 arrestations par jour. Au cours des 10 jours qui ont suivi le règlement du conflit, on a relevé le nombre X d'arrestations quotidiennes suivantes : X = 20, 18, 25, 19, 17, 22, 16, 23, 12, 15 De ces observations, on déduit : Au niveau de signification a = 0,05, y a-t-il lieu de croire que le règlement du conflit a fait diminuer de façon significative le nombre d'arrestations effectuées par les policiers de Charlesbourg ? On suppose que le nombre d'arrestations suit une loi normale. Réponse: On ne rejettera pas l’hypothèse nulle H0:m=20 car la valeur t critique qu’on obtient est égale à –1,04 ce qui n’est pas plus petit que -t(9)