Statistique II Chapitre 3: Tests d’hypothèses

Slides:



Advertisements
Présentations similaires
Introduction aux statistiques Intervalles de confiance
Advertisements

L’échantillonnage & Ses Fluctuations
Comparaison d’une moyenne observée à une moyenne théorique
Corrélation Position du problème Définition covariance (X,Y) r =
But de la lecture critique
Risques d’erreur statistique et test statistique
Test statistique : principe
Les tests d’hypothèses (II)
Les tests d’hypothèses (I)
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Collecte de données F. Kohler.
Inférence statistique
Comparaison de deux moyennes observées
Inférence statistique
Faculté de médecine de Nancy - SPI-EAO - Pr. F. KOHLER
Comparaison d'une distribution observée à une distribution théorique
Comparaison de deux pourcentages observés
Comparaison de plusieurs moyennes observées
Tests non paramétriques
Les TESTS STATISTIQUES
Tests de comparaison de pourcentages
Nombre de sujets nécessaires en recherche clinique
Les TESTS STATISTIQUES
Les Tests dhypothèses. 1)Définition Un test cest une méthode qui permet de prendre une décision à partir des résultats dun échantillon.
Échantillonnage-Estimation
Les tests d’hypothèses
La loi normale et l’estimation de paramètres
Opération et systèmes de décision Faculté des Sciences de lAdministration MQT Probabilités et statistique Tests dhypothèses Chapitre 9.
Tests de comparaison de moyennes
Méthodes de Biostatistique
L’inférence statistique
Nombre de sujets nécessaires en recherche clinique
Régression linéaire simple
Comprendre la variation
La corrélation et la régression multiple
Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte.
Le test t.
La puissance statistique
La puissance statistique
Corrélation Principe fondamental d’une analyse de corrélation
Théorie… Inférence statistique: étude du comportement d’une population ou d’un caractère X des membres d’une population à partir d’un échantillon aléatoire.
Distribution d’échantillonnage
Lectures Volume du cours : Chapitre 7
Tests d’hypothèses.
Méthodes de Biostatistique
PRINCIPE DES TESTS D’HYPOTHÈSE
ANALYSE DE DONNEES TESTS D’ASSOCIATION
Test d'hypothèse pour des proportions:
Lien entre deux variables
Intervalles de confiance pour des proportions L’inférence statistique
D.E ZEGOUR Ecole Supérieure d’Informatique. Problèmes de décision Concepts de base Expressions régulières Notation particulière pour exprimer certaines.
Probabilités et Statistiques Année 2010/2011
Probabilités et statistique Test d’hypothèse de deux moyennes
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
L’erreur standard et les principes fondamentaux du test de t
1.  On souhaite comparer deux traitements dans le cadre d’un essai randomisé sur les lombosciatiques :  corticoïdes par infiltrations  placebo  Critère.
Échantillonnage (STT-2000) Section 5 Types d’erreur de sondage. Version: 22 août 2003.
La Maîtrise Statistique des Procédés
Probabilités et statistique MQT-1102
ECHANTILLONAGE ET ESTIMATION
Comparaison de plusieurs moyennes observées
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Académie européenne des patients sur l'innovation thérapeutique Rôle et notions élémentaires des statistiques dans les essais cliniques.
Introduction aux statistiques Intervalles de confiance
Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.
Chap. III Statistiques inférentielles
Tests d’hypothèses paramétriques 1 Cours Statistiques Chapitre 9.
Transcription de la présentation:

Statistique II Chapitre 3: Tests d’hypothèses Pr. Abdelkrim EL MOUATASIM Site internet : www.el-mouatasim.webs.com

La différence entre une estimation et un test d’hypothèses Estimation : On suppose inconnu le paramètre de la population et on cherche à l’estimer au moyen d’une statistique définie à partir d’un échantillon aléatoire. Test d’hypothèses : On suppose au départ que l’on a une certaine connaissance de la valeur du paramètre et on essaie d’en vérifier la véracité. Cette valeur constitue l’hypothèse de base.

Définitions * Hypothèse statistique : C’est un énoncé (une affirmation) concernant les caractéristiques (valeurs des paramètres, forme de la distribution des observations) d’une population * Test d’hypothèses : C’est une démarche qui a pour but de fournir une règle de décision permettant, sur la base des résultats d’échantillon, de faire un choix entre deux hypothèses statistiques.

Développer les hypothèses nulle et alternative Les tests d’hypothèses permettent de déterminer si une affirmation au sujet de la valeur d’un paramètre de la population doit être rejetée L’hypothèse nulle est une hypothèse sur la valeur d’un paramètre de la population. Elle est notée H0. C’est l’hypothèse qui sera rejetée uniquement s’il y a suffisamment d’évidence contre elle: H0: m=30 30 est la valeur paramétrique hypothétique

Développer les hypothèses nulle et alternative L’hypothèse alternative correspond à l’opposé de ce qui est établi dans l’hypothèse nulle. Elle est notée Ha ou H1 ou H’. C’est l’hypothèse qui sera acceptée si H0 est rejetée. Hypothèses simples: H0: m =30 Ha: m = 20 Hypothèses composées: H0 : μ = 30 Ha : μ > 30 ou Ha : μ < 30 ou Ha : μ  30 H0 : μ  30 ou H0 : μ ≤ 30 Ha : μ < 30 Ha : μ > 30

Développer les hypothèses nulle et alternative Tester les hypothèses de recherche L’hypothèse de recherche correspond à l’hypothèse alternative On ne peut pas conclure que l’hypothèse de recherche est vraie si les données de l’échantillon ne permettent pas de rejeter l’hpothèse nulle Exemple: nouveau moteur qui fait plus de kilomètres par litre d’essence, m : nombre moyen de kilomètres par litre H0: m ≤24 Ha: m>24 Nouvelle affirmation, hypothèse alternative

Développer les hypothèses nulle et alternative Tester la validité d’une affirmation L’affirmation d’un manufacturier est habituellement formulée comme l’hypothèse nulle. On cherche à vérifier si les données de l’échantillon permettent de rejeter l’hypothèse nulle. On accorde ainsi le bénéfice du doute au manufacturier On conclut que l’affirmation du manufacturier est fausse si les données de l’échantillon permettent de refuter l’hypothèse nulle Exemple: Producteur de boisson non alcoolisée prétend que les bouteilles de 2 litres contiennent en moyenne au moins 2,028 litres H0: m ≥ 2,028 Ha: m  2,028

Développer les hypothèses nulle et alternative Tests d’hypothèses dans un contexte de prise de décision Un décideur peut avoir à choisir entre deux actions, l’une associée à l’hypothèse nulle et l’autre à l’hypothèse alternative Par exemple, sur la base d’un échantillon de pièces, un inspecteur de contrôle de qualité doit décider s’il accepte ou refuse un lot de pièces qui vient d’êre livré Supposons que les critères de qualité d’une pièce particulière correspondent à une longueur moyenne de 2 pouces. Si la longueur moyenne est supérieure ou inférieure à 2 pouces, les pièces poseront problème dans le processus d’assemblage. Dans ce cas, on peut formuler: H0: m=2 (On donne le bénéfice du doute au manufacturier) Ha: m  2

Rejeter H0 ? Ou ne pas rejeter H0 ? Règle de décision Quelle conclusion tirer? Rejeter H0 ? Ou ne pas rejeter H0 ? On rejette H0 si la statistique estimée à partir de l’échantillon est éloignée de la valeur du paramètre supposée dans H0 (valeur hypothétique). On rejette H0 lorsque l'écart entre la valeur hypothétique du paramètre et la valeur de la statitstique est grand, ce qui signifie que l'écart n'est pas uniquement dû au hasard de l’échantillonnage.

Exemple: Metro EMS Une compagnie de service ambulancier dessert la grande région de Québec. Elle opère 20 unités médicales mobiles. Son objectif de service est de répondre aux appels d’urgence en un temps moyen de 12 minutes ou moins. Le directeur des services médicaux veut formuler un test d’hypothèses basé sur un échantillon de temps de réponse aux urgences afin de vérifier si l’objectif de temps de service moyen de 12 minutes est atteint ou non.

Exemple: Metro EMS Formulation de test d’hypothèses Hypothèses Conclusion et Action H0:  Le service d’urgence rencontre son objectif, donc aucun changement est nécessaire Ha: Le service d’urgence ne rencontre pas son objectif, donc il faut s’ajuster où  = le temps moyen de réponse pour la population des appels d’urgence

Zones de rejet (régions critiques) La région critique d’un test est l’ensemble des valeurs possibles de la statistique provenant de l’échantillon aléatoire qui entraînent le rejet de H0 au niveau de signification a. La région critique est définie à partir d’une valeur critique On calcule une statistique à partir de l’échantillon et on la compare avec la valeur critique afin de vérifier si la statistique calculée à partir de l’échantillon se trouve dans la région critique. Si oui, on rejettera H0.

Zones de rejet (régions critiques) Test unilatéral inférieur Valeur(s) z critiques a H0: m ³ m0 ou H0: m =m0 H1: m < m0 Test unilatéral supérieur a H0: m £ m0 ou H0: m =m0 H1: m > m0 Test bilatéral a/2 H0: m = m0 H1: m ¹ m0 Régions de rejet

Région critique Pour les tests d'hypothèses sur une moyenne par exemple, il existe deux façons de se situer par rapport à la région critique: On compare la statistique à la valeur z critique za (test par la statistique z) On calcule une valeur critique et on rejette l’hypothèse nulle selon le type de région critique et la position de par rapport à ( Test par la méthode des valeurs critiques)

Statistique de test z connu s inconnu Tests unilatéraux concernant la moyenne d’une population: cas des grands échantillons(n > 30) Hypothèses H0:  ou H0: = Ha:  Statistique de test z connu s inconnu Règle de rejet (de décision) au seuil de signification a Rejeter H0 si z > z zest la valeur z critique: valeur comparée à la statistique de test z pour déterminer si H0 doit être rejetée au seuil de signification a

Statistique de test z  connu  inconnu Tests unilatéraux concernant la moyenne d’une population: cas des grands échantillons(n > 30) Hypothèses H0:  ou H0: = Ha: Statistique de test z  connu  inconnu Règle de rejet (de décision) au seuil de signification a Rejeter H0 si z < -z -z est la valeur z critique: valeur comparée à la statistique de test pour déterminer si H0 doit être rejetée au seuil de signification a

Statistique de test connu  inconnu Tests bilatéraux concernant la moyenne d’une population: cas des grands échantillons(n > 30) Hypothèses H0:   Ha:  Statistique de test connu  inconnu Règle de rejet (de décision) Rejeter H0 si |z| > z

Test unilatéral à droite : Tests sur la moyenne: Calcul des valeurs critiques cas des grands échantillons(n > 30) Test bilatéral : Test unilatéral à droite : Test unilatéral à gauche : H0: m = m0 H1: m ¹ m0 H0: m £ m0 ou H0: m=m0 H1: m > m0 H0: m ³ m0 ou H0: m=m0 H1: m < m0 Si s inconnu , utiliser s

Exemple: Metro EMS- test par la statistique z Soit n = 40, = 13,25 minutes, s = 3,2 minutes (L’écart-type de l’échantillon s peut être utilisé pour estimer l’écart-type de la population .) Puisque 2,47 > 1,645, on rejette H0. Conclusion: Nous sommes confiants à 95% que Metro EMS ne rencontre pas son objectif de réponse de 12 minutes; le service devrait donc être amélioré

Exemple: Dentifrice Brille La chaîne de production du dentifrice Brille est conçue pour remplir les tubes de dentifrice de poids moyen de 6 onces. Les données disponibles ont montré que l’écart-type est 0,2 onces. Régulièrement, on choisit 30 tubes au hasard pour vérifier si le processus de remplissage fonctionne adéquatement. Si l’échantillon ne supporte pas l’hypothèse que la moyenne de remplissage pour la population est de 6 onces, le procédé est arrêté et ajusté.

Exemple: Dentifrice Brille Un test d’hypothèse sur la moyenne de la population peut aider à déterminer si le procédé de remplissage fonctionne tel que planifié. Hypothèses H0:   Ha:  Règle de rejet (de décision) En supposant un niveau de signification a de 0,05: Rejeter H0 si |z| > 1,96

Exemple: Dentifrice Brille Supposons qu’un échantillon de 30 tubes de dentifrice fournisse une moyenne échantillonnale de 6,1 onces. Puisque n = 30, = 6,1 onces, s = 0,2 onces Puisque 2,74 > 1,96, on rejette H0. Conclusion: On est confiant à 95% que le poids de remplissage moyen des tubes de dentifrice n’est pas 6 onces. Ajuster le mécanisme de remplissage

Étapes d’un test d’hypothèses Déterminez les hypothèses nulle et alternative appropriées à l’étude Sélectionnez la statistique de test qui sera utilisée pour décider du rejet ou du non rejet de l’hypothèse nulle Spécifiez le seuil de signification  du test Utilisez pour définir la règle de rejet qui indique les valeurs de la statistique de test qui conduiront au rejet de H0 Collectez les données d’échantillon et calculez la valeur de la statistique de test

Étapes d’un test d’hypothèses 6a- Comparez la statistique z avec za (ou za/2 si le test est bilatéral) OU 6b- Comparer avec la valeur critique (ou avec et si le test est bilatéral) (Test par valeur critique) 7- Appliquer la règle de décision pour déterminer si H0 doit être rejetée

Tests sur la moyenne d’une population: cas de petits échantillons (n < 30) Statistique de test  inconnu Cette statistique de test t suit une distribution du t avec (n - 1) degrés de liberté, en supposant que la population suit une loi normale et que s est inconnu. (Dans le cas où s connu, on utilise la statistique z) Règle de rejet Unilatéral Bilatéral Ha: > Rejeter H0 si t > t Ha: < Rejeter H0 si t < -t Ha:  Rejeter H0 si |t| > t

Tests sur la moyenne d’une population (n < 30) Calcul des valeurs critiques, s inconnu Test bilatéral : Test unilatéral à droite : Test unilatéral à gauche : Si on suppose que la population suit une loi normale et σ est inconnu

Note Pour un petit échantillon, s connu, et une population qui suit une loi normale, on utilise les mêmes approches que pour les grands échantillons

Test d’hypothèses paramétriques usuels Exemple : Le boucher M. Simon affirme qu'il vend en moyenne 86 kg de bœuf par jour. Un employé de la boucherie pense que son patron exagère et veut démontrer que la boucherie vend moins de bœuf que le patron le prétend. Pour un échantillon de 20 jours choisis au hasard, on trouve qu'on y a vendu en moyenne 81 kg de bœuf par jour. En supposant que les ventes quotidiennes de bœuf obéissent à une loi normale d’écart type 10 kg et en utilisant un seuil de signification a = 0,05, doit-on rejeter l'affirmation du patron ?

Solution H0: m=86 H1: m<86 On calcule la statistique: On compare cette statistique avec la valeur critique -z0,05=-1,64 Puisque -2,23 est plus petite que -1,64, on rejette l'hypothèse nulle et l'affirmation que le patron vend 86 kg de boeuf par jour

Test d’hypothèses paramétriques Avant le règlement de leur conflit de travail, les policiers de la ville de Charlesbourg effectuaient en moyenne 20 arrestations par jour. Au cours des 10 jours qui ont suivi le règlement du conflit, on a relevé le nombre X d'arrestations quotidiennes suivantes : X = 20, 18, 25, 19, 17, 22, 16, 23, 12, 15 De ces observations, on déduit : Au niveau de signification a = 0,05, y a-t-il lieu de croire que le règlement du conflit a fait diminuer de façon significative le nombre d'arrestations effectuées par les policiers de Charlesbourg ? On suppose que le nombre d'arrestations suit une loi normale. Réponse: On ne rejettera pas l’hypothèse nulle H0:m=20 car la valeur t critique qu’on obtient est égale à –1,04 ce qui n’est pas plus petit que -t(9)