Les tests d’hypothèses (I) Économétrie COURS 2 Les tests d’hypothèses (I)
Concepts Hypothèse statistique = l’hypothèse qui est faite concernant le paramètre d’une répartition ou la lois de répartition suivie par certains variables aléatoires. Hypothèse nulle (H0) = consiste toujours dans l’admission du caractère accidentel des différences, c’est à dire, dans la supposition qu’il n’y a pas de différences essentielles. Hypothèse alternative (H1) = une théorie qui contredit l’hypothèse nulle. Elle sera acceptée seulement quand il y a des preuves suffisantes, des évidences, pour établir qu’elle est vraie. Si l’hypothèse nulle consiste dans l’affirmation que le paramètre θ d’une distribution est égale à une certain valeur θ0: l’hypothèse alternative simple: θ = θ1 l’hypothèse alternative composée:
Concepts Le test statistique est utilisé comme critère d’acceptation ou de rejection de l’hypothèse nulle. La région critique (de rejet), Rc = les valeurs numériques du test statistique pour les quelles l’hypothèse nulle sera rejetée. est choisie de telle sorte que la probabilité qu‘elle contienne le test statistique, quand l’hypothèse nulle est vraie, sera égale à α, α étant petit (α = 0.01 etc.). Si le point définit par le vecteur de sondage x1,x2,…,xn tombe dans la région critique, Rc, l’hypothèse nulle H0 est rejetée, et si le point tombe en dehors de la région critique, Rc, l’hypothèse nulle H0 est acceptée. La région critique est délimitée par la valeur critique, C – le point de coupure dans son établissement.
Concepts Erreur de première espèce = l’erreur qu’on fait en éliminant une hypothèse nulle, même si l’hypothèse est vraie. Risque de première espèce (α) = la probabilité de commettre une erreur de première espèce. est nommé niveau ( seuil) de signification. Le niveau de confiance d’un test statistique est (1-α) et, exprimé en pourcentage, (1-α)100, représente la probabilité qui garanti les résultats. Erreur de deuxième espèce = l’erreur qu’on fait en acceptant une hypothèse nulle, même si l’hypothèse est fausse. La probabilité (le risque) de commettre une erreur de deuxième espèce est égale à β. Le pouvoir de test statistique est (1-β).
Concepts Erreurs dans les tests d’hypothèses α = P(rejet de H0 ׀ H0 est correcte) = P(erreur de première espèce) β= P(acceptation de H0 ׀ H0 est fausse) = P(erreur de deuxième espèce) Décision Hypothèse vraie d’acceptation H0 H1 Décision correcte (probabilité 1-α) Erreur de deuxième espèce (risque β) Erreur de première espèce (risque α) (probabilité 1-β)
Le liaison entre les probabilités α et β Concepts Le liaison entre les probabilités α et β
α et β quand la taille de l’échantillon n' > n Concepts Comme, , avec l’augmentation de la taille n de l’échantillon, les écarts-type des distributions pour H0 et H1 deviennent plus petits et, évidemment, α, et aussi β, baissent. α et β quand la taille de l’échantillon n' > n
Concepts On fait des hypothèses sur la population ou les populations qui sont échantillonnées (normalité etc.). On calcule après le test statistique et on détermine son valeur numérique, basé sur les données de l’échantillon. On obtient les conclusions: l’hypothèse nulle est soit acceptée, soit rejetée, ainsi: Si la valeur numérique de test statistique tombe dans la région critique (Rc), nous rejetons l’hypothèse nulle et nous décidons que l’hypothèse alternative est vraie. Cette décision est incorrecte seulement dans 100 α % cas; Si la valeur numérique de test statistique ne tombe pas dans la région critique (Rc), on accepte l’hypothèse nulle H0.
Concepts L’hypothèse alternative peut prendre une des formes suivantes (qui seront exemplifiées pour la vérification de l’égalité du paramètre “la moyenne de la collectivité générale”, μ, avec la valeur μ0) test bilatéral: H0: μ = μ0 H1: μ ≠ μ0 (μ < μ0 ou μ > μ0) test unilatéral à droite: H1: μ > μ0 test unilatéral à gauche: H1: μ < μ0
Concepts μ μ μ a) b) c) Région critique pour a) test bilatéral; b) test unilatéral à gauche; c) test unilatéral à droite
Test d’hypothèse sur la moyenne de la population générale (μ) pour échantillons de grande taille L’utilisation des échantillons de grande taille (n > 30) fait possible l’application de la théorème central limite. Dans le cas de test bilatéral, les hypothèses sont: H0: μ = μ0 (μ - μ0=0) H1: μ ≠ μ0 (μ - μ0≠0) (c’est à dire μ < μ0 ou μ > μ0); Le test statistique calculé est: La région critique est donnée par: Rc: z< - z α/2 ou z> z α/2 La règle de décision est, donc: Nous rejetons l’hypothèse H0 si ou
Test d’hypothèse sur la moyenne de la population générale (μ) pour échantillons de grande taille Exemple: On suppose qu’un fabricant de matériaux de construction vend ciment dans sacs qui doivent contenir 12 kg/sac. Pour détecter les éventuels écarts dans les deux sensés par rapport à cette quantité, ont été sélectés 100 sacs, pour lesquels ont été calculés , sx= 0,5 kg. Pour un niveau de signification α = 0,01 (la probabilité qui garanti les résultats: (1- α)100=99%), déterminez si l’hypothèse nulle est acceptée, c’est à dire que le poids des sacs est, en moyenne, égale à 12 kg. H0: μ = 12; H1: μ ≠ 12 ( μ < 12 ou μ > 12). z α/2=z0,005=2,576 La région critique: z< - z α/2 ou z> z α/2 Parce que z = - 3,0 < - 2,576 on rejette l’hypothèse nulle H0 et on accepte l’hypothèse alternative, c’est à dire que le poids des sacs diffère, en moyenne, de 12 kg.
Test d’hypothèse sur la moyenne de la population générale (μ) pour échantillons de grande taille Pour le test unilatéral à droite, les hypothèses sont: H0: μ = μ0 (μ - μ0=0); H1: μ > μ0 (μ - μ0>0). Le test statistique calculé est: La région critique est donnée par: Rc: z > zα La règle de décision est: Nous rejetons l’hypothèse H0 si
Test d’hypothèse sur la moyenne de la population générale (μ) pour échantillons de grande taille Pour le test unilatéral à gauche, les hypothèses sont: H0: μ = μ0 (μ - μ0=0); H1: μ < μ0 (μ - μ0<0). Le test statistique calculé est: La région critique est donnée par: Rc: z < –zα La règle de décision est: Nous rejetons l’hypothèse H0 si
Test d’hypothèse sur la différence entre deux moyennes pour échantillons de grande taille Les hypothèses statistiques à vérifier sont les suivants: 1. test bilatéral H0: (μ1- μ2) = D H1: (μ1- μ2) ≠ D [(μ1- μ2)>D ou (μ1- μ2)<D] 2. test unilatéral à droite H1: (μ1- μ2) > D 3. test unilatéral à gauche H1: (μ1- μ2) < D La région critique est donnée par: 1. z< - zα/2 ou z> zα/2 2. z> zα 3. z< - zα
Test d’hypothèse sur la différence entre deux moyennes pour échantillons de grande taille Exemple: Le manager d’un restaurant veut savoir si une campagne de publicité a déterminé l’augmentation des revenus moyennes journaliers. Ainsi, ont été enregistrés les revenus 50 jours avant le développement de la campagne. Après le déroulement de la campagne et le passage d’une période de 20 jours pour prendre effet la campagne, ont été enregistrés les revenus pour 30 jours. Ces deux échantillons permettront le test d’hypothèse concernant l’effet de la campagne sur le revenus. Par le traitement des données pour les deux échantillons on a résulte que: Avant la campagne Après la campagne n1=50 jours n2=30 jours s1=2,15 mil. lei s2=2,38 mil. lei Nous voulons savoir si le revenus ont augmenté (μ2> μ1), donc, nous allons réaliser un test unilatéral à gauche: H0: μ1 = μ2 (μ1 - μ2 = 0) H1: μ1 < μ2 (μ1 - μ2 < 0)
Test d’hypothèse sur la différence entre deux moyennes pour échantillons de grande taille Comme la valeur calculée n’est pas plus petite que –z0,05= –1,645, il résulte que nous ne sommes pas dans la région critique. Les échantillons n’offrent pas des preuves suffisantes (pour α = 0,05) pour le manager de restaurant de conclure que les revenus ont augmenté à cause de la campagne de publicité. α Test unilatéral à gauche Test unilatéral à droite Test bilatéral 0,10 z < - 1,28 z > 1,28 z < - 1,645 ou z > 1,645 0,05 z < - 1,645 z > 1,645 z < - 1,96 ou z > 1,96 0,01 z < - 2,33 z > 2,33 z < - 2,576 ou z > 2,576