Les tests d’hypothèses (II) Économétrie COURS 3-4 Les tests d’hypothèses (II)
Test d’hypothèse sur la moyenne de la population générale (μ) pour échantillons de petite taille La forme de la distribution d’échantillonnage de la moyenne dépend de la forme de la population générale à partir de laquelle l’échantillon a été extrait. La distribution d’échantillonnage de sera normale (ou approximatif normale) dans le cas d’échantillons de petite taille seulement si la collectivité générale est normalement distribue. La variance de l’échantillon ( ) est susceptible de ne pas fournir une bonne approximation de (dans le cas d’échantillons de petite taille). Au lieu de la statistique z, qui exige la connaissance (ou une bonne approximation) de , nous utilisons la statistique: ou:
Test d’hypothèse sur la moyenne de la population générale (μ) pour échantillons de petite taille Les hypothèses sont: pour le test bilatéral: H0: μ = μ0, H1: μ ≠ μ0 (μ < μ0 ou μ > μ0). pour le test unilatéral à droite H1: μ > μ0. pour le test unilatéral à gauche H1: μ < μ0. Le test statistique utilisé est:
Test d’hypothèse sur la moyenne de la population générale (μ) pour échantillons de petite taille L’hypothèse particulière qui doit d'être faite est que la population générale est normalement ou approximatif normalement distribué. La region critique est donnée par: t > t α/2,n-1 ou t < - t α/2,n-1; t > t α,n-1; t < - t α,n-1.
Test d’hypothèse sur la moyenne de la population générale (μ) pour échantillons de petite taille Exemple: La direction d’une société a appelé au 5 experts pour prévoir le profit de la société pour l’année curent. Les valeurs estimées sont: 2,60; 3,32; 1,80; 3,43; 2,00 (milliards lei, prix de l’année dernière). En sachant que le profit de la société pendant l’année dernière a été 2,01 mld. lei, est-ce qu’il y a des preuves suffisants pour conclure que la moyenne des prévisions des experts est significatif plus grande que la chiffre de l’année dernière (pour α = 0,05)? La moyenne des prévisions des experts est mld. lei, la variance: et l’écart-type: mld. lei. Les éléments du processus de test d'hypothèse statistique sont les suivantes H0: μ = 2,01, H1: μ > 2,01 (test unilatéral à droite). Parce que tα,n-1 = t0,05;4 = 2,132, la région critique est donnée par t>tα,n-1. Comme t=1,874< t0,05;4=2,132, nous ne pouvons pas conclure que la moyenne de profit estimée par les 5 experts pour l’année curent est significatif plus grande que le profit de l’année dernière, qui a été égale à 2,01 mld. lei.
Test d’hypothèse sur la proportion de la population pour échantillons de grande taille Pour les variables alternatives, la moyenne de l’échantillon est notée à f (la proportion des réussites), la variance a été calcule comme f (1-f) et l’écart-type comme La proportion de l’échantillon (f) est approximatif normal distribuée, ayant la moyenne p et l’écart-type, pour un n grand ( et ): et Pour vérifier les hypothèses statistiques concernant la proportion il est nécessaire de travailler avec des grands échantillons (n>100). Comme la proportion f est approximatif normalement distribue, il résulte que la variable standardisée est approximatif normalement standard distribue.
Test d’hypothèse sur la proportion de la population pour échantillons de grande taille L’hypothèse nulle indique le fait que la proportion p est égale à une valeur spécifie: Alors que l’hypothèse alternative réponds à une de ces trois questions: si la proportion est différente de la valeur spécifiée (test bilatéral): ; si la proportion est plus grande (supérieure) que la valeur spécifiée (test unilatéral à droite): ; si la proportion est plus petite (inferieure) que la valeur spécifiée (test unilatéral à gauche):
Test d’hypothèse sur la proportion de la population pour échantillons de grande taille Le test statistique pour la proportion p est: La région critique (Rc) est donnée par: ou pour le test bilatéral; pour le test unilatéral à droite; pour le test unilatéral à gauche.
Test d’hypothèse sur la proportion de la population pour échantillons de grande taille Example: Le manager d’une chaine de magasins considère que, après une analyse financière réalisée pour un nouveau produit, la commercialisation est profitable, et que le pourcentage des acheteurs qui désirent acheter le produit est plus grand que 12%. Il sélectionne 400 acheteurs potentiels et constate que 48 d’entre eux achèteront le produit. Pour une probabilité de 99%, est-ce qu’il y a de preuves suffisantes pour convaincre le manager de commercialiser le produit? Les hypothèses sont: test unilatéral à droite. Le test statistique est: Comme et , il résulte que nous ne sommes pas dans la région critique (Rc) et que nous n’avons pas de preuves suffisantes pour rejeter l’hypothèse nulle, donc le pourcentage n’est pas plus grande que 12%.
Test d’hypothèse sur la différence entre deux moyennes pour échantillons de petite taille On fait les hypothèses: les deux collectivités générales d’où ont été extraites les échantillons sont normalement ou approximatif normalement distribues; les échantillons aléatoires sont sélectionnés indépendant un d’autre. Dans les conditions dans lesquelles on suppose que les deux collectivités générales ont des variances égales ( = = ), un estimateur de la variance (variabilité) totale à partir de deux populations combinées est: ou
Test d’hypothèse sur la différence entre deux moyennes pour échantillons de petite taille Si les variances ne sont pas égales (σ2x1 ≠ σ2x2), puis le test statistique a la forme: avec les degrés de liberté:
Test d’hypothèse sur la différence entre deux moyennes pour échantillons de petite taille Les hypothèses statistiques seront, dans ces conditions: pour le test bilatéral H0: μ1 = μ2 (μ1- μ2 = D); H1: μ1 ≠ μ2 (μ1- μ2 ≠ D). pour le test unilatéral à droite H1: μ1 > μ2 (μ1- μ2 > D). pour le test unilatéral à gauche H1: μ1 < μ2 (μ1- μ2 < D).
Test d’hypothèse sur la différence entre deux moyennes pour échantillons de petite taille Le test statistique t aura la forme: La région critique est donnée par: pour le test bilatéral: ou ; pour le test unilatéral à droite: ; pour le test unilatéral à gauche: .
Test d’hypothèse sur la différence entre deux moyennes pour échantillons de petite taille Exemple Supposons que nous voulons tester l'hypothèse selon laquelle entre deux marques de voitures il n’y a pas de différences significatives concernant les coûts d'exploitation. Pour cette raison, 20 propriétaires de voiture (8 propriétaires de la première marque et 12 propriétaires de la seconde marque) sont priés de garder avec précision l’évidence des coûts d'exploitation pendant une période d'un année. Pour α=0,1 (la probabilité qui garanti les résultats (1-α)100 = 90%) testez cette hypothèse, si les résultats du traitement des échantillons sont les suivants: Marque 1 Marque 2 n1=8 n2=12 mil. lei mil. lei sx1=0,485 mil. lei sx2=0,635 mil. Lei Les hypothèses statistiques sont: H0: μ1 = μ2 (μ1- μ2 = 0), H1: μ1 ≠ μ2 (μ1- μ2 ≠ 0) [μ1> μ2 ou μ1< μ2].
Test d’hypothèse sur la différence entre deux moyennes pour échantillons de petite taille Le test statistique est: Comme tα/2,n1+n2-2 = t0,05;18 = 1,734, on observe que t < tα/2,n1+n2-2, donc nous ne sommes pas dans la région critique. Il résulte, donc, qu’il n’y a pas des preuves suffisantes pour conclure qu'ils existent des différences significatives entre les coûts d’exploitation de ces deux marques de voitures.
Test d’hypothèse sur la variance d’une population La somme des carrés des différences (qui est, en fait, égale à ou pour échantillons de petite taille), divisée à la variance de la collectivité générale, suit une distribution chi deux ( ) (si la population échantillonnée est normalement distribuée). Donc, les test statistique utilisé pour vérifier l’hypothèse concernant la variance est: qui suit une distribution avec (n-1) degrés de liberté, quand population échantillonnée est normalement distribuée, avec la variance .
Test d’hypothèse sur la variance d’une population La valeur de pour laquelle l’aire située sous la courbe (située à sa droite) este égale à α, est notée avec . Nous ne pouvons pas utiliser la notation pour représenter le point pour lequel l’aire située dans la part gauche est α, parce que la statistique est toujours supérieure à zéro. Mais représente le point pour lequel l’aire sous la courbe situe à son gauche est α. Par exemple:
Test d’hypothèse sur la variance d’une population L’hypothèse nulle est: avec les hypotheses alternatives: pour le test bilatéral ; pour le test unilatéral à droite ; pour le test unilatéral à gauche . La région critique est donnée par: ou pour le test bilatéral; pour le test unilatéral à droite; pour le test unilatéral à gauche.
Test d’hypothèse sur la variance d’une population Exemple: Pour les données suivantes concernant la demande d’un produit (choisies parmi une collectivité normalement distribuée), testez (pour une probabilité de 95%), les hypothèses: Les données sont: 85, 59, 66, 81, 35, 57, 55, 63, 63, 66. Dans l’échantillon: , . Le test statistique est: Comme et nous rejetons l'hypothèse nulle et nous acceptons l'hypothèse alternative
Test d’hypothèse sur le rapport des deux variances Le paramètre qui nous intéresse est Si la variance de l’échantillon est (comme nous avons vu) un estimateur non biaisé et consistent de la variance de la collectivité générale, à noter que le rapport est un estimateur ponctuel du rapport des variances . La distribution d’échantillonnage du rapport est une distribution F, si les échantillons ont étaient extraites indépendant parmi des populations normalement distribuées. La valeur de la statistique F pour la quelle l’aire située sous la courbe (située à sa droite) est α, est notée avec Fα (avec les degrés de liberté dl1 et dl2).
Test d’hypothèse sur le rapport des deux variances Les rapport entre deux variables Chi-deux indépendantes, divisées aux ses degrés de liberté suit une distribution F. Les degrés de liberté de la distribution F sont identiques aux degrés de liberté de ceux deux distributions Chi-deux. Puis: à et degrés de liberté. Dans ce qui suit, l'hypothèse nulle est toujours désigné comme l'égalité entre les deux variances, c’est-à-dire sous la forme de l’égalité du rapport des variances à l'unité:
Test d’hypothèse sur le rapport des deux variances Le test statistique est ,mais, dans les conditions de l’hypothèse nulle, c’est à dire , le test statistique devienne: ,qui suit une distribution F à et degrés de liberté. La région critique est donnée par: ou pour le test bilatéral, pour le test unilatéral à droite, pour le test unilatéral à gauche . En général – si au numérateur on utilise la plus grande variance- le test F est un test unilatéral à droite.
Test d’hypothèse sur le rapport des deux variances Example: Un analyste veut comparer la dispersion des revenus par famille pour la collectivité des voyageurs qui préfèrent le tourisme littoral avec la dispersion des revenus pour les voyageurs qui préfèrent le tourisme balnéaire. En supposant que les distributions des revenus (millions lei) dans les deux collectivités sont approximatif normales, deux échantillons ont été sélectionnés, ayant le volume égale à 60 et, respectivement à 50 personnes, et les écarts-type (millions lei) sont: s1 = 2,84 et s2 = 1,86. On utilise une probabilité qui garanti les résultats égale à 95%. Les hypothèses statistiques sont: Le test statistique a la valeur: La région critique (pour ) est donnée par: Comme , l’hypothèse nulle est rejetée (c’est à dire le rapport entre les variances est nul) et l’hypothèse alternative est acceptée. Ça signifie que on accepte ’hypothèse en conformité avec laquelle la dispersion des revenus pour les voyageurs de la région littorale est significative plus grande que celle des voyageurs de la région balnéaire.