LOI NORMALE LOI STUDENT ECHANTILLONS ET TESTS DE MOYENNE
Principales lois de probabilités Une application de la loi Normale : l’induction statistique L’induction statistique traite des liens entre les paramètres d’une population mère et ceux issus d’échantillons, on note: Population mère N = taille de la population mère m = moyenne déterminée dans la population mère = Ecart-type déterminé dans la population mère P= Proportion déterminée dans la population mère, ECHANTILLON n = taille de l’ échantillon = Moyenne c sur échantillon = Ecart-type sur échantillon Pn= Proportion sur échantillon x
Principales lois de probabilités Une application de la loi Normale : l’estimation, Le travail d’estimation consiste à partir d’informations tirées d’un échantillon pour donner un intervalle de confiance dans la population mère du paramètre estimé. L’estimation de moyenne: Par exemple, on a commandé 30 000 ours en peluche, avec une résistance des yeux à au moins 15 kg de traction. On teste 82 ours et on obtient 14,5kg de résistance moyenne avec un écart-type de 0,9 kg, l’annonce du vendeur est-elle acceptable ou doit-elle être rejetée? x
Une application de la loi Normale : l’estimation de moyenne Cela revient au shéma ci-dessous Population mère N = 30000 = inconnu m = à estimer Pour traiter ces questions on partira de la propriété suivante : si ou si n>30 alors Ici = 14,5 ECHANTILLON = 0,9 n = 82 x
Principales lois de probabilités Une application de la loi Normale : l’estimation de moyenne Cela revient au shéma ci-dessous avec : On ne connaît pas , il faudra donc l’estimer de manière ponctuelle, n’est pas à l’état brut un bon estimateur, il faut passer par S: à comparer avec On en déduit que ici S= = et donc 𝒙 𝒏 ~𝑵(𝒎, 𝑺 𝒏 ) soit ici 𝒙 𝒏 ~𝑵(𝒎, ) x
Principales lois de probabilités Une application de la loi Normale : l’estimation de moyenne et donc 𝒙 𝒏 ~𝑵(𝒎, 𝑺 𝒏 ) soit ici 𝒙 𝒏 ~𝑵(𝒎, ) Si on applique la méthode des intervalles de confiance, On tire la formule: m∈ 𝒙 𝒏 ± 𝒖 𝟏− ∝ 𝟐 × 𝑺 𝒏 Ici pour un intervalle de confiance à 95%, on obtient : m∈ soit m ∈ m∈[ ; ] donc ne figure pas x
Principales lois de probabilités Une application de la loi Normale : l’estimation de moyenne sur la base de 𝒙 𝒏 ~𝑵(𝒎, 𝑺 𝒏 ) ne s’applique que dans le cas où n est au moins égale à 30 Si n<30, il faut passer par la loi de Student Fisher… …paramétrée de la même manière que la loi Normale 𝒙 𝒏 ~𝑺𝒕(𝒎, 𝑺 𝒏 ) Avec une variable t au lieu de u et une lecture directe sur le risque en au lieu de pour déterminer l’intervalle de confiance qui devient : m∈ 𝒙 𝒏 ± 𝒕 ∝ × 𝑺 𝒏 x
Principales lois de probabilités Estimation de moyenne: Par exemple pour un échantillon de 26 et un intervalle de confiance à 95% alors que l’on a obtenu une moyenne de 14,5 et l’écart-type de 0,9 sur l’échantillon On a S= et m∈ ± 𝒕 ∝ × s’obtient directement dans la table de Student en croisant la ligne des degrés de liberté ddl ou = n-1 : ici 25 et la colonne des risques ici 0,05 Soit = 2,06 Et m∈𝟏𝟒,𝟓± m∈[ ] ddl 0.50 0.20 0.10 0.05 0.02 1 1.000 3.078 6.314 12.706 31.281 2 0.816 1.886 2.920 4.303 6.965 3 0.765 1.638 2.353 3.182 4.541 4 0.741 1.533 2.132 2.776 3.747 ,,, ,, 23 0.685 1.319 1.714 2.069 2.500 24 1.318 1.711 2.064 2.492 25 0.684 1.316 1.708 2.060 2.485 30 0.683 1.310 1.697 2.042 2.457 x
La moyenne annoncée par le vendeur est m=15kg, Les Tests de moyenneS Comparaison d’une Moyenne observée à une moyenne théorique La moyenne annoncée par le vendeur est m=15kg, Peut-on accepter cette moyenne (Ho), sachant que dans un échantillon de 36 on a obtenu 𝒙 𝟑𝟔 =14,5kg avec S=1,5 ou peut-on la rejeter au risque de 5% (H1)? Reprenant les règles applicables aux échantillons, on peut Considérer Z = 𝑥 36 −𝑚 𝑠 36 = 14.5 −15 1.5 36 = -2 Or le seuil pour un intervalle de confiance à 95% de la loi Normale est ou
Considérer Z = 𝑥 36 −𝑚 𝑠 36 = 14.5 −15 1.5 36 = -2 Les Tests de moyenneS Comparaison d’une Moyenne observée à une moyenne théorique Considérer Z = 𝑥 36 −𝑚 𝑠 36 = 14.5 −15 1.5 36 = -2 Or le seuil pour un intervalle de confiance à 95% de la loi Normale est +1,96 ou -1,96 Cela veut aussi dire que lorsque l’on a une moyenne de population mère égale à 15, il y a 95% de chance pour que le U obtenu soit compris entre -1,96 et +1,96 et donc 5% pour qu’il soit à l’extérieur de cet intervalle. Si U<-1,96 ou U>+1,96, on peut rejeter l’hypothèse Ho de la moyenne théorique annoncée avec un risque de rejet à tort de 5%. ici le U calculé -2 <- 1,96 donc on rejette la moyenne de15 kg
Si n<30 on procède de la même manière mais via le t de student. Les Tests de moyenneS Comparaison d’une Moyenne observée à une moyenne théorique Si n<30 on procède de la même manière mais via le t de student. Par exemple si l’on avait testé 25 unités avec les mêmes résultats Soit t = 𝑥 25 −𝑚 𝑠 25 = 14.5 −15 1.5 25 = -1,67 𝑡 0,05 avec ddl de 24 =2,064 références [ -2,064 ; +2,064] Comme t=-1,67 non <-2,064 on ne peut rejeter l’affirmation du fournisseur sur le risque de 5% Il faudrait monter à 20% de risque pour obtenir un t=1,318 tel que -1,67<-1,318
Bateau A 𝒏 𝑨 =𝟑𝟔 donne 𝒙 𝑨 =14,5kg avec 𝑺 𝑨 =1,5 Les Tests de moyenneS Comparaison de deux moyennes issues de deux échantillons indépendants (non appariés) On prélève deux échantillons issus de deux bateaux différents et l’on se demande s’ils viennent bien du même fournisseur où si les moyennes sont si différentes qu’ils ne peuvent avoir une même origine. Bateau A 𝒏 𝑨 =𝟑𝟔 donne 𝒙 𝑨 =14,5kg avec 𝑺 𝑨 =1,5 Bateau B 𝒏 𝑩 =𝟒𝟗 donne 𝒙 𝑩 =15,5kg avec 𝑺 𝑩 =1,0 Cette fois la formule devient U= 𝑥 𝑎 − 𝑥 𝑏 𝑆 𝑎 2 𝑛 𝑎 + 𝑆 𝑏 2 𝑛 𝑏 = 14.5−15.5 1.5 2 36 + 1 2 49 =3.47
Cette fois la formule devient Les Tests de moyenneS Comparaison de deux moyennes issues de deux échantillons indépendants (non appariés) Bateau A 𝒏 𝑨 =𝟑𝟔 donne 𝒙 𝑨 =14,5kg avec 𝑺 𝑨 =1,5 Bateau B 𝒏 𝑩 =𝟒𝟗 donne 𝒙 𝑩 =15,5kg avec 𝑺 𝑩 =1,0 Cette fois la formule devient U= 𝑥 𝑎 − 𝑥 𝑏 𝑆 𝑎 2 𝑛 𝑎 + 𝑆 𝑏 2 𝑛 𝑏 = 14.5−15.5 1.5 2 36 + 1 2 49 =3.47 3,47 > 1,96 donc la différence est significative au risque de 5% Si 𝒏 𝑨 et/ou 𝒏 𝑩 <30 alors on procèderait via un test de Student avec un ddl = 𝒏 𝑨 + 𝒏 𝑩 -2 si 𝒏 𝑩 = 26 ddl = 36+26-2=60 soit à 5% un t=2 Là aussi dépassé par 3,47