Chapitre 6. Introduction à l’échantillonnage Les sondages Notions fondamentales Fluctuations d’échantillonnage d’une moyenne Théorème central limite C6-1
C6-2 Étude de marché / sondage / échantillonnage Les sondages / échantillonnage visent à découvrir des renseignements au sujet d’une population particulière Une étude de marché / sondage / échantillonnage consiste à prélever un sous-ensemble d’unités statistiques d’une population afin de mieux en connaître les caractéristiques (préférences, revenus, intention d’achat, …) Moins dispendieux qu’un recensement qui considère toutes les unités statistiques de la population Bien que plus précis, les recensements sont plus dispendieux et prennent en général plus de temps Pour obtenir des renseignements valides, il faut prélever selon des méthodes appropriées un échantillon représentatif de la population
C6-3 Échantillons Population e1e1 e8e8 e 12 e 21 e 22 e 108 e4e4 e 323 E(X) f(X) 2 (X) X S 2 (X) P(X=x) e2e2 e1e1 e 12 s1s1 x1x1 n n e5e5 e 21 e 102 s2s2 x2x2 L’échantillonnage vise à mieux connaître un paramètre d’une population à partir d’une statistique
C6-4 Fluctuations d’échantillonnage d’une moyenne Il est facile de constater que si nous prélevons tous les échantillons possibles de même taille n d’une population de taille N, la moyenne arithmétique calculée sur chaque échantillon peut varier d’un échantillon à l’autre Il y a donc des fluctuations de la moyenne arithmétique des échantillons autour de la moyenne de la population
C6-5 Distribution d'échantillonnage La distribution de probabilité d'une statistique s’appelle la distribution d’échantillonnage puisque les variations sont attribuables à l’échantillonnage Par exemple, la distribution d'échantillonnage de la moyenne X
C6-6 Espérance mathématique de la distribution de X Soit une variable statistique X qui suit une loi de probabilité de moyenne E(X) = et de variance Var(X) = 2 Si on prélève un échantillon aléatoire de taille n d’une population infinie (ou d’une population finie et un échantillonnage avec remise), alors la moyenne d’échantillon X suit une loi de probabilité d’espérance mathématique
C6-7 Variance de la distribution de X La variance de est: L’écart-type de la moyenne d’échantillon, aussi appelé l’erreur type de la moyenne, est:
C6-8 Théorème central limite La distribution d’échantillonnage de la variable aléatoire tend à se rapprocher d’une loi normale d’autant plus que la taille de l’échantillon est grande
C6-9 Exemple 1: distribution d’échantillonnage On a une population formée de cinq unités statistiques: x 1 =8, x 2 =8,5, x 3 =9, x 4 =9,5, x 5 =10
C6-10 Exemple 1: distribution de X
C6-11 Exemple 1: estimation de Afin d’estimer , on prélève avec remise un échantillon aléatoire de taille n=2 On peut donc former 5×5 = 25 échantillons différents On calcule pour chaque échantillon, la moyenne et on construit ensuite l’histogramme de ces 25 moyennes, la distribution d’échantillonnage de X
C6-12 Exemple 1: les échantillons et leur moyenne
C6-13 Exemple 1: distribution de fréquence de MoyennesFréquenceFréquence relative 8,0010,04 8,2520,08 8,5030,12 8,7540,16 9,0050,20 9,2540,16 9,5030,12 9,7520,08 10,0010,04
C6-14 Exemple 1: distribution d’échantillonnage de la moyenne
C6-15 Exemple 1: forme de la distribution d’échantillonnage On observe que la forme de la distribution d’échantillonnage tend vers la loi normale
C6-16 Exemple 1: moyenne de la distribution d’échantillonnage MoyennesFréquenceMoyenne × Fréquence 8,001 8,25216,50 8,50325,50 8,75435,00 9,00545,00 9,25437,00 9,50328,50 9,75219,50 10, ,00
C6-17 Exemple 1: variance de la distribution d’échantillonnage Fréquence 8,001-1,001,00 8,252-0,750,561,13 8,503-0,500,250,75 8,754-0,250,060,25 9,0050,00 9,2540,250,060,25 9,5030,500,250,75 9,7520,750,561,13 10,0011,00 6,25 )X(EX X 2 )X(EX f)X(EX 2
C6-18 Transformation de X en une variable aléatoire centrée réduite Z a b N( ) 0 z1z1 z2z2 N( /n) X
Les résultats d’un test d’aptitude sont distribués selon une loi normale de moyenne = 150 et de variance 2 = 100 On fait passer le test à un échantillon aléatoire de 25 individus Déterminer les caractéristiques de la distribution d’échantillonnage X C6-19 Exemple 2: distribution d’échantillonnage
C6-20 Exemple 2: forme de la distribution d’échantillonnage Puisque la population échantillonnée est distribuée normalement, la distribution d’échantillonnage de X sera également une distribution normale
C6-21 Exemple 2: calcul des probabilités Quelle est la probabilité que la moyenne d’échantillon soit comprise entre 146 et 154? Z 0 z1z1 z2z2
C6-22 Caractéristique de X tend vers la loi normale lorsque n est grand
C6-23 Distribution de X Cas 1: Les observations proviennent d’une population normale de variance, , connue quelque soit n
C6-24 Distribution de X Cas 2: Les observations proviennent d’une population de distribution et de variance inconnues mais n grand, alors on a approximativement Ce résultat découle du théorème central limite
C6-25 Exemple 3: distribution d’échantillonnage Provipak fabrique la céréale Cherry-Ô dans des contenants de 340 grammes, = 340gr Le procédé donne un écart-type du poids des contenants de 10 grammes, = 10 gr Le poids des contenants suit une distribution normale, X N(340, 10 2 ) On prélève au hasard un échantillon de 50 contenants
C6-26 Exemple 3: distribution d’échantillonnage (suite) Quel sera la distribution d’échantillonnage de ? Calculer P(338 < < 342) Que devient la distribution d’échantillonnage de si on double la taille de l’échantillon
C6-27 Exemple 3: calcul des probabilités La distribution d’échantillonnage de sera normale avec et Si on double la taille de l’échantillon, on a et