POL1803: Analyse des techniques quantitatives Cours 3 Analyse univariée, 2è partie
Question à résoudre Quel parti politique remportera la prochaine élection provinciale québécoise?
Qui gagnerait? Sondage Mainstreet Research 1665 répondants, 14/09-15/09 2018 CAQ 29,1 % PLQ 28,6 % PQ 21,5 % QS 17,1 % Marge d’erreur 2,4 %
Programme Quelques notions d’inférence statistique Estimation d’une moyenne Estimation d’un pourcentage Problèmes d’interprétation des sondages
Quelques notions d’inférence statistique Définition: L’ensemble des méthodes permettant de tirer des conclusions sur un groupe déterminé - la population - à partir des données provenant d’un échantillon choisi dans cette population.
Quelques notions d’inférence statistique Quelques notions d’inférence statistique Population Échantillon Définition L’ensemble des unités considérées Un sous-ensemble choisi pour étude Symbole Lettres grecques ou majuscules lettres minuscules Caractéristique paramètre statistique Taille N n Moyenne m Écart-type s Pourcentage p
Symboles interchangeables Écart type d’une population (s): racine carrée de S (x - m)2 N Écart type d’un échantillon (s): racine carrée de S (x - )2 n - 1
Les trois distributions Distribution de la population Un recensement (N) m , s Distribution d’un échantillon Un sondage (n) , s Distribution d’échantillonnage Tous les sondages possibles (Ncn) m , s
Tous les échantillons possibles Population: N = 5 A, B, C, D, E Échantillon: n = 2 Tous les échantillons différents: AB, AC, AD, AE, BC, BD, BE, CD, CE, DE Ncn = N! . = 5! . = n! (N-n)! 2! (5-2)! 5*4*3*2*1 . = 120 . = 10 2*1 * 3*2*1 12
Tous les échantillons possibles Ncn (1000, 5000000) = Ncn = N! . n! (N-n)! Ncn = 5000000! . 1000! (5000000-1000)! Ncn (1000, 5000000) = ... Ncn (10, 50000) = 27 000 000 000 000 000 000 000 000 000 000 000 000 000
La distribution d’échantillonnage Si la taille de l’échantillon est de 30 ou plus: la moyenne de la distribution d’échantillonnage est identique à la moyenne de la population (m = m ). - la distribution d’échantillonnage suit une distribution normale.
La distribution normale Définition: Distribution lisse, symétrique et unimodale d’une variable d’intervalles / ratio.
La distribution normale
La distribution normale Propriété fondamentale: Pour toute combinaison de moyenne et d’écart-type, il y aura toujours une proportion constante de cas entre la moyenne et un point quelconque situé à une certaine distance de la moyenne exprimée en termes d’unité(s) d’écart-type.
La distribution normale
La distribution normale
La distribution normale
La distribution normale
Une application concrète L’estimation de la moyenne d’une population à partir de la moyenne d’un échantillon
Intervalles de confiance À 95% : m = 1,96 s où s = s ¯ n À 99% : m = 2,58 s où s = s ¯ n
Un exemple À 95% : = 2,15 n = 30 s = 1,29 m = 1,96 s où s = s ¯ n 2,15 1,96 s où s = 1,29 ¯ 30 2,15 1,96 * 1,29/5,48 = 2,15 1,96 * 0,24 2,15 0,47 = 1,68 < m < 2,62
Un exemple À 99% : = 2,15 n = 30 s = 1,29 m = 2,58 s où s = s ¯ n 2,15 2,58 s où s = 1,29 ¯ 30 2,15 2,58 * 1,29/5,48 = 2,15 2,58 * 0,24 2,15 0,62 = 1,53 < m < 2,77
L’ampleur des intervalles varie selon … Le niveau de confiance Un exemple: À 95%: 1,68 < m < 2,62 À 99%: 1,53 < m < 2,77
L’ampleur des intervalles varie selon … L’écart-type de l’échantillon Deux cas de figures (à 95%): s (2): 1,42 < m < 2,88 s (0,82): 1,86 < m < 2,44
L’ampleur des intervalles varie selon … La taille de l’échantillon Un exemple (à 95%): n = 30: 1,68 < m < 2,62 n = 1000: 2,07 < m < 2,23 n = 10000: 2,12 < m < 2,18
De la moyenne au pourcentage À 95% : m = 1,96 s où s = s ¯ n À 95% : = p 1,96 sp où sp = s ¯ n
De la moyenne au pourcentage À 95% : p = 45% n = 1001 s = 49,7 = p 1,96 sp où sp = s ¯ n 45 1,96 sp où sp = 49,7 ¯1001 45 1,96 * 49,7/31,6 = 45 1,96 * 1,57 45 3,1 = 41,9 < < 48,1
De la moyenne au pourcentage À 99% : m = 2,58 s où s = s ¯ n À 99% : = p 2,58 sp où sp = s ¯ n
De la moyenne au pourcentage À 99% : p = 45% n = 1001 s = 49,7 = p 2,58 sp où sp = s ¯ n 45 2,58 sp où sp = 49,7 ¯1001 45 2,58 * 49,7/31,6 = 45 2,58 * 1,57 45 4,1 = 40,9 < < 49,1
L’ampleur des intervalles varie selon … Le niveau de confiance L’écart-type de l’échantillon La taille de l’échantillon
Qui gagnerait? Sondage Mainstreet Research 1665 répondants, 14/09-15/09 2018 CAQ 29,1 % PLQ 28,6 % PQ 21,5 % QS 17,1 % Marge d’erreur 2,4 %
Qui gagnerait? Sondage Mainstreet Research 1665 répondants, 14/09-15/09 2018 CAQ 29,1 % 26,7 - 31,5% PLQ 28,6 % 26,2 - 31,0% PQ 21,5 % 19,1 - 23,9% QS 17,1 % 14,7 - 19,5% Marge d’erreur 2,4 %
La marge d’erreur des sondages
Problèmes d’interprétation des sondages Cours 3 Analyse univariée, 2è partie
« Les Libéraux en avance » ? Sondage CROP 1000 pers., 10 - 18 décembre 2002 ADQ 31 % 28 - 34% PLQ 34 % 31 - 37% PQ 33 % 30 - 36% Marge d’erreur: 3%, 19 fois sur 20
« Le PLQ serait relégué au troisième rang » ? (TVA) Sondage Léger Marketing 30 mars - 3 avril 2005 PQ 47 % 44 - 50% ADQ 25 % 22 - 28% PLQ 21 % 18 - 24% Marge d’erreur: 3%, 19 fois sur 20
« La CAQ en avance » ? (LaPresse) Sondage IPSOS 1008 pers., 23 - 25 octobre 2017 CAQ 34 % 31 - 37% PLQ 29 % 26 - 32% PQ 20 % 17 - 23% Marge d’erreur: 3%, 19 fois sur 20
«Sondages contradictoires»? «Deux sondages effectués par des maisons différentes donnent des résultats contradictoires sur la position des libéraux au Québec.» (SRC, 24 avril 2004) Sondage CROP Léger Avril 15-25 20-24 BQ 41% 46% PLC 39% 34% NDP 10% 8% PC 10% 8% Marge 3% 3%
«Sondages contradictoires»? «Deux sondages effectués par des maisons différentes donnent des résultats contradictoires sur la position des libéraux au Québec.» (SRC, 24 avril 2004) Sondage CROP Léger Avril 15-25 20-24 BQ 38-44% 43-49% PLC 36-42% 31-37% NDP 7-13% 5-11% PC 7-13% 5-11% Marge 3% 3%
«Le PQ creuse l’écart»? La Presse, 16 août 2012 Sondage CROP CROP Dates 4-8 août 12-14 août PQ 32% 34% PLQ 29% 27% CAQ 21% 25% Marge 3% 3%
«Le PQ creuse l’écart»? La Presse, 16 août 2012 Sondage CROP CROP Dates 4-8 août 12-14 août PQ 29-35% 31-37% PLQ 26-32% 24-30% CAQ 18-24% 22-28% Marge 3% 3%
«La charte relance le PQ»? Le Devoir, 31 août 2013 Sondage Léger Léger Dates 17-19 juin 29-30 août PLQ 38% 36% PQ 27% 32% CAQ 19% 18% Marge 3% 3%
«La charte relance le PQ»? Le Devoir, 31 août 2013 Sondage Léger Léger Dates 17-19 juin 29-30 août PLQ 35-41% 33-39% PQ 24-30% 29-35% CAQ 16-22% 15-21% Marge 3% 3%
«Les Libéraux regagnent du terrain»? La Presse, 28 avril 2004 Sondage CROP CROP Mois Mars Avril BQ 45% 41% PLC 35% 39% Marge 3% 3%
«Les Libéraux regagnent du terrain»? La Presse, 28 avril 2004 Sondage CROP CROP Mois Mars Avril BQ 42-48% 38-44% PLC 32-38% 36-42% Marge 3% 3%
«Les Libéraux sont en chute libre»? Journal de Montréal, 2 juin 2004 Sondage Léger Léger Mois Avril Mai PLC 38% 35% PC 26% 30% Marge 2% 2%
«Les Libéraux sont en chute libre»? Journal de Montréal, 2 juin 2004 Sondage Léger Léger Mois Avril Mai PLC 36-40% 33-37% PC 24-28% 28-32% Marge 2% 2%