5 e cours : reprise Résumé Échantillon hasard prudence dans l’interprétation Imprécision : marge + fourchette incertitude : 95 (ou 99 %) k = 1,96 (ou 2,58) interprétation : à 95% (99%), « p » dans la population est dans la fourchette 1
Interprétation des données d’enquête Interprétation des données : non-exhaustivité <> exhaustivité Hypothèse : pas d’erreur d’observation (déclarations sincères, bon enregistrement des réponses…) d’une valeur unique, on passe à une fourchette de certaine, la donnée devient incertaine 2 CollecteValeur tirée de l’observationDegré de certitude Exhaustiveuniquecertaine Non exhaustive : enquête fourchette (= imprécision) incertaine (= incertitude) En passant de l’exhaustif au non-exhaustif, on perd beaucoup dans l’interprétation des données !
Interprétation des données d’enquête Interprétation des données : non-exhaustivité <> exhaustivité Hypothèse : pas d’erreur d’observation (déclarations sincères, bon enregistrement des réponses…) d’une valeur unique, on passe à une fourchette de certaine, la donnée devient incertaine 3 CollecteValeur tirée de l’observationDegré de certitude Exhaustiveuniquecertaine Non exhaustive : enquête fourchette (= imprécision) incertaine (= incertitude) En passant de l’exhaustif au non-exhaustif, on perd beaucoup dans l’interprétation des données !
Interprétation des données d’enquête Interprétation des données : non-exhaustivité <> exhaustivité Hypothèse : pas d’erreur d’observation (déclarations sincères, bon enregistrement des réponses…) d’une valeur unique, on passe à une fourchette de certaine, la donnée devient incertaine 4 CollecteValeur tirée de l’observationDegré de certitude Exhaustiveuniquecertaine Non exhaustive : enquête fourchette (= imprécision) incertaine (= incertitude) En passant de l’exhaustif au non-exhaustif, on perd beaucoup dans l’interprétation des données !
Interprétation des données d’enquête Utilité des sondages, des enquêtes ? Critère : utile si surplus de connaissance Exemple 1 : pays où vont se dérouler les 1 res élections Exemple 2 : sondages préélectoraux en Belgique 5
Interprétation des données d’enquête Critère : utile si surplus de connaissance Exemple 1 : pays où vont se dérouler les 1 res élections Exemple 2 : sondages préélectoraux en Belgique (situation ancienne) Avec les mêmes données : Exemple 1 : commentaires intéressants Exemple 2 : à la limite ne rien faire, car information évidente ! 6 PartisScore auxSondage en 1994 élections ‘89B. inf.Valeur centraleB. sup. PS38,1%25,8%29,2%32,6% PRL-FDF22,7%21,9%25,2%28,5% PSC21,3%17,020,0%23,0% PartisSondage en 1994 B. infValeur centraleB. Sup. PS25,8%29,2%32,6% PRL-FDF21,9%25,2%28,5% PSC17,0%20,0%23,0%
Critère : utile si surplus de connaissance si pas d’autre source ou si autres sources déjà anciennes utilisation des données d’enquête malgré le flou on ne peut pas rejeter toutes les enquêtes parce que imprécision incertitude … ou alors vous ferez pas grand-chose ! par contre, ne jamais oublier la prudence dans l’interprétation Interprétation des données d’enquête
Exercices pp Calcul de la « marge maximale » en juin 2010 et septembre 2011 Juin 2010 : p = 0,5 (car marge maximale) q = 0,5 n = 500 (500 individus dans l’échantillon de Bruxelles) degré de certitude = 95 % (taux de confiance) k = 1,96 Septembre 2011 p = 0,5 (car observation de 50% marge max.) q = 0,5 n = 2,000 (marge sur l’échantillon TOTAL) degré de certitude = 95 % (valeur par défaut) k = 1,96 Logique entre les résultats : plus «n» est grand, plus la marge est petite Critiques expression « marge maximale » : présente en 2010, mais pas en 2011 degré de certitude : présent en 2010, mais pas en 2011 taux de réponse : pas présent en 2010, mais bien en
Exercices pp Calcul de la « marge maximale » en juin 2010 et septembre 2011 Juin 2010 : p = 0,5 (car marge maximale) q = 0,5 n = 500 (500 individus dans l’échantillon de Bruxelles) degré de certitude = 95 % (taux de confiance) k = 1,96 Septembre 2011 p = 0,5 (car observation de 50% marge max.) q = 0,5 n = 2,000 (marge sur l’échantillon TOTAL) degré de certitude = 95 % (valeur par défaut) k = 1,96 Logique entre les résultats : plus «n» est grand, plus la marge est petite Critiques expression « marge maximale » : présente en 2010, mais pas en 2011 degré de certitude : présent en 2010, mais pas en 2011 taux de réponse : pas présent en 2010, mais bien en
Exercices pp Calcul de la « marge maximale » en juin 2010 et septembre 2011 Juin 2010 : p = 0,5 (car marge maximale) q = 0,5 n = 500 (500 individus dans l’échantillon de Bruxelles) degré de certitude = 95 % (taux de confiance) k = 1,96 Septembre 2011 p = 0,5 (car observation de 50% marge max.) q = 0,5 n = 2,000 (marge sur l’échantillon TOTAL) degré de certitude = 95 % (valeur par défaut) k = 1,96 Logique entre les résultats : plus «n» est grand, plus la marge est petite Critiques expression « marge maximale » : présente en 2010, mais pas en 2011 degré de certitude : présent en 2010, mais pas en 2011 taux de réponse : pas présent en 2010, mais bien en
Exercices pp Calcul de la « marge maximale » en juin 2010 et septembre 2011 Juin 2010 : p = 0,5 (car marge maximale) q = 0,5 n = 500 (500 individus dans l’échantillon de Bruxelles) degré de certitude = 95 % (taux de confiance) k = 1,96 Septembre 2011 p = 0,5 (car observation de 50% marge max.) q = 0,5 n = 2,000 (marge sur l’échantillon TOTAL) degré de certitude = 95 % (valeur par défaut) k = 1,96 Logique entre les résultats : plus «n» est grand, plus la marge est petite Critiques expression « marge maximale » : présente en 2010, mais pas en 2011 degré de certitude : présent en 2010, mais pas en 2011 taux de réponse : pas présent en 2010, mais bien en
Exercices pp Calcul de la « marge maximale » en juin 2010 et septembre 2011 Juin 2010 : p = 0,5 (car marge maximale) q = 0,5 n = 500 (500 individus dans l’échantillon de Bruxelles) degré de certitude = 95 % (taux de confiance) k = 1,96 Septembre 2011 p = 0,5 (car observation de 50% marge max.) q = 0,5 n = 2,000 (marge sur l’échantillon TOTAL) degré de certitude = 95 % (valeur par défaut) k = 1,96 Logique entre les résultats : plus «n» est grand, plus la marge est petite Critiques expression « marge maximale » : présente en 2010, mais pas en 2011 degré de certitude : présent en 2010, mais pas en 2011 taux de réponse : pas présent en 2010, mais bien en
Exercices pp Calcul de la « marge maximale » en juin 2010 et septembre 2011 Juin 2010 : p = 0,5 (car marge maximale) q = 0,5 n = 500 (500 individus dans l’échantillon de Bruxelles) degré de certitude = 95 % (taux de confiance) k = 1,96 Septembre 2011 p = 0,5 (car observation de 50% marge max.) q = 0,5 n = 2,000 (marge sur l’échantillon TOTAL) degré de certitude = 95 % (valeur par défaut) k = 1,96 Logique entre les résultats : plus «n» est grand, plus la marge est petite Critiques expression « marge maximale » : présente en 2010, mais pas en 2011 degré de certitude : présent en 2010, mais pas en 2011 taux de réponse : pas présent en 2010, mais bien en
Exercices pp Calcul de la « marge maximale » en juin 2010 et septembre 2011 Juin 2010 : p = 0,5 (car marge maximale) q = 0,5 n = 500 (500 individus dans l’échantillon de Bruxelles) degré de certitude = 95 % (taux de confiance) k = 1,96 Septembre 2011 p = 0,5 (car observation de 50% marge max.) q = 0,5 n = 2,000 (marge sur l’échantillon TOTAL) degré de certitude = 95 % (valeur par défaut) k = 1,96 Logique entre les résultats : plus «n» est grand, plus la marge est petite Critiques expression « marge maximale » : présente en 2010, mais pas en 2011 degré de certitude : présent en 2010, mais pas en 2011 taux de réponse : pas présent en 2010, mais bien en
Exercices pp Calcul de la « marge maximale » en juin 2010 et septembre 2011 Juin 2010 : p = 0,5 (car marge maximale) q = 0,5 n = 500 (500 individus dans l’échantillon de Bruxelles) degré de certitude = 95 % (taux de confiance) k = 1,96 Septembre 2011 p = 0,5 (car observation de 50% marge max.) q = 0,5 n = 2,000 (marge sur l’échantillon TOTAL) degré de certitude = 95 % (valeur par défaut) k = 1,96 Logique entre les résultats : plus «n» est grand, plus la marge est petite Critiques expression « marge maximale » : présente en 2010, mais pas en 2011 degré de certitude : présent en 2010, mais pas en 2011 taux de réponse : pas présent en 2010, mais bien en
Exercices pp Calcul de la « marge maximale » en juin 2010 et septembre 2011 Juin 2010 : p = 0,5 (car marge maximale) q = 0,5 n = 500 (500 individus dans l’échantillon de Bruxelles) degré de certitude = 95 % (taux de confiance) k = 1,96 Septembre 2011 p = 0,5 (car observation de 50% marge max.) q = 0,5 n = 2,000 (marge sur l’échantillon TOTAL) degré de certitude = 95 % (valeur par défaut) k = 1,96 Logique entre les résultats : plus «n» est grand, plus la marge est petite Critiques expression « marge maximale » : présente en 2010, mais pas en 2011 degré de certitude : présent en 2010, mais pas en 2011 taux de réponse : pas présent en 2010, mais bien en
Exercices pp Calcul de la « marge maximale » en juin 2010 et septembre 2011 Juin 2010 : p = 0,5 (car marge maximale) q = 0,5 n = 500 (500 individus dans l’échantillon de Bruxelles) degré de certitude = 95 % (taux de confiance) k = 1,96 Septembre 2011 p = 0,5 (car observation de 50% marge max.) q = 0,5 n = 2,000 (marge sur l’échantillon TOTAL) degré de certitude = 95 % (valeur par défaut) k = 1,96 Logique entre les résultats : plus «n» est grand, plus la marge est petite Critiques expression « marge maximale » : présente en 2010, mais pas en 2011 degré de certitude : présent en 2010, mais pas en 2011 taux de réponse : pas présent en 2010, mais bien en
Exercices pp Calcul de la « marge maximale » en juin 2010 et septembre 2011 Juin 2010 : p = 0,5 (car marge maximale) q = 0,5 n = 500 (500 individus dans l’échantillon de Bruxelles) degré de certitude = 95 % (taux de confiance) k = 1,96 Septembre 2011 p = 0,5 (car observation de 50% marge max.) q = 0,5 n = 2,000 (marge sur l’échantillon TOTAL) degré de certitude = 95 % (valeur par défaut) k = 1,96 Logique entre les résultats : plus «n» est grand, plus la marge est petite Critiques expression « marge maximale » : présente en 2010, mais pas en 2011 degré de certitude : présent en 2010, mais pas en 2011 taux de réponse : pas présent en 2010, mais bien en
Exercices pp Calcul de la « marge maximale » en juin 2010 et septembre 2011 Juin 2010 : p = 0,5 (car marge maximale) q = 0,5 n = 500 (500 individus dans l’échantillon de Bruxelles) degré de certitude = 95 % (taux de confiance) k = 1,96 Septembre 2011 p = 0,5 (car observation de 50% marge max.) q = 0,5 n = 2,000 (marge sur l’échantillon TOTAL) degré de certitude = 95 % (valeur par défaut) k = 1,96 Logique entre les résultats : plus «n» est grand, plus la marge est petite Critiques expression « marge maximale » : présente en 2010, mais pas en 2011 degré de certitude : présent en 2010, mais pas en 2011 taux de réponse : pas présent en 2010, mais bien en
Exercices pp Calcul de la « marge maximale » en juin 2010 et septembre 2011 Juin 2010 : p = 0,5 (car marge maximale) q = 0,5 n = 500 (500 individus dans l’échantillon de Bruxelles) degré de certitude = 95 % (taux de confiance) k = 1,96 Septembre 2011 p = 0,5 (car observation de 50% marge max.) q = 0,5 n = 2,000 (marge sur l’échantillon TOTAL) degré de certitude = 95 % (valeur par défaut) k = 1,96 Logique entre les résultats : plus «n» est grand, plus la marge est petite Critiques expression « marge maximale » : présente en 2010, mais pas en 2011 degré de certitude : présent en 2010, mais pas en 2011 taux de réponse : pas présent en 2010, mais bien en
Exercices pp Marge pour le PS à Bruxelles en septembre 2011 Calcul : p = 0,263 q = 0,737 n = 500 (500 individus dans l’échantillon de Bruxelles) degré de certitude = 95 % (valeur pas défaut) k = 1,96 Critiques marge « maximale » en 2011 : 2,19% (calcul sur dia précédente) MAIS 3,9% pour le PS (avec un calcul définitivement juste) marge pour le PS > marge maximale ! erreur provient du « n » : on doit prendre 500, et pas les « p » sont calculées sur les échantillons des Régions 21
Exercices pp Marge pour le PS à Bruxelles en septembre 2011 Calcul : p = 0,263 q = 0,737 n = 500 (500 individus dans l’échantillon de Bruxelles) degré de certitude = 95 % (valeur pas défaut) k = 1,96 Critiques marge « maximale » en 2011 : 2,19% (calcul sur dia précédente) MAIS 3,9% pour le PS (avec un calcul définitivement juste) marge pour le PS > marge maximale ! erreur provient du « n » : on doit prendre 500, et pas les « p » sont calculées sur les échantillons des Régions 22
Exercices pp Marge pour le PS à Bruxelles en septembre 2011 Calcul : p = 0,263 q = 0,737 n = 500 (500 individus dans l’échantillon de Bruxelles) degré de certitude = 95 % (valeur pas défaut) k = 1,96 Critiques marge « maximale » en 2011 : 2,19% (calcul sur dia précédente) MAIS 3,9% pour le PS (avec un calcul définitivement juste) marge pour le PS > marge maximale ! erreur provient du « n » : on doit prendre 500, et pas les « p » sont calculées sur les échantillons des Régions 23
Exercices pp Marge pour le PS à Bruxelles en septembre 2011 Calcul : p = 0,263 q = 0,737 n = 500 (500 individus dans l’échantillon de Bruxelles) degré de certitude = 95 % (valeur pas défaut) k = 1,96 Critiques marge « maximale » en 2011 : 2,19% (calcul sur dia précédente) MAIS 3,9% pour le PS (avec un calcul définitivement juste) marge pour le PS > marge maximale ! erreur provient du « n » : on doit prendre 500, et pas les « p » sont calculées sur les échantillons des Régions 24
Exercices pp Marge pour le PS à Bruxelles en septembre 2011 Calcul : p = 0,263 q = 0,737 n = 500 (500 individus dans l’échantillon de Bruxelles) degré de certitude = 95 % (valeur pas défaut) k = 1,96 Critiques marge « maximale » en 2011 : 2,19% (calcul sur dia précédente) MAIS 3,9% pour le PS (avec un calcul définitivement juste) marge pour le PS > marge maximale ! erreur provient du « n » : on doit prendre 500, et pas les « p » sont calculées sur les échantillons des Régions 25
Exercices pp Marge pour le PS à Bruxelles en septembre 2011 Calcul : p = 0,263 q = 0,737 n = 500 (500 individus dans l’échantillon de Bruxelles) degré de certitude = 95 % (valeur pas défaut) k = 1,96 Critiques marge « maximale » en 2011 : 2,19% (calcul sur dia précédente) MAIS 3,9% pour le PS (avec un calcul définitivement juste) marge pour le PS > marge maximale ! erreur provient du « n » : on doit prendre 500, et pas les « p » sont calculées sur les échantillons des Régions 26
Exercices pp Marge pour le PS à Bruxelles en septembre 2011 Calcul : p = 0,263 q = 0,737 n = 500 (500 individus dans l’échantillon de Bruxelles) degré de certitude = 95 % (valeur pas défaut) k = 1,96 Critiques marge « maximale » en 2011 : 2,19% (calcul sur dia précédente) MAIS 3,9% pour le PS (avec un calcul définitivement juste) marge pour le PS > marge maximale ! erreur provient du « n » : on doit prendre 500, et pas les « p » sont calculées sur les échantillons des Régions 27
Exercices pp Marge pour le PS à Bruxelles en septembre 2011 Calcul : p = 0,263 q = 0,737 n = 500 (500 individus dans l’échantillon de Bruxelles) degré de certitude = 95 % (valeur pas défaut) k = 1,96 Critiques marge « maximale » en 2011 : 2,19% (calcul sur dia précédente) MAIS 3,9% pour le PS (avec un calcul définitivement juste) marge pour le PS > marge maximale ! erreur provient du « n » : on doit prendre 500, et pas les « p » sont calculées sur les échantillons des Régions 28
Exercices pp. 7-8 p. 7 : rapidement (cf. corrigé) p. 8 : Les francophones de Flandre Le texte (extrait légèrement modifié, simplifié) : vu que la marge d’erreur pour une fréquence de 5,9% est de ± 0,92%, la % de francophones parmi les habitants en Flandre se situe donc entre 4,98 % ( francophones) et 6,82 % ( francophones ) Réponses aux questions incertitude : elle passe au bleu imprécision : fourchette = [ ; ] : OK marge : OK, si degré de certitude = 95% titre : chiffre unique et certain, comme si données exhaustives… critique du titre : mais où sont donc l’imprécision et l’incertitude ? « À 95 chances sur 100, i l y aurait entre et francophones en Flandre » titre quasiment invendable auprès d’un large public et pourtant ! 29
Exercices pp. 7-8 p. 8 : La Libre Belgique du 6 septembre 2012 (si temps) Réponses aux questions marge = 3,3% pour les 3 Régions (diviseur presqu’égal : 902, 901 et 904) comparaison des fiches techniques 2011 & 2012 : en 2012, mode de sélection expliqué : point positif en 2012, via internet : difficile d’assurer la représentativité, point négatif en 2012, quotas selon différents critères : point positif en 2012, marge max. calculée sur la base des 3 échantillons : point positif en 2012, rien sur les taux de réponse : point négatif (mais dit dans le commentaire) en 2012, comme en 2011, pas de degré de certitude : point négatif fourchette du MR : [18,4% ; 23,8%] montée du MR : mai 2012, % MR = 19,6, qui est dans la fourchette de sept. 2012… 25% d’indécis prudence redoublée ! 30
31 Bon travail avec les données d’enquête