Les distributions de fréquences et de pourcentages
Plan de la séance 1 – Les distributions 1.1 – de fréquences 1.2 – de pourcentages 1.3 – de pourcentages cumulatifs 2 – Présentation des tableaux de résultats 3 – Les graphiques 3.1 – les diagrammes circulaires 3.2 – les diagrammes en bâtons 3.3 – l’histogramme 3.5 – faire mentir les graphiques... 4 - Exemple
1.1 – Les distributions de fréquences Une distribution de fréquences (ou d’effectifs) nous montre le nombre de cas correspondant à chaque valeur d’une variable Notation: f = fréquence Donne une meilleure idée de la façon dont sont distribué les scores
1.1 – Les distributions de fréquences Répartition des répondants selon le sexe (en fréquences) Sexe des répondants f Hommes 719 Femmes 1424 Total 2143
1.1 – Les distributions de pourcentages Une distribution de pourcentages nous montre ce que serait la distribution de fréquence si le nombre total de cas était exactement 100 Pourcentage = f / N * 100 où f = fréquence N = Nombre total de cas Plus facilement interprétable qu’une distribution de fréquences
1.1 – Les distributions de pourcentages Répartition des répondants selon le sexe (en fréquences et en pourcentages) Sexe des répondants f pourcentages Hommes 719 33.6 Femmes 1424 66.4 Total 2143 100.0 f / N * 100 = (719 / 2143) * 100 = 0.336 * 100 = 33.6
1.1 – Les distributions de pourcentages ATTENTION : pour que les pourcentages soient ‘fiables’, le nombre de cas doit être élevé Règle d’usage : minimum 50 cas idéalement plus de 100 cas
1.1 – Les distributions de pourcentages Nombre d’enfants des répondants (avec des enfants) Nombre d’enfants f pourcentages 1 15 46.9 5 33.3 2 10 31.3 4 26.7 3 9.4 20.0 12.5 total 32 100.0
1.2 – Les distributions de pourcentages cumulatifs Un pourcentage cumulatif est le pourcentage de toutes les observations égales ou inférieurs à une valeur donnée pourcentage cumulatif = F / N * 100 où F = fréquence cumulative pertinent pour les distributions ordinales ou d’intervalles/ratio
1.2 – Les distributions de pourcentages cumulatifs Nombre d’enfants des répondants (avec enfants) Nombre d’enfants f pourcentage pourcentage cumulatif 1 80 54.1 2 47 31.8 85.8 3 11 7.4 93.2 4 et plus 10 6.8 100.0 Total 148 F F / N * 100 = (80 + 47 + 11) / 148 * 100 = (138 / 148) * 100 = 0.932 * 100 = 93.2
2 – Présentation des tableaux de résultats Quelques règles générales : Un titre clair et complet : phénomène étudié, le lieu, la date, la population de référence Intitulés des lignes et des colonnes : noms clairs pour décrire les variables et leurs valeurs, mentionner s’il s’agit de fréquences, de taux ou de pourcentages Le nombre total de cas (N) doit être inscrit La source des données doit être mentionnée
2 – Présentation des tableaux de résultats Tableau 1 : Répartition de la population selon l’état matrimonial, Canada, 2007 * Inclus les personnes légalement mariées et séparées et les personnes vivant en union libre Source : Statistique Canada (http://www40.statcan.gc.ca/l02/cst01/famil01-fra.htm) État matrimonial f pourcentage Célibataires 13 800 997 41.8 Marié(e)s* 15 916 860 48.3 Veuf(ve)s 1 573 455 4.8 Divorcé(e)s 1 684 714 5.1 Total 32 976 026 100.0
2 – Présentation des tableaux de résultats Pour commenter les tableaux de résultats, il suffit de traduire en mots simples ce que les chiffres suggèrent Ex. : La tableau 1 montre qu’en 2007, près de la moitié de la population canadienne était légalement mariée, séparée ou vivait en union libre
2 – Présentation des tableaux de résultats Attention au traitement des données manquantes (ne sais pas, sans réponse, refus, ne s’applique pas) généralement ces valeurs sont exclues mais la décision d’exclure ces observations dépend de la question de recherche Exclure les données manquantes change le N
2 – Présentation des tableaux de résultats Tableau 2 : Répartition des répondants selon l’état matrimonial, 18 ans et plus, Canda, 2004 Source : GENACIS (GENder Alcohol and Culture: an International Study) État matrimonial f pourcentage Marié Union libre Veuf Divorcé Séparé Jamais marié Ne sais pas Refus 6831 1472 718 1138 606 3244 13 45 48.6 10.5 5.1 8.1 4.3 23.1 0.1 0.3 48.8 23.2 Total 14067 100.0 14009
2 – Présentation des tableaux de résultats Tableau 3 : Satisfaction du travail pour les travailleurs, 18 ans et plus, Canada, 2004 satisfaction f pourcentage Très satisfait Satisfait Peu satisfait Pas satisfait Sans objet Ne sais pas refus 4384 4085 650 207 4694 40 7 31.2 29.0 4.6 1.5 33.4 0.3 0.0 Total 14067 100.0 satisfaction f pourcentage Très satisfait Satisfait Peu satisfait Pas satisfait 4384 4085 650 207 47.0 43.8 7.0 2.2 Total 9326 100.0 Source : GENACIS (GENder Alcohol and Culture: an International Study)
3.1 – Les diagrammes circulaires Le diagramme circulaire est un cercle dont la surface est divisée en tranches représentant les catégories de la variable et ou chaque tranche est proportionnelle à l’effectif de la catégorie qu’elle représente Principalement utilisé pour les variables nominales avec un petit nombre de catégories
3.1 – Les diagrammes circulaires
3.2 – Les diagrammes en bâtons Le diagramme en bâton est constitué de bandes représentant les catégories de la variable et ou chaque bande est proportionnelle à l’effectif de la catégorie qu’elle représente Généralement utilisé pour représenter la répartition des variables discrètes avec de nombreuses catégories
3.2 – Les diagrammes en bâtons
3.3 – L’histogramme L’histogramme est utilisé pour représenter graphiquement la distribution d’une variable continue en ses différentes classes de données Même principe que pour le diagramme en bâton, mais les bandes sont collées Le choix de la largueur des bandes influence l’aspect visuel
3.3 – L’histogramme
3.3 – L’histogramme Données extrêmes
3.4 – Faire mentir les graphiques... “La représentation des nombres par des grandeurs physiques mesurées sur la surface de l’illustration elle-même devrait être directement proportionnelle aux quantités représentée.” Source: Tufte (2001) The Visual Display of Quantitative Information p. 70
3.4 – Faire mentir les graphiques...
4 – Exemple : Activité et chômage au Canada en 2008 Répartiton de la population canadienne âgée de 15 ans et plus selon le statut d’activité, 2008 Statut d’activité f pourcentage Travailleurs 17 125 800 Chômeurs 1 119 300 Innactifs 8 679 600 Total 26 924 700 Source: Statistique Canada (http://www40.statcan.gc.ca/l02/cst01/econ10-fra.htm) Calculer le taux d’activité et le taux de chômage