Plan la séance 10 Analyse des données quantitatives Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures de forme Utilisation du logiciel SPSS Atelier Démonstration du logiciel SPSS Traitement des données recueillies avec SPSS Rencontre de chacune des équipes avec le professeur
Analyse statistique Ressource Web http://www.statcan.gc.ca/edu/power-pouvoir/toc-tdm/5214718-fra.htm
Analyse de fréquences (1 de 2) Fondement de l’analyse statistique Analyse de la distribution des réponses une variable à la fois : Selon le nombre de réponses (effectif) Selon le pourcentage de réponses Présentation : Tableau Graphique Source : http://www.mineful.com/analytics/frequency-distribution-analysis.html
Analyse de fréquences (2 de 2) Permet d’évaluer l’importance des réponses manquantes : Pourcentage valide exclue les réponses manquantes Permet d’évaluer la présence de données hors norme (anormales) : P. ex., la valeur 6 pour une variable codifiée de 1 à 5 Source : http://www.mineful.com/analytics/frequency-distribution-analysis.html
Tableau de fréquences Variable Consommation
Graphique de fréquences Variable Consommation
Mesures de position centrale Mode : Valeur la plus fréquente Certaines données peuvent être bimodales Médiane : Valeur centrale d’un ensemble ordonné de réponses Moyenne : Somme des réponses divisée par le nombre de réponses Pour une courbe normale, les trois valeurs sont identiques et centrées sur la courbe Mode Médiane Moyenne
Mesures de position centrale en fonction du type d’échelle utilisé Mesure de tendance centrale Nominale Mode Ordinale Médiane, mode D’intervalles Moyenne, médiane De proportions (rapport, ratio) Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2011), Études Marketing avec SPSS, 6e éd., Paris: Pearson Éducation France.
Problèmes avec la moyenne Statistique très affectée par les valeurs extrêmes Moyenne unique seulement hypothétique pour les courbes bicéphales (voir ci-contre) Souvent peu de réponses , voire aucune, près de la moyenne (grands écarts types) Ne pas exagérer la précision : (5000+3000+2000)/3 = 3333 3300 suffisant Tiré et adapté de: McGown (1979), Marketing Research: Text and Cases, Cambridge : Winthrop Publishers
Mesures de dispersion Écart type (S) : Écart (ou étendue) : Mesure de dispersion autour de la moyenne La plus utilisée Variance = Moyenne des carrés des écarts à la moyenne Écart type = Racine carrée de la variance Écart (ou étendue) : Différence entre les valeurs maximale et minimale Source : http://www.socialresearchmethods.net/kb/statdesc.php
Présentation de la moyenne et de l’écart type pour plusieurs aspects d’une même question Gracieuseté des étudiants suivants du EUT4108 H2009: Marie-Ève Aubry, Alexandre Champagne, Alexandra Fauteux, Mathieu Lavoie, Micheline Petit
Relation entre l’écart type et la courbe normale -1 +1 -2 -3 +2 +3 68% 95% 99% Mode Médiane Moyenne Conventional Product Adoption Life Cycle: Five types of customers who will end up adopting a product INNOVATORS (2.5%): People who are the first to adopt a product. They are trend-setting, risk-taking, and are not typical consumers. Example: See a movie first weekend it’s out or in a preview. EARLY ADOPTERS (13.5%): People who are among the first but not as risk-taking. They adopt ideas early but with consideration, and they enjoy roles as opinion leaders. They spread the word about the product. Example: See a movie the first week of its release. EARLY MAJORITY (34%): Deliberate customers; adopt earlier than most customers but are not leaders. Example: See a movie after a few weeks, after reading all the reviews and getting recommendations from early adopters. LATE MAJORITY (34%): Skeptical customers, will only adopt an idea if the majority of people have tried it. Example: See a movie after it has been nominated for an Oscar. LAGGARDS (16%): Tradition-bound, suspicious of change; will adopt an idea only after it has been around long enough. Example: See a movie after it has come out on video.
Mesures de formes Symétrie (skewness) : Aplatissement (kurtosis) : mesure indiquant que les déviations par rapport à la moyenne sont plus importantes dans une direction, à gauche (si valeur positive), ou à droite (si valeur négative) Symétrie d’une distribution normale = 0 Aplatissement (kurtosis) : Mesure indiquant que la courbe de la distribution de fréquence est plus plate (si valeur négative), ou moins plate (si valeur positive), par rapport à une courbe normale Aplatissement d’une distribution normale = 0 Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2011), Études Marketing avec SPSS, 6e éd., Paris: Pearson Éducation France.
Symétrie de la distribution Distribution asymétrique Skewness = négatif Distribution asymétrique Skewness = positif Distribution symétrique Skewness = 0 Source : http://experimentaltheology.blogspot.ca/2012/03/central-tendency-in-skewed.html
Aplatissement de la distribution Source : http://mvpprograms.com/help/mvpstats/distributions/SkewnessKurtosis
La courbe de la variable Consommation est-elle normale?
Statistiques de la variable Consommation Moyenne Médiane Mode Écart type Symétrie Aplatissement Étendue
La courbe de la variable Âge est-elle normale?
Statistiques de la variable Âge Moyenne Médiane Mode Écart type Symétrie Aplatissement Étendue
Utilisation du logiciel SPSS Importer des données du fichier Excel à SPSS Ajouter de nouvelles données une fois le fichier Excel importé dans SPSS Identifier les variables et leurs valeurs, et la ou les valeurs pour les données manquantes : Guide interactif « Comment identifier les variables et leurs valeurs » Créer une nouvelle variable avec des catégories : Guide interactif « Comment créer une variable avec des catégories » Réaliser les analyses de fréquences : Guide interactif « Comment réaliser une analyse des fréquences » Ressource Web : Site SPSS de l'Université de Sherbrooke
Atelier Démonstration du logiciel SPSS Traitement des données recueillies avec SPSS Rencontre de chacune des équipes avec le professeur