Introduction à une analyse statistique de données Atelier TM / Juin 2007 Paul-André Garessus
Objectifs de l‘atelier Connaître les éléments de base de la statistique descriptive Mettre en forme des données brutes et les représenter graphiquement de manière appropriée Connaître les mesures centrales principales et leurs propriétés Connaîtres quelques mesures de dispersion RÉPONDRE À VOS BESOINS! Juin 2007/Ga Atelier TM
Eléments de base Population Individu Variable Étudiants au Gymnase de la rue des Alpes en 2007 Aiguilles de montre fabriquées par l‘usine n°3 en mai 2004 Un/une étudiant/e Une aiguille de montre Age, classe, OS, date de naissance, genre, … Couleur, longueur, prix,… Juin 2007/Ga Atelier TM
Démarche générale (analyse statistique) Définir précisément la population étudiée Choisir entre un recensement ou un sondage Créer les instruments (par ex. un questionnaire) Récolter les données brutes Mettre en forme les données Analyser et représenter les données Interpréter et communiquer les résultats Juin 2007/Ga Atelier TM
Types de variables Qualitatives Quantitatives Langue maternelle, genre, profession, couleur des yeux, lieu d’origine, numéro AVS, …. Taille, salaire mensuel, nombre d’enfants, dimensions, … On peut effectuer des opérations (+,-,x,/) sur les valeurs Juin 2007/Ga Atelier TM
Variables quantitatives Continue Discrète Tailles, salaires, dimensions,… Dénombrement (nombre de…) Prend toutes les valeurs possibles dans des intervalles Prend des valeurs isolées Juin 2007/Ga Atelier TM
Mise en forme des données Création d’un tableau statistique Choix du type de graphique Juin 2007/Ga Atelier TM
Types de graphique selon le type de variable Quantitative Qualitative Diagramme en bâtons Diagramme circulaire Histogramme Discrète Continue Juin 2007/Ga Atelier TM
Mesures centrales Exemples Une mesure centrale est une valeur qui résume à elle seule une variable étudiée. Elle doit être représentative de la population. Exemples Moyenne arithmétique Médiane Mode Juin 2007/Ga Atelier TM
Moyenne arithmétique Définition Valeurs Fréquences (effectifs) x1 n1 … xk nk Juin 2007/Ga Atelier TM
Médiane Si les valeurs d’une variable étudiée sont rangées en ordre croissant, la médiane est la valeur située exactement au milieu de la distribution. Ainsi, en général, 50% des individus prennent une valeur inférieure à la médiane. (Evidemment, les autres 50% prennent en général une valeur supérieure à la médiane) Juin 2007/Ga Atelier TM
Le mode Le mode est la valeur ayant la fréquence la plus élevée Dans le cas d’une variable continue, on parle de classe modale S’il existe deux modes, on parle de variable bimodale. Juin 2007/Ga Atelier TM
Propriétés des mesures centrales Equilibre les écarts positifs et négatifs (« balance ») Sensible aux valeurs extrêmes Insensible aux valeurs extrêmes N’est pas forcément « centrée » Moyenne arithmétique Médiane Mode Juin 2007/Ga Atelier TM
Mesures de dispersion Une mesure de dispersion est liée à une mesure centrale. Elle indique comment les valeurs de la variable sont distribuées autour de la mesure centrale. (valeurs très dispersées ou plutôt regroupées) Juin 2007/Ga Atelier TM
Exemples Étendue Écart moyen Quartiles, déciles, centiles Écart-type et variance Juin 2007/Ga Atelier TM
Variance et écart-type La variance est notée L’écart-type est la racine carrée de la variance Juin 2007/Ga Atelier TM
Références http://www.lirmm.fr/~jq/Cours/SOCIO/XS3S15M/quiz/variablesc.htm (quizz type de variable) http://www.virtuel.collegebdeb.qc.ca/intermath/stats/stats.htm (exemples de graphiques) Juin 2007/Ga Atelier TM