Les statistiques, pour quoi faire ?

Slides:



Advertisements
Présentations similaires
5. Statistiques.
Advertisements

Pr. Abdelkrim EL MOUATASIM EST de Guelmim Maroc
Présentation des données
Estimation ponctuelle Estimation par intervalle de confiance
Statistique descriptive
Chapitre 5. Description numérique d’une variable statistique.
Les Variables statistiques continues
Comparaison de deux moyennes observées
Inférence statistique
1. Les caractéristiques de dispersion. 11. Utilité.
Notions de variable aléatoire et de probabilité d’un événement
Statistique et probabilités au collège
Quelques exercices sur les probabilités
Le plan des cours d’analyse ‘Etude des phénomènes variables’
Tableau de bord. Tableau de bord QCM personnalisés.
Primitives - Intégration
La régression simple Michel Tenenhaus
Modèle Linéaire Généralisé (Proc Genmod)
Description et estimation
Analyse de la variance à un facteur
Cinématique Étude du mouvement d’un corps en fonction du temps, indépendamment de toute cause pouvant le provoquer ou le modifier. Le mouvement s’effectue.
Révision Module 4 Fractions & Pourcentages
Mai 2010Paul-Marie Bernard Université Laval 1 Les variables au plan formel 1.Définitions 2.Variable quantitative 3.Variable ordinale 4.Variable qualitative.
Service de formation en indemnisation Valeur au jour du sinistre ou valeur à neuf.
High Frequency Trading Introduction. Séminaires de 30 minutes, une fois par semaine (8 en tout) Sujets abordés – Définition dun algorithme et introduction.
Petite introduction au logiciel de traitement statistique SPSS
07/23/
Courbes elliptiques.
Les traitements à plat Cette partie du cours abordera les traitements élémentaires d’une enquête. Les analyses uni-variées, ou tris à plat, sont en fait.
Géo 6: Se repérer sur Terre
Activités sur les statistiques à une variable
L’OUTIL STATISTIQUE.
Les principaux résumés de la statistique
Groupe 1: Classes de même intervalle
Opération et systèmes de décision Faculté des Sciences de l administration MQT Probabilités et statistique Mesures caractéristiques.
Comprendre la variation dans les données: Notions de base
Statistique descriptive
La statistique descriptive
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Modélisation Nuage de points.
Modélisation et analyse de la variabilité dans une chaîne logistique par Laurence Morlet Promoteur : Philippe Chevalier Lecteurs : Laurence.
Séries chronologiques et prévision
Rappels de statistiques descriptives
COURS STATISTIQUE - DESCRIPTIVE DEFINITIONS
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
Intervalles de confiance pour des proportions L’inférence statistique
ANALYSE D’UN ÉCHANTILLON PORTANT SUR UNE VARIABLE STATISTIQUE
Seconde partie Cours de seconde
STATISTIQUE DESCRIPTIVE Dr LEMDAOUI MOHAMED CHERIF
Introduction à une analyse statistique de données
Statistiques descriptives-Distributions expérimentales à une dimension
VARIABLES ET MESURES DE FREQUENCES Pr. KELLIL M 1.
Concepts fondamentaux: statistiques et distributions
1 Licence Stat-info CM1 b 2004Christophe Genolini 2.1. Vocabulaire Individu : objet étudié Population : Ensemble des individus Variable : nom donné à ce.
Méthodologie de l’observation
PARAMETRES STATISTIQUES
STATISTIQUES DESCRIPTIVES
STATISTIQUE DESCRIPTIVE Dr LEMDAOUI MOHAMED CHERIF
Statistique Descriptive Les Paramètres de Tendance Centrale
BIOSTATISTIQUES Définitions.
BIOSTATISTIQUES Définitions.
Mesures de description des valeurs des variables
Nature de la statistique La statistique est la science qui étudie la collecte, la présentation, l’analyse et l’utilisation des données numériques en vue.
 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs.
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
Notions de statistiques et d’analyse de données Master 1 MGS – Sarah MISCHLER –
STATISTIQUE DESCRIPTIVE
Statistiques.
Transcription de la présentation:

Les statistiques, pour quoi faire ? Introduction Les statistiques, pour quoi faire ? - Le recours à la statistique permet de décrire des phénomènes à l’aide de mesures, de tableaux et de graphiques. Elle permet d’établir l’existence de lien entre certains phénomènes, d’expliquer des relations entre des indicateurs par un modèle mathématique. - Et enfin de généraliser des résultats obtenus sur un petits groupes à l’ensemble d’une population. Imed Ben Mahmoud Statistiques

Il y a trois types d’analyse statistique : Introduction Il y a trois types d’analyse statistique : - Résumé des données : c’est la plus commune, celle qu’on trouve dans nos journaux. Elle décrit simplement les données. Le calcul de moyenne, d’écart type, de pourcentage et leur représentation graphique entrent dans cette catégorie. Test statistique : un test permettra de répondre à une question : « y a-t-il plus de cancer chez ceux qui fument ? » Les tests statistiques tranchent…avec une fiabilité variable, mais que l’on peut connaître. Modélisation : enfin, les statistiques permettent de décrire le monde de manière raisonnablement précise et de jouer aux devinettes. Sur les trois dernières années, aucun des étudiants qui ont entre 10 et 11 en licence n’ont eu le CAPEPS. On peut donc « parier » raisonnablement que cette années, il en sera de même et donc déconseiller cette voie à ceux qui n’ont pas eu de mention du tout. Naturellement, rien n’est sûr et l’on peut se tromper, mais statistiquement, c’est rare. Imed Ben Mahmoud Statistiques

Définitions Un Individu : (ou Sujet, ou Unité statistique) est l’objet étudié. La Population : est l’ensemble de tous les individus (effectif = N). Un Echantillon : est une fraction de la population (effectif = n). Une Variable (ou Caractère) est-ce qui est étudié chez les individus (et qui a priori varie d’un individu à l’autre). Les Modalités (ou Ensemble fondamental) d’une variable sont toutes les valeurs que cette variable peut prendre. Imed Ben Mahmoud Statistiques

La statistique descriptive Les renseignements que l’on détient sur une population sont généralement inutilisables sous leur forme brute. Il convient de procéder à des regroupements, à des classements et à l’établissement de tableaux statistiques en distinguant les séries selon la nature du caractère : qualitatif, quantitatif discontinu ou continu. Une mise en ordre des résultats obtenus qui se traduit par des tableaux ; Visualisation des regroupements opérés sous forme de figure ; Analyse numérique aboutissant à des indices. Imed Ben Mahmoud Statistiques

Les variables Les caractéristiques des individus portent le nom de variables parce qu’elles peuvent varier d’un individu à l’autre. Le sexe, la profession, l’âge, le revenu, la situation matrimoniale, le niveau de diplôme la consommation d’un biceps en oxygène, l’opinion politique sont des exemples de variables connues. Imed Ben Mahmoud Statistiques

Nature d’une variable En pratique, toutes les variables n’ont pas les mêmes propriétés. Par exemple, on peut faire la moyenne des températures mais pas la moyenne des Oui/Non. Trois propriétés intéressent particulièrement les statisticiens : 1. Arithmétique : peut-on additionner les observations entre elles ? 2a. Comparaison : cela a-t-il du sens de dire q’une observation est plus grande qu’une autre ? 2b. Continuité : le nombre de modalités est-il petit ou grand ? Imed Ben Mahmoud Statistiques

Nature d’une variable Imed Ben Mahmoud Statistiques

Variables qualitatives Les variables qualitatives contiennent des données qui s’évaluent avec des mots et non avec des nombres. Elles mesurent une qualité de l’individu et non une quantité : le métier, le sexe, le groupe sanguin, la mention au bac… Les différentes formes que peut prendre une variable qualitative sont appelées modalités. La variable « sexe » possède deux modalités : sexe masculin et sexe féminin, et l’on ne peut appartenir qu’à une seule des modalités de cette variable. Ces variables qualitatives peuvent être nominales ou ordinales. Imed Ben Mahmoud Statistiques

Variables qualitatives Une Variable nominale est une variable dont on ne peut additionner, ni les ordonner les modalités. Une Variable ordonnée est une variable dont on ne peut pas additionner les modalités, mais dont on peut les ordonner. Alors qu’une variable nominale répond à une classification, une variable ordinale correspond à un classement. Imed Ben Mahmoud Statistiques

Présentation des données (variable qualitative) Liste brute liste triée Résultat Perdu Nul Gagné Résultat Perdu Nul Gagné Résultat Effectif Perdu 5 Nul 3 Gagné 2 Total 10 Imed Ben Mahmoud Statistiques

Présentation des données (variables qualitatives) Représentation graphique : Diagramme en bandeaux Résultat Effectif Perdu 5 Nul 3 Gagné 2 Total 10 Imed Ben Mahmoud Statistiques

Présentation des données (variable qualitative) Représentations graphiques possibles : Le graphe en bandeaux Le graphe en points Le camembert Imed Ben Mahmoud Statistiques

Variables quantitatives (ou numérique) Une variable est quantitative lorsque ses modalités sont de nature numérique, elles prennent donc la forme de nombres réels. Le terme « valeur » remplace ici celui de « modalités ». C’est la variable la plus utilisé. Elle comprend toutes les mesures sur lesquelles il est possible de faire des opérations et des comparaisons : performances sportives, notes, nombre de membre de clubs, l’âge, la taille d’un individu, … Les variables numériques peuvent être continues ou discrètes et peuvent utiliser des échelles d’intervalles ou de rapports. Imed Ben Mahmoud Statistiques

Variables quantitatives (ou numérique) On dit qu’une variable est continue si elle peut supposer un nombre infini de valeurs réelles. L’âge , la taille d’une personne, la température. Ainsi une personne peut être âgée de 25 ans, 2 mois, 24 jours, 11 heures, 15 minutes, 20 secondes…elle peut mesurer 1,958186…mètre. Les variables continues sont donc le plus souvent arrondies, et regroupé en « intervalles en classes », les 25-30 ans. Contrairement aux variables continues, une variables discrète ne peut revêtir qu’un nombre défini de valeurs réelles. Le revenu, le score obtenu à un test, le nombre d’enfants. Un étudiant peut obtenir une note qui varie entre 0 et 20. Imed Ben Mahmoud Statistiques

L’échelle d’intervalles Cette échelle de mesure quantitative utilise une unité de mesure normalisée et un zéro relatif qui permettent d'évaluer des écarts à l'aide de deux opérations simples : l'addition et la soustraction. Le zéro est dit « relatif » car il fixe, par convention, l'origine de l'échelle. Nature de l'échelle d'intervalles Origine de l'échelle. zéro relatif Unité de mesure normalisée Exemples d'application La mesure du temps Naissance du Christ dans le calendrier grégorien L'année 1 an il s’est écoulé 513 ans depuis la découverte du Nouveau Monde par Christophe Colomb. (2005 -1492 = 513) La mesure de la température Température à laquelle l’eau gèle en degrés Celsius 1 degré Celsius 1°C Hier, il y avait un écart de 12 °C entre Cherbourg et Marseille.. (25 à Marseille - 13 à Cherbourg = 12) La mesure de l’altitude Niveau de la mer Le mètre 1m Le mont Blanc culmine à 4 807 m. Imed Ben Mahmoud Statistiques

L’échelle de rapport Cette échelle de mesure est considérée comme la plus précise car elle autorise tous les calculs arithmétiques: addition, soustraction, multiplication et division. Elle se distingue de l'échelle d'intervalles par le fait qu'elle utilise un « zéro absolu » qui renvoie à l'absence de la caractéristique mesurée. Nature de l’échelle de rapports Origine de l’échelle: zéro absolu Unité de mesure normalisée Exemples d’application La taille Absence de taille 0 cm Le centimètre 1 cm À 15 ans, Rémi mesurait 185 cm, il était 1,12 fois plus grand que son ami Thierry qui mesurait 165 cm. (185 / 165 = 1,12) L’âge Absence d’âge 0 an L’année 1 an Cette personne est 3 fois plus jeune que les personnes présentes à cette assemblée. Le nombre d’enfants d'un couple Pas d’enfant 1 enfant Ce couple de 4 enfants à 2 fois plus d'enfants que l’ensemble des couples français. Imed Ben Mahmoud Statistiques

Présentation des données (variables quantitatives) Variables quantitatives discontinues (ou discrètes) Exemple : Au cours d’une journée de championnat de France de football de première division, la distribution des 20 clubs selon le nombre de buts marqués est la suivante : Nombre de buts marqués Effectifs des clubs ou fréquence absolues Effectifs cumulés absolus Fréquences relatives Fréquences cumulées relatives 10 0,5 1 2 12 0,1 0,6 14 0,7 3 5 19 0,25 0,95 4 6 20 0,05 Total   Fréquence relative : « n/N » Imed Ben Mahmoud Statistiques

Présentation des données (variables quantitatives) Variables quantitatives discontinues (ou discrètes) Représentation graphique : Diagramme en Bâtons Imed Ben Mahmoud Statistiques

Présentation des données (variables quantitatives) Variables quantitatives continues : Exemple : On a mesuré la taille au centimètre près de chacun des concurrents de l’épreuve du marathon des jeux Olympiques d’Athènes en 2004. On dispose de 73 résultats. Imed Ben Mahmoud Statistiques

Présentation des données (variables quantitatives) Taille en cm 160 175 180 170 174 168 165 181 169 171 176 173 201 161 179 172 167 190 178 185 166 156 183 Valeurs limites de l’intervalle : Min : 156 Max : 201 Découpage en 12 classes de 4 cm Imed Ben Mahmoud Statistiques

Présentation des données (variables quantitatives) Variables quantitatives continues : Classes Effectifs Fréquences 156 à 159 1 0,0137 160 à 163 8 0,1096 164 à 167 9 0,1233 168 à 171 20 0,2740 172 à 175 16 0,2191 176 à 179 180 à 183 6 0,0822 184 à 187 2 0,0274 188 à 191 192 à 195 196 à 199 200 à 203 N = 73 Imed Ben Mahmoud Statistiques

Présentation des données (variables quantitatives) Variables quantitatives continues : Représentation graphique : Histogramme Imed Ben Mahmoud Statistiques

Analyse numérique Cette partie de la statistique descriptive consiste notamment à calculer quelques valeurs caractéristiques qui synthétisent l’ensemble des données. Ces valeurs typiques sont appelées indices ou paramètres. On distingue les paramètres de tendance centrale et les paramètres de dispersion. Imed Ben Mahmoud Statistiques

Analyse numérique Imed Ben Mahmoud Statistiques

Analyse numérique Le Mode C’est la valeur du caractère qui correspond à l’effectif le plus grand ou la fréquence la plus importante. C’est le caractère le plus dominant. Imed Ben Mahmoud Statistiques

Analyse numérique La Médiane Cas des séries à caractères discontinus ou données non regroupées : Si le nombre d’éléments est impair : (2 n + 1) ; la Médiane est le rang (n + 1) Si le nombre d’éléments est pair : (2 n) ; la Médiane est déterminée dans l’intervalle séparant le terme de rang (n) et le terme de rang (n + 1) Imed Ben Mahmoud Statistiques

Analyse numérique La Médiane Classes Effectifs Effectifs cumulés 156 à 159 1 160 à 163 8 9 164 à 167 18 168 à 171 20 38 172 à 175 16 54 176 à 179 63 180 à 183 6 69 184 à 187 2 71 188 à 191 72 192 à 195 196 à 199 200 à 203 73 N = 73 Cas des séries à caractères continus ou données regroupées : Il faut d’abord calculer les effectifs cumulés, Imed Ben Mahmoud Statistiques

Analyse numérique La Médiane Cas des séries à caractères continus ou données regroupées : L’effectif total étant de n = 73, il faut rechercher la taille du sujet n / 2, soit 36,5. En consultant la colonne des effectifs cumulés on voit que la position 36,5 se trouve dans la classe 168 – 171 (dont les bornes exactes sont 167,5 – 171,5). 18 sujets mesurent moins de 167,5 cm (effectifs cumulés de la classe 164 – 167). Il nous manque donc pour atteindre la position 36,5 la différence entre 36,5 et 18, soit 18,5 sujets. On cherche donc dans la classe 168 – 171, qui comprend 20 sujets, La taille du 18,5ème. Si les sujets sont répartis uniformément sa distance à la borne inférieure de la classe est de 18,5 / 20 * 4 cm, l’intervalle de classe étant de 4 cm. La valeur de la médiane est de ce fait égale à : 167,5 + 18,5 / 20 * 4 = 171,2 cm. Imed Ben Mahmoud Statistiques

Analyse numérique La Moyenne Lorsque les données sont regroupées en classes on considère que chaque valeur de la classe est représentée par le centre de la classe. M = ni xi / ni M = 12553,5 / 73 =171,97 Imed Ben Mahmoud Statistiques

Analyse numérique L’étendue On appelle ’’étendue’’ d’une distribution la mesure de l’intervalle séparant les deux valeurs extrêmes de cette distribution. E = Xmax – Xmin E = 201 – 156 = 45 Imed Ben Mahmoud Statistiques

Analyse numérique La Variance (ni xi²) - (ni xi)² / N S² = —————————————— N - 1 Imed Ben Mahmoud Statistiques

Analyse numérique L’Ecart-type S = racine de S² Imed Ben Mahmoud Statistiques

Analyse numérique Coefficient de Variation CV = S / M * 100, M ≠ 0 Imed Ben Mahmoud Statistiques

Analyse numérique Les quantiles Imed Ben Mahmoud Statistiques

Caractéristiques de formes : Asymétrie Valeurs de Sk Type d'asymétrie Négative Asymétrie négative Nulle Distribution symétrique Positive Asymétrie positive Imed Ben Mahmoud Statistiques

Caractéristiques de formes : Asymétrie M = Me = Mo Imed Ben Mahmoud Statistiques

Caractéristiques de formes : Asymétrie M > Me > Mo Les observations présentent un étalement plus important sur le côté supérieur de la distribution Imed Ben Mahmoud Statistiques

Caractéristiques de formes : Asymétrie M < Me < Mo Les observations présentent un étalement plus important sur le côté inférieur de la distribution Imed Ben Mahmoud Statistiques

Caractéristiques de formes : Aplatissement d’une distribution Si α4 > 3, la courbe est leptokurtique (courbe aigüe) Si α4 = 3, la courbe est mésokurtique (courbe normale) Si α4 < 3, la courbe est platykurtique (courbe aplatie). Imed Ben Mahmoud Statistiques