La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Les statistiques, pour quoi faire ?

Présentations similaires


Présentation au sujet: "Les statistiques, pour quoi faire ?"— Transcription de la présentation:

1 Les statistiques, pour quoi faire ?
Introduction Les statistiques, pour quoi faire ? - Le recours à la statistique permet de décrire des phénomènes à l’aide de mesures, de tableaux et de graphiques. Elle permet d’établir l’existence de lien entre certains phénomènes, d’expliquer des relations entre des indicateurs par un modèle mathématique. - Et enfin de généraliser des résultats obtenus sur un petits groupes à l’ensemble d’une population. Imed Ben Mahmoud Statistiques

2 Il y a trois types d’analyse statistique :
Introduction Il y a trois types d’analyse statistique : - Résumé des données : c’est la plus commune, celle qu’on trouve dans nos journaux. Elle décrit simplement les données. Le calcul de moyenne, d’écart type, de pourcentage et leur représentation graphique entrent dans cette catégorie. Test statistique : un test permettra de répondre à une question : « y a-t-il plus de cancer chez ceux qui fument ? » Les tests statistiques tranchent…avec une fiabilité variable, mais que l’on peut connaître. Modélisation : enfin, les statistiques permettent de décrire le monde de manière raisonnablement précise et de jouer aux devinettes. Sur les trois dernières années, aucun des étudiants qui ont entre 10 et 11 en licence n’ont eu le CAPEPS. On peut donc « parier » raisonnablement que cette années, il en sera de même et donc déconseiller cette voie à ceux qui n’ont pas eu de mention du tout. Naturellement, rien n’est sûr et l’on peut se tromper, mais statistiquement, c’est rare. Imed Ben Mahmoud Statistiques

3 Définitions Un Individu : (ou Sujet, ou Unité statistique) est l’objet étudié. La Population : est l’ensemble de tous les individus (effectif = N). Un Echantillon : est une fraction de la population (effectif = n). Une Variable (ou Caractère) est-ce qui est étudié chez les individus (et qui a priori varie d’un individu à l’autre). Les Modalités (ou Ensemble fondamental) d’une variable sont toutes les valeurs que cette variable peut prendre. Imed Ben Mahmoud Statistiques

4 La statistique descriptive
Les renseignements que l’on détient sur une population sont généralement inutilisables sous leur forme brute. Il convient de procéder à des regroupements, à des classements et à l’établissement de tableaux statistiques en distinguant les séries selon la nature du caractère : qualitatif, quantitatif discontinu ou continu. Une mise en ordre des résultats obtenus qui se traduit par des tableaux ; Visualisation des regroupements opérés sous forme de figure ; Analyse numérique aboutissant à des indices. Imed Ben Mahmoud Statistiques

5 Les variables Les caractéristiques des individus portent le nom de variables parce qu’elles peuvent varier d’un individu à l’autre. Le sexe, la profession, l’âge, le revenu, la situation matrimoniale, le niveau de diplôme la consommation d’un biceps en oxygène, l’opinion politique sont des exemples de variables connues. Imed Ben Mahmoud Statistiques

6 Nature d’une variable En pratique, toutes les variables n’ont pas les mêmes propriétés. Par exemple, on peut faire la moyenne des températures mais pas la moyenne des Oui/Non. Trois propriétés intéressent particulièrement les statisticiens : 1. Arithmétique : peut-on additionner les observations entre elles ? 2a. Comparaison : cela a-t-il du sens de dire q’une observation est plus grande qu’une autre ? 2b. Continuité : le nombre de modalités est-il petit ou grand ? Imed Ben Mahmoud Statistiques

7 Nature d’une variable Imed Ben Mahmoud Statistiques

8 Variables qualitatives
Les variables qualitatives contiennent des données qui s’évaluent avec des mots et non avec des nombres. Elles mesurent une qualité de l’individu et non une quantité : le métier, le sexe, le groupe sanguin, la mention au bac… Les différentes formes que peut prendre une variable qualitative sont appelées modalités. La variable « sexe » possède deux modalités : sexe masculin et sexe féminin, et l’on ne peut appartenir qu’à une seule des modalités de cette variable. Ces variables qualitatives peuvent être nominales ou ordinales. Imed Ben Mahmoud Statistiques

9 Variables qualitatives
Une Variable nominale est une variable dont on ne peut additionner, ni les ordonner les modalités. Une Variable ordonnée est une variable dont on ne peut pas additionner les modalités, mais dont on peut les ordonner. Alors qu’une variable nominale répond à une classification, une variable ordinale correspond à un classement. Imed Ben Mahmoud Statistiques

10 Présentation des données (variable qualitative)
Liste brute liste triée Résultat Perdu Nul Gagné Résultat Perdu Nul Gagné Résultat Effectif Perdu 5 Nul 3 Gagné 2 Total 10 Imed Ben Mahmoud Statistiques

11 Présentation des données (variables qualitatives)
Représentation graphique : Diagramme en bandeaux Résultat Effectif Perdu 5 Nul 3 Gagné 2 Total 10 Imed Ben Mahmoud Statistiques

12 Présentation des données (variable qualitative)
Représentations graphiques possibles : Le graphe en bandeaux Le graphe en points Le camembert Imed Ben Mahmoud Statistiques

13 Variables quantitatives (ou numérique)
Une variable est quantitative lorsque ses modalités sont de nature numérique, elles prennent donc la forme de nombres réels. Le terme « valeur » remplace ici celui de « modalités ». C’est la variable la plus utilisé. Elle comprend toutes les mesures sur lesquelles il est possible de faire des opérations et des comparaisons : performances sportives, notes, nombre de membre de clubs, l’âge, la taille d’un individu, … Les variables numériques peuvent être continues ou discrètes et peuvent utiliser des échelles d’intervalles ou de rapports. Imed Ben Mahmoud Statistiques

14 Variables quantitatives (ou numérique)
On dit qu’une variable est continue si elle peut supposer un nombre infini de valeurs réelles. L’âge , la taille d’une personne, la température. Ainsi une personne peut être âgée de 25 ans, 2 mois, 24 jours, 11 heures, 15 minutes, 20 secondes…elle peut mesurer 1,958186…mètre. Les variables continues sont donc le plus souvent arrondies, et regroupé en « intervalles en classes », les ans. Contrairement aux variables continues, une variables discrète ne peut revêtir qu’un nombre défini de valeurs réelles. Le revenu, le score obtenu à un test, le nombre d’enfants. Un étudiant peut obtenir une note qui varie entre 0 et 20. Imed Ben Mahmoud Statistiques

15 L’échelle d’intervalles
Cette échelle de mesure quantitative utilise une unité de mesure normalisée et un zéro relatif qui permettent d'évaluer des écarts à l'aide de deux opérations simples : l'addition et la soustraction. Le zéro est dit « relatif » car il fixe, par convention, l'origine de l'échelle. Nature de l'échelle d'intervalles Origine de l'échelle. zéro relatif Unité de mesure normalisée Exemples d'application La mesure du temps Naissance du Christ dans le calendrier grégorien L'année 1 an il s’est écoulé 513 ans depuis la découverte du Nouveau Monde par Christophe Colomb. ( = 513) La mesure de la température Température à laquelle l’eau gèle en degrés Celsius 1 degré Celsius 1°C Hier, il y avait un écart de 12 °C entre Cherbourg et Marseille.. (25 à Marseille à Cherbourg = 12) La mesure de l’altitude Niveau de la mer Le mètre 1m Le mont Blanc culmine à m. Imed Ben Mahmoud Statistiques

16 L’échelle de rapport Cette échelle de mesure est considérée comme la plus précise car elle autorise tous les calculs arithmétiques: addition, soustraction, multiplication et division. Elle se distingue de l'échelle d'intervalles par le fait qu'elle utilise un « zéro absolu » qui renvoie à l'absence de la caractéristique mesurée. Nature de l’échelle de rapports Origine de l’échelle: zéro absolu Unité de mesure normalisée Exemples d’application La taille Absence de taille 0 cm Le centimètre 1 cm À 15 ans, Rémi mesurait 185 cm, il était 1,12 fois plus grand que son ami Thierry qui mesurait 165 cm. (185 / 165 = 1,12) L’âge Absence d’âge 0 an L’année 1 an Cette personne est 3 fois plus jeune que les personnes présentes à cette assemblée. Le nombre d’enfants d'un couple Pas d’enfant 1 enfant Ce couple de 4 enfants à 2 fois plus d'enfants que l’ensemble des couples français. Imed Ben Mahmoud Statistiques

17 Présentation des données (variables quantitatives)
Variables quantitatives discontinues (ou discrètes) Exemple : Au cours d’une journée de championnat de France de football de première division, la distribution des 20 clubs selon le nombre de buts marqués est la suivante : Nombre de buts marqués Effectifs des clubs ou fréquence absolues Effectifs cumulés absolus Fréquences relatives Fréquences cumulées relatives 10 0,5 1 2 12 0,1 0,6 14 0,7 3 5 19 0,25 0,95 4 6 20 0,05 Total Fréquence relative : « n/N » Imed Ben Mahmoud Statistiques

18 Présentation des données (variables quantitatives)
Variables quantitatives discontinues (ou discrètes) Représentation graphique : Diagramme en Bâtons Imed Ben Mahmoud Statistiques

19 Présentation des données (variables quantitatives)
Variables quantitatives continues : Exemple : On a mesuré la taille au centimètre près de chacun des concurrents de l’épreuve du marathon des jeux Olympiques d’Athènes en On dispose de 73 résultats. Imed Ben Mahmoud Statistiques

20 Présentation des données (variables quantitatives)
Taille en cm 160 175 180 170 174 168 165 181 169 171 176 173 201 161 179 172 167 190 178 185 166 156 183 Valeurs limites de l’intervalle : Min : 156 Max : 201 Découpage en 12 classes de 4 cm Imed Ben Mahmoud Statistiques

21 Présentation des données (variables quantitatives)
Variables quantitatives continues : Classes Effectifs Fréquences 156 à 159 1 0,0137 160 à 163 8 0,1096 164 à 167 9 0,1233 168 à 171 20 0,2740 172 à 175 16 0,2191 176 à 179 180 à 183 6 0,0822 184 à 187 2 0,0274 188 à 191 192 à 195 196 à 199 200 à 203 N = 73 Imed Ben Mahmoud Statistiques

22 Présentation des données (variables quantitatives)
Variables quantitatives continues : Représentation graphique : Histogramme Imed Ben Mahmoud Statistiques

23 Analyse numérique Cette partie de la statistique descriptive consiste notamment à calculer quelques valeurs caractéristiques qui synthétisent l’ensemble des données. Ces valeurs typiques sont appelées indices ou paramètres. On distingue les paramètres de tendance centrale et les paramètres de dispersion. Imed Ben Mahmoud Statistiques

24 Analyse numérique Imed Ben Mahmoud Statistiques

25 Analyse numérique Le Mode
C’est la valeur du caractère qui correspond à l’effectif le plus grand ou la fréquence la plus importante. C’est le caractère le plus dominant. Imed Ben Mahmoud Statistiques

26 Analyse numérique La Médiane
Cas des séries à caractères discontinus ou données non regroupées : Si le nombre d’éléments est impair : (2 n + 1) ; la Médiane est le rang (n + 1) Si le nombre d’éléments est pair : (2 n) ; la Médiane est déterminée dans l’intervalle séparant le terme de rang (n) et le terme de rang (n + 1) Imed Ben Mahmoud Statistiques

27 Analyse numérique La Médiane
Classes Effectifs Effectifs cumulés 156 à 159 1 160 à 163 8 9 164 à 167 18 168 à 171 20 38 172 à 175 16 54 176 à 179 63 180 à 183 6 69 184 à 187 2 71 188 à 191 72 192 à 195 196 à 199 200 à 203 73 N = 73 Cas des séries à caractères continus ou données regroupées : Il faut d’abord calculer les effectifs cumulés, Imed Ben Mahmoud Statistiques

28 Analyse numérique La Médiane
Cas des séries à caractères continus ou données regroupées : L’effectif total étant de n = 73, il faut rechercher la taille du sujet n / 2, soit 36,5. En consultant la colonne des effectifs cumulés on voit que la position 36,5 se trouve dans la classe 168 – 171 (dont les bornes exactes sont 167,5 – 171,5). 18 sujets mesurent moins de 167,5 cm (effectifs cumulés de la classe 164 – 167). Il nous manque donc pour atteindre la position 36,5 la différence entre 36,5 et 18, soit 18,5 sujets. On cherche donc dans la classe 168 – 171, qui comprend 20 sujets, La taille du 18,5ème. Si les sujets sont répartis uniformément sa distance à la borne inférieure de la classe est de 18,5 / 20 * 4 cm, l’intervalle de classe étant de 4 cm. La valeur de la médiane est de ce fait égale à : 167,5 + 18,5 / 20 * 4 = 171,2 cm. Imed Ben Mahmoud Statistiques

29 Analyse numérique La Moyenne
Lorsque les données sont regroupées en classes on considère que chaque valeur de la classe est représentée par le centre de la classe. M = ni xi / ni M = 12553,5 / 73 =171,97 Imed Ben Mahmoud Statistiques

30 Analyse numérique L’étendue
On appelle ’’étendue’’ d’une distribution la mesure de l’intervalle séparant les deux valeurs extrêmes de cette distribution. E = Xmax – Xmin E = 201 – 156 = 45 Imed Ben Mahmoud Statistiques

31 Analyse numérique La Variance
(ni xi²) - (ni xi)² / N S² = —————————————— N - 1 Imed Ben Mahmoud Statistiques

32 Analyse numérique L’Ecart-type
S = racine de S² Imed Ben Mahmoud Statistiques

33 Analyse numérique Coefficient de Variation
CV = S / M * 100, M ≠ 0 Imed Ben Mahmoud Statistiques

34 Analyse numérique Les quantiles
Imed Ben Mahmoud Statistiques

35 Caractéristiques de formes : Asymétrie
Valeurs de Sk Type d'asymétrie Négative Asymétrie négative Nulle Distribution symétrique Positive Asymétrie positive Imed Ben Mahmoud Statistiques

36 Caractéristiques de formes : Asymétrie
M = Me = Mo Imed Ben Mahmoud Statistiques

37 Caractéristiques de formes : Asymétrie
M > Me > Mo Les observations présentent un étalement plus important sur le côté supérieur de la distribution Imed Ben Mahmoud Statistiques

38 Caractéristiques de formes : Asymétrie
M < Me < Mo Les observations présentent un étalement plus important sur le côté inférieur de la distribution Imed Ben Mahmoud Statistiques

39 Caractéristiques de formes : Aplatissement d’une distribution
Si α4 > 3, la courbe est leptokurtique (courbe aigüe) Si α4 = 3, la courbe est mésokurtique (courbe normale) Si α4 < 3, la courbe est platykurtique (courbe aplatie). Imed Ben Mahmoud Statistiques


Télécharger ppt "Les statistiques, pour quoi faire ?"

Présentations similaires


Annonces Google