La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

2008 Imed Ben Mahmoud Statistiques Introduction Les statistiques, pour quoi faire ? - Le recours à la statistique permet de décrire des phénomènes à laide.

Présentations similaires


Présentation au sujet: "2008 Imed Ben Mahmoud Statistiques Introduction Les statistiques, pour quoi faire ? - Le recours à la statistique permet de décrire des phénomènes à laide."— Transcription de la présentation:

1 2008 Imed Ben Mahmoud Statistiques Introduction Les statistiques, pour quoi faire ? - Le recours à la statistique permet de décrire des phénomènes à laide de mesures, de tableaux et de graphiques. - Elle permet détablir lexistence de lien entre certains phénomènes, dexpliquer des relations entre des indicateurs par un modèle mathématique. - Et enfin de généraliser des résultats obtenus sur un petits groupes à lensemble dune population.

2 2008 Imed Ben Mahmoud Statistiques Introduction Il y a trois types danalyse statistique : - Résumé des données : cest la plus commune, celle quon trouve dans nos journaux. Elle décrit simplement les données. Le calcul de moyenne, décart type, de pourcentage et leur représentation graphique entrent dans cette catégorie. - Test statistique : un test permettra de répondre à une question : « y a-t-il plus de cancer chez ceux qui fument ? » Les tests statistiques tranchent…avec une fiabilité variable, mais que lon peut connaître. - Modélisation : enfin, les statistiques permettent de décrire le monde de manière raisonnablement précise et de jouer aux devinettes. Sur les trois dernières années, aucun des étudiants qui ont entre 10 et 11 en licence nont eu le CAPEPS. On peut donc « parier » raisonnablement que cette années, il en sera de même et donc déconseiller cette voie à ceux qui nont pas eu de mention du tout. Naturellement, rien nest sûr et lon peut se tromper, mais statistiquement, cest rare.

3 2008 Imed Ben Mahmoud Statistiques Définitions Un Individu : (ou Sujet, ou Unité statistique) est lobjet étudié. La Population : est lensemble de tous les individus (effectif = N). Un Echantillon : est une fraction de la population (effectif = n). Une Variable (ou Caractère) est-ce qui est étudié chez les individus (et qui a priori varie dun individu à lautre). Les Modalités (ou Ensemble fondamental) dune variable sont toutes les valeurs que cette variable peut prendre.

4 2008 Imed Ben Mahmoud Statistiques La statistique descriptive Les renseignements que lon détient sur une population sont généralement inutilisables sous leur forme brute. Il convient de procéder à des regroupements, à des classements et à létablissement de tableaux statistiques en distinguant les séries selon la nature du caractère : qualitatif, quantitatif discontinu ou continu. 1. Une mise en ordre des résultats obtenus qui se traduit par des tableaux ; 2. Visualisation des regroupements opérés sous forme de figure ; 3. Analyse numérique aboutissant à des indices.

5 2008 Imed Ben Mahmoud Statistiques Les variables Les caractéristiques des individus portent le nom de variables parce quelles peuvent varier dun individu à lautre. Le sexe, la profession, lâge, le revenu, la situation matrimoniale, le niveau de diplôme la consommation dun biceps en oxygène, lopinion politique sont des exemples de variables connues.

6 2008 Imed Ben Mahmoud Statistiques Nature dune variable En pratique, toutes les variables nont pas les mêmes propriétés. Par exemple, on peut faire la moyenne des températures mais pas la moyenne des Oui/Non. Trois propriétés intéressent particulièrement les statisticiens : 1. Arithmétique : peut-on additionner les observations entre elles ? 2a. Comparaison : cela a-t-il du sens de dire qune observation est plus grande quune autre ? 2b. Continuité : le nombre de modalités est-il petit ou grand ?

7 2008 Imed Ben Mahmoud Statistiques Nature dune variable

8 2008 Imed Ben Mahmoud Statistiques Variables qualitatives Les variables qualitatives contiennent des données qui sévaluent avec des mots et non avec des nombres. Elles mesurent une qualité de lindividu et non une quantité : le métier, le sexe, le groupe sanguin, la mention au bac… Les différentes formes que peut prendre une variable qualitative sont appelées modalités. La variable « sexe » possède deux modalités : sexe masculin et sexe féminin, et lon ne peut appartenir quà une seule des modalités de cette variable. Ces variables qualitatives peuvent être nominales ou ordinales.

9 2008 Imed Ben Mahmoud Statistiques Variables qualitatives Une Variable nominale est une variable dont on ne peut additionner, ni les ordonner les modalités. Une Variable ordonnée est une variable dont on ne peut pas additionner les modalités, mais dont on peut les ordonner. Alors quune variable nominale répond à une classification, une variable ordinale correspond à un classement.

10 2008 Imed Ben Mahmoud Statistiques Présentation des données (variable qualitative) Liste bruteliste triée Résultat Perdu Nul Perdu Gagné Perdu Gagné Nul Perdu Résultat Perdu Nul Gagné RésultatEffectif Perdu5 Nul3 Gagné2 Total10

11 2008 Imed Ben Mahmoud Statistiques Présentation des données (variables qualitatives) Représentation graphique : Diagramme en bandeaux RésultatEffectif Perdu5 Nul3 Gagné2 Total10

12 2008 Imed Ben Mahmoud Statistiques Présentation des données (variable qualitative) Représentations graphiques possibles : - Le graphe en bandeaux - Le graphe en points - Le camembert

13 2008 Imed Ben Mahmoud Statistiques Variables quantitatives (ou numérique) Une variable est quantitative lorsque ses modalités sont de nature numérique, elles prennent donc la forme de nombres réels. Le terme « valeur » remplace ici celui de « modalités ». Cest la variable la plus utilisé. Elle comprend toutes les mesures sur lesquelles il est possible de faire des opérations et des comparaisons : performances sportives, notes, nombre de membre de clubs, lâge, la taille dun individu, … Les variables numériques peuvent être continues ou discrètes et peuvent utiliser des échelles dintervalles ou de rapports.

14 2008 Imed Ben Mahmoud Statistiques Variables quantitatives (ou numérique) On dit quune variable est continue si elle peut supposer un nombre infini de valeurs réelles. Lâge, la taille dune personne, la température. Ainsi une personne peut être âgée de 25 ans, 2 mois, 24 jours, 11 heures, 15 minutes, 20 secondes…elle peut mesurer 1,958186…mètre. Les variables continues sont donc le plus souvent arrondies, et regroupé en « intervalles en classes », les ans. Contrairement aux variables continues, une variables discrète ne peut revêtir quun nombre défini de valeurs réelles. Le revenu, le score obtenu à un test, le nombre denfants. Un étudiant peut obtenir une note qui varie entre 0 et 20.

15 2008 Imed Ben Mahmoud Statistiques Léchelle dintervalles Cette échelle de mesure quantitative utilise une unité de mesure normalisée et un zéro relatif qui permettent d'évaluer des écarts à l'aide de deux opérations simples : l'addition et la soustraction. Le zéro est dit « relatif » car il fixe, par convention, l'origine de l'échelle. Nature de l'échelle d'intervalles Origine de l'échelle. zéro relatif Unité de mesure normalisée Exemples d'application La mesure du temps Naissance du Christ dans le calendrier grégorien L'année 1 an il sest écoulé 513 ans depuis la découverte du Nouveau Monde par Christophe Colomb. ( = 513) La mesure de la température Température à laquelle leau gèle en degrés Celsius 1 degré Celsius 1°C Hier, il y avait un écart de 12 °C entre Cherbourg et Marseille.. (25 à Marseille - 13 à Cherbourg = 12) La mesure de laltitude Niveau de la mer Le mètre 1m Le mont Blanc culmine à m.

16 2008 Imed Ben Mahmoud Statistiques Léchelle de rapport Cette échelle de mesure est considérée comme la plus précise car elle autorise tous les calculs arithmétiques: addition, soustraction, multiplication et division. Elle se distingue de l'échelle d'intervalles par le fait qu'elle utilise un « zéro absolu » qui renvoie à l'absence de la caractéristique mesurée. Nature de léchelle de rapports Origine de léchelle: zéro absolu Unité de mesure normalisée Exemples dapplication La taille Absence de taille 0 cm Le centimètre 1 cm À 15 ans, Rémi mesurait 185 cm, il était 1,12 fois plus grand que son ami Thierry qui mesurait 165 cm. (185 / 165 = 1,12) Lâge Absence dâge 0 an Lannée 1 an Cette personne est 3 fois plus jeune que les personnes présentes à cette assemblée. Le nombre denfants d'un couple Pas denfant 1 enfant Ce couple de 4 enfants à 2 fois plus d'enfants que lensemble des couples français.

17 2008 Imed Ben Mahmoud Statistiques Présentation des données (variables quantitatives) Variables quantitatives discontinues (ou discrètes) Exemple : Au cours dune journée de championnat de France de football de première division, la distribution des 20 clubs selon le nombre de buts marqués est la suivante : Nombre de buts marqués Effectifs des clubs ou fréquence absolues Effectifs cumulés absolus Fréquences relatives Fréquences cumulées relatives 010 0, ,10, ,10, ,250, , , ,051 Total20 1 Fréquence relative : « n/N »

18 2008 Imed Ben Mahmoud Statistiques Présentation des données (variables quantitatives) Variables quantitatives discontinues (ou discrètes) Représentation graphique : Diagramme en Bâtons

19 2008 Imed Ben Mahmoud Statistiques Présentation des données (variables quantitatives) Variables quantitatives continues : Exemple : On a mesuré la taille au centimètre près de chacun des concurrents de lépreuve du marathon des jeux Olympiques dAthènes en On dispose de 73 résultats.

20 2008 Imed Ben Mahmoud Statistiques Présentation des données (variables quantitatives) Taille en cm Valeurs limites de lintervalle : Min : 156 Max : 201 Découpage en 12 classes de 4 cm

21 2008 Imed Ben Mahmoud Statistiques Présentation des données (variables quantitatives) Variables quantitatives continues : ClassesEffectifsFréquences 156 à 15910, à 16380, à 16790, à , à , à 17990, à 18360, à 18720, à 19110, à à à 20310,0137 N = 73

22 2008 Imed Ben Mahmoud Statistiques Présentation des données (variables quantitatives) Variables quantitatives continues : Représentation graphique : Histogramme

23 2008 Imed Ben Mahmoud Statistiques Analyse numérique Cette partie de la statistique descriptive consiste notamment à calculer quelques valeurs caractéristiques qui synthétisent lensemble des données. Ces valeurs typiques sont appelées indices ou paramètres. On distingue les paramètres de tendance centrale et les paramètres de dispersion.

24 2008 Imed Ben Mahmoud Statistiques Analyse numérique

25 2008 Imed Ben Mahmoud Statistiques Analyse numérique Le Mode Cest la valeur du caractère qui correspond à leffectif le plus grand ou la fréquence la plus importante. Cest le caractère le plus dominant.

26 2008 Imed Ben Mahmoud Statistiques Analyse numérique La Médiane Cas des séries à caractères discontinus ou données non regroupées : - Si le nombre déléments est impair : (2 n + 1) ; la Médiane est le rang (n + 1) - Si le nombre déléments est pair : (2 n) ; la Médiane est déterminée dans lintervalle séparant le terme de rang (n) et le terme de rang (n + 1)

27 2008 Imed Ben Mahmoud Statistiques Analyse numérique La Médiane Cas des séries à caractères continus ou données regroupées : Il faut dabord calculer les effectifs cumulés, ClassesEffectifsEffectifs cumulés 156 à à à à à à à à à à à à N = 73

28 2008 Imed Ben Mahmoud Statistiques Analyse numérique La Médiane Cas des séries à caractères continus ou données regroupées : Leffectif total étant de n = 73, il faut rechercher la taille du sujet n / 2, soit 36,5. Leffectif total étant de n = 73, il faut rechercher la taille du sujet n / 2, soit 36,5. En consultant la colonne des effectifs cumulés on voit que la position 36,5 se trouve dans la classe 168 – 171 (dont les bornes exactes sont 167,5 – 171,5). 18 sujets mesurent moins de 167,5 cm (effectifs cumulés de la classe 164 – 167). Il nous manque donc pour atteindre la position 36,5 la différence entre 36,5 et 18, soit 18,5 sujets. On cherche donc dans la classe 168 – 171, qui comprend 20 sujets, La taille du 18,5ème. Si les sujets sont répartis uniformément sa distance à la borne inférieure de la classe est de 18,5 / 20 * 4 cm, lintervalle de classe étant de 4 cm. La valeur de la médiane est de ce fait égale à : 167,5 + 18,5 / 20 * 4 = 171,2 cm.

29 2008 Imed Ben Mahmoud Statistiques Analyse numérique La Moyenne Lorsque les données sont regroupées en classes on considère que chaque valeur de la classe est représentée par le centre de la classe. M = ni xi / ni M = 12553,5 / 73 =171,97

30 2008 Imed Ben Mahmoud Statistiques Analyse numérique Létendue On appelle étendue dune distribution la mesure de lintervalle séparant les deux valeurs extrêmes de cette distribution. E = Xmax – Xmin E = 201 – 156 = 45

31 2008 Imed Ben Mahmoud Statistiques Analyse numérique La Variance (ni xi²) - ( ni xi)² / N (ni xi²) - ( ni xi)² / N S² = S² = N - 1

32 2008 Imed Ben Mahmoud Statistiques Analyse numérique LEcart-type S = racine de S² S = racine de S²

33 2008 Imed Ben Mahmoud Statistiques Analyse numérique Coefficient de Variation Coefficient de variation Coefficient de variation CV = S / M * 100, CV = S / M * 100, M 0

34 2008 Imed Ben Mahmoud Statistiques Analyse numérique Les quantiles

35 2008 Imed Ben Mahmoud Statistiques Caractéristiques de formes : Asymétrie Valeurs de S k Type d'asymétrie NégativeAsymétrie négative NulleDistribution symétrique PositiveAsymétrie positive

36 2008 Imed Ben Mahmoud Statistiques Caractéristiques de formes : Asymétrie M = M e = M o

37 2008 Imed Ben Mahmoud Statistiques Caractéristiques de formes : Asymétrie M > M e > M o Les observations présentent un étalement plus important sur le côté supérieur de la distribution

38 2008 Imed Ben Mahmoud Statistiques Caractéristiques de formes : Asymétrie M < M e < M o Les observations présentent un étalement plus important sur le côté inférieur de la distribution

39 2008 Imed Ben Mahmoud Statistiques Caractéristiques de formes : Aplatissement dune distribution Si α 4 > 3, la courbe est leptokurtique (courbe aigüe) Si α 4 = 3, la courbe est mésokurtique (courbe normale) Si α 4 < 3, la courbe est platykurtique (courbe aplatie).


Télécharger ppt "2008 Imed Ben Mahmoud Statistiques Introduction Les statistiques, pour quoi faire ? - Le recours à la statistique permet de décrire des phénomènes à laide."

Présentations similaires


Annonces Google