Télécharger la présentation
1
Statistique descriptive
Pr Hinde HAMI Faculté des Sciences, Université Ibn Tofail, Kénitra, Maroc
2
OBJECTIFS Se familiariser avec le vocabulaire de la statistique descriptive; Fournir des outils de base permettant de décrire des données statistiques.
3
La Statistique,… c’est quoi ?
4
DÉFINITIONS Statistiques: Ensemble cohérent de données numériques relatives à un groupe d’individus. Ex: Statistiques démographiques, Statistiques du chômage Statistique: Ensemble des méthodes qui permettent de rassembler, de présenter, d’analyser et d’interpréter les données associées à une situation ou à un phénomène. Statistique descriptive: Ensemble des méthodes permettant de décrire, de résumer et de présenter les données observées sous la forme la plus accessible : Tableaux, graphiques, pourcentages et indicateurs ou résumés numériques (moyenne, médiane…..)
5
LA DÉMARCHE STATISTIQUE
Toute étude statistique se fonde sur une population formée de nombreux individus sur lesquels on peut observer des caractères (variables).
6
VOCABULAIRE DE BASE Population: ensemble des personnes, objets ou éléments sur lesquels on veut effectuer l’étude statistique; Population Individu Echantillon Échantillon: c’est un sous-ensemble de la population; Individu (ou unité statistique): chacun des éléments de la population; La population est l’ensemble des individus sur lesquels porte l’étude statistique Variable (ou caractère): caractéristique relative à chacun des individus de la population Sur la même population, on peut s'intéresser à plusieurs variables telles l'âge, le sexe, la filière…
7
Nature des données variable Qualitative Quantitative Discrète Continue
Nominale ordinale Chaque variable peut être, selon le cas Quantitative: Série de valeurs, mesurable Discrète: Ne peut prendre que des valeurs entières Continu: Peut prendre n’importe quelle valeur dans un intervalle donné Qualitative: Série de modalités, non mesurable Nominale: Les modalités ne peuvent pas être ordonnées Ordinale: Les modalités peuvent être ordonnées Nombre d’enfants Poids Taille Salaire Groupes sanguins Couleur Profession Etat matrimonial Mention Stade d’une maladie Taille vestimentaire
8
Exemples Exemple 1 Une étude sur le poids de chacun des enfants d’un groupe d’enfants de 7 ans donne la série suivante (en Kg) Il s'agit d'une série statistique brute résultant de la mesure de la variable (ou caractère)………………sur les individus (ou unités statistiques)…………… La population étudiée comporte……………individus. La nature de la variable étudiée: …………… Le caractère étudié est "le poids des enfants", il est quantitatif continu 28 individus
9
Exemples Exemple 1 Série brute 1. Classer le caractère étudié par ordre croissant en fonction de son effectif 2. Quel est l’effectif des enfants ayant moins de 21 kg ? 1. Poids des enfants xi 17 18 19 20 21 22 23 24 25 Total Nombre d’enfants ni 2 1 5 4 3 28 2. Le nombre d’enfants ayant un poids moins de 21 kg est 13 enfants
10
Nombre d’employés concernés ni
Exemples Exemple 2 Absentéisme dans le service « Achats » (pendant une période donnée) Nombre de jours d’absence xi Nombre d’employés concernés ni 5 1 8 2 6 3 4 Total 27 individus Le caractère étudié est "le nombre de jours d’absence", il est quantitatif discret 27 1. Le tableau de données ci-dessus comporte :…………individus 2. Quel est le caractère étudié ? Donner sa nature
11
Exemples Effectif Exemple 3 Destination des voyages/Heure xi Nombre de voyageurs ni Europe 2300 Afrique 1200 Asie 850 Amérique du Nord 4800 Amérique du sud 1100 Total 10250 Fréquence fi=ni/n 0,22 0,12 0,08 0,47 0,11 1 Effectif total n Le caractère étudié est "Destination des voyages", il est qualitatif nominal 1. Quel est le caractère étudié ? Est-il qualitatif, quantitatif ? Pour l’«Afrique» par exemple, l’effectif est 1200, il y a 1200 voyageurs qui se dirigent vers l’Afrique (à chaque heure) La fréquence pour l’Afrique est 1200/10250=0,12 (12%)
12
REPRÉSENTATION DES DONNÉES
Pour exploiter au mieux les données, on fait : Classement des valeurs par ordre croissant ou décroissant; Transformation des effectifs en fréquences; Répartition des valeurs en classes; Tableaux statistiques (effectifs et fréquences) et Graphiques; La synthèse des résultats à l’aide d’un tableau ou graphique pour une meilleure lisibilité des données Calcul des mesures caractéristiques.
13
INDICATEURS NUMERIQUES
Les indicateurs numériques ont pour but de résumer, à partir de quelques nombres clés, l'essentiel de l'information relative à l'observation d'une variable quantitative. Indicateurs de position (tendance centrale) Moyenne Mode Médiane Quartiles Indicateurs de dispersion (variabilité) Variance Ecart type Coefficient de variation sont dits de tendance centrale car ils représentent une valeur numérique autour de laquelle les observations sont réparties.
14
INDICATEURS DE POSITION
LA MOYENNE =1/n Σ nixi n=Σ ni Variable discrète Variable continue =1/n Σ nici ni: Effectif n: Effectif total ci: Centre de la classe La moyenne arithmétique d'une série statistique (xi, ni) se calcule de la manière suivante La moyenne permet de caractériser le niveau général d’un étudiant mais elle masque en même temps son niveau réel dans chaque discipline La moyenne s'exprime toujours dans la même unité que les observations Xi
15
INDICATEURS DE POSITION
LA MOYENNE Exemple 1 Soit la série statistique correspondant à la taille de 6 étudiants: 160, 170, 180, 180, 190, 200 (en cm) n=6, Σxi=1080 =1080/6=180 cm La moyenne arithmétique d'une série statistique (xi, ni) se calcule de la manière suivante La moyenne permet de caractériser le niveau général d’un étudiant mais elle masque en même temps son niveau réel dans chaque discipline Ainsi la moyenne arithmétique de la taille des étudiants est : 180 cm
16
INDICATEURS DE POSITION
LA MOYENNE Exemple 2 Au poste de péage, on compte le nombre de voitures se présentant sur une période de 5 mn. Sur 100 observations de 5 mn, on obtient les résultats suivants : Nb de voitures xi 1 2 3 4 5 6 7 8 9 10 11 12 T Nb d’observations ni 14 20 19 15 100 ni xi 2 16 42 80 95 90 63 48 18 30 11 12 507 n=Σni=100 =1/n Σnixi =507/100=5,07
17
INDICATEURS DE POSITION
LA MOYENNE Exemple 3 Soit le tableau suivant donnant les salaires en dirhams des cadres d’une entreprise Salaires xi Effectif ni [5000, 7000[ 21 [7000, 9000[ 34 [9000,14000[ 25 [14000, 20000[ 15 [20000, 30000[ 5 Total 100 ci 6000 8000 11500 17000 25000 nici 126000 272000 287500 255000 125000 n=Σni=100 =1/n Σnici = /100=10655
18
LES AUTRES VALEURS CENTRALES
LE MODE Le mode: Correspond à la valeur la plus fréquente dans une distribution. Il peut y avoir plusieurs modes : 2 (bimodale) ; 3 (trimodale); 4 modes ou plus (plurimodale). Variable discrète: le mode correspond à la valeur qui admet le plus grand effectif; Variable continue: on parle de la classe modale, la classe qui admet le plus grand effectif.
19
LES AUTRES VALEURS CENTRALES
LE MODE Exemple 1 Nb de voitures xi 1 2 3 4 5 6 7 8 9 10 11 12 T Effectif ni 14 20 19 15 100 Le mode est le nombre de voitures qui revient plus fréquemment dans la série (20 observations) Mode=4
20
LES AUTRES VALEURS CENTRALES
LA MÉDIANE La médiane: correspond au centre de la série statistique classée par ordre croissant. Sur une distribution non groupée : Si n est impair, la médiane est l’observation de rang (n+1)/2 Si n est pair, la médiane est tout nombre situé entre xn/2 et x(n/2)+1
21
LES AUTRES VALEURS CENTRALES
LA MÉDIANE Exemple 1 Nb de voitures xi 1 2 3 4 5 6 7 8 9 10 11 12 T Nb d’observations ni 14 20 19 15 100 Effectif cumulé Ni 2 10 24 44 63 78 87 93 95 98 99 100 N est pair: X100/2 ; X(100/2) X50 ; X51?? Médiane=5
22
LES AUTRES VALEURS CENTRALES
LA MÉDIANE Sur une distribution groupée, la classe médiane est celle qui contient la médiane. On suppose que [xm, x’m[ est la classe médiane Médiane=xm+am [(n/2)-Nm-1)]/nm am= x’m –xm xm: limite inférieure de la classe médiane am: amplitude de la classe médiane n: taille de l’échantillon (effectif total) Nm-1: effectif cumulé de la classe inférieure à la classe médiane (la somme des effectifs des classes inférieures à la classe médiane) nm: effectif de la classe médiane
23
LES AUTRES VALEURS CENTRALES
LA MÉDIANE Exemple 2 Médiane=xm+am [(n/2)-Nm-1)]/nm On a mesuré la longueur de la grande nervure de 75 feuilles de plantes. L’étude de la répartition des mesures a donné les résultats suivants : Longueur en mm xi Nombre de feuilles ni [ [ 1 [ [ 6 [ [ [ [ 9 [ [ 15 [ [ 16 [ [ 11 [ [ 8 [ [ 3 T 75 Effectif cumulé Ni 1 7 13 22 37 53 64 72 75 N est impair: X(75+1)/ X38?? La classe médiane: [ [ Médiane= [(75/2)-37)]/16 Médiane=150,31 mm
24
INDICATEURS DE DISPERSION
LA VARIANCE La variance: est la moyenne arithmétique des carrés des écarts à la moyenne Exemple 1 Nb de voitures xi 1 2 3 4 5 6 7 8 9 10 11 12 T Nb d’observations ni 14 20 19 15 100 nixi2 2 32 126 320 475 540 441 384 162 300 121 144 3047 Maintenant que nous connaissons la tendance centrale d’une distribution, nous pouvons nous demander si les valeurs de la variable sont fortement concentrées autour de cette tendance centrale ou, au contraire, si elles sont très dispersées. 2 = 1/n Σnixi2 - S2 = 1/n Σni(xi- ) S2 =1/100*3047-(5,07)2=4,77
25
INDICATEURS DE DISPERSION
L’ÉCART TYPE L’écart type: est la racine carrée de la variance et sa formule est la suivante: S = S2 Exemple 1 Nb de voitures xi 1 2 3 4 5 6 7 8 9 10 11 12 T Nb d’observations ni 14 20 19 15 100 nixi2 2 32 126 320 475 540 441 384 162 300 121 144 3047 S2=4,77 S =2,18
26
INDICATEURS DE DISPERSION COEFFICIENT DE VARIATION
Le coefficient de variation: est le rapport de l'écart-type à la moyenne. Il est souvent utilisé pour comparer la variabilité de deux groupes de données par rapport à leur niveau moyen. C.V.=100*S / Plus la valeur du coefficient de variation est élevée, plus la dispersion autour de la moyenne est grande. Il est généralement exprimé en pourcentage.
27
REPRÉSENTATION GRAPHIQUE Diagramme circulaire ou sectoriel
DES DONNÉES Exemple 1: Situation familiale de 150 employés d’une entreprise Situation familiale xi Effectif ni Célibataire 30 Marié 80 Divorcé 20 Veuf Total 150 Pour visualiser une distribution statistique, il est généralement plus parlant d'utiliser un graphique, à la place ou en complément du tableau. Cas d’une variable qualitative Diagramme circulaire ou sectoriel Situation familiale Célibataire Marié Divorcé Veuf
28
REPRÉSENTATION GRAPHIQUE
DES DONNÉES Exemple 2: Nombre de voitures se présentant sur une période de 5 mn au poste de péage Nb de voitures xi 1 2 3 4 5 6 7 8 9 10 11 12 T fi (%) 14 20 19 15 100 2 4 6 8 10 12 14 16 18 20 1 2% Nb de voitures fi(%) Diagramme en bâtons des fréquences Cas d’une variable discrète Le diagramme en bâtons (en barres) pour les données non groupées En abscisse: les valeurs de la variable discrète En ordonnée: bâton de longueur proportionnelle à la fréquence de chaque variable L’histogramme (pour les données groupées) Rectangles juxtaposés dont chacune des bases est égale à l’intervalle de chaque classe, et dont la hauteur est telle que la surface soit proportionnelle à la fréquence de la classe correspondante Le polygone de fréquences Distribution des fréquences sous-forme de courbe
29
REPRÉSENTATION GRAPHIQUE DES DONNÉES
Exemple 3: Age de 240 patients intoxiqués par une plante % Histogramme Cas d’une variable continue [2-10[ [10-20[ [20-30[ [30-40[ [40-50[ [50-60[ Groupes d’âges (en années) Répartition des patients en fonction de l’âge
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.