Statistique descriptive

Slides:



Advertisements
Présentations similaires
Statistique Descriptive Chapitre 2: Paramètres de tendance centrale
Advertisements

5. Statistiques.
Pr. Abdelkrim EL MOUATASIM EST de Guelmim Maroc
Présentation des données
ACTIVITES NUMERIQUES Ranger les nombres Trouver le nombre manquant
Statistiques à une variable
Séries statistiques à une variable
Statistique descriptive
Chapitre 5. Description numérique d’une variable statistique.
Les Variables statistiques continues
1. Les caractéristiques de dispersion. 11. Utilité.
LES STATISTIQUES partie 3
Statistique et probabilités au collège
LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.
Activités sur les statistiques à une variable
variable aléatoire Discrète
La mesure de tendance centrale
Les principaux résumés de la statistique
Exercice de statistiques
Opération et systèmes de décision Faculté des Sciences de l administration MQT Probabilités et statistique Mesures caractéristiques.
Tableaux de distributions
Lectures Livre du cours :
Tableaux de distributions
Comprendre la variation dans les données: Notions de base
Statistique descriptive
La statistique descriptive
La Distribution des Données
Modélisation Nuage de points.
LE CHOIX EN CONTEXTE D’INCERTITUDE
Les mesures de la tendance centrale
Modélisation Nuage de points.
Aire d’une figure par encadrement
Écart moyen et écart type
Combat des valeurs. Quelle est la valeur de : 18 unités 18.
P.A. MARQUES S.A.S Z.I. de la Moussière F DROUE Tél.: + 33 (0) Fax + 33 (0)
Séries chronologiques et prévision
Les mesures de tendance centrale
Introduction aux statistiques
Mesures de position Ils s’expriment dans la même unité que les observations Moyenne et moyenne pondérée Exemple : on dispose du nombre moyen d’enfants.
1 - Programme de Seconde (juin 2009) Statistique et probabilités
Méthodes de Biostatistique
Introduction: DEFINITION
fumer nuit dangereusement à la santé
Thème: statistiques et probabilités Séquence 3: Statistique descriptive Utiliser un logiciel (par exemple, un tableur) ou une calculatrice pour étudier.
Introduction à l’analyse statistique
Master 1 – Sciences du Langage –
Commission paritaire de suivi des opérations de reclassement repositionnement dans le cadre du droit d’option Statistiques novembre 2010.
Christophe Genolini INSERM U669 / Université de Paris X.
Rappels de statistiques descriptives
Biostatistiques Quand on souhaite étudier une (ou des) caractéristique(s) sur un ensemble d’individus ou d’objets, il est difficile, voir impossible, d’observer.
Fabienne BUSSAC STATISTIQUES 1. VOCABULAIRE
Sommaire: Mesures numériques de la dispersion d’une distribution
COURS STATISTIQUE - DESCRIPTIVE DEFINITIONS
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
Seconde partie Cours de seconde
STATISTIQUE DESCRIPTIVE Dr LEMDAOUI MOHAMED CHERIF
Introduction à une analyse statistique de données
Statistiques descriptives-Distributions expérimentales à une dimension
1 Licence Stat-info CM1 b 2004Christophe Genolini 2.1. Vocabulaire Individu : objet étudié Population : Ensemble des individus Variable : nom donné à ce.
PARAMETRES STATISTIQUES
Statistique Descriptive Les Paramètres de Tendance Centrale
Statistiques Première partie Cours de première S.
BIOSTATISTIQUES Définitions.
BIOSTATISTIQUES Définitions.
Mesures de description des valeurs des variables
Nature de la statistique La statistique est la science qui étudie la collecte, la présentation, l’analyse et l’utilisation des données numériques en vue.
 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs.
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
STATISTIQUE DESCRIPTIVE
Transcription de la présentation:

Statistique descriptive Pr Hinde HAMI Faculté des Sciences, Université Ibn Tofail, Kénitra, Maroc 2011-2012

OBJECTIFS Se familiariser avec le vocabulaire de la statistique descriptive; Fournir des outils de base permettant de décrire des données statistiques.

La Statistique,… c’est quoi ?

DÉFINITIONS Statistiques: Ensemble cohérent de données numériques relatives à un groupe d’individus. Ex: Statistiques démographiques, Statistiques du chômage Statistique: Ensemble des méthodes qui permettent de rassembler, de présenter, d’analyser et d’interpréter les données associées à une situation ou à un phénomène. Statistique descriptive: Ensemble des méthodes permettant de décrire, de résumer et de présenter les données observées sous la forme la plus accessible : Tableaux, graphiques, pourcentages et indicateurs ou résumés numériques (moyenne, médiane…..)

LA DÉMARCHE STATISTIQUE Toute étude statistique se fonde sur une population formée de nombreux individus sur lesquels on peut observer des caractères (variables).

VOCABULAIRE DE BASE Population: ensemble des personnes, objets ou éléments sur lesquels on veut effectuer l’étude statistique; Population Individu Echantillon Échantillon: c’est un sous-ensemble de la population; Individu (ou unité statistique): chacun des éléments de la population; La population est l’ensemble des individus sur lesquels porte l’étude statistique Variable (ou caractère): caractéristique relative à chacun des individus de la population Sur la même population, on peut s'intéresser à plusieurs variables telles l'âge, le sexe, la filière…

Nature des données variable Qualitative Quantitative Discrète Continue Nominale ordinale Chaque variable peut être, selon le cas Quantitative: Série de valeurs, mesurable Discrète: Ne peut prendre que des valeurs entières Continu: Peut prendre n’importe quelle valeur dans un intervalle donné Qualitative: Série de modalités, non mesurable Nominale: Les modalités ne peuvent pas être ordonnées Ordinale: Les modalités peuvent être ordonnées Nombre d’enfants Poids Taille Salaire Groupes sanguins Couleur Profession Etat matrimonial Mention Stade d’une maladie Taille vestimentaire

Exemples Exemple 1 Une étude sur le poids de chacun des enfants d’un groupe d’enfants de 7 ans donne la série suivante (en Kg) 22 25 23 25 24 19 23 18 20 21 19 22 20 17 21 23 24 23 17 21 20 20 19 22 19 20 19 21 Il s'agit d'une série statistique brute résultant de la mesure de la variable (ou caractère)………………sur les individus (ou unités statistiques)…………… La population étudiée comporte……………individus. La nature de la variable étudiée: …………… Le caractère étudié est "le poids des enfants", il est quantitatif continu 28 individus

Exemples Exemple 1 Série brute 22 25 23 25 24 19 23 18 20 21 19 22 20 17 21 23 24 23 17 21 20 20 19 22 19 20 19 21 1. Classer le caractère étudié par ordre croissant en fonction de son effectif 2. Quel est l’effectif des enfants ayant moins de 21 kg ? 1. Poids des enfants xi 17 18 19 20 21 22 23 24 25 Total Nombre d’enfants ni 2 1 5 4 3 28 2. Le nombre d’enfants ayant un poids moins de 21 kg est 13 enfants

Nombre d’employés concernés ni Exemples Exemple 2 Absentéisme dans le service « Achats » (pendant une période donnée) Nombre de jours d’absence xi Nombre d’employés concernés ni 5 1 8 2 6 3 4 Total 27 individus Le caractère étudié est "le nombre de jours d’absence", il est quantitatif discret 27 1. Le tableau de données ci-dessus comporte :…………individus 2. Quel est le caractère étudié ? Donner sa nature

Exemples Effectif Exemple 3 Destination des voyages/Heure xi Nombre de voyageurs ni Europe 2300 Afrique 1200 Asie 850 Amérique du Nord 4800 Amérique du sud 1100 Total 10250 Fréquence fi=ni/n 0,22 0,12 0,08 0,47 0,11 1 Effectif total n Le caractère étudié est "Destination des voyages", il est qualitatif nominal 1. Quel est le caractère étudié ? Est-il qualitatif, quantitatif ? Pour l’«Afrique» par exemple, l’effectif est 1200, il y a 1200 voyageurs qui se dirigent vers l’Afrique (à chaque heure) La fréquence pour l’Afrique est 1200/10250=0,12 (12%)

REPRÉSENTATION DES DONNÉES Pour exploiter au mieux les données, on fait :  Classement des valeurs par ordre croissant ou décroissant;  Transformation des effectifs en fréquences;  Répartition des valeurs en classes;  Tableaux statistiques (effectifs et fréquences) et Graphiques; La synthèse des résultats à l’aide d’un tableau ou graphique pour une meilleure lisibilité des données  Calcul des mesures caractéristiques.

INDICATEURS NUMERIQUES Les indicateurs numériques ont pour but de résumer, à partir de quelques nombres clés, l'essentiel de l'information relative à l'observation d'une variable quantitative. Indicateurs de position (tendance centrale) Moyenne Mode Médiane Quartiles Indicateurs de dispersion (variabilité) Variance Ecart type Coefficient de variation sont dits de tendance centrale car ils représentent une valeur numérique autour de laquelle les observations sont réparties.

INDICATEURS DE POSITION LA MOYENNE =1/n Σ nixi n=Σ ni Variable discrète Variable continue =1/n Σ nici ni: Effectif n: Effectif total ci: Centre de la classe La moyenne arithmétique d'une série statistique (xi, ni) se calcule de la manière suivante La moyenne permet de caractériser le niveau général d’un étudiant mais elle masque en même temps son niveau réel dans chaque discipline La moyenne s'exprime toujours dans la même unité que les observations Xi

INDICATEURS DE POSITION LA MOYENNE Exemple 1 Soit la série statistique correspondant à la taille de 6 étudiants: 160, 170, 180, 180, 190, 200 (en cm) n=6, Σxi=1080 =1080/6=180 cm La moyenne arithmétique d'une série statistique (xi, ni) se calcule de la manière suivante La moyenne permet de caractériser le niveau général d’un étudiant mais elle masque en même temps son niveau réel dans chaque discipline Ainsi la moyenne arithmétique de la taille des étudiants est : 180 cm

INDICATEURS DE POSITION LA MOYENNE Exemple 2 Au poste de péage, on compte le nombre de voitures se présentant sur une période de 5 mn. Sur 100 observations de 5 mn, on obtient les résultats suivants : Nb de voitures xi 1 2 3 4 5 6 7 8 9 10 11 12 T Nb d’observations ni 14 20 19 15 100 ni xi 2 16 42 80 95 90 63 48 18 30 11 12 507 n=Σni=100 =1/n Σnixi =507/100=5,07

INDICATEURS DE POSITION LA MOYENNE Exemple 3 Soit le tableau suivant donnant les salaires en dirhams des cadres d’une entreprise   Salaires xi Effectif ni [5000, 7000[ 21 [7000, 9000[ 34 [9000,14000[ 25 [14000, 20000[ 15 [20000, 30000[ 5 Total 100 ci 6000 8000 11500 17000 25000 nici 126000 272000 287500 255000 125000 1065500 n=Σni=100 =1/n Σnici =1065500/100=10655

LES AUTRES VALEURS CENTRALES LE MODE Le mode: Correspond à la valeur la plus fréquente dans une distribution. Il peut y avoir plusieurs modes : 2 (bimodale) ; 3 (trimodale); 4 modes ou plus (plurimodale). Variable discrète: le mode correspond à la valeur qui admet le plus grand effectif; Variable continue: on parle de la classe modale, la classe qui admet le plus grand effectif.

LES AUTRES VALEURS CENTRALES LE MODE Exemple 1 Nb de voitures xi 1 2 3 4 5 6 7 8 9 10 11 12 T Effectif ni 14 20 19 15 100 Le mode est le nombre de voitures qui revient plus fréquemment dans la série (20 observations) Mode=4

LES AUTRES VALEURS CENTRALES LA MÉDIANE La médiane: correspond au centre de la série statistique classée par ordre croissant.  Sur une distribution non groupée : Si n est impair, la médiane est l’observation de rang (n+1)/2 Si n est pair, la médiane est tout nombre situé entre xn/2 et x(n/2)+1

LES AUTRES VALEURS CENTRALES LA MÉDIANE Exemple 1 Nb de voitures xi 1 2 3 4 5 6 7 8 9 10 11 12 T Nb d’observations ni 14 20 19 15 100 Effectif cumulé Ni 2 10 24 44 63 78 87 93 95 98 99 100 N est pair: X100/2 ; X(100/2)+1 X50 ; X51?? Médiane=5

LES AUTRES VALEURS CENTRALES LA MÉDIANE  Sur une distribution groupée, la classe médiane est celle qui contient la médiane. On suppose que [xm, x’m[ est la classe médiane Médiane=xm+am [(n/2)-Nm-1)]/nm am= x’m –xm xm: limite inférieure de la classe médiane am: amplitude de la classe médiane n: taille de l’échantillon (effectif total) Nm-1: effectif cumulé de la classe inférieure à la classe médiane (la somme des effectifs des classes inférieures à la classe médiane) nm: effectif de la classe médiane

LES AUTRES VALEURS CENTRALES LA MÉDIANE Exemple 2 Médiane=xm+am [(n/2)-Nm-1)]/nm On a mesuré la longueur de la grande nervure de 75 feuilles de plantes. L’étude de la répartition des mesures a donné les résultats suivants : Longueur en mm xi Nombre de feuilles ni [100-110[ 1 [110-120[ 6 [120-130[ [130-140[ 9 [140-150[ 15 [150-160[ 16 [160-170[ 11 [170-180[ 8 [180-190[ 3 T 75 Effectif cumulé Ni 1 7 13 22 37 53 64 72 75 N est impair: X(75+1)/2 X38?? La classe médiane: [150-160[ Médiane=150+10 [(75/2)-37)]/16 Médiane=150,31 mm

INDICATEURS DE DISPERSION LA VARIANCE La variance: est la moyenne arithmétique des carrés des écarts à la moyenne Exemple 1 Nb de voitures xi 1 2 3 4 5 6 7 8 9 10 11 12 T Nb d’observations ni 14 20 19 15 100 nixi2 2 32 126 320 475 540 441 384 162 300 121 144 3047 Maintenant que nous connaissons la tendance centrale d’une distribution, nous pouvons nous demander si les valeurs de la variable sont fortement concentrées autour de cette tendance centrale ou, au contraire, si elles sont très dispersées. 2 = 1/n Σnixi2 - S2 = 1/n Σni(xi- ) S2 =1/100*3047-(5,07)2=4,77

INDICATEURS DE DISPERSION L’ÉCART TYPE L’écart type: est la racine carrée de la variance et sa formule est la suivante: S = S2 Exemple 1 Nb de voitures xi 1 2 3 4 5 6 7 8 9 10 11 12 T Nb d’observations ni 14 20 19 15 100 nixi2 2 32 126 320 475 540 441 384 162 300 121 144 3047 S2=4,77 S =2,18

INDICATEURS DE DISPERSION COEFFICIENT DE VARIATION Le coefficient de variation: est le rapport de l'écart-type à la moyenne. Il est souvent utilisé pour comparer la variabilité de deux groupes de données par rapport à leur niveau moyen. C.V.=100*S / Plus la valeur du coefficient de variation est élevée, plus la dispersion autour de la moyenne est grande. Il est généralement exprimé en pourcentage.

REPRÉSENTATION GRAPHIQUE Diagramme circulaire ou sectoriel DES DONNÉES Exemple 1: Situation familiale de 150 employés d’une entreprise Situation familiale xi Effectif ni Célibataire 30 Marié 80 Divorcé 20 Veuf Total 150 Pour visualiser une distribution statistique, il est généralement plus parlant d'utiliser un graphique, à la place ou en complément du tableau. Cas d’une variable qualitative Diagramme circulaire ou sectoriel Situation familiale Célibataire Marié Divorcé Veuf

REPRÉSENTATION GRAPHIQUE DES DONNÉES Exemple 2: Nombre de voitures se présentant sur une période de 5 mn au poste de péage Nb de voitures xi 1 2 3 4 5 6 7 8 9 10 11 12 T fi (%) 14 20 19 15 100 2 4 6 8 10 12 14 16 18 20 1 2 3 4 5 6 7 8 9 10 11 12 1 2% Nb de voitures fi(%) Diagramme en bâtons des fréquences Cas d’une variable discrète Le diagramme en bâtons (en barres) pour les données non groupées En abscisse: les valeurs de la variable discrète En ordonnée: bâton de longueur proportionnelle à la fréquence de chaque variable L’histogramme (pour les données groupées) Rectangles juxtaposés dont chacune des bases est égale à l’intervalle de chaque classe, et dont la hauteur est telle que la surface soit proportionnelle à la fréquence de la classe correspondante Le polygone de fréquences Distribution des fréquences sous-forme de courbe

REPRÉSENTATION GRAPHIQUE DES DONNÉES Exemple 3: Age de 240 patients intoxiqués par une plante  % Histogramme Cas d’une variable continue [2-10[ [10-20[ [20-30[ [30-40[ [40-50[ [50-60[ Groupes d’âges (en années) Répartition des patients en fonction de l’âge