Statistique Descriptive Chapitre 2: Paramètres de tendance centrale

Slides:



Advertisements
Présentations similaires
5. Statistiques.
Advertisements

Pr. Abdelkrim EL MOUATASIM EST de Guelmim Maroc
Présentation des données
2-3-4 : Avantages de la médiane.
Statistiques à une variable
Séries statistiques à une variable
Statistique descriptive
Chapitre 5. Description numérique d’une variable statistique.
Les Variables statistiques continues
Inférence statistique
Comparaison d'une distribution observée à une distribution théorique
Licence 3ème année de sociologie Semestre 1
1. Les caractéristiques de dispersion. 11. Utilité.
Notions de variable aléatoire et de probabilité d’un événement
Statistique et probabilités au collège
variable aléatoire Discrète
L’OUTIL STATISTIQUE.
INF L14 Initiation aux statistiques
COURS 5 Les tableaux croisés, le chi-carré et la corrélation
Les principaux résumés de la statistique
Statistique descriptive, analyse de données
Notions de base de statistique
Opération et systèmes de décision Faculté des Sciences de l administration MQT Probabilités et statistique Mesures caractéristiques.
Tableaux de distributions
Lectures Livre du cours :
Tableaux de distributions
Comprendre la variation dans les données: Notions de base
TECHNIQUES QUANTITATIVES APPLIQUEES A LA FINANCE
Fonction partie entière
Statistique descriptive
La statistique descriptive
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
La Distribution des Données
Moyenne, médiane et mode
Modélisation Nuage de points.
Les mesures de la tendance centrale
Introduction à l’algèbre
Modélisation Nuage de points.
Séries chronologiques et prévision
Les mesures de tendance centrale
Mesures de position Ils s’expriment dans la même unité que les observations Moyenne et moyenne pondérée Exemple : on dispose du nombre moyen d’enfants.
Méthodes de Biostatistique
Statistique descriptive
Thème: statistiques et probabilités Séquence 3: Statistique descriptive Utiliser un logiciel (par exemple, un tableur) ou une calculatrice pour étudier.
Rappels de statistiques descriptives
Fabienne BUSSAC STATISTIQUES 1. VOCABULAIRE
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
Intervalles de confiance pour des proportions L’inférence statistique
Seconde partie Cours de seconde
Introduction à une analyse statistique de données
Statistiques descriptives-Distributions expérimentales à une dimension
1 Licence Stat-info CM1 b 2004Christophe Genolini 2.1. Vocabulaire Individu : objet étudié Population : Ensemble des individus Variable : nom donné à ce.
Méthodologie de l’observation
PARAMETRES STATISTIQUES
Chapitre 4 Variables aléatoires discrètes
STATISTIQUES DESCRIPTIVES
Statistique Descriptive Les Paramètres de Tendance Centrale
Statistiques Première partie Cours de première S.
BIOSTATISTIQUES Définitions.
BIOSTATISTIQUES Définitions.
ECHANTILLONAGE ET ESTIMATION
Mesures de description des valeurs des variables
Les mesures de tendance centrale
Nature de la statistique La statistique est la science qui étudie la collecte, la présentation, l’analyse et l’utilisation des données numériques en vue.
 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs.
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
TP1: Statistique application chapitre 2. Le tableau suivant reprend le taux d'intérêt (en %) payé par 20 banques sur les dépôts d'épargne de leurs clients.
Notions de statistiques et d’analyse de données Master 1 MGS – Sarah MISCHLER –
STATISTIQUE DESCRIPTIVE
Transcription de la présentation:

Statistique Descriptive Chapitre 2: Paramètres de tendance centrale Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : www.el-mouatasim.webs.com

Les paramètres statistiques ont pour but de résumer, à partir de quelques nombres clés, l'essentiel de l'information relative à l'observation d'une variable quantitative.

Principales grandeurs économiques du secteur industriel dérivé de la pêche Indicateurs A terre En mer Effective unités 391 353 Effective emplois 70 000 10 000 Production (en tonne) 343 000 64 500 Chiffre d’affaires (en Dh) 11 milliards 3,7 milliards Source: Etude des schémas régionaux d’aménagement du territoire des provinces du sud, 2010.

On définira plusieurs sortes de paramètres : Certains, comme la moyenne, seront dits de tendance centrale car ils représentent une valeur numérique autour de laquelle les observations sont réparties. D'autres, par exemple, seront dits de dispersion car ils permettent de résumer le plus ou moins grand étalement des observations de part et d'autre de la tendance centrale.

Objectifs de ce chapitre Statistiques descriptives à une variable : paramètres de position Objectifs de ce chapitre Pouvoir résumer une série de données par un ou plusieurs paramètres représentatifs (moyenne, médiane…)

Plan de la partie Mode. Médiane. Moyennes. Paramètres de tendance centrale Plan de la partie Voici les chapitres que nous allons aborder : Mode. Médiane. Moyennes.

Introduction Les tableaux et graphiques contiennent la totalité des données : ils sont parfois durs à interpréter. On va chercher à résumer les données par quelques valeurs numériques. Dans cette partie, on s’intéresse aux paramètres de tendance centrale, i.e. aux paramètres mesurant le « centre » des séries statistiques. Cela ne s’applique bien sur qu’aux caractères quantitatifs, à l’exception du mode qui concerne tous types de caractères.

2.1 Le mode (Mo) C'est la valeur dont la fréquence est la plus élevée. Détermination du mode : Cas d'une variable discrète : Le mode est facilement repérable. Sur le tableau statistique, c'est la valeur xi pour laquelle la fréquence est la plus élevée

Exemple Soit la série de chiffres {8, 8, 8, 7, 4, 4, 4, 4, 4, 5, 5, 5, 5, 6} La valeur la plus fréquente est le 4 Mode

Cas d'une variable continue : les données sont groupées en classes ; on définit la classe modale comme la classe correspondant à la fréquence la plus élevée ni. En peut calculer le Mode par la formule suivante: Borne inférieure de la classe modale Amplitude de classe d1=ni –ni-1 et d2=ni –ni+1

Exemple : Le Mode (valeurs groupées) [0.08,0.25] est la classe modale pour le débit . D’après la formule de le mode Mo = 0.08 + a(d1/(d1+d2)) avec a = 0.25-0.08 = 0.17 d1 = 22-0 = 22 et d2 = 22-8 = 14 donc Mo = 0.08 + 0.17*22/36 = 0.184

Si la distribution présente 2 ou plus maxima relatifs, on dit qu'elle est bimodale ou plurimodale. Si la série n’a qu’un seul mode, elle est dite unimodale. On peut définir de même le mode pour un caractère qualitatif.

2.2 La médiane : Me Si la série brute des valeurs observées est triée par ordre croissant : La médiane Me d’un série statistique est la valeur qui partage cette série en deux séries de même effectif.

c'est-à-dire que Si n est impair, soit n = 2 p + 1 , Me = x(p+1) Si n est pair, soit n = 2 p, toute valeur de l'intervalle médian [ x(p) ; x(p+1) ] répond à la question. Afin de définir Me de façon unique, on choisit souvent soit le centre de l'intervalle médian.

Par exemple, la médiane de la série de tailles ci-contre est : Me = (m) Aurait-elle été différente si on avait noté par erreur la plus petite taille 0.55 m au lieu de 1.55 ?

* Cas d'une variable continue: Pour des données groupées en classes, la classe médiane est la classe qui contient la médiane. On détermine la médiane par interpolation linéaire.

De manière générale, si a et b sont les bornes de la classe contenant la médiane, F(a) et F(b) les valeurs de la fréquence cumulée croissante en a et b, alors

Lo : Limite inférieure de la classe médiane Dans le cas d'une variable groupée en classes, en peut calculer la médiane par la formule suivante : Lo : Limite inférieure de la classe médiane ai : Amplitude de la classe médiane n : Nombre total des observations Ni‑1 effectif cumulé croissant de la classe inférieure à la classe médiane ni : effectif de la classe médiane

La médiane est la valeur de rang (43 + 1) / 2 c’est à dire 22, celle ci se trouve dans la classe 6‑8, la classe 6 ‑ 8 est donc la classe médiane. Me = 6 + 2(21.5 +13)/12

Moyenne Arithmétique Appelée moyenne notée Population m (mean) Echantillon x (average) Appelée moyenne notée Paramètre central qui concerne bien évidemment uniquement des variables quantitatives. Dans l’unité de la variable. Calculable quelque soit la loi qui régit la distribution. Suivant la forme de présentation des observations, différentes formules de calcul peuvent être employées. 23

Moyenne arithmétique On note : n : Nombre total de mesures. k : Nombre de valeurs différentes observées. ni : Nombre d’occurrences de la valeur observée i. fi : Fréquence relative (pourcentage) de la valeur observée i. 24

2.3 La moyenne arithmétique La moyenne arithmétique d'une série statistique (xi, ni) se calcule de la manière suivante : La moyenne s'exprime toujours dans la même unité que les observations xi . Elles peut être décimale, même si les xi sont entiers par nature.

Ainsi la moyenne arithmétique du nombre d'appels reçus à un standard est : 2,97 appels

Plus généralement, lorsqu'on ne dispose que de la distribution regroupée en classes

on calculera la moyenne par : xi étant le centre de classe.

Exemple Soit la série correspondant aux tailles en cm de 6 étudiants : 160,170,180,180, 190, 200. n = 6; T = 160+170+180+180+190+200 = 1080 29

nombre de familles (ni) Exemple Le nombre de familles enquêtées est de 53. Le nombre total d’enfants est de 77. La moyenne du nombre d’enfants par famille est de 77/53 = 1,45. Attention aux arrondis ici si on arrondit à une décimale la moyenne est de 1,5 enfants par famille. nombre d'enfants (xi) nombre de familles (ni) ni*xi 10 1 20 2 15 30 3 5 4 12 Total 53 77 30

Remarque 1: Pour plusieurs populations d'effectifs n1, n2, ....., nk, de moyennes respectives : moyenne globale = moyenne des moyennes

Comparons le salaire moyen dans 2 entreprises Entreprise A : 1/ 3 de femmes , salaire moyen 8000Dh 2/3 hommes, salaire moyen 11000 Dans l'entreprise A le salaire moyen est de : …. Entreprise B : 2/ 3 de femmes , salaire moyen 9000Dh 1/3 hommes, salaire moyen 12000 Dans l'entreprise B le salaire moyen est de : ….

On constate donc que le salaire moyen de B est égal à celui de A On constate donc que le salaire moyen de B est égal à celui de A. Pourtant le salaire moyen des hommes est supérieur en B à celui des hommes en A. Il en est de même pour les femmes. D'où vient ce résultat paradoxal ? Il s'agit d'un effet de structure : cela vient du fait que les femmes (au salaire plus bas) sont plus nombreuses en B qu'en A.

Exemple Les étudiants de première année de L1 santé sont répartis dans 3 amphithéâtres avec les données ci-dessous. Quelle est la moyenne de l’âge en L1 santé ?   Effectifs Moyenne de l'âge en années Amphi 1 1000 18,1 Amphi 2 500 19,5 Amphi 3 18,3 Les effectifs étant différents dans les 3 groupes, la moyenne recherchée n’est pas la moyenne des moyennes. On calcule le total de l’âge des 3 groupes réunis : T = 18,1*1000+ 500*19,5+ 18,3*1000 =46 150. L’effectif total est de 2 500. La moyenne recherchée est 46150/2500 =18,5 ans 34

Moyenne arithmétique Propriétés : Centre de gravité de la distribution. La somme des écarts à la moyenne est nulle. La moyenne minimise les distances au carré 35

3. Moyennes Avantages Elle a de bonnes propriétés calculatoires comme la linéarité : si est la moyenne d’une série (xi, ni) alors la moyenne de la série (axi+b, ni) est Elle prend en compte l’ensemble des valeurs (contrairement au mode).

3. Moyennes Inconvénient Elle est très sensible aux valeurs « extrêmes ». Exemple : si dans votre entreprise les 10 salariés (dont vous faites partie) gagnent chacun 1500€ par mois et que le patron gagne lui 7000€ par mois, le salaire moyen mensuel est de 2000€… Par valeur « extrême », on entend valeur sensiblement différente des autres.

De combien augmenterait la moyenne ? Exemple Dans une entreprise de 100 salariés, le salaire moyen est égal à 8 400 Dh. Supposons qu'une erreur se soit glissée lors de la transcription des salaires. Monsieur Dahbi est crédité d'un salaire de 108 000 DH au lieu de 8 000 Dh. De combien augmenterait la moyenne ?

La nouvelle moyenne est de : ……. Une seule valeur (sur 100) peut donc beaucoup modifier la moyenne. La moyenne arithmétique est sensible aux valeurs extrêmes.

Les autres moyennes Moyenne géométrique d'une série de valeurs positives est la racine nième du produit des n valeurs. Elle est toujours inférieure ou égale à la moyenne arithmétique. Moyenne harmonique d'une série de valeurs positives est égale à l'inverse de la moyenne des inverses. Moyenne quadratique est la racine carré de la moyenne arithmétique des carrés. 40

3. Moyennes Moyenne géométrique Avec les notations précédentes : est la moyenne géométrique de la série statistique. Même convention que précédemment si l’on ne dispose que du regroupement en classes : on prend pour xi le centre de la ième classe. Pour le calcul, on applique: Log G = n1Logx1+n2Logx2+….+nkLogxk

3. Moyennes Exemple L’essence a augmenté de 10% l’an dernier et de 30% cette année. Quelle est le taux d’augmentation annuelle ? Ce n’est pas 20% ! La moyenne arithmétique ne convient pas. Si t est ce taux, on a bien sûr : et donc t =0,196=19,6%. La « bonne » moyenne est ici la moyenne géométrique. L’utilisation de la moyenne géométrique est toutefois beaucoup plus marginale que celle de la moyenne arithmétique. Mais il est bon d’en avoir entendu parler ! Elle est bien entendu très adaptée aux séries statistiques dont les valeurs sont en progression géométrique, comme dans cet exemple.

3. Moyennes Moyenne harmonique Toujours avec les notations précédentes : est la moyenne harmonique de la série statistique. Même convention que précédemment si l’on ne dispose que du regroupement en classes : on prend pour xi le centre de la ième classe.

3. Moyennes Exemple Si je fais un trajet aller-retour avec une vitesse v1 à l’aller et une vitesse v2 au retour, quelle est ma vitesse moyenne sur l’ensemble du trajet ? La réponse n’est pas Mais qui est la moyenne harmonique de v1 et v2. Même marginalité que pour la moyenne géométrique. L’étudiant qui a des doutes refera le calcul, ce qui lui rappellera sa tendre enfance puisque l’on fait ce type de moyenne (certes sans le dire) en troisième…

Positions respectives du mode, de la médiane et de la moyenne pour une distribution unimodale.  Lorsque la distribution est symétrique les trois paramètres sont confondus. Lorsque la distribution est asymétrique, la médiane est généralement située entre le mode et la moyenne et plus proche de cette dernière.

Exemple Ex: Absentéisme dans le service Achats Le mode La médiane Jours absentéisme Nb. employés Fréquences relative % relative % cumulées 5 19 1 8 30 49 2 6 22 71 3 11 82 4 7 89 93 100 Ex: Absentéisme dans le service Achats Le mode Le mode = 1 La médiane Médiane= 2 La moyenne arithmétique Moyenne = 2 Faire graphique pour la médiane 47 47

Quelle mesure de tendance retenir ? Tout dépend de ce qu’on veut étudier. Le mode: peu utilisé Médiane: stable Moyenne: informative mais instable 48