Les principaux résumés de la statistique Les résumés de position et de valeur centrale LA STATISTIQUE DESCRIPTIVE Année 2005-2006 COURS STATISTIQUE – Les résumés de la statistique Jean-Louis MONINO
Veuillez cliquer sur l’un des boutons MENU GENERAL Veuillez cliquer sur l’un des boutons COURS EXERCICE Fractal FIN
Veuillez cliquer sur l’un des boutons Menu du cours Veuillez cliquer sur l’un des boutons Valeurs centrales Dispersion Forme des distributions Fractal MENU GENERAL
Menu des résumés de positions et de valeurs centrales Veuillez cliquer sur l’un des boutons Conditions de YULE Moyenne Arithmétique Moyenne Géométrique Médiane Moyenne Harmonique Fractal Mode Moyenne quadratique Quartiles Déciles et centiles RETOUR MENU
Propriétés souhaitables Les distributions statistiques à une variable sont représentées par un petit nombre d'indicateurs (résumés numériques) qui doivent être représentatifs de la distribution statistique. Il est souhaitable que les paramètres ou résumés numériques possèdent certaines propriétés, appelées conditions de Yule : être définis de manière objective, dépendre de toutes les observations, avoir une signification concrète, être facilement calculables et interprétables, être peu sensibles aux fluctuations d'échantillonnage, se prêter aisément aux calculs algébriques. COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS RETOUR MENU
COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS La médiane Voir exercice Définition La médiane XM d'une distribution statistique est la valeur de la variable qui partage l'effectif total de la distribution en deux parties égales, telles que la première moitié des observations soit inférieures (ou égales) à XM et la seconde moitié soit supérieures (ou égales) à XM. COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS RETOUR MENU
COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS La médiane (suite) Voir exercice Calcul de la médiane Si (xi , Fi(x)) est la distribution des fréquences cumulées d'une variable statistique, alors la médiane est donnée par l'équation : F(XM) = 1/2 Si la variable est continue on effectue une interpolation à l’intérieure de la classe médiane. COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS RETOUR MENU
Les quartiles, déciles et centiles Définition des quartiles Les quartiles Q1, Q2, Q3, sont les valeurs d'une série ou d'une distribution statistique rangée par ordre croissant (ou décroissant) qui partagent l'effectif total en quatre parties égales. Si (xi , Fi(x)) représente la distribution de fréquences relatives cumulées d'une variable statistique, alors les quartiles sont donnés par les équations : F(Q1) = 0.25 F(Q2) = 0.5 F(Q3) = 0.75 COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS Le quartile Q2 d'une variable statistique est égale à la médiane XM RETOUR MENU
Les quantiles (suites) Définition des déciles et centiles Les déciles, notés D1, D2, D3 ,..., D9 (resp. les centiles ou percentiles, souvent notés C1, C2, C3,..., C99 ) partagent l'effectif total d'une série ou d'une distribution statistique rangée par ordre croissant (ou décroissant) en dix (resp. cent) parties égales. Si l'on reprend les notations ci-dessus nous avons la relation : C50 = D5 = Q2 = XM ; C10 = D1 ; C90 = D9 . COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS RETOUR MENU
COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS Le mode Voir exercice Définition restrictive Le mode Xm d'une série ou d'une distribution statistique est la valeur de la variable pour laquelle l'effectif est le plus élevé ; on parle alors de mode absolu. Définition élargie Le mode Xm d'une série ou d'une distribution statistique est la valeur de la variable dont l'effectif ou la fréquence est encadré par deux valeurs qui lui sont inférieures ; on parle alors de mode relatif. COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS Lorsqu'une série ou une distribution statistique possède un seul mode on dit que la série ou la distribution est unimodale, en possède plusieurs, on dit qu'elle est multimodale RETOUR MENU
COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS Le mode (suite) Voir exercice Calcul du mode Lorsque les variables sont groupées en classes il est parfois utile de remplacer la notion de classe modale par la notion de mode, pour cela on effectue une interpolation linéaire à l'intérieur de la classe modale ; la détermination se fait de la façon suivante : COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS RETOUR MENU
La moyenne arithmétique Voir exercice Définition Soit x1, ..., xi, ..., xr les r observations numériques d'une variable statistique X et soit les effectifs respectifs n1, ..., ni, ..., nr de ces r valeurs numériques avec : COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS RETOUR MENU
La moyenne géométrique Définition Soit x1, ..., xi, ..., xr les r observations numériques d'une variable statistique X et soit les effectifs respectifs n1, ..., ni, ..., nr de ces r valeurs numériques avec : COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS RETOUR MENU
COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS La moyenne harmonique Définition Soit x1, ..., xi, ..., xr les r observations numériques d'une variable statistique X et soit les effectifs respectifs n1, ..., ni, ..., nr de ces r valeurs numériques avec : COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS RETOUR MENU
La moyenne quadratique Définition Soit x1, ..., xi, ..., xr les r observations numériques d'une variable statistique X et soit les effectifs respectifs n1, ..., ni, ..., nr de ces r valeurs numériques avec : COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS RETOUR MENU
Menu des résumés des valeurs de dispersion Veuillez cliquer sur l’un des boutons Étendue Variance – écart type Fractal RETOUR MENU
COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS L’étendue Les résumés de dispersion Définition L'étendue est la mesure la plus simple de la dispersion (ou variabilité ou étalement) des observations faites sur une variable. L'étendue ne dépend que très indirectement de l'ensemble des valeurs xi de la variable X. L'étendue est très influencée par les valeurs extrêmes de la variable statistique qui sont parfois aberrantes, ce qui en fait une mesure peu utilisée. COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS RETOUR MENU
La variance et l’écart-type Voir exercice Définition Soit X une variable statistique de distribution (xi, ni) où , on appelle variance (mesure de dispersion ou de variabilité), notée, la moyenne arithmétique pondérée des carrés des écarts à la moyenne arithmétique pondérée : COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS On appelle écart-type de la variable X, noté, la racine carrée de la variance : RETOUR MENU
Les moments non-centrés d’ordre r Voir exercice Définition Soit la distribution statistique (xi, ni) où , on appelle moment non centré d’ordre r de la variable statistique X ,la quantité définie par : COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS RETOUR MENU
Les moments centrés d’ordre r Voir exercice p=2 Voir exercice p=3 Définition Voir exercice p=4 Soit la distribution statistique (xi, ni) où , on appelle moment non centré d’ordre r de la variable statistique X ,la quantité définie par : COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS RETOUR MENU
Menu des caractéristiques asymétrie et d’aplatissement Veuillez cliquer sur l’un des boutons Présentation Moment non centré Moment centré Fractal Asymétrie Aplatissement RETOUR MENU
Les caractéristiques de forme Les différents indicateurs d’asymétrie et d’aplatissement permettent en premier lieu la comparaison entre les distributions statistiques. l’asymétrie d’une distribution peut être approchée par une comparaison entre le mode, la médiane et la moyenne arithmétique (vision empirique). l’aplatissement peut être approchée par l’étude des observations aux alentours du mode. Plus le nombre d’individus ayant une valeur proche du mode de la distribution, plus la courbe sera concentrée et plus l’aplatissement sera faible. COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS RETOUR MENU
Le coefficient d'asymétrie de Pearson Voir exercice Définition L'approche de la mesure de l’asymétrie est réalisée grâce à la notion de moment centré. COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS Si AP est nul alors la distribution est symétrique. Si AP est positif alors il y a asymétrie. Le signe est donné par le moment centré d’ordre 3 Voir asymétrie de Fisher RETOUR MENU
Le coefficient d'asymétrie de Fisher Définition L'approche de la mesure de l’asymétrie pour Fisher est réalisée à partir de la définition de Pearson. S’il est calculé directement, alors il est possible d’écrire : Si AF = 0 alors la distribution est symétrique, Si AF > 0 alors la distribution est étalée vers la droite, Si AF < 0 alors la distribution est étalée vers la gauche. COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS RETOUR MENU
Le coefficient d'aplatissement de Pearson Définition L'approche de la mesure de l’aplatissement est réalisée grâce à la notion de moment centré. Si APP = 3 alors la distribution est dite « normale » ou mésokurtique (de mêmes paramètres),, Si APP < 3 alors la distribution est dite plus aplatie que la « normale » ou platykurtique (de mêmes paramètres),, Si APP > 3 alors la distribution est dite moins aplatie que la « normale » ou leptokurtique (de mêmes paramètres). COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS Voir aplatissement de Fisher RETOUR MENU
Le coefficient d'aplatissement de Fisher Voir exercice Définition L'approche de la mesure de l’asymétrie pour Fisher est réalisée à partir de la définition de Pearson. Si APP = 0 alors la distribution est dite « normale » ou mésokurtique (de même paramètres), Si APP < 0 alors la distribution est dite plus aplatie que la « normale » ou platykurtique (de même paramètres), Si APP > 0 alors la distribution est dite moins aplatie que la « normale » ou leptokurtique (de même paramètres). COURS STATISTIQUE DESCRIPTIVE - DESCRIPTIVE DEFINITIONS RETOUR MENU
Veuillez cliquer sur l’un des boutons Menu exercice Veuillez cliquer sur l’un des boutons La médiane Les calculs Le moment – m3 La moyenne L’histogramme Le moment – m4 Les effectifs Asymétrie Le mode Aplatissement La variance Fractal Les moments - m MENU COURS
EXERCICE STATISTIQUE DESCRIPTIVE Présentation d’un exercice Variable statistique continue groupée en classes LE TABLEAU DES CALCULS L’ensemble de ces sommes permettent de déterminer les principaux résumés : moyenne, variance, moments, asymétrie et aplatissement EXERCICE STATISTIQUE DESCRIPTIVE r est le nombre de classes xi est la borne de classe ni est l’effectif de classe MENU EXERCICE
EXERCICE STATISTIQUE DESCRIPTIVE L’histogramme L’amplitude de base est de 5 unités EXERCICE STATISTIQUE DESCRIPTIVE MENU EXERCICE
La somme des effectifs ou effectif total EXERCICE STATISTIQUE DESCRIPTIVE Cette somme correspond au nombre d’individus de l’échantillon ou qui ont un age entre 20 ans et plus de 75 ans C’est l’effectif total. ni est l’effectif de classe MENU EXERCICE
Le mode (regroupement en classe) Le mode XM d'une série ou d'une distribution statistique est la valeur de la variable pour laquelle l'effectif est le plus élevé. Ici la distribution est unimodale. FAIRE LE CALCUL SUR LES EFFECTIFS CORRIGES La classe modale EXERCICE STATISTIQUE DESCRIPTIVE Le mode n’existe pas. Nous avons un intervalle modal. Néanmoins, nous pouvons calculer une valeur qui par définition est obtenue par : MENU EXERCICE
EXERCICE STATISTIQUE DESCRIPTIVE La médiane Définition La médiane Xm d'une distribution statistique est la valeur de la variable qui partage l'effectif total de la distribution en deux parties égales, telles que la première moitié des observations soit inférieures (ou égales) à Xm et la seconde moitié soit supérieures (ou égales) à Xm. La classe médiane Effectifs cumulés croissants EXERCICE STATISTIQUE DESCRIPTIVE MENU EXERCICE
La moyenne arithmétique Le rapport de ces deux quantités donne la moyenne arithmétique de la distribution statistique EXERCICE STATISTIQUE DESCRIPTIVE On obtient la moyenne arithmétique : MENU EXERCICE
La variance ou dispersion On obtient : Le rapport de ces deux quantités donne la variance de la distribution statistique. EXERCICE STATISTIQUE DESCRIPTIVE On obtient : Voir également moment centré 2 MENU EXERCICE
Moments non centré d’ordre 2, 3 et 4 Moment non centré d’ordre s EXERCICE STATISTIQUE DESCRIPTIVE MENU EXERCICE
Le moment centré d’ordre 2 Le moment centré d’ordre : correspond à la variance La variance est un moment non centré d’ordre 2 moins un moment non centré d’ordre 1 élevé au carré. EXERCICE STATISTIQUE DESCRIPTIVE MENU EXERCICE
Le moment centré d’ordre 3 En fonction des moments non centrés Calcul EXERCICE STATISTIQUE DESCRIPTIVE Solution MENU EXERCICE
Le moment centré d’ordre 4 En fonction des moments non centrés Calcul EXERCICE STATISTIQUE DESCRIPTIVE Solution MENU EXERCICE
EXERCICE STATISTIQUE DESCRIPTIVE Asymétrie de Pearson Le coefficient de Pearson Calcul EXERCICE STATISTIQUE DESCRIPTIVE Coefficient sans dimension Décision : La distribution est asymétrique étalée vers la droite. Le coefficient est positif (asymétrie) et le moment centré d’ordre 3 est positif (étalée vers la droite ou oblique à gauche) MENU EXERCICE
Aplatissement de Fisher Le coefficient de Fisher Calcul Coefficient sans dimension EXERCICE STATISTIQUE DESCRIPTIVE Décision : La distribution est plus aplatie que la loi normale de mêmes paramètres. La distribution est « platykurtique ». Les paramètres sont ici : MENU EXERCICE
Fin des définitions & Graphiques LA STATISTIQUE Année 2005-2006 DESCRIPTIVE COURS STATISTIQUE DESCRIPTIVE - DEFINITIONS Jean-Louis MONINO MENU GENERAL