La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Les caractéristiques des distributions à un caractère Tendance centrale, dispersion, disparité et concentration.

Présentations similaires


Présentation au sujet: "Les caractéristiques des distributions à un caractère Tendance centrale, dispersion, disparité et concentration."— Transcription de la présentation:

1 Les caractéristiques des distributions à un caractère Tendance centrale, dispersion, disparité et concentration.

2 Les indicateurs de tendance centrale Les moyennes On peut calculer 2 types de moyennes : La moyenne arithmétique (ou moyenne simple). Il sagit dune moyenne calculée de telle sorte que chaque variable de la population étudiée a le même poids dans le calcul. La moyenne pondérée tient compte du poids qua chaque valeur. On va pondérer chaque valeur dun coefficient. La médiane Cest la valeur dune série statistique qui divise en 2 groupes égaux la population étudiée. Le mode Cest la valeur dune série statistique qui est la plus fréquente.

3 Tendance centrale et caractéristique de forme Une distribution est symétrique si les observations, repérées par leurs fréquences sont également dispersées de part et dautres de la valeur centrale. Une distribution est symétrique si mode, moyenne et médiane sont confondues. Les indicateurs de tendance centrale nous renseignent sur lordre de grandeur de la série statistique et sur sa forme.

4 Tendance centrale et caractéristique de forme Une courbe non symétrique est dite oblique: lobliquité se repère du côté de la décroissance la plus forte de la courbe des fréquences.

5 Limite des indicateurs de tendance centrale Exemple: 2 élèves ont les notes de SES suivantes: Elève 1 : 2;2;2;2;10;10;10;10;10;18;18;18;18 Elève 2 : 9;9;9;9;10;10;10;10;10;11;11;11;11 Ces 2 élèves ont la même moyenne, le même mode et la même médiane. Ainsi, les indicateurs de tendance centrale ne montrent pas les irrégularités des notes. Il parait donc utile de mettre en relief ces écarts. La notion de dispersion va donc compléter linformation sur les séries statistiques.

6 La dispersion On appelle dispersion statistique, la tendance qu'ont les valeurs de la distribution d'un caractère à s'étaler, à se disperser, de part et d'autre d'une valeur centrale. Exemple : analyser les inégalités de revenus en France, cest-à-dire les écarts plus ou moins importants par rapport à la moyenne On distingue la dispersion absolue (mesurée dans l'unité de mesure du caractère), et la dispersion relative (mesurée par un nombre sans dimension).

7 Les mesures de la dispersion absolue Les paramètres de dispersion absolue indiquent de combien les valeurs d'une distribution s'écartent en général de la valeur centrale de référence. Les mesures de la dispersion absolue sexpriment dans lunité de mesure de la variable considérée. Exemples: Pour le nombre d'habitants en 2006, il sagira du nombre d'habitants Pour la part des cadres dans le total de la population active occupée, il sagira de % de personnes actives occupant un emploi de cadre. Les trois paramètres de dispersion absolue les plus courants sont l'étendue, l'écart type et l'intervalle inter quantile

8 Létendue ou amplitude L'étendue ou amplitude d'une distribution est égale à la différence entre la plus grande et la plus petite valeur de la distribution : Etendue de X = Xmax –Xmin Ainsi, pour le nombre dhabitants des plus grandes villes françaises, létendue de la série est de habitants. Lamplitude pour la part des cadres dans la population active occupée de ces mêmes villes est de 31,26 points.

9 La mesure de la dispersion statistique et les valeurs centrales A lexception de lamplitude, les paramètres de dispersion statistique caractérisent lécart des valeurs de la distribution statistique de part et d'autre d'une valeur centrale de référence. Il peut sagir de la moyenne ou de la médiane.

10 Mesures de la dispersion autour de la moyenne La variance de X, notée σ² est une mesure globale de la variation d'un caractère de part et d'autre de la moyenne arithmétique. Elle exprime la dispersion dans une unité de lordre du carré de lunité de mesure du caractère. Pour obtenir un paramètre de dispersion absolue, on calcule la racine carrée de la variance L'écart type, noté σ est la racine carré de la moyenne des carrés des écarts à la moyenne, c'est à dire la racine carrée de la variance.

11 La signification probabiliste de lécart-type Lécart-type σ a l'avantage d'avoir une signification probabiliste. La théorie des probabilités permet en effet d'estimer la chance qu'a une valeur d'être éloignée de la moyenne de plus d'un certain nombre d'écart-types. Lorsqu'une distribution est gaussienne (on dit aussi "normale") les probabilités de trouver les valeurs a une distance donnée de la moyenne μ sont les suivantes : 68,3% des valeurs sont entre μ-σ et μ+σ 95,5% des valeurs sont entre μ-2σ et μ+2σ 99,7 % des valeurs sont entre μ-3σ et μ+3σ

12 Mesures de la dispersion autour de la médiane Les quantiles sont les valeurs du caractère qui définissent les bornes d'une partition en classes d'effectifs égaux. Nombre de parties Nombre de quantiles Nom du quantile MédianeQuartileQuintileDécileVingtileCentile

13 Les écarts et les rapports interquantiles L'intervalle interquartile (Xq3-Xq1) est l'étendue de la distribution sur laquelle se trouvent concentrée au moins la moitié des éléments dont les valeurs de X sont les plus proches de la médiane. On exclut alors de la distribution les 25% des valeurs les plus faibles et les 25 % des valeurs les plus fortes de X. L'intervalle interdécile (Xd9-Xd1) est l'étendue de la distribution sur laquelle se trouvent concentrés 80% des éléments dont les valeurs de X sont les moins différentes de la médiane. On exclut alors de la distribution les 10 % des valeurs les plus faibles et les 10% des valeurs les plus fortes.

14 Les mesures de la dispersion relative Eliminer leffet de lunité de mesure du caractère pour pouvoir comparer les degrés de dispersion de deux caractères Deux mesures usuelles de la dispersion relative à partir de: lintervalle interquantile: lintervalle interquantile relatif (IIQR) le rapport interquantile lécart-type: le coefficient de variation (CV)

15 Exemple : la distribution des niveaux de vie en France Lecture : en 2006, en France, 10 % des individus ont un niveau de vie inférieur à 9723 euros. Le plus pauvre des 10 % les plus riches avait un niveau de vie 3.4 fois plus élevé que le plus riche des 10 % les plus pauvres. (en euros 2006) er décile (D1) ème décile (D2) ème décile (D3) ème décile (D4) Médiane (D5) ème décile (D6) ème décile (D7) ème décile (D8) ème décile (D9) Rapport interdécile (D9/D1) 3,143,41 Sources : Insee-DGI, enquêtes Revenus fiscaux 2002 à 2005, Insee-DGFiP-Cnaf-Cnav-CCMSA, enquêtes Revenus fiscaux et sociaux 2005 et 2006.

16 Avantage et limites des quantiles Les quantiles permettent déliminer les problèmes liés aux valeurs extrêmes exceptionnelles. Les indicateurs de dispersion utilisant les quantiles ignorent : Ce qui se passe entre les valeurs limites des quantiles extrêmes. Ce qui se passe au-delà des valeurs limites des quantiles extrêmes.

17 La boîte à moustaches En mathématiques, les élèves ont lhabitude de représenter les séries statistiques à laide dun graphique appelé « boîte à moustaches ».

18 Les diagrammes en boîte

19 La mesure de la disparité La disparité consiste à mesurer lécart entre les valeurs centrales qui caractérisent une ou plusieurs populations statistiques. Exemple : comparer les revenus entre la France et les EU, analyser les disparités régionales, entre PCS, entre sexes,… en termes de chômage, de revenus…)

20 Exemple : la distribution des niveaux de vie moyen en France Lecture : En 2006, le niveau de vie des 10% de la population les plus pauvres était en moyenne de Entre 2004 et 2006, le niveau de vie moyen des français a augmenté de 10.4%. Les inégalités ont elles aussi augmenté, le rapport du niveau de vie moyen des 10% de la population les plus riches sur celui des 10% les plus pauvres passant de 5,63 à 6,75. On peut dailleurs noter que cette évolution sexplique par la stagnation des niveaux de vie moyen des 10% les plus pauvres et par une augmentation près de 20% du niveau de vie moyen du dixième de la population le plus aisé. Dixième de la population ordonné par niveau de vie croissant er ème ème ème ème ème ème ème ème ème Ensemble Rapport (B)/(A)5,636,75

21 Disparité versus dispersion Dans des sociétés comme la nôtre, le rapport des revenus moyens des deux dixièmes extrêmes est en général un meilleur indicateur des inégalités que le rapport interdécile. Exemple: Une amélioration des revenus des 5% les plus pauvres. Une hausse des revenus des 1% les plus riches. Dans les 2 cas ci-dessus, le rapport interdécile reste inchangé.

22 La concentration La concentration permet de visualiser les conséquences de la dispersion. Elle concerne les variables continues ne pouvant prendre que des valeurs positives. Nous limiterons notre méthode de détermination de la concentration à la méthode graphique.

23 La courbe de Lorenz (1905) La courbe de Lorenz permet de visualiser la concentration. Cette courbe se construit dans un repère orthonormé : Les valeurs de la fréquence cumulée de la population en abscisses. Les valeurs de la fréquence cumulée des revenus ou du patrimoine.

24 Des exemples de courbes de Lorenz Plus la courbe de Lorenz séloigne de la droite déquirépartition (cette surface est appelée surface de concentration), plus la concentration (les inégalités) est forte. Sur la représentation ci- contre, on peut sapercevoir que le Portugal a une distribution des revenus plus inégalitaire que la France Source : Eurostats, 2004.

25 Le coefficient de Gini Cet indice est égal au rapport de deux surfaces : Au numérateur, on trouve la surface comprise entre la droite déquirépartition et la courbe de Lorenz, appelée surface de concentration. Au dénominateur, la surface du triangle compris entre la droite déquirépartition et laxe des abscisses.

26 Comparaison de coefficient de Gini Le coefficient de Gini est un nombre compris entre 0 et 1. Plus il est grand (plus la surface de concentration est grande), plus la répartition est inégalitaire. Le coefficient de Gini de la France est de 0,27 et celui du Portugal est de 0,37.

27 Une critique de Gini par Chauvel La pertinence des mesures offertes par le coefficient de Gini est discutable car il sagit dune mesure unidimensionnelle de linégalité. Exemple de Chauvel.

28 Les strobiloïdes Pour résoudre ce problème, il faut utiliser une loi de Champernowne. Cette fonction de répartition se dérive, ce qui permet d'obtenir la densité de la répartition. α est un indicateur de densité et donc dhomogénéité de la classe moyenne. Plus α est grand, plus la courbe est asymétrique. échelle de revenu dont l'unité est le revenu médian

29 Les strobiloïdes La courbe représentative de cette fonction est appelée strobiloïde, elle prend ce nom en l'honneur de Henri Mendras, et de la toupie (στροβιλοσ) de sa Seconde révolution française (Mendras, 1994), qui mettait en évidence le fait que la société ne se scinde pas en deux, et que l'architecture sociale échappe largement à une logique univoque de domination. Revenu médianisé Part de la population

30 Lavantage des strobiloïdes En superposant 2 strobiloïdes, on peut avoir une lecture immédiate des conséquences dun partage du revenu disponible dans la population, en termes de qui est gagnant et qui est perdant. Ainsi, Chauvel propose des simulations de déformation de la courbe française de répartition des revenus vers des modèles de répartition dautres pays.

31 Déformation de la courbe française vers le modèle américain Principales conséquences sur la répartition du revenu disponible : Baisse de 36% du premier décile. Baisse de 14 % du premier quartile. Hausse du dernier quartile de 8 %. Prélever une part substantielle du revenu disponible des plus pauvres (moins de prestations sociales) ne dégage en définitive que des sommes fort modestes et ne conduit quà un enrichissement très limité des plus riches. Revenu médianisé Part de la population

32 Déformation de la courbe française vers le modèle suédois Principales conséquences sur la répartition du revenu disponible : Accroissement de 13 % du premier décile. Hausse du premier quartile de 18%. Hausse du revenu médian de 12 % Baisse de 11% pour le dernier décile. Baisse de 18 % pour le dernier vingtile. Cette évolution profiterait donc surtout au bas de la classe moyenne. On conserverait à lidentique la pauvreté relative, cest-à-dire la distance entre les pauvres et les gens moyens. Revenu médianisé Part de la population


Télécharger ppt "Les caractéristiques des distributions à un caractère Tendance centrale, dispersion, disparité et concentration."

Présentations similaires


Annonces Google