Télécharger la présentation
Publié parInès Bordes Modifié depuis plus de 11 années
1
Le taux de variation (ou variation relative) est définie par :
Exemple 3 : L'échelle logarithmique transforme en droite les graphiques montrant des évolutions à taux constant On souhaite faire un graphique indiquant l'évolution du chiffre d'affaires d'une entreprise dont la croissance est très rapide : Années Y : CA (en euros) 2001 100 2002 1000 2003 10000 2004 100000 2005 Comme on peut le voir en comparant les deux graphiques ci-dessous, la progression qui est exponentielle à gauche, devient linéaire à droite : Le taux de variation (ou variation relative) est définie par : On déduit que :
2
En prenant les logarithmes à droite et à gauche on obtient :
Donc la différence entre deux points donne une mesure du taux de variation. Années Y : CA (en euros) 2001 100 2002 1000 2003 10000 2004 100000 2005 entre Variation absolue Variation relative 100 et 1000 900 ( )/100 = 9 1000 et 9000 ( )/1000 = 9 et 90000 ( )/10000 = 9 Les variations relatives sont constantes alors que les variations absolues ne le sont pas. Si on prend le logarithme des nombres ci-dessus, on aura : entre log (1 + t ) Variation relative 100 et 1000 log(1000) – log(100) = = 1 9 1000 et log(10000) – log(1000) = = 1 et log(100000) – log(10000) = = 1 La différence en logarithme est bien constante et à une variation donnée du logarithme correspond une variation relative constante.
3
. . 1-5-3- b: Les coordonnées polaires.
Dans le repère orthogonal (figure de gauche) le point P est déterminé sans ambiguïté par la connaissance de ses coordonnées cartésiennes, l’abscisse x et l’ordonnée y. Si nous considérons la figure de droite, la demi droite [Ox) dont l’origine O est appelé pôle il est bien évident que le même point P peut aussi être repéré grâce à la connaissance de la mesure de q du secteur angulaire limité par [Ox) et [OP) et de r = OP (distance entre les points O et P). q et r sont les coordonnées polaires du point P. P . x y O y P . q r x O Exemple : Supposons que nous ayons à traduire graphiquement les renseignements statistiques suivants, portant sur les mesures, en milliers d’euros, du chiffre d’affaires mensuel d’une entreprise, observé au cours de deux années consécutives. Mois 1 2 3 4 5 6 7 8 9 10 11 12 Année 1 28 22 27 32 35 29 18 39 47 45 Année 2 31 33 37 20 41 49 52
4
Traçons à partir d’un pôle O, 12 demi-droites formant entre elles des secteurs angulaires dont la mesure en degrés est 360/12 = 30 et portant sur ces demi-droites des longueurs proportionnelles aux mesures des chiffres d’affaires données, chacune de ces demi-droites étant affectée à un mois. Joignant ensuite, dans l’ordre, les points obtenus. Cette représentation polaire prend approximativement la forme d’une spirale (graphique en colimaçon). Pareille représentation est surtout intéressante lorsque les observations statistiques sont faites à intervalles réguliers dans le temps (observations horaires, mensuelles, trimestrielles) et lorsque l’évolution du phénomène observé se fait toujours, ou presque toujours, dans le même sens : croissant ou décroissant. Elle permet aussi de mettre en évidence les influences saisonnières.
5
1-5-3- c: Les coordonnées triangulaires.
Ce type de diagramme peut être utilisé dans le cas d’un phénomène pouvant être divisé en trois sous-ensembles : Des prix de revient décomposés en : coût des matières premières, dépenses de main-d’œuvre, frais de fabrication. - Des stocks ventilés en : stocks de matières premières, stocks de produits en cours de fabrication, stocks de produits finis etc. Exemple : Une société a fondé un certain nombre de petites entreprises. À une date donnée le bilan de ces entreprises se décomposent de la façon suivante (les nombres fournis sont des taux de pourcentages) : Matières premières Produits en fabrication Produits finis Total Entreprise A B C D E F 45 25 20 60 30 40 15 50 35 100 Pour représenter graphiquement ces résultats, remarquons d’abord que pour chaque entreprise, le total des trois taux est égal à 100.
6
Ainsi : d(A, P) + d(A, Q) + d(A, R) = d(M, H) = constante.
La représentation graphique que nous allons construire est fondée sur la propriété suivante des triangles équilatéraux :’’ La somme des mesures des distances d’un point d’un triangle équilatéral aux côtés de ce triangle est constante et égale à la mesure de la hauteur du triangle équilatéral ’’. Ainsi : d(A, P) + d(A, Q) + d(A, R) = d(M, H) = constante. P L M R Q N A H L P M R Q N Matières premières Produits fabrication Produits finis 100 Traçons un triangle équilatéral. Affectons chacun de ses côtés à l’une des trois composantes des produits à représenter. Graduons ses trois hauteurs de 0 à 100 (le 0 l’intersection de la hauteur et du côté correspondant, le 100 au sommet opposé à ce côté).
7
Construisons le point qui traduit le résultat de l’entreprise A :
- Par le point de coordonnée 45 sur la hauteur relative au côté ‘’matières premières’’ traçons la parallèle à ce côté. - Par le point de coordonnée 20 sur la hauteur relative au côté ‘’produits en cours de fabrication’’ traçons la parallèle à ce côté. L’intersection de ces deux parallèles construites est le point représentatif du résultat de l’entreprise A. Ce point se trouverait également sur la parallèle au côté ‘’produits finis’’ menée par le point de coordonnée 35 sur la hauteur relative à ce côté. Les points traduisant les résultats des entreprises B, C, D, E et F seraient obtenus de la même façon. P M R Q N A 45 35 20 Matières premières Produits fabrication Produits finis 100 Les représentations triangulaires sont utilisables lorsque des phénomènes peuvent être ventilés en trois composantes dont le total des mesures est constant. On peut d’ailleurs assurer cette constance en exprimant les mesures des trois composantes à l’aide d’un pourcentage de leur total.
8
Etude des séries statistiques simples
Chapitre 2 : Etude des séries statistiques simples 2-1 : Introduction. Lorsque l’on se livre à l’analyse de données statistiques, la représentation graphique est souvent fort intéressante mais ne permet pas facilement ni l’analyse, ni les comparaisons. C’est pourquoi nous cherchons à tirer, d’une série statistique un certain nombre d’éléments caractéristiques dont le but sera de donner, sous une forme condensée une image de la série étudiée qui soit la plus fidèle possible. Les conditions de représentativité des valeurs typiques ont été posées par Yules. Ces valeurs doivent : 1- être définies de manière objective 2- dépendre autant que possible de toutes les valeurs de la série 3- avoir une signification concrète et aisée à comprendre 4- être simple à calculer 5- être peu sensible aux fluctuations d’échantillonnage 6- se prêter aisément aux calculs algébriques ultérieurs. Dans certains cas, les valeurs typiques ne pourront répondre à toutes ces conditions à la fois. Il faudra avoir toujours à l’esprit leurs insuffisances et leurs limites. Nous étudierons : les paramètres de position et les paramètres de dispersion.
9
2-2 : Le mode ou la classe modale.
Le mode ou valeur modale est la valeur qui représente l’effectif le plus élevé (la valeur que la variable statistique prend le plus fréquemment). 2-2-1 : Variable discrète. 1- statistique du personnel d’une entreprise d’après le nombre d’enfants à charge : le mode est 2 enfants, car l’effectif correspondant, 31, est le plus grand de tous les effectifs observés. 2- l’ensemble : 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18 a pour mode 9. 3- l’ensemble : 3, 5, 8, 10, 12, 15, 16 n’a pas de mode. 4- l’ensemble : 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 a deux modes, 4 et 7, on l’appelle ensemble bimodal. Nb d’enfants à charge Effectifs ni Effectifs cumulés croissants 1 2 3 4 5 6 Total 17 31 20 11 89 22 53 73 84 88 Une distribution n’ayant qu’un seul mode est appelée unimodale. Série unimodale Série bimodale
10
ai : limite inférieure de la classe modale
2-2- 2 : Variable continue. Si la variable est continue, et si les données sont groupées en classes, on parle plutôt de classe modale : la classe ayant l’effectif le plus élevé (effectif ramené à l’unité d’amplitude : nr et non pas ni). Age en années Effectifs nr = ni [20, 25[ [25, 30[ [30, 35[ [35, 40[ [40, 45[ [45, 50[ [50, 55[ [55, 60[ Total 9 27 36 45 18 3 150 On considère la statistique portant sur l’âge des ouvriers d’une entreprise : la classe modale (ou intervalle modal) est [35,40[ qui comprend un nombre de salariés (45) plus grand que chacune des autres classes. On peut identifier le mode comme le centre de la classe, soit 37 ans et demi, ou bien effectuer une interpolation linaire pour obtenir la valeur exacte du mode par la formule suivante : ai : limite inférieure de la classe modale Ai : amplitude de la classe modale = ai+1 - ai Dinf : écart d’effectif entre la classe modale et la classe inférieure la plus proche Dsup : écart d’effectif entre la classe modale et la classe supérieure la plus proche
11
Le Mode On définit le mode comme l’abscisse du point A intersection des droites (BD) et (CE). Les triangles ABF et ADG (respectivement ACF et AEG) sont semblables, donc : mode Dinf Dsup A B E D F G C On déduit que le Mode est donné par la formule suivante : ou avec
12
2-2- 4 : Inconvénients du mode.
2-2- 3 : Avantages du mode. Sa détermination est aisée aussi bien par le graphique (le mode est égale à l’abscisse correspondant au bâton le plus long) qu’à l’aide du tableau statistique. Son intérêt est évident puisqu’il désigne la valeur de la variable qui revient le plus souvent à l’occasion des observations faites. Nb d’enfants à charge Effectifs ni 1 2 3 4 5 6 Total 17 31 20 11 89 2-2- 4 : Inconvénients du mode. Le mode n’a de signification véritable que si l’effectif correspondant est nettement supérieur aux effectifs présentés par les autres valeurs de la variable. Le mode ne doit être retenu que s’il est unique (série unimodale). Une série statistique peut en effet être bimodale ou multimodale. Le mode perd alors toute signification. Série unimodale
13
2-3 : La médiane. 2-3-1 : Variable discrète.
Un candidat à un examen a obtenu les notes suivantes, sur 20, à l’occasion des épreuves qu’il a dû subir : Notes Coefficients 14 8 11 12 10 7 Total 1 3 2 9 Rangeons dans l’ordre croissant les notes obtenues par ce candidat la note 7 (dont le coefficient est 2) étant écrite deux fois, et la note 12 (coefficient 3) étant écrite trois fois. Dans la série ainsi écrite et qui compte neuf termes, 9 étant la somme des coefficients (ou somme des effectifs), on dira que la note médiane est 11, car les notes inférieures à 11 sont au nombre de quatre et les notes supérieures à 11, sont également au nombre de quatre. La médiane est la valeur de la variable telle que le total des effectifs correspondant à des valeurs inférieurs de la médiane, soit égale au total des effectifs correspondant à des valeurs supérieures de la médiane. Si le candidat en question avait subi une épreuve supplémentaire, avec coefficient 1, et obtenu à cette épreuve la note 6, l’ordre des notes : (les notes étant au nombre de dix) aurait conduit à un intervalle médian [10, 11], où à la rigueur à une médiane égale à 10.5, centre de la classe médiane. On remarquera qu’on obtiendrait la même médiane si au lieu d’être écrites dans l’ordre croissant, les notes étaient rangées dans l’ordre décroissant.
14
La série des notes se présenterait alors comme suit :
Supposons maintenant que le candidat ait subi une autre épreuve, avec coefficient 3, ce qui porte à 13 la somme des coefficients et qu’il ait obtenu à cette épreuve la note 17. La série des notes se présenterait alors comme suit : Le nombre des notes étant 13 nous sommes conduits à chercher la note de 7e rang, qui laisse 6 notes avant elle et 6 notes après. Cette note est 12. cependant 12 n’est pas la note médiane car si nous avons bien 6 notes inférieures à 12, nous n’avons pas 6 notes supérieurs à 12. En effet parmi les notes écrites à droite de 12, seules 4 notes, et non 6, sont supérieures à 12. Nous pouvons en conclure que, lorsque la variable statistique est discontinue il n’y pas, en général, de valeur médiane. Nb d’enfants à charge Effectifs ni 1 2 3 4 5 6 Total 17 31 20 11 89 Ainsi dans l’exemple des enfants à charge du personnel d’une entreprise, le 45e terme (44 termes avant lui, 44 termes après lui) est un 2, qui ne répond pas à la définition de la médiane.
15
2-3-2 : Variable continue. Si les observations sont groupées en classes, il est nécessaire de recourir aux effectifs (ou aux fréquences) cumulé(e)s. La médiane est la valeur de la variable qui correspond à la fréquence cumulée 50%, ou à l’effectif cumulé N/2. On cherche la classe contenant le Ne/2 individu de l’échantillon. En supposant que tous les individus de cette classe sont uniformément répartis à l’intérieur, la position exacte du Ne/2 individu de la façon suivante par interpolation linéaire : effectifs cumulés croissants effectifs cumulés décroissants am : limite inférieure de la classe modale am+1 : limite supérieure de la classe modale Am : amplitude de la classe modale = am+1 – am nm : effectif de la classe médiane N : effectif total (ou taille de l’échantillon) Sni : effectif cumulé relatif à toutes les classes inférieures – i < m – (respectivement supérieures – i > m –) à la classe médiane
16
La Médiane La médiane est l’abscisse du point d’ordonnée égale à la moitié de l’effectif total (fréquence cumulée de 50%). Les triangles ABC et ADE sont semblables donc : On déduit que la médiane est donné par les formules suivantes : médiane A C D E B médiane A C D E B
17
Effectifs cumulés croissants Effectifs cumulés décroissants
Nous allons reprendre l’exemple des 150 ouvriers d’une entreprise classés d’après leur âge, et utiliser d’abord la colonne des effectifs cumulés croissants. La lecture de ce tableau nous montre que 72 personnes ont un age inférieur à 35 ans et 117 parmi lesquelles figurent les 72 déjà évoquées, ont un âge inférieurs à 40ans. Age en années Effectifs ni Effectifs cumulés croissants Effectifs cumulés décroissants [20, 25[ [25, 30[ [30, 35[ [35, 40[ [40, 45[ [45, 50[ [50, 55[ [55, 60[ Total 9 27 36 45 18 3 150 72 117 135 144 147 141 114 78 33 15 6 Or nous cherchons l’âge de la 75e personne, Pour les âges classés par ordre croissant. Le nombre 75 étant compris entre 72 et 117, l’âge médian se situe donc entre 35 et 40 ans. A titre de vérification reprenons le même raisonnement en utilisant la colonne des effectifs cumulés décroissants. Lue de bas en haut, les valeurs de la variable étant donc rangées en ordre décroissant, cette colonne indique que : 33 personnes ont au moins 40 ans et 78 personnes ont au moins 35 ans. L’âge médian, âge de la 75e, est donc compris entre 40 ans et 35 ans. En conclusion, dans cette entreprise, la moitié du personnel a moins de 35 ans 4 mois, l’autre moitié a plus de 35 ans 4 mois, à la date où le tableau statistique a été dressé.
18
2-3-3 : Détermination graphique de la médiane.
Il nous suffira de prendre le polygone cumulatif croissant et de rechercher l’intersection de ce polygone avec la parallèle à l’axe des abscisses, menée par le point de coordonnées (0 ; 75) ou (0 ; 50) si on utilise en ordonnées les effectifs cumulés croissants exprimés en pourcentage de l’effectif total. L’abscisse de cette intersection donne la valeur médiane cherchée. 75 35+1/3 50 35+1/3 Il est utile de remarquer qu’il ne s’agit ici que de la traduction graphique du raisonnement arithmétique tenu plus haut. La détermination graphique peut se faire en utilisant le polygone cumulatif décroissant.
19
75 35+1/3 50 35+1/3 Puisque le point d’abscisse égale à la médiane, et d’ordonnée égale à 75, se trouve sur le polygone cumulatif croissant et aussi sur le polygone cumulatif décroissant, il constitue l’intersection de ces deux polygones tracés dans le même repère cartésien. Cette remarque nous fournit un troisième procédé de détermination graphique de la médiane. Il suffira en effet de tracer dans le même repère les deux polygones cumulatifs. L’abscisse de leur intersection donnera la valeur médiane. 75 35+1/3
20
2-3-4 : Avantages de la médiane.
La médiane est d’un calcul facile ; elle résulte presque d’une simple lecture après classement des observations faites. Elle donne une idée satisfaisante de la tendance générale d’une série statistique. Elle n’est pas influencé par les valeurs aberrantes de la variable qui pourraient figurer dans la série. Si, par exemple, dans le calcul précédent, au lieu d’une classe [55, 60 ] comprenant 3 unités, nous avions une classe [55, 60[ comprenant deux unités et une classe [85, 90[ comprenant une unité, la valeur obtenue de la variable, 35 années et 4 mois, ne serait en rien modifiée. 2-3-5 : Propriétés de la médiane. :Reprenons la série suivante des neuf notes obtenues par un candidat à un examen et pour laquelle la médiane est 11 : et calculons |xi -11| pour chacune des valeurs de la variable : |7-11| = |7-11| = |8-11| = 3 ……….. |12-11| = |14-11| = 3 On obtient la suite : dont le total des termes est 18. Prenons une autre valeur observée de la variable, 10 par exemple et calculons |xi -10|. On obtient la suite : dont le total est 19, total plus élevé que le précédent, obtenu par référence à la médiane. Ainsi S |xi – a| > S |xi – médiane| où a est une valeur quelconque de la variable.
21
En statistique la valeur absolue de la différence entre deux nombres s’appelait l’écart des deux nombres, nous énoncerons alors la propriété suivante de la médiane propriété que nous ne démontrerons pas mais qu’il est aisé de vérifier. «La somme des écarts des valeurs observées de la variable et de la médiane, est plus petite que la somme des écarts des valeurs observées de la variable et d’une valeur quelconque de la variable». Vous pouvez vérifier cette propriété sur la série des âges qui nous a servi à la détermination de la médiane dans le cas d’une variable continue, mais en utilisant comme valeurs de la variable les centres de classes, soit 22.5, 27.5, 32.5, etc.…et en tenant compte, bien entendu des effectifs correspondant à chaque classe. : Reprenons l’histogramme, relatif à la série des âges des ouvriers et menons, par le point de l’axe des abscisse ayant pour abscisse 35 ans et 4 mois, valeur de la médiane, une parallèle à l’axe des ordonnées. Cette parallèle partage l’histogramme en deux parties. Calculons la mesure de l’aire de chacune de ces deux parties. Mesure aire de gauche : 5*9 + 5*27 + 5* *1/3 = 375. Mesure aire de droite : 15*(14/3) + 5*18 + 5*9 + 5*3 + 5*3 = 375. « La verticale menée à hauteur de la médiane partage l’histogramme en deux surfaces dont les aires sont égales entre elles ». 9 27 36 45 18 3 5 10 15 20 25 30 35 40 50 [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ Age Effectifs n i médiane
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.