Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parCadice Loison Modifié depuis plus de 11 années
1
Dénombrement et représentations graphiques d’un caractère continu
TD Statistique 2 - Ludovic Méasson 3 novembre 2004
2
Rappel TD précédent Exemple d’un caractère continu : les altitudes d ’une chaîne de montagne. 2312, 1985, 1642, 1340, 1854, 1789, 1891, 2210, 2425, 1956, 1970, 2003, 1515, 2102, 2010, 2412 Produire un tableau de dénombrement avec la même méthode que pour les caractères discrets aurait peu de sens : nombre important de modalités effectifs très faibles (en général, comme ici, 1 seul individu par valeur) Ainsi, pour les caractères continus, le dénombrement passe soit par : une analyse élémentaire une analyse par classes
3
1 - L ’analyse élémentaire
Lorsque la population n’est pas trop nombreuse, on ordonne les valeurs du caractère X. Dans ce nouveau tableau élémentaire , on peut associer à chaque modalité xi un rang, qui est sa position dans le classement des valeurs de la plus petite à la plus grande Ex : rendement en blé de différentes parcelles agricoles Parcelle Rdt (q/ha) A 25 B 22 C 51 D 62 E 75 F 20 G 49 H 78 I 68 J 50 Rang X (q/ha) 1 20 2 22 3 25 4 49 5 50 6 51 7 62 8 68 9 75 10 78
4
Une fois ce tableau réalisé, on réalise un diagramme de distribution :
X (q/h) Rang X (q/ha) 1 20 2 22 3 25 4 49 5 50 6 51 7 62 8 68 9 75 10 78 Rmq : chaque individu est représenté par sa modalité sur un axe gradué. Si deux individus ont des modalités identiques ou très proches, on procède à un empilement des points
5
Réalisez ce même travail avec les tailles des étudiants d’IUP.
(Tableau élémentaire élèves IUP + Exo 1) Le tableau Le diagramme de distribution (sur papier)
6
2 - La partition en classes Ex : Tailles des IUP en cours de stat.
Ce mode de traitement est le plus fréquent. Inconvénient par rapport à l’analyse élémentaire : on perd de l’information puisque chaque valeur n’est pas représentée. Toutes les valeurs tombant dans une même classe sont considérées comme identiques. Avantage : on gagne en lisibilité Condition : chaque individu doit appartenir à une classe et une seule. Taille Effectifs [150,160[ 1 [160,170[ 5 [170,180[ 6 [180,190[ 2 [190,200[ Fréquence moyenne ou densité d ’effectif : fmi = fi / Ai % d'individus contenus dans une classe / l'amplitude de la classe => on compare donc en fait, la densité des classes si amplitude grande et effectif relatif de cette classe faible => densité faible si amplitude petite et effectif relatif de cette classe forte => densité forte
7
Modalités du caractère X
Rappel : n1 n2 … ni nk X1 X2 Xi Xk [eo, e1[ [e1, e2[ [ei-1, ei[ [ek-1, ek[ Effectif Centre de la classe Modalités du caractère X Où xi = (ei-1 + ei) / 2 Amplitude d’une classe : Ai = ei - ei-1 Etendue de la distribution : Valeur max - valeur mini Fréquence simple des classes : fi = ni / n Fréquence moyenne ou densité d ’effectif : fmi = fi / Ai => cet indicateur sert à comparer deux classes qui n’ont pas la même amplitude.
8
A - Les méthodes de « discrétisation » (création des classes) :
Le nombre de classes Il n’y a pas réellement de règles si ce n’est qu’il ne doit pas être trop important. Trop de classes réduit la lisibilité du graphique. Le nombre de classes doit être définit en fonction du message recherché. Le type de classes : Méthodes des seuils naturels : consiste à placer les limites de classes dans les zones de discontinuités (milieux des « marches d’escalier » des courbes de fréquences cumulées). Méthode des amplitudes égales : consiste à diviser l’étendue en classes de même amplitude Méthode des effectifs égaux : consiste à placer les bornes de façon à avoir approximativement le même effectif dans chacune des classes.
9
B - Les enseignements des courbes de fréquences cumulées pour la
construction des classes avec la méthode des « seuils naturels ». Rappel : Fréquence cumulée ascendante (% des individus ayant des modalités de valeur inférieure ou égale) Fréquence cumulée descendante (% des individus ayant des modalités de valeur supérieure ou égale).
10
Que nous disent ces phénomènes sur la courbe au niveau de
la distribution des individus ? 4 3 2 1 Zones de concentration : le diagramme ou les courbes permettent de repérer les zones de concentration de la distribution (beaucoup d’individus sur un intervalle => pentes fortes sur les courbes), Les zones de dispersion : peu d’individus par intervalle => pentes faibles sur les courbes). Les zones de dispersion séparant deux zones de concentration, qui constituent des discontinuités (milieu des « marches d’escalier » sur les courbes).
11
Que nous disent ces phénomènes sur la courbe au niveau de
la distribution des individus ? Zones de concentration : Une pente forte indique qu’il y a beaucoup d’individus sur un intervalle donné. 4 3 Les zones de dispersion : Inversement, une pente faible indique qu’il y a peu d’individus sur l’intervalle 2 1 Zones de concentration : le diagramme ou les courbes permettent de repérer les zones de concentration de la distribution (beaucoup d’individus sur un intervalle => pentes fortes sur les courbes), Les zones de dispersion : peu d’individus par intervalle => pentes faibles sur les courbes). Les zones de dispersion séparant deux zones de concentration, qui constituent des discontinuités (milieu des « marches d’escalier » sur les courbes). Les discontinuités : Zones de dispersion séparant deux zones de concentration : milieu des « marches d’escalier ».
12
3 – Les représentations graphiques des variables quantitatives
A - Le cas des séries chronologiques est particulier : l'ordre des individus étant primordial, on n'effectue pas de tri à plat, et on représente directement les données brutes en ordonnée, l'échelle du temps étant placée en abscisse. Le temps étant continu, on relie par des segments de droite les points obtenus. Si un phénomène saisonnier apparaît (même type de variations d'année en année par exemple), il est possible de superposer plusieurs graphiques, ou de les remplacer par des moyennes.
13
B - Pour une variable discrète (valable également pour les
variables qualitatives), après un tri à plat conduisant à la distribution observée, on représente celle-ci par un diagramme en bâtons les xi sont placés suivant une échelle sur l'axe des abscisses, et les effectifs ni sont matérialisés par un "bâton" de longueur ni(axe des ordonnées). Ex : nombre d’enfants par famille. Le fait d'avoir des "bâtons" séparés les uns des autres permet de voir l'aspect ponctuel et discontinu des valeurs de la variable sur lesquelles l'effectif total est réparti. Nombre d'enfants xi Effectifs ni Fréquences fi 6 0.33 1 4 0.22 2 5 0.28 3 0.11 0.06 Total : 18
14
On peut aussi tracer la courbe cumulative croissante, appelé
également fonction de répartition. On utilise alors les effectifs cumulés. Elle se présente généralement comme une courbe « en escalier » (pour bien montrer le caractère discret de la variable). Par convention, le segment de droite se place à gauche de la valeur xi. Ce segment est fermé à gauche et ouvert à droite. Nombre d'enfants xi Effectifs ni Effectifs cumulés croissants Ni Effectifs cumulés décroissants N'i 6 18 1 4 10 12 2 5 15 8 3 17 Courbe en escalier : en effet, si l’on trace une courbe classique (on relie les différents points par une droite), on propose une représentation graphique erronée. En effet, on pourrait graphiquement déterminer combien de famille ont 1,5 enfant… ce qui n’existe pas Cette représentation offre un moyen pratique de savoir par exemple : Combien de familles ont deux enfants maximum ? Combien de familles ont 3 enfants maximum ?
15
De même, on peut réaliser une courbe cumulative décroissante
(ci-dessous) et les courbes des fréquences cumulées. Ici, on saura par exemple : Combien de familles ont au moins 1 enfants ? Combien de familles on au moins 2 enfants ?
16
Exercice : A partir du tableau élémentaire de l’âge des étudiants d’IUP, représenter graphiquement les effectifs, les effectifs cumulés croissants et décroissants et les fréquences cumulées croissantes et décroissantes. Et répondez aux deux questions : Quel pourcentage des élèves a 21 ans ou moins ? Quel pourcentage des élèves a 21 ans ou plus ? Enregistrer votre travail sous votre nom dans : Z:/Public/Measson/Exercices en classe
17
C – Représentation graphique d'une variable continue,
On a vu que si l'on compte les effectifs par valeur on risque souvent d'avoir un trop grand nombre de valeurs différentes, avec de trop faibles effectifs, et qu'il convient de regrouper les données en classes. Il existe souvent un moyen simple d'effectuer simultanément un tri à plat des données et un graphique : c'est le diagramme tige-feuilles. Ex : les tailles ci-dessous se situent entre 159 et 177. Les deux premiers chiffres sont 15, 16, ou 17 (la tige) et les suivants différencient les valeurs (ce sont les feuilles).
18
On peut diviser de 5 en 5 pour avoir plus de classes :
On peut ordonner ensuite les valeurs pour mieux voir la répartition des feuilles sur chaque tige.
19
Classes de tailles (en cm)
Si le nombre de données est trop important ou que l’on veut un autre type de représentation graphique, il fait organiser les données en classes. Avec l’exemple précédent, on peut avoir : Classes de tailles (en cm) Effectifs [ [ 1 [ [ 5 [ [ [ [ [ [ 4 21 29
20
A partir de la distribution précédente, on peut construire un
histogramme des effectifs : les classes étant de même amplitude, en plaçant en ordonnée les effectifs on obtient des rectangles dont la surface est proportionnelle à l'effectif associé.
21
Mais supposons qu'on veuille détailler davantage :
L'effectif 21 entre 1.65 m et 1.70 m se répartit en 8 dans [1.65 ; [ et 13 dans [1.675 ; 1.70 [. Quel graphique est exacte ? Réponse : le graphique 2
22
la surface du rectangle qui représente la valeur de l’effectif.
Quand on représente une variable continue sous forme d’histogramme, c’est la surface du rectangle qui représente la valeur de l’effectif. La surface (l’effectif ni en fait) dépend de l’amplitude de la classe (ai ou largeur) et de la hauteur (y). Or, pour ni = 1 ; y = 1 quand ai = 5 cm (ex. entre 155 et 160). Quel doit être y pour ai = 2,5 ? Il s’agit donc de résoudre l’équation suivante : S = 1*5 S = y*2,5 Donc 1*5 = y*2,5 => y = 5/2,5 = 2 Ainsi, quand ai = 2,5, y = 2 pour ni=1. Dit autrement, la barre est deux fois plus grande quand l’amplitude de la classe est deux fois plus petite. En ccl : Y = 8 quand ai = 5 cm et y = 16 quand ai = 2,5 cm Et quelle est la hauteur du rectangle entre 167,5 et 175 ?
23
Exercice : A partir du tableau élémentaire de la taille des étudiants d’IUP : Construisez la courbe des fréquences cumulées Opérez la discrétisation des données et argumentez votre choix Représentez graphiquement les effectifs, les effectifs cumulés croissants, et les fréquences cumulées croissantes. Enregistrer votre travail sous votre nom dans : Z:/Public/Measson/Exercices en classe
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.