La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004.

Présentations similaires


Présentation au sujet: "Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004."— Transcription de la présentation:

1 Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004

2 Rappel TD précédent Exemple dun caractère continu : les altitudes d une chaîne de montagne. 2312, 1985, 1642, 1340, 1854, 1789, 1891, 2210, 2425, 1956, 1970, 2003, 1515, 2102, 2010, 2412 Produire un tableau de dénombrement avec la même méthode que pour les caractères discrets aurait peu de sens : nombre important de modalités effectifs très faibles (en général, comme ici, 1 seul individu par valeur) Ainsi, pour les caractères continus, le dénombrement passe soit par : une analyse élémentaire une analyse par classes

3 1 - L analyse élémentaire Lorsque la population nest pas trop nombreuse, on ordonne les valeurs du caractère X. Dans ce nouveau tableau élémentaire, on peut associer à chaque modalité x i un rang, qui est sa position dans le classement des valeurs de la plus petite à la plus grande Ex : rendement en blé de différentes parcelles agricoles ParcelleRdt (q/ha) A25 B22 C51 D62 E75 F20 G49 H78 I68 J50 RangX (q/ha)

4 Une fois ce tableau réalisé, on réalise un diagramme de distribution : X (q/h) RangX (q/ha) Rmq : chaque individu est représenté par sa modalité sur un axe gradué. Si deux individus ont des modalités identiques ou très proches, on procède à un empilement des points

5 Réalisez ce même travail avec les tailles des étudiants dIUP. (Tableau élémentaire élèves IUP + Exo 1) Le tableau Le diagramme de distribution (sur papier)

6 2 - La partition en classes Ex : Tailles des IUP en cours de stat. Ce mode de traitement est le plus fréquent. Inconvénient par rapport à lanalyse élémentaire : on perd de linformation puisque chaque valeur nest pas représentée. Toutes les valeurs tombant dans une même classe sont considérées comme identiques. Avantage : on gagne en lisibilité Condition : chaque individu doit appartenir à une classe et une seule. TailleEffectifs [150,160[1 [160,170[5 [170,180[6 [180,190[2 [190,200[1

7 n1 n2 … ni … nk X1 X2 … Xi … Xk [eo, e1[ [e1, e2[ … [ei-1, ei[ … [ek-1, ek[ EffectifCentre de la classeModalités du caractère X Rappel : Où xi = (ei-1 + ei) / 2 Amplitude dune classe : Ai = ei - ei-1 Etendue de la distribution : Valeur max - valeur mini Fréquence simple des classes : fi = ni / n Fréquence moyenne ou densité d effectif : fmi = fi / Ai => cet indicateur sert à comparer deux classes qui nont pas la même amplitude.

8 A - Les méthodes de « discrétisation » (création des classes) : 1.Le nombre de classes Il ny a pas réellement de règles si ce nest quil ne doit pas être trop important. Trop de classes réduit la lisibilité du graphique. Le nombre de classes doit être définit en fonction du message recherché. 2.Le type de classes : Méthodes des seuils naturels : consiste à placer les limites de classes dans les zones de discontinuités (milieux des « marches descalier » des courbes de fréquences cumulées). Méthode des amplitudes égales : consiste à diviser létendue en classes de même amplitude Méthode des effectifs égaux : consiste à placer les bornes de façon à avoir approximativement le même effectif dans chacune des classes.

9 B - Les enseignements des courbes de fréquences cumulées pour la construction des classes avec la méthode des « seuils naturels ». Rappel : Fréquence cumulée ascendante (% des individus ayant des modalités de valeur inférieure ou égale) Fréquence cumulée descendante (% des individus ayant des modalités de valeur supérieure ou égale).

10 Que nous disent ces phénomènes sur la courbe au niveau de la distribution des individus ?

11 Que nous disent ces phénomènes sur la courbe au niveau de la distribution des individus ? Zones de concentration : Une pente forte indique quil y a beaucoup dindividus sur un intervalle donné. Les zones de dispersion : Inversement, une pente faible indique quil y a peu dindividus sur lintervalle Les discontinuités : Zones de dispersion séparant deux zones de concentration : milieu des « marches descalier ».

12 3 – Les représentations graphiques des variables quantitatives A - Le cas des séries chronologiques est particulier : l'ordre des individus étant primordial, on n'effectue pas de tri à plat, et on représente directement les données brutes en ordonnée, l'échelle du temps étant placée en abscisse. Le temps étant continu, on relie par des segments de droite les points obtenus. Si un phénomène saisonnier apparaît (même type de variations d'année en année par exemple), il est possible de superposer plusieurs graphiques, ou de les remplacer par des moyennes.

13 B - Pour une variable discrète (valable également pour les variables qualitatives), après un tri à plat conduisant à la distribution observée, on représente celle-ci par un diagramme en bâtons les x i sont placés suivant une échelle sur l'axe des abscisses, et les effectifs n i sont matérialisés par un "bâton" de longueur n i (axe des ordonnées). Ex : nombre denfants par famille. Le fait d'avoir des "bâtons" séparés les uns des autres permet de voir l'aspect ponctuel et discontinu des valeurs de la variable sur lesquelles l'effectif total est réparti. Nombre d'enfants x i Effectifs n i Fréquences f i Total : 181

14 On peut aussi tracer la courbe cumulative croissante, appelé également fonction de répartition. On utilise alors les effectifs cumulés. Elle se présente généralement comme une courbe « en escalier » (pour bien montrer le caractère discret de la variable). Par convention, le segment de droite se place à gauche de la valeur xi. Ce segment est fermé à gauche et ouvert à droite. Nombre d'enfan ts x i Effecti fs n i Effecti fs cumulés croissan ts N i Effectifs cumulés décroissan ts N' i Cette représentation offre un moyen pratique de savoir par exemple : Combien de familles ont deux enfants maximum ? Combien de familles ont 3 enfants maximum ?

15 De même, on peut réaliser une courbe cumulative décroissante (ci-dessous) et les courbes des fréquences cumulées. Ici, on saura par exemple : Combien de familles ont au moins 1 enfants ? Combien de familles on au moins 2 enfants ?

16 Exercice : A partir du tableau élémentaire de lâge des étudiants dIUP, représenter graphiquement les effectifs, les effectifs cumulés croissants et décroissants et les fréquences cumulées croissantes et décroissantes. Et répondez aux deux questions : Quel pourcentage des élèves a 21 ans ou moins ? Quel pourcentage des élèves a 21 ans ou plus ? Enregistrer votre travail sous votre nom dans : Z:/Public/Measson/Exercices en classe

17 C – Représentation graphique d'une variable continue, On a vu que si l'on compte les effectifs par valeur on risque souvent d'avoir un trop grand nombre de valeurs différentes, avec de trop faibles effectifs, et qu'il convient de regrouper les données en classes. Il existe souvent un moyen simple d'effectuer simultanément un tri à plat des données et un graphique : c'est le diagramme tige-feuilles. Ex : les tailles ci-dessous se situent entre 159 et 177. Les deux premiers chiffres sont 15, 16, ou 17 (la tige) et les suivants différencient les valeurs (ce sont les feuilles).

18 On peut diviser de 5 en 5 pour avoir plus de classes : On peut ordonner ensuite les valeurs pour mieux voir la répartition des feuilles sur chaque tige.

19 Si le nombre de données est trop important ou que lon veut un autre type de représentation graphique, il fait organiser les données en classes. Avec lexemple précédent, on peut avoir : Classes de tailles (en cm)Effectifs [ [1 [ [5 [ [ [ [ [ [

20 A partir de la distribution précédente, on peut construire un histogramme des effectifs : les classes étant de même amplitude, en plaçant en ordonnée les effectifs on obtient des rectangles dont la surface est proportionnelle à l'effectif associé.

21 Mais supposons qu'on veuille détailler davantage : L'effectif 21 entre 1.65 m et 1.70 m se répartit en 8 dans [1.65 ; [ et 13 dans [1.675 ; 1.70 [. Quel graphique est exacte ?

22 Quand on représente une variable continue sous forme dhistogramme, cest la surface du rectangle qui représente la valeur de leffectif. La surface (leffectif ni en fait) dépend de lamplitude de la classe (ai ou largeur) et de la hauteur (y). Or, pour ni = 1 ; y = 1 quand ai = 5 cm (ex. entre 155 et 160). Quel doit être y pour ai = 2,5 ?

23 Exercice : A partir du tableau élémentaire de la taille des étudiants dIUP : 1.Construisez la courbe des fréquences cumulées 2.Opérez la discrétisation des données et argumentez votre choix 3.Représentez graphiquement les effectifs, les effectifs cumulés croissants, et les fréquences cumulées croissantes. Enregistrer votre travail sous votre nom dans : Z:/Public/Measson/Exercices en classe


Télécharger ppt "Dénombrement et représentations graphiques dun caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004."

Présentations similaires


Annonces Google