Dénombrement et représentations graphiques d’un caractère continu

Slides:



Advertisements
Présentations similaires
5. Statistiques.
Advertisements

Pr. Abdelkrim EL MOUATASIM EST de Guelmim Maroc
Statistiques à une variable
Statistique descriptive
Chapitre 5. Description numérique d’une variable statistique.
Les Variables statistiques continues
Inférence statistique
Le nombre total des élèves est : 160
Notions de variable aléatoire et de probabilité d’un événement
Statistique et probabilités au collège
Activités sur les statistiques à une variable
2.5 Champ électrique produit par une distribution continue de charges.
Statistiques descriptives
la statistique descriptive se compose de 3 domaines distincts :   
Les principaux résumés de la statistique
Fonction puissance Montage préparé par : André Ross
Mathématiques Les statistiques et probabilités en STI2d/STL
Groupe 1: Classes de même intervalle
Calcul Intégral Au XVIIIème siècle, les mathématiciens progressent dans deux domaines séparés : les problèmes des tangentes (et la longueur des arcs) et.
Tableaux de distributions
Lectures Livre du cours :
Tableaux de distributions
Comprendre la variation dans les données: Notions de base
TEMPS PASSÉ DEVANT LA TV
Statistique descriptive
La Distribution des Données
Modélisation Nuage de points.
Fonction partie entière
Les fonctions leurs propriétés et.
Inéquations du premier degré à une inconnue
Modélisation Nuage de points.
CHAPITRE 2 LES SITUATIONS FONCTIONNELLES
Séries chronologiques et prévision
Comment construire un graphique ?
Statistique descriptive
Thème: statistiques et probabilités Séquence 3: Statistique descriptive Utiliser un logiciel (par exemple, un tableur) ou une calculatrice pour étudier.
Valoriser les ressources externes pour développer des compétences transversales Excel pour la réalisation des graphiques Activité CDS 38 Liège.
Rappels de statistiques descriptives
COURS STATISTIQUE - DESCRIPTIVE DEFINITIONS
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
Intervalles de confiance pour des proportions L’inférence statistique
La collecte et la description des données
Seconde partie Cours de seconde
L’étude du mouvement.
Introduction à une analyse statistique de données
Chapitre 3: Variables aléatoires réelles continues
Statistiques descriptives-Distributions expérimentales à une dimension
Construire un graphique
Statistiques Cours de seconde.
1 Licence Stat-info CM1 b 2004Christophe Genolini 2.1. Vocabulaire Individu : objet étudié Population : Ensemble des individus Variable : nom donné à ce.
Les premiers pas vers les calculs statistiques
PARAMETRES STATISTIQUES
STATISTIQUES DESCRIPTIVES
Chapitre 2 La statistique descriptive I
Les distributions de fréquences et de pourcentages
Statistique Descriptive Les Paramètres de Tendance Centrale
Seconde 8 Chapitre 4: Les statistiques
CHAPITRE 2 LES SITUATIONS FONCTIONNELLES
BIOSTATISTIQUES Définitions.
BIOSTATISTIQUES Définitions.
Mesures de description des valeurs des variables
Nature de la statistique La statistique est la science qui étudie la collecte, la présentation, l’analyse et l’utilisation des données numériques en vue.
 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs.
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
Notions de statistiques et d’analyse de données Master 1 MGS – Sarah MISCHLER –
1 M1 MQSE Cours n°2 1 - Rappels du cours n°1 2 - La statistique: un outil pour décrire.
STATISTIQUE DESCRIPTIVE
Transcription de la présentation:

Dénombrement et représentations graphiques d’un caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004

Rappel TD précédent Exemple d’un caractère continu : les altitudes d ’une chaîne de montagne. 2312, 1985, 1642, 1340, 1854, 1789, 1891, 2210, 2425, 1956, 1970, 2003, 1515, 2102, 2010, 2412 Produire un tableau de dénombrement avec la même méthode que pour les caractères discrets aurait peu de sens : nombre important de modalités effectifs très faibles (en général, comme ici, 1 seul individu par valeur) Ainsi, pour les caractères continus, le dénombrement passe soit par : une analyse élémentaire une analyse par classes

1 - L ’analyse élémentaire Lorsque la population n’est pas trop nombreuse, on ordonne les valeurs du caractère X. Dans ce nouveau tableau élémentaire , on peut associer à chaque modalité xi un rang, qui est sa position dans le classement des valeurs de la plus petite à la plus grande Ex : rendement en blé de différentes parcelles agricoles Parcelle Rdt (q/ha) A 25 B 22 C 51 D 62 E 75 F 20 G 49 H 78 I 68 J 50 Rang X (q/ha) 1 20 2 22 3 25 4 49 5 50 6 51 7 62 8 68 9 75 10 78

Une fois ce tableau réalisé, on réalise un diagramme de distribution : X (q/h) 20 50 80 Rang X (q/ha) 1 20 2 22 3 25 4 49 5 50 6 51 7 62 8 68 9 75 10 78 Rmq : chaque individu est représenté par sa modalité sur un axe gradué. Si deux individus ont des modalités identiques ou très proches, on procède à un empilement des points

Réalisez ce même travail avec les tailles des étudiants d’IUP. (Tableau élémentaire élèves IUP + Exo 1) Le tableau Le diagramme de distribution (sur papier)

2 - La partition en classes Ex : Tailles des IUP en cours de stat. Ce mode de traitement est le plus fréquent. Inconvénient par rapport à l’analyse élémentaire : on perd de l’information puisque chaque valeur n’est pas représentée. Toutes les valeurs tombant dans une même classe sont considérées comme identiques. Avantage : on gagne en lisibilité Condition : chaque individu doit appartenir à une classe et une seule. Taille Effectifs [150,160[ 1 [160,170[ 5 [170,180[ 6 [180,190[ 2 [190,200[ Fréquence moyenne ou densité d ’effectif : fmi = fi / Ai % d'individus contenus dans une classe / l'amplitude de la classe => on compare donc en fait, la densité des classes si amplitude grande et effectif relatif de cette classe faible => densité faible si amplitude petite et effectif relatif de cette classe forte => densité forte

Modalités du caractère X Rappel : n1 n2 … ni nk X1 X2 Xi Xk [eo, e1[ [e1, e2[ [ei-1, ei[ [ek-1, ek[ Effectif Centre de la classe Modalités du caractère X Où xi = (ei-1 + ei) / 2 Amplitude d’une classe : Ai = ei - ei-1 Etendue de la distribution : Valeur max - valeur mini Fréquence simple des classes : fi = ni / n Fréquence moyenne ou densité d ’effectif : fmi = fi / Ai => cet indicateur sert à comparer deux classes qui n’ont pas la même amplitude.

A - Les méthodes de « discrétisation » (création des classes) : Le nombre de classes Il n’y a pas réellement de règles si ce n’est qu’il ne doit pas être trop important. Trop de classes réduit la lisibilité du graphique. Le nombre de classes doit être définit en fonction du message recherché. Le type de classes : Méthodes des seuils naturels : consiste à placer les limites de classes dans les zones de discontinuités (milieux des « marches d’escalier » des courbes de fréquences cumulées). Méthode des amplitudes égales : consiste à diviser l’étendue en classes de même amplitude Méthode des effectifs égaux : consiste à placer les bornes de façon à avoir approximativement le même effectif dans chacune des classes.

B - Les enseignements des courbes de fréquences cumulées pour la construction des classes avec la méthode des « seuils naturels ». Rappel : Fréquence cumulée ascendante (% des individus ayant des modalités de valeur inférieure ou égale) Fréquence cumulée descendante (% des individus ayant des modalités de valeur supérieure ou égale).

Que nous disent ces phénomènes sur la courbe au niveau de la distribution des individus ? 4 3 2 1 Zones de concentration : le diagramme ou les courbes permettent de repérer les zones de concentration de la distribution (beaucoup d’individus sur un intervalle => pentes fortes sur les courbes), Les zones de dispersion : peu d’individus par intervalle => pentes faibles sur les courbes). Les zones de dispersion séparant deux zones de concentration, qui constituent des discontinuités (milieu des « marches d’escalier » sur les courbes).

Que nous disent ces phénomènes sur la courbe au niveau de la distribution des individus ? Zones de concentration : Une pente forte indique qu’il y a beaucoup d’individus sur un intervalle donné. 4 3 Les zones de dispersion : Inversement, une pente faible indique qu’il y a peu d’individus sur l’intervalle 2 1 Zones de concentration : le diagramme ou les courbes permettent de repérer les zones de concentration de la distribution (beaucoup d’individus sur un intervalle => pentes fortes sur les courbes), Les zones de dispersion : peu d’individus par intervalle => pentes faibles sur les courbes). Les zones de dispersion séparant deux zones de concentration, qui constituent des discontinuités (milieu des « marches d’escalier » sur les courbes). Les discontinuités : Zones de dispersion séparant deux zones de concentration : milieu des « marches d’escalier ».

3 – Les représentations graphiques des variables quantitatives A - Le cas des séries chronologiques est particulier : l'ordre des individus étant primordial, on n'effectue pas de tri à plat, et on représente directement les données brutes en ordonnée, l'échelle du temps étant placée en abscisse. Le temps étant continu, on relie par des segments de droite les points obtenus. Si un phénomène saisonnier apparaît (même type de variations d'année en année par exemple), il est possible de superposer plusieurs graphiques, ou de les remplacer par des moyennes.

B - Pour une variable discrète (valable également pour les variables qualitatives), après un tri à plat conduisant à la distribution observée, on représente celle-ci par un diagramme en bâtons les xi sont placés suivant une échelle sur l'axe des abscisses, et les effectifs ni sont matérialisés par un "bâton" de longueur ni(axe des ordonnées). Ex : nombre d’enfants par famille. Le fait d'avoir des "bâtons" séparés les uns des autres permet de voir l'aspect ponctuel et discontinu des valeurs de la variable sur lesquelles l'effectif total est réparti. Nombre d'enfants xi Effectifs ni Fréquences fi 6 0.33 1 4 0.22 2 5 0.28 3 0.11 0.06 Total : 18                                                                              

On peut aussi tracer la courbe cumulative croissante, appelé également fonction de répartition. On utilise alors les effectifs cumulés. Elle se présente généralement comme une courbe « en escalier » (pour bien montrer le caractère discret de la variable). Par convention, le segment de droite se place à gauche de la valeur xi. Ce segment est fermé à gauche et ouvert à droite. Nombre d'enfants xi Effectifs ni Effectifs cumulés croissants Ni Effectifs cumulés décroissants N'i 6 18 1 4 10 12 2 5 15 8 3 17 Courbe en escalier : en effet, si l’on trace une courbe classique (on relie les différents points par une droite), on propose une représentation graphique erronée. En effet, on pourrait graphiquement déterminer combien de famille ont 1,5 enfant… ce qui n’existe pas Cette représentation offre un moyen pratique de savoir par exemple : Combien de familles ont deux enfants maximum ? Combien de familles ont 3 enfants maximum ?

De même, on peut réaliser une courbe cumulative décroissante (ci-dessous) et les courbes des fréquences cumulées. Ici, on saura par exemple : Combien de familles ont au moins 1 enfants ? Combien de familles on au moins 2 enfants ?

Exercice : A partir du tableau élémentaire de l’âge des étudiants d’IUP, représenter graphiquement les effectifs, les effectifs cumulés croissants et décroissants et les fréquences cumulées croissantes et décroissantes. Et répondez aux deux questions : Quel pourcentage des élèves a 21 ans ou moins ? Quel pourcentage des élèves a 21 ans ou plus ? Enregistrer votre travail sous votre nom dans : Z:/Public/Measson/Exercices en classe

C – Représentation graphique d'une variable continue, On a vu que si l'on compte les effectifs par valeur on risque souvent d'avoir un trop grand nombre de valeurs différentes, avec de trop faibles effectifs, et qu'il convient de regrouper les données en classes. Il existe souvent un moyen simple d'effectuer simultanément un tri à plat des données et un graphique : c'est le diagramme tige-feuilles. Ex : les tailles ci-dessous se situent entre 159 et 177. Les deux premiers chiffres sont 15, 16, ou 17 (la tige) et les suivants différencient les valeurs (ce sont les feuilles).                                        

On peut diviser de 5 en 5 pour avoir plus de classes : On peut ordonner ensuite les valeurs pour mieux voir la répartition des feuilles sur chaque tige.

Classes de tailles (en cm) Si le nombre de données est trop important ou que l’on veut un autre type de représentation graphique, il fait organiser les données en classes. Avec l’exemple précédent, on peut avoir : Classes de tailles (en cm) Effectifs [ 155 - 160 [ 1 [ 160 - 165 [ 5 [ 165 - 170[ [ 170 - 175 [ [ 175 - 180 [ 4 21 29

A partir de la distribution précédente, on peut construire un histogramme des effectifs : les classes étant de même amplitude, en plaçant en ordonnée les effectifs on obtient des rectangles dont la surface est proportionnelle à l'effectif associé.

Mais supposons qu'on veuille détailler davantage : L'effectif 21 entre 1.65 m et 1.70 m se répartit en 8 dans [1.65 ; 1.675 [ et 13 dans [1.675 ; 1.70 [. Quel graphique est exacte ? Réponse : le graphique 2

la surface du rectangle qui représente la valeur de l’effectif. Quand on représente une variable continue sous forme d’histogramme, c’est la surface du rectangle qui représente la valeur de l’effectif. La surface (l’effectif ni en fait) dépend de l’amplitude de la classe (ai ou largeur) et de la hauteur (y). Or, pour ni = 1 ; y = 1 quand ai = 5 cm (ex. entre 155 et 160). Quel doit être y pour ai = 2,5 ? Il s’agit donc de résoudre l’équation suivante : S = 1*5 S = y*2,5 Donc 1*5 = y*2,5 => y = 5/2,5 = 2 Ainsi, quand ai = 2,5, y = 2 pour ni=1. Dit autrement, la barre est deux fois plus grande quand l’amplitude de la classe est deux fois plus petite. En ccl : Y = 8 quand ai = 5 cm et y = 16 quand ai = 2,5 cm Et quelle est la hauteur du rectangle entre 167,5 et 175 ?

Exercice : A partir du tableau élémentaire de la taille des étudiants d’IUP : Construisez la courbe des fréquences cumulées Opérez la discrétisation des données et argumentez votre choix Représentez graphiquement les effectifs, les effectifs cumulés croissants, et les fréquences cumulées croissantes. Enregistrer votre travail sous votre nom dans : Z:/Public/Measson/Exercices en classe