Statistique et probabilités au collège Versailles Mercredi 14 Janvier 2009 1
Des séries statistiques aux probabilités : la progression dans les programmes du collège 6ème : Organisation et représentation de données (tableaux, repérage sur un axe, diagrammes, graphiques) 5ème : Représentation et traitement de données (classes, effectifs, fréquences, tableau de données, représentations graphiques de données) 4ème : Traitement de données (moyennes pondérées) 3ème : Statistique (caractéristiques de position) Notion de probabilité programmes 2
I. Statistique descriptive A. Histogramme Le graphique Histogramme avec les TICE Histogramme et paramètre statistiques
Représentation graphique d’une série statistique Variable quantitative discrète : diagramme en bâtons Chaque modalité est représentée par une barre dont la hauteur est proportionnelle à l’effectif. Série statistique continue : histogramme Suite de rectangles contigus : chaque classe est représentée par un rectangle dont l’aire est proportionnelle à l’effectif.
1. Classes de même amplitude Histogramme 1. Classes de même amplitude Repère orthogonal et modalités du caractère placées sur l’axe des abscisses Chaque classe est représentée par un rectangle dont l’aire est proportionnelle à l’effectif de la classe concernée . Toutes les bases ont la même dimension donc les « hauteurs » des rectangles sont proportionnelles aux effectifs.
Exemple : dureté de pièces et Indice de Rockwell.xls Graphique Exemple : dureté de pièces et Indice de Rockwell.xls Les aires sont proportionnelles aux effectifs. Or les amplitudes sont égales, donc les hauteurs sont proportionnelles aux effectifs.
2. Classes d’amplitudes différentes Histogramme 2. Classes d’amplitudes différentes Les bases des rectangles n’ont pas toutes la même longueur. Les aires des rectangles sont proportionnelles aux effectifs des classes. L’histogramme se construit dans un repère orthogonal en portant sur l’axe des abscisses les bornes des classes et en ordonnée des nombres « hauteurs » des rectangles proportionnels aux densités d’effectifs (effectif/amplitude). le coefficient de proportionnalité choisi est souvent min(Li) qui est alors l’unité d’amplitude de classe. Pour un histogramme des fréquences, on définit les densités de fréquence. Histogramme classes d’amplitudes différentes
Ancienneté du personnel cadre d’une entreprise Les deux dernières classes représentées correspondent au même effectif de 9. Leurs aires sont égales. Histogramme réalisé avec sine qua non
B. Des paramètres pour caractériser une série statistique Mode Moyenne(s) Étendue Quantiles Médiane Quartiles Déciles
1. Caractéristiques de tendance centrale ou de position Moyenne Médiane Définition : Soit S une série statistique quantitative discrète à une variable, de taille n, n N*, définie par S = {si}1 i n, ordonnée dans l’ordre croissant. On appelle médiane de S tout réel m tel que au moins 50 % des valeurs de la série sont supérieures ou égales à m et au moins 50 % des valeurs de la série sont inférieures ou égales à m. Par exemple : Soit S une série statistique quantitative discrète à une variable, de taille n, n N*, définie par S = {si}1 i n, ordonnée dans l’ordre croissant. Si n est impair, avec n = 2p + 1, p N, alors sp + 1 est une médiane de S ; Si n est pair, avec n = 2p, p N*, alors (sp + sp + 1)/2 est une médiane de S. Lorsque n est pair, tout réel compris entre sp et sp+1 est une médiane
Quartiles Définition : Soit S une série statistique quantitative discrète à une variable, de taille n, n N*, définie par S = {si} 1 i n, ordonnée dans l’ordre croissant. Le premier quartile Q1 de S est le plus petit élément a de S tel qu’au moins 25% des valeurs de S soient inférieures ou égales à a. Le troisième quartile Q3 de S est le plus petit élément a’ de S tel qu’au moins 75% des valeurs de S soient inférieures ou égales à a’. Les quartiles ne sont pas sensibles aux valeurs extrêmes. Remarques : Un quartile est une valeur de la série. Le deuxième quartile Q2 de S est le plus petit élément a’’ de S tel qu’au moins 50% des valeurs de la série soient inférieures ou égales à a’’. Q2 ne coïncide toujours pas avec la médiane ! De la même façon, on peut définir des quantiles : déciles, centiles. Pour une série quantitative discrète, les quantiles sont toujours des valeurs de la série. Lorsque N est impair, med = Q2
1. Caractéristiques de tendance centrale ou de position Leur choix dépend du contexte de l’étude. La moyenne est généralement pertinente si la série est longue et relativement homogène. La médiane est très facile à obtenir mais sensible aux fluctuations d’échantillonnage. Elle décrit bien la série et élimine l’effet des valeurs aberrantes. Le mode indique la valeur la plus typique et intéressant dans le cas de séries asymétriques. George Yule ( 1871-1951) a défini en 1911 les conditions idéales souhaitables pour une valeur centrale qui peut résumer une série et éclaire sur la position du « noyau » de la série - Être définie objectivement à partir de la série - Dépendre de tous les termes de la série - Être compréhensible par les non-spécialistes - Être simple à calculer - Être peu sensible aux fluctuations d'échantillonnage - Se prêter à des calculs algébriques Il est pertinent de faire apparaître tous ces paramètres sur les représentations graphiques, cela permet une visualisation synthétique de la série.
2. Caractéristiques de dispersion L’étendue : max min L’écart interquartile : Q3 Q1 L’intervalle interquartile : [Q1 , Q3] L’étendue est sensible aux valeurs extrêmes. Les quartiles ne sont pas sensibles aux valeurs extrêmes.
3. Histogramme et paramètres statistiques Médiane : Une valeur médiane partage la population observée en deux groupes de même effectif. La surface totale « sous l’histogramme » représente la population complète donc la droite d’équation x = Me partage l’histogramme en deux parties de même aire comme la médiane d’un triangle partage un triangle en deux triangles de même aire.
Ancienneté du personnel cadre d’une entreprise 3. Histogramme et paramètres statistiques Ancienneté du personnel cadre d’une entreprise Histogramme réalisé avec sine qua non
Classe modale, mode Mode : modalité d’effectif maximal, donc représentée par une barre de hauteur maximale. Classe modale : classe représentée par un rectangle de hauteur maximale. Une classe modale est donc une classe pour laquelle c’est le quotient (effectif/amplitude) qui est maximal alors que pour des classes d’amplitudes égales ou pour les variables discrètes, les classes modales ou les modes correspondent aux effectifs maxima. Remarque : le quotient effectif/amplitude s’appelle la densité d’effectif de la classe. Il peut exister plusieurs modes ou plusieurs classes modales.