Tableaux de distributions

Slides:



Advertisements
Présentations similaires
Bratec Martin ..
Advertisements

NOTIFICATION ÉLECTRONIQUE
Fragilité : une notion fragile ?
SEMINAIRE DU 10 AVRIL 2010 programmation du futur Hôtel de Ville
Phono-sémantique différentielle des monosyllabes italiens
MAGGIO 1967 BOLOGNA - CERVIA ANOMALIES DU SOMMEIL CHEZ L'HOMME
droit + pub = ? vincent gautrais professeur agrégé – avocat
Transcription de la présentation:

Tableaux de distributions et histogramme

Certaines distributions de données peuvent être très longues. Ainsi, il est souvent nécessaire de condenser ces données sous une forme plus propice à l’analyse statistique. Les tableaux de distribution et les diagrammes sont des outils qui permettent une meilleure compréhension des phénomènes étudiés. Ils permettent de faire de meilleures prédictions et de prendre de meilleures décisions.

Cependant, il n’est pas facile d’en tirer des conclusions. Exemple : Les listes de distribution sont importantes, car elles permettent d’obtenir des informations précises. 6 Cependant, il n’est pas facile d’en tirer des conclusions.

La même étude (synthétisée) fait apparaître un phénomène très clair.

Le tableau à données condensées Lorsqu’une distribution comporte un petit nombre de données différentes et qu’elles ont tendance à se répéter, il convient de les compiler dans un tableau dont les données sont condensées. Total Âge Effectifs 2 3 4 5 6 7 8 9 10 11 12 Répartition des enfants d’une garderie 1 21

Le tableau à données condensées Exemple : Voici une liste de données représentant l’âge d’un groupe d’enfants à une garderie. 2, 2, 3, 4, 5, 5, 5, 5, 5, 5, 6, 6, 7, 7, 8, 8, 9, 10, 10, 11, 12. Voici le tableau de distribution : Répartition des enfants d’une garderie Il faut toujours donner un titre. Cette colonne indique le caractère de l’étude (les données). Âge Effectifs Cette colonne indique le nombre de fois que la donnée se répète. 2 3 4 5 6 7 8 9 10 11 12 2 1 Ce sont les effectifs. Ici, l’âge. 1 6 2 Il reste à compiler. 2 2 1 2 Il faut toujours indiquer le nombre total de données. 1 1 Total 21

x Le tableau est complété. Total Âge Effectifs 2 3 4 5 6 7 8 9 10 11 12 Répartition des enfants d’une garderie 1 21 Il donne plusieurs informations. n = 21 données 10 données Mo = 5 ans Médiane : 11e donnée n ÷ 2 = 10,5 La médiane est donc la 11e donnée en partant du début. On compte les effectifs à partir du début. Md = 6 ans La moyenne : On fait : total des effectifs la somme des produits des valeurs par leur effectif ( 2X2 + 3X1 + 4X1 + 5X6 + 6X2 + 7X2 + 8X2 + 9X1 + 10X2 + 11X1 + 12 X 1 ) 21 x ≈ 6,43

Le tableau de données groupées en classes Consommation d’eau hebdomadaire [ 0 , 10 [ [ 10 , 20 [ [ 20 , 30 [ [ 30, 40 [ [ 40 , 50 [ Quantité (L) Total Effectifs 10 9 7 11 13 50 Ce type de tableau est utilisé lorsque les données de la distribution n’ont pas tendance à se répéter et qu’il y a un très grand nombre de possibilités.

Le tableau de données groupées en classes Exemple : Voici les données recueillies auprès de 50 élèves sur la quantité d’eau qu’ils consomment par semaine : 2, 2, 5, 5, 6, 6, 6, 7, 7, 8, 10, 11, 11, 13, 13, 13, 13, 15, 17, 24, 24, 24, 26, 27, 27, 29, 30, 30, 30, 32, 33, 33, 34, 36, 37, 38, 39, 40, 41, 42, 44, 44, 45, 45, 46, 46, 47, 47, 47, 47. La 1ère étape est d’écrire la liste en ordre croissant. Ce qui est fait ici. La 2e étape est de regrouper toutes ces données en classes.

2, 2, 5, 5, 6, 6, 6, 7, 7, 8, 10, 11, 11, 13, 13, 13, 13, 15, 17, 24, 24, 24, 26, 27, 27, 29, 30, 30, 30, 32, 33, 33, 34, 36, 37, 38, 39, 40, 41, 42, 44, 44, 45, 45, 46, 46, 47, 47, 47, 47. Déterminer les classes 1) Calculer l’étendue : Max. – min. = 47 – 2 = 45 2) Déterminer le nombre de classes. Il n’y a pas de règle stricte pour trouver le nombre de classes; un tableau compte habituellement entre 5 et 10 classes. Il s’agit de faire une représentation facile à lire. 3) Déterminer la largeur des classes. On divise l’étendue par le nombre de classes retenues. Largeur d’une classe : étendue nombre de classes = S’il y a 5 classes, 45 5 = 9 La largeur de chaque classe pourrait être de 10 unités.

2, 2, 5, 5, 6, 6, 6, 7, 7, 8, 10, 11, 11, 13, 13, 13, 13, 15, 17, 24, 24, 24, 26, 27, 27, 29, 30, 30, 30, 32, 33, 33, 34, 36, 37, 38, 39, 40, 41, 42, 44, 44, 45, 45, 46, 46, 47, 47, 47, 47. Les classes seront : [ 0 , 10 [ [ 10 , 20 [ La détermination des classes doit respecter des règles. [ 20 , 30 [ Les classes doivent avoir la même largeur. [ 30 , 40 [ Ici, chaque classe a une largeur de 10 unités. [ 40 , 50 [ Chaque classe débute par un crochet fermé et se termine par un crochet ouvert. La classe [ 0 , 10 [ signifie que toutes les données comprises entre 0 inclus et 10 exclu y seront inscrites. La classe [ 10 , 20 [ signifie que toutes les données comprises entre 10 inclus et 20 exclu y seront inscrites. Les classes doivent être choisies de telle sorte que la plus petite et la plus grande données y soient incluses. 2 sera inclus dans [ 0 , 10 [ et 47 sera inclus dans [ 40 , 50 [.

2, 2, 5, 5, 6, 6, 6, 7, 7, 8, 10, 10, 11, 13, 13, 13, 13, 15, 17, 24, 24, 24, 26, 27, 27, 29, 30, 30, 30, 32, 33, 33, 34, 36, 37, 38, 39, 40, 41, 42, 44, 44, 45, 45, 46, 46, 47, 47, 47, 47. Il reste à compiler les données. Consommation d’eau hebdomadaire Quantité (L) Effectifs [ 0 , 10 [ [ 10 , 20 [ [ 20 , 30 [ [ 30, 40 [ [ 40 , 50 [ 10 9 7 11 13 Total 50

Le tableau est complété. Consommation d’eau hebdomadaire [ 0 , 10 [ [ 10 , 20 [ [ 20 , 30 [ [ 30, 40 [ [ 40 , 50 [ Quantité (L) Total Effectifs 10 9 7 11 13 50 Il donne plusieurs informations. n = 50 données Mode : Dans un tableau de données groupées en classe, il peut y avoir une classe modale . Il s’agit de la classe possédant le plus d’effectifs. Ici, la classe modale est [ 40 , 50 [. Nous ne pouvons pas connaître avec précision le mode. Cependant, nous pouvons l’estimer. Il faut prendre le milieu de la classe modale : ( 40 + 50 ) ÷ 2 = 45 Mo ≈ 45 L

Le tableau est complété. Consommation d’eau hebdomadaire [ 0 , 10 [ [ 10 , 20 [ [ 20 , 30 [ [ 30, 40 [ [ 40 , 50 [ Quantité (L) Total Effectifs 10 9 7 11 13 50 Il donne plusieurs informations. Médiane : 19 données n ÷ 2 = 25 + 6 données La médiane est donc la moyenne de la 25e et 26e donnée. Il faut compter les effectifs à partir du début. La classe contenant la médiane s’appelle la classe médiane. Ici, la classe médiane est [ 20 , 30 [. Nous ne pouvons pas connaître avec précision la médiane. Cependant, nous pouvons l’estimer. Il faut prendre le milieu de la classe médiane : ( 20 + 30 ) ÷ 2 = 25 Md ≈ 25 L

x Le tableau est complété. Consommation d’eau hebdomadaire [ 0 , 10 [ [ 0 , 10 [ [ 10 , 20 [ [ 20 , 30 [ [ 30 , 40 [ [ 40 , 50 [ Quantité (L) Total Effectifs 10 9 7 11 13 50 Il donne plusieurs informations. La moyenne : Nous ne pouvons pas calculer précisément la moyenne dans un tableau de données groupées en classes. Cependant, nous pouvons l’estimer. Il faut faire : la somme des produits des milieux des classes par leur effectif total des effectifs Remarque : Comme le milieu de la première classe est 5 et que les classes ont toutes une largeur de 10, le milieu de chacune des classes augmentera de 10 unités. ( 5 X 10 + 15 X 9 + 25 X 7 + 35 X 11 + 45 X 13 ) 50 = 1 330 50 ≈ 26,6 x ≈ 26,6 L

L’histogramme 10 20 30 40 50 2 4 6 8 12 14 Litres Élèves Consommation d’eau hebdomadaire L’histogramme est la représentation graphique d’un tableau de données groupées en classes.

L’histogramme Consommation d’eau hebdomadaire [ 0 , 10 [ [ 10 , 20 [ [ 20 , 30 [ [ 30, 40 [ [ 40 , 50 [ Quantité (L) Total Effectifs 10 9 7 11 13 50 Reprenons notre exemple : Pour construire l’histogramme, il faut : - tracer, graduer également et identifier les axes; Il faut tracer des rectangles de même largeur et de hauteur correspondant à l’effectif de chaque classe. Élèves 2 4 6 8 10 12 14 Les effectifs sont placés sur l’axe des ordonnées. Les classes sont placées sur l’axe des abscisses. Il faut utiliser la limite inférieure de chaque classe. 10 20 30 40 50 Litres

Il ne faut pas oublier le titre. Consommation d’eau hebdomadaire 2 4 6 8 10 12 14 20 30 40 50 Litres Élèves 13 11 10 9 7 L’histogramme donne aussi beaucoup d’informations. Le total des données : n = 50 La classe modale : [ 40 , 50 [ et le mode en prenant le milieu de la classe modale : Mo ≈ 45 L

Consommation d’eau hebdomadaire 2 4 6 8 10 12 14 20 30 40 50 Litres Élèves 19 + 6 13 11 10 9 8 7 La classe médiane : n ÷ 2 = 50 ÷ 2 = 25 La médiane est donc la moyenne de la 25e et 26e donnée. Il faut compter les effectifs à partir du début. La classe médiane est donc [ 20 , 30 [. Nous ne pouvons pas connaître avec précision la médiane. Cependant, nous pouvons l’estimer. Il faut prendre le milieu de la classe médiane : ( 20 + 30 ) ÷ 2 = 25 Md ≈ 25 L

x Consommation d’eau hebdomadaire 10 9 13 8 11 2 4 6 12 14 20 30 40 50 Litres Élèves 7 La moyenne : Nous ne pouvons pas calculer précisément la moyenne dans un histogramme. Cependant, nous pouvons l’estimer. Il faut faire : la somme des produits des milieux des classes par leur effectif total des effectifs ( 5 X 10 + 15 X 9 + 25 X 7 + 35 X 11 + 45 X 13 ) 50 = 1 330 50 ≈ 26,6 x ≈ 26,6 L

Remarque : S’il n’y a pas de classe qui débute à 0, [ 30 , 40 [ [ 40 , 50 [ [ 50 , 60 [ [ 60 , 70 [ [ 70 , 80 [ Données Total Effectifs [ 20 , 30 [ 3 6 10 12 8 5 44 20 30 40 50 60 70 2 4 6 8 10 12 14 80 il faut penser à mettre une coupure d’axe.

x Interprétation Consommation d’eau hebdomadaire 10 9 13 8 11 2 4 6 12 14 20 30 40 50 Litres Élèves 7 Dans ce groupe d’élèves : 19 individus sont au-dessous de la moyenne; - 24 individus sont au-dessus de la moyenne; - la médiane ou la moyenne sont représentatives de la quantité moyenne de litres d’eau consommée par semaine; - il y a plus d’élèves qui boivent beaucoup d’eau; Mo ≈ 45 L Md ≈ 25 L x ≈ 26,6 L - la classe modale n’est pas centrale. Il serait intéressant d’en comprendre la raison.