Dr. Tarek Barhoumi statistiques descriptives Statistiques descriptives Dr. Tarek Barhoumi
Dr. Tarek Barhoumi statistiques descriptives La statistique
Dr. Tarek Barhoumi statistiques descriptives Ce n’est pas le Dénombrement « La statistique est une science moderne et positive. Elle met en lumi è re les faits les plus obscurs. Ainsi derni è rement, grâce à des recherches, nous sommes arriv é s à conna î tre le nombre exact des veuves qui ont pass é sur le Pont Neuf pendant le cours de l ’ ann é e 1860 … … et une douteuse ». Eug è ne Labiche
Dr. Tarek Barhoumi statistiques descriptives Ce qui est… Statistique: Discipline scientifique qui permet de r é sumer les donn é es et d ’ inf é rer d ’ un é chantillon à une population – Statistique descriptive: R é sumer …. – Statistique inf é rentielle: Inf é rer « L ’ intervalle de confiance les tests d ’ hypoth è se » Bio statistique: Statistique appliqu é e à des donn é es biologiques et m é dicales
Dr. Tarek Barhoumi statistiques descriptives Définitions «Une terminologie » 1.Population (Échantillon) 2.Unité 3.Série 4.Distribution 5.Variable
Dr. Tarek Barhoumi statistiques descriptives Population ( É chantillon) Population : Le plus grand ensemble d’unités concernés par la problématique Échantillon : Sous ensemble de cette population
Dr. Tarek Barhoumi statistiques descriptives Pourquoi faut-il échantillonner ? 1- Quand la population est infinie. 2- Même si la population est finie ressources limitées impossibilité de disposer de la population en même temps détermination de la variable à étudier est destructrice
Dr. Tarek Barhoumi statistiques descriptives Comment échantillonner ? L’étude sur l’échantillon, celui-ci n’a pas d’intérêt en soi. Ce que l’on veut connaître, c’est la population. L’échantillon doit ressembler le plus possible à la population Il doit être représentatif de la population. Il faut donner à chaque élément de la population une chance égale de faire partie de l’échantillon. Tirage au sort : Randomisation Échantillon aléatoire Échantillon aléatoire : Un échantillon où les sujets sont sélectionnées au hasard
Dr. Tarek Barhoumi statistiques descriptives
Unité statistique Elément de la population ou du groupe étudié
Dr. Tarek Barhoumi statistiques descriptives Série statistique Ensemble des valeurs observées pour une ou plusieurs variables sur les n sujets ou éléments de la population
Dr. Tarek Barhoumi statistiques descriptives Distribution statistique Ensemble des couples (xi, ni) où xi est une modalité de la variable et ni est sa fréquence
Dr. Tarek Barhoumi statistiques descriptives Statistique et variabilité La statistique est basée sur une notion importante qui est la variabilité. – La variabilité c’est le fait qu’on ne trouve jamais deux êtres humains identiques. – Nous sommes tous différents les uns des autres. « Tailles différentes, poids différents, valeurs biologiques différentes, groupes sanguins différents ».
Dr. Tarek Barhoumi statistiques descriptives Variables Résultat d'une mesure. Elle s'exprime par une valeur numérique. (poids, taille, glycémie, nombre de colonies bactériennes…) Résultat d’un classement. Représente un attribut de l'objet non susceptible de mesure. (genre, couleur des cheveux, groupe sanguin…) Variable quantitative Variable quantitative Variable qualitative 14
Dr. Tarek Barhoumi statistiques descriptives Variables C’est le résultat d’un dénombrement nombre є N (nombre d’enfants/famille) Résultat de la mesure d’une grandeur nombre є R (glycémie, poids…) Variable quantitative Variable qualitative discrètecontinue ordinalenominale Les catégories respectent un certain ordre croissant ou décroissant. (niveau socioéconomique…………. Les différentes catégories ne respectent aucun ordre. (couleur des yeux, situation matrimoniale…) 15
Dr. Tarek Barhoumi statistiques descriptives Quel type de variable? Groupe de transmission du VIH : Nausée (oui/non) : TA : Nombre de grossesse : Département (1, 2,..13, ) : Satisfaction ( non – peu – moyennement- très ) : 16
Dr. Tarek Barhoumi statistiques descriptives Quel type de variable? Groupe de transmission du VIH : qualitative nominale Nausée (oui/non) : Qualitative dichotomique TA : Quantitative continue Nombre de grossesse : Quantitative discrète Département (1, 2,..13, ) : Qualitative nominale Satisfaction ( non – peu – moyennement- très ) : Qualitative ordinale 17
Dr. Tarek Barhoumi statistiques descriptives Variables
Dr. Tarek Barhoumi statistiques descriptives Statistique descriptive - Généralités Méthodes : décrire, résumer et présenter les données variées pour que l’on puisse en prendre connaissance facilement. – Représentations numériques « paramètre statistique » – Représentations graphiques. – Représentations tabulaires.
Dr. Tarek Barhoumi statistiques descriptives 20 Paramètres de tendance centrale Paramètres de dispersion Des valeurs numériques autour desquelles les observations sont réparties Des valeurs numériques résumant le plus ou moins étalement des observations de part et d’autre de la tendance centrale Représentations numériques « paramètre statistique » : Mesures de tendance centrale et mesures de dispersion
Dr. Tarek Barhoumi statistiques descriptives Représentations numériques « paramètre statistique » : Mesures de tendance centrale et mesures de dispersion Paramètres de tendance centrale Paramètres de dispersion La moyenne Le mode La médiane 3 M La moyenne Le mode La médiane 3 M L’étendue L’écart type L’écart interquartiles 3 E L’étendue L’écart type L’écart interquartiles 3 E 21
Dr. Tarek Barhoumi statistiques descriptives Moyenne arithmétique : exemple La moyenne = la somme des observations / Le nombre des observations On tire au hasard 10 ménages, le nombre de personnes dans chacun: 2, 8, 2, 6, 4, 5, 2, 3, 7, 1 nombre moyen de personnes par ménage ? ( ) / 10 = 40 / 10 = 4
Dr. Tarek Barhoumi statistiques descriptives La médiane Lorsque les valeurs d’une variable sont ordonnées, la médiane correspond à la valeur centrale. La médiane est la valeur de l’observation qui sépare une distribution en deux parties égales: 50 % inférieur 50 % supérieur
Dr. Tarek Barhoumi statistiques descriptives D é termination de la m é diane Classer les données par ordre croissant /…. – La Position de la médiane Si l’effectif est impair, alors la médiane est a la position centrale / n/2 Si l’effectif est pair, alors la médiane est a la position obtenue en faisant la moyenne : n + 1 / 2 ou – La valeur de l’observation qui correspond à cette position
Dr. Tarek Barhoumi statistiques descriptives D é termination de la m é diane 25
Dr. Tarek Barhoumi statistiques descriptives valeur de la médiane Nombre de personnes dans chacun des 10 ménages : 2, 8, 2, 6, 4, 5, 2, 3, 7, 1 Nombre médian de personnes par ménage ?
Dr. Tarek Barhoumi statistiques descriptives NB : Moyenne et médiane Moyenne Unique Facile à calculer Influencée par les valeurs extrêmes Médiane Unique Facile à calculer Peu affectée par les valeurs extrêmes
Dr. Tarek Barhoumi statistiques descriptives Le mode Le mode d’un ensemble de valeurs correspond à la valeur la plus fréquente. Il n’y a pas de mode lorsque toutes les valeurs sont différentes Il peut y avoir plusieurs modes 28
Dr. Tarek Barhoumi statistiques descriptives Le mode Nombre de personnes dans chacun des 10 ménages : 2, 8, 2, 6, 4, 5, 2, 3, 7, 1 Mode de personnes par ménage ? 2 29
Dr. Tarek Barhoumi statistiques descriptives Paramètres : Tendance centrale Nombre de personnes dans chacun des 10 ménages : 2, 8, 2, 6, 4, 5, 2, 3, 7, 1 – moyenne = 4 – médiane = 3,5 – Mode =2 30
Dr. Tarek Barhoumi statistiques descriptives Représentations numériques « paramètre statistique » : Mesures de tendance centrale et mesures de dispersion Paramètres de dispersion L’étendue L’écart type L’écart interquartiles 3 E L’étendue L’écart type L’écart interquartiles 3 E 31
Dr. Tarek Barhoumi statistiques descriptives L’étendue Écart entre les valeurs extrêmes Valeur maximale – Valeur minimale Étendue = Maxi-Min Nombre de personnes dans chacun des 10 ménages : 2, 8, 2, 6, 4, 5, 2, 3, 7, 1 Etendue : 8 – 1 = 7
Dr. Tarek Barhoumi statistiques descriptives L’écart interquartiles : Les quartiles Un quartile est la valeur de la variable qui s é pare une distribution en quatre segments é gaux. Un quartile est le 25 è me percentile On distingue: – Le premier quartile Q1: 25 % - 75 % – Le deuxi è me quartile Q2:50 % - 50 % – Le troisi è me quartile Q3: 75 % - 25 %
Dr. Tarek Barhoumi statistiques descriptives Les quartiles Nombre de personnes dans chacun des 10 ménages : Q1. Q25 %Q2. Q 50 % Q3. Q 75 %
Dr. Tarek Barhoumi statistiques descriptives La variance Elle permet d’évaluer l’importance de la dispersion des valeurs de part et d’autre de la moyenne (Écart entre chaque observation et la moyenne) C’est la (somme des écarts) 2 / n-1 La somme (xi – Ecart ) 2 / n-1 n-1: Degrés de liberté 35
Dr. Tarek Barhoumi statistiques descriptives Ecart -Ecart + Moyenne Xi 36
Dr. Tarek Barhoumi statistiques descriptives La variance Nombre de personnes dans chacun des 10 ménages : Variance = ((1-4) 2 + 3(2-4) 2 + (3-4) 2 + (4-4) 2 + (5-4) 2 +(6-4) 2 + (7-4) 2 + (8-4) 2 ) / Variance = 5,7 personne 2
Dr. Tarek Barhoumi statistiques descriptives Écart type L’écart type correspond à la racine carré de la variance. La mesure de la dispersion est exprimée dans les unités de mesure originales de la variable Nombre de personnes dans chacun des 10 ménages : Écart type = √ 5,7 = 2,4 « 2 » personnes par ménage 38
Dr. Tarek Barhoumi statistiques descriptives Au total 000
Dr. Tarek Barhoumi statistiques descriptives Représentations numériques « paramètre statistique » : Mesures de tendance centrale et mesures de dispersion Paramètres de tendance centrale Paramètres de dispersion La moyenne Le mode La médiane 3 M La moyenne Le mode La médiane 3 M L’étendue L’écart type L’écart interquartiles 3 E L’étendue L’écart type L’écart interquartiles 3 E 40
Dr. Tarek Barhoumi statistiques descriptives Représentations graphiques Variable quantitative : histogramme, polygone de fréquence, box plot
Dr. Tarek Barhoumi statistiques descriptives Histogramme Variable quantitative
Dr. Tarek Barhoumi statistiques descriptives Graphique Box plot Variable quantitative
Dr. Tarek Barhoumi statistiques descriptives
Représentation tabulaire Variable qualitative – Tableau des fréquence : une variable – Tableau de contingence : deux variables
Dr. Tarek Barhoumi statistiques descriptives Tableau des fréquences Fréquence absolue : Effectif Nombre d’observations Fréquence relative : Pourcentage Rapport entre l’effectif de la classe et l’effectif total Fréquence cumulée: Pourcentage Somme de la fréquence d’une classe et de toutes les classes qui la précédent
Dr. Tarek Barhoumi statistiques descriptives
Tableau de contingence Deux variables – Des lignes – Des colonnes – Des cellules Des fréquences absolues Des pourcentages – Par rapport aux totaux des lignes – Par rapport aux totaux des colonnes
Dr. Tarek Barhoumi statistiques descriptives
Représentations graphiques Variable qualitative ; diagramme en barre, diagramme en secteur
Dr. Tarek Barhoumi statistiques descriptives Diagramme en barre Variable qualitative ordinale
Dr. Tarek Barhoumi statistiques descriptives diagramme en secteur Variable qualitative nominale
Dr. Tarek Barhoumi statistiques descriptives Exercices 53
Dr. Tarek Barhoumi statistiques descriptives 54
Dr. Tarek Barhoumi statistiques descriptives Exercice : statistiques descriptives Numériques, graphiques, pour les variables suivantes – Age – Genre – Niveau d’instruction