La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Faculté de médecine de Sousse Module : Biostatistique PCEM

Présentations similaires


Présentation au sujet: "Faculté de médecine de Sousse Module : Biostatistique PCEM"— Transcription de la présentation:

1 Faculté de médecine de Sousse Module : Biostatistique PCEM2 2011-2012
Les statistiques descriptives Iheb Bougmiza 03 novembre 2011 Iheb Bougmiza Les statistiques descriptives

2 Les statistiques descriptives
Iheb Bougmiza Les statistiques descriptives

3 Planifier Analyse données
Place des statistiques… Problème Recherche Question de recherche Type d’étude Population cible Budget Instr. mesure Échéancier Éthique Planifier Analyse données Iheb Bougmiza Les statistiques descriptives

4 Les statistiques descriptives
Iheb Bougmiza Les statistiques descriptives

5 Les statistiques descriptives
Approches Faire des exercices +++ « we learn by doing » « j’entends et j’oublie. Je vois et je retiens, je fais et je comprend » Le moins de mathématique possible et le plus orienté possible vers la résolution de problèmes concrets Iheb Bougmiza Les statistiques descriptives

6 Les statistiques descriptives
Les objectifs A la fin du cours, l’étudiant sera capable de Définir la notion de variable Identifier les types de variables Présenter les données par des tableaux de fréquence Présenter les données par des graphiques Décrire les paramètres de tendance centrale Décrire les paramètres de dispersion Iheb Bougmiza Les statistiques descriptives

7 Les statistiques descriptives
Au menu …. I) la notion de variables et de mesure 1. Définitions 2. Types de variables II) La présentation des données 1. Méthode tabulaire 2. Méthode graphique III) Les paramètres de réduction 1.Les paramètres de tendance centrale 2.Les paramètres de dispersion Iheb Bougmiza Les statistiques descriptives

8 La statistique en médecine…
Outil pour répondre à plusieurs questions Quelle est la valeur normale de la glycémie ? Quel est le risque de complication d’une maladie X ? Quel est le risque d’un traitement ? Le traitement A est-il plus efficace que le traitement B ? Iheb Bougmiza Les statistiques descriptives

9 La variabilité est la règle (1)…
Iheb Bougmiza Les statistiques descriptives

10 La variabilité est la règle (2)…
La variabilité totale = variabilité expérimentale et variabilité biologique. Variabilité biologique = variabilité intra-individuelle + variabilité inter-individuelle La décision dans l’incertain (diagnostic, traitement, pronostic..) Iheb Bougmiza Les statistiques descriptives

11 Les statistiques descriptives
Une petite réflexion… 8% des accidents mortels sur autoroute sont directement provoqués par des conducteurs ayant emprunté l’autoroute en sens inverse Cela signifie que 92% des accidents mortels sont imputables à des conducteurs ayant roulé en bon sens Conclusion : il est statistiquement moins dangereux de prendre l’autoroute en sens inverse !!!!!! Iheb Bougmiza Les statistiques descriptives

12 I) la notion de variables et de mesure 1. Définitions
Une variable est une propriété commune aux individus de la population étudiée (taille, poids, glycémie, genre…) et qui varie en fonction du temps, du lieu et de l’individu Les modalités d'une variable sont les différentes valeurs que celle-ci peut prendre variable situation familiale : célibataire, marié, veuf.. variable genre: homme, femme. variable prénom : El Fehem, Mohamed, Salah… Iheb Bougmiza Les statistiques descriptives

13 I) la notion de variables et de mesure 2. Types de variables
Variable quantitative :les modalités s’expriment par des valeurs numériques Variable continue :prend un nombre infini de valeurs à l’intérieur d’un intervalle donné (nombre réel) Taille, poids, glycémie… Variable discrète : prend un nombre fini de valeur à l’intérieur d’un intervalle donné (nombre entier) Nbr de lits dans un hôpital, nbr d’enfants dans une famille On transforme parfois une variable continue en une variable discrète = Discrétisation = groupement par classe (plus simple mais perte de l’information) Iheb Bougmiza Les statistiques descriptives

14 I) la notion de variables et de mesure 2. Types de variables
Variable qualitative : les modalités s’expriment par des qualités (genre, système ABO, état civil...) ordinale : s’exprime en classes qui peut être ordonnée selon une échelle de valeurs (degré de satisfaction, niveau d’étude, NSE, taille vestimentaire) Nominales : les classes ne peuvent pas être hiérarchisées. L’ordre de précision est arbitraire (ABO, état civile, religion…) Binaires ne prennent que 2 valeurs (H/F, malade/sain…) appelées aussi: Variables dichotomiques, Variables booléennes: vrai ou faux ou Variables de Bernouilli (0/1) Iheb Bougmiza Les statistiques descriptives

15 I) la notion de variables et de mesure 2. Types de variables (résumé)
Iheb Bougmiza Les statistiques descriptives

16 Les statistiques descriptives
I) la notion de variables et de mesure 2. Types de variables (résumé) QUANTITATIVE QUALITATIVE ordinale continue nominale discrète binaire temporelle Iheb Bougmiza Les statistiques descriptives

17 Les statistiques descriptives
Indiquez le type et l’échelle de mesure Applications : indiquer pour chaque variable l’échelle de mesure appropriée Variables Échelle Age de l’enfant en mois Gnre de l’enfant : G/F Poids de l’enfant en gr Origine : Monastir, Sousse, Mahdia État vaccinal : non vacc/incomplet/complet Profession père : Agricult/Comercant/autres …… ….. Iheb Bougmiza Les statistiques descriptives

18 Les statistiques descriptives
Indiquez le type et l’échelle de mesure Applications : indiquer pour chaque variable l’échelle de mesure appropriée Variables Type et échelle Date de naissance Age en classe Statut tabagique (Fumeur/Non Fumeur) Couleur des yeux Le nombre de dents Nationalité …… ….. Iheb Bougmiza Les statistiques descriptives

19 II) La présentation des données brutes
Comment les structurer et les interpréter ? Age (années) Groupes 32 ; 35 ; 40 ; 42 ; 43 ; 43 ; 49 ; 50 ; 55 ; 58 A 22 ; 26 ; 27 ; 27 ; 29 ; 30 ; 31 ; 31 ; ; 36 ; 38 ; 39 ; 39 ; 42 ; 44 ; 46 ; 51 ; 53 B 20 ; 20 ; 21 ; 22 ; 23 ; 24 ; 24 ; 24 ; 26 ; 28 ; 28 ; 28 ; 29 ; 29 ; 30 ; 32 ; 33 ; 33 ; ; 41 ; 43 ; 45 ; 45 C Iheb Bougmiza Les statistiques descriptives

20 Fréquence relative (%)
II) La présentation des données 1. Méthode tabulaire Il faut présenter l’effectif absolu (faire un tri à plat) Il faut présenter la proportion d’individus dans une modalité par rapport au total = fréquence relative qui peut s’exprimer en pourcentages ou non Situation familiale Effectif (ou fréq. absolue) Fréquence relative Fréquence relative (%) Marié 390 0,46 46% célibataire 463 0,54 54% Total 853 1,00 100% C’est la même chose ! Iheb Bougmiza Les statistiques descriptives

21 Les statistiques descriptives
II) La présentation des données 1. Méthode tabulaire Il faut faire attention aux données manquantes +++ Elles peuvent êtres liées : Au refus de réponse A des mesures non pratiquées ou oublis de saisie Tenter de récupérer le maximum de données manquantes En tenir compte dans le tableau de fréquences Iheb Bougmiza Les statistiques descriptives

22 Les statistiques descriptives
II) La présentation des données 2. présentation graphique Méthode visuelle pour saisir rapidement la forme d’une distribution Le choix du graphique est déterminé par l’échelle de mesure de la variable Les Variables qualitatives : Diagramme en bâtons Diagramme en secteur Les Variables quantitatives Histogrammes polygones de fréquence Iheb Bougmiza Les statistiques descriptives

23 Les statistiques descriptives
II) La présentation des données 2. Méthode graphique (diagramme en bâtons) Iheb Bougmiza Les statistiques descriptives

24 Les statistiques descriptives
II) La présentation des données 2. Méthode graphique (diagramme en secteurs) Iheb Bougmiza Les statistiques descriptives

25 Année de 1ère inscription
II) La présentation des données 2. Méthode graphique (Polygone de fréquences) Année de 1ère inscription Effectif 1998 8 1999 27 2000 42 2001 88 2002 115 2003 192 2004 381 Iheb Bougmiza Les statistiques descriptives

26 Les statistiques descriptives
II) La présentation des données 2. Méthode graphique (Boite à moustaches) Maximum Q3 Médiane Q1 Minimum Iheb Bougmiza Les statistiques descriptives

27 Les statistiques descriptives
III) Les paramètres de réduction 1. Définition et types Ce sont des valeurs numériques qui résument les mesures d’une variable quantitative Paramètres de tendance centrale Des mesures qui localisent « le centre » d’une distribution Paramètres de dispersion Renseignent sur l’étalement de la série autour de la mesure de tendance centrale Iheb Bougmiza Les statistiques descriptives

28 Les statistiques descriptives
III) Les paramètres de réduction 1. Définition et types Fréquences Tendances centrales Dispersion MEDIANE MOYENNE ECART-TYPE ETENDUE MODE Iheb Bougmiza Les statistiques descriptives

29 Les statistiques descriptives
III) Les paramètres de réduction 2. Les paramètres de tendance centrale Où situeriez-vous le "centre" ? A la valeur 6, qui est la plus fréquente ? ou bien plus à droite, par exemple de façon à partager les observations en paquets égaux ? Si oui, où, exactement ? 7, 8, 9 ? Iheb Bougmiza Les statistiques descriptives

30 Les statistiques descriptives
III) Les paramètres de réduction 2. Les paramètres de tendance centrale (la Moyenne) Mesure la plus connue Division de la somme de toutes les valeurs de l'échantillon par sa taille (n). Le point auquel il faudrait placer un support pour que la "planche" reste en équilibre. Iheb Bougmiza Les statistiques descriptives

31 Les statistiques descriptives
III) Les paramètres de réduction 2. Les paramètres de tendance centrale (la Moyenne) Iheb Bougmiza Les statistiques descriptives

32 III) Les paramètres de réduction
2. Les paramètres de tendance centrale (la Moyenne) On compare deux classes de 10 élèves Classe A est meilleure que la classe B ????? Iheb Bougmiza Les statistiques descriptives

33 III) Les paramètres de réduction
2. Les paramètres de tendance centrale (la Moyenne) Inconvénient de la moyenne +++ Sensibilité aux valeurs extrêmes erreurs cas particuliers les danseuses ont de quoi se faire du sushi Iheb Bougmiza Les statistiques descriptives

34 Les statistiques descriptives
Oops !!!!!!! Existe-t-il un paramètre meilleur que la moyenne pour synthétiser l’information ? Iheb Bougmiza Les statistiques descriptives

35 Les statistiques descriptives
III) Les paramètres de réduction 2. Les paramètres de tendance centrale (la Médiane) Valeur pour laquelle il y a autant d'observations à gauche qu'à droite. La meilleure mesure de TC pour les variables ordinales Pour la calculer : on classe les observations par ordre croissant on cherche quelle est la valeur qui divise les observations en deux groupes égaux ? Si le nombre d'observations est pair: la médiane est la moyenne entre les observations n/2 et n/2 + 1 Si le nombre d'observations est impair: la médiane est la valeur (n+1)/2. Iheb Bougmiza Les statistiques descriptives

36 Les statistiques descriptives
III) Les paramètres de réduction 2. Les paramètres de tendance centrale (la Médiane) 50% 50% 50% 50% Iheb Bougmiza Les statistiques descriptives

37 Les statistiques descriptives
III) Les paramètres de réduction 2. Les paramètres de tendance centrale (la Médiane) Iheb Bougmiza Les statistiques descriptives

38 Les statistiques descriptives
III) Les paramètres de réduction 2. Les paramètres de tendance centrale (la Médiane) La médiane se situe entre174 et 176 cm. Iheb Bougmiza Les statistiques descriptives

39 Les statistiques descriptives
III) Les paramètres de réduction 2. Les paramètres de tendance centrale (la Médiane) Iheb Bougmiza Les statistiques descriptives

40 Les statistiques descriptives
III) Les paramètres de réduction 2. Les paramètres de tendance centrale (le mode) La valeur la plus fréquente dans un échantillon. Si l'échantillon est divisé en classes, la classe modale constitue la classe la plus fréquente. Distributions bimodales, ou multimodales le mode est 6 Iheb Bougmiza Les statistiques descriptives

41 Les statistiques descriptives
III) Les paramètres de réduction 2. Les paramètres de tendance centrale (le mode) Exemple : 156, 178, 189, 178, 152, 1, 34 : le mode = ?? apparaît le plus, c'est-à-dire deux fois alors que les autres n'apparaissent qu'une fois).   Iheb Bougmiza Les statistiques descriptives

42 Les statistiques descriptives
III) Les paramètres de réduction 2. Les paramètres de tendance centrale (les quartiles, déciles et percentiles) Quartiles : 3 valeurs qui partagent la distribution en 4 1er quartile : divise d’un coté les 25 % des valeurs les plus faibles et de l’autre coté les 75 % restants 2ème quartile = Médiane 3ème quartile : divise l’échantillon en ¾ - ¼ Déciles (9 valeurs : 10 %, 20 % ……., 90 %) Percentiles (1%, 2% %) Iheb Bougmiza Les statistiques descriptives

43 Les statistiques descriptives
III) Les paramètres de réduction 2. Les paramètres de tendance centrale (les quartiles, déciles et percentiles) 130, 124, 147, 160, 139, 105, 112, 137, 122, 134 1 – On range en premier lieu les données par ordre croissant Ordre Valeur Me 2 – On calcule la position de Q1 et Q3 P (q3) = (n +1/ 4) x 3 = 8,25 P (q1) = n +1/ 4 = 2,75 q3 = entre 139 et 147 mm q1 = entre 112 et 122 mm Iheb Bougmiza Les statistiques descriptives

44 Les statistiques descriptives
III) Les paramètres de réduction 2. Les paramètres de dispersion Problème : moyenne identique étalement différent des données +++ Nécessité de mesurer la dispersion des données Iheb Bougmiza Les statistiques descriptives

45 Les statistiques descriptives
III) Les paramètres de réduction 2. Les paramètres de dispersion (l’étendue) Mesure l'écart entre la valeur la plus élevée et la plus petite Exemple : 220 cm cm = 49 cm. Etendue (Et.) = Valeur maximale (Vmax) -Valeur minimale (Vmin) Iheb Bougmiza Les statistiques descriptives

46 Inconvénient : l’étendue ne tient pas compte de l’ensemble des valeurs
III) Les paramètres de réduction 2. Les paramètres de dispersion (l’étendue) Mesure l'écart entre la valeur la plus élevée et la plus petite Exemple : 220 cm cm = 49 cm. Etendue (Et.) = Valeur maximale (Vmax) -Valeur minimale (Vmin) Inconvénient : l’étendue ne tient pas compte de l’ensemble des valeurs Iheb Bougmiza Les statistiques descriptives

47 Les statistiques descriptives
III) Les paramètres de réduction 2. Les paramètres de dispersion (la variance) Moyenne des carrés des écarts à la moyenne La variance n’est pas dans la même unité que les données m  m2 kg  kg2 X X-M (X-M)2 1 -5,3 28,2 3 -3,3 10,9 4 -2,3 5,3 5 -1,3 1,7 6 -0,3 0,1 7 0,7 0,5 8 2,9 9 2,7 7,2 10 3,7 13,6 11 4,7 22,0 Moyenne 0,0 9,1 Iheb Bougmiza Les statistiques descriptives

48 Les statistiques descriptives
III) Les paramètres de réduction 2. Les paramètres de dispersion (l’écart-type) Caractérise la dispersion des valeurs de part et d’autre de la moyenne. Plus l'écart-type est grand, plus la dispersion est grande également. racine carrée de la variance même unité que les données Formule : Iheb Bougmiza Les statistiques descriptives

49 Relation entre les trois indices (1)
La relation dépend de la forme la distribution Distribution symétrique (ou à peu près) : mode = médiane = moyenne So ? Iheb Bougmiza Les statistiques descriptives

50 Relation entre les trois indices (2)
Distribution asymétrique Etalée à gauche : mode < médiane <moyenne Iiiik !!! Iheb Bougmiza Les statistiques descriptives

51 Relation entre les trois indices (3)
Distribution asymétrique Etalée à droite : mode > médiane > moyenne Yuuuk !!! Iheb Bougmiza Les statistiques descriptives

52 Notions essentielles…
La variabilité est une caractéristique de toutes les mesures Pour la description d’une population Méthode tabulaire Méthode graphique (dépend de la nature des variables) Méthode numérique : il est indispensable de définir des indices synthétiques Les paramètres de tendance centrale Les paramètres de dispersion Iheb Bougmiza Les statistiques descriptives

53 Les statistiques descriptives
Iheb Bougmiza Les statistiques descriptives


Télécharger ppt "Faculté de médecine de Sousse Module : Biostatistique PCEM"

Présentations similaires


Annonces Google