La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Iheb BougmizaLes statistiques descriptives1 Faculté de médecine de Sousse Module : Biostatistique PCEM2 2011-2012 Les statistiques descriptives Iheb Bougmiza.

Présentations similaires


Présentation au sujet: "Iheb BougmizaLes statistiques descriptives1 Faculté de médecine de Sousse Module : Biostatistique PCEM2 2011-2012 Les statistiques descriptives Iheb Bougmiza."— Transcription de la présentation:

1

2 Iheb BougmizaLes statistiques descriptives1 Faculté de médecine de Sousse Module : Biostatistique PCEM Les statistiques descriptives Iheb Bougmiza 03 novembre 2011

3 Iheb BougmizaLes statistiques descriptives2

4 Iheb BougmizaLes statistiques descriptives3 Place des statistiques… Problème Recherche Question de recherche Type d’étude Population cible Instr. mesure Planifier Analyse données Échéancier Budget Éthique

5 Iheb BougmizaLes statistiques descriptives4

6 Approches  Faire des exercices +++  « we learn by doing »  « j’entends et j’oublie. Je vois et je retiens, je fais et je comprend »  Le moins de mathématique possible et le plus orienté possible vers la résolution de problèmes concrets Iheb BougmizaLes statistiques descriptives5

7 Les objectifs A la fin du cours, l’étudiant sera capable de 1.Définir la notion de variable 2.Identifier les types de variables 3.Présenter les données par des tableaux de fréquence 4.Présenter les données par des graphiques 5.Décrire les paramètres de tendance centrale 6.Décrire les paramètres de dispersion Iheb BougmizaLes statistiques descriptives6

8 Au menu …. I) la notion de variables et de mesure 1. Définitions 2. Types de variables II) La présentation des données 1. Méthode tabulaire 2. Méthode graphique III) Les paramètres de réduction 1.Les paramètres de tendance centrale 2.Les paramètres de dispersion Iheb BougmizaLes statistiques descriptives7

9 La statistique en médecine…  Outil pour répondre à plusieurs questions — Quelle est la valeur normale de la glycémie ? — Quel est le risque de complication d’une maladie X ? — Quel est le risque d’un traitement ? — Le traitement A est-il plus efficace que le traitement B ? Iheb BougmizaLes statistiques descriptives8

10 La variabilité est la règle (1)… Iheb BougmizaLes statistiques descriptives9

11 La variabilité est la règle (2)…  La variabilité totale = variabilité expérimentale et variabilité biologique.  Variabilité biologique = variabilité intra-individuelle + variabilité inter-individuelle  La décision dans l’incertain (diagnostic, traitement, pronostic..) Iheb BougmizaLes statistiques descriptives10

12 Une petite réflexion…  8% des accidents mortels sur autoroute sont directement provoqués par des conducteurs ayant emprunté l’autoroute en sens inverse Cela signifie que 92% des accidents mortels sont imputables à des conducteurs ayant roulé en bon sens Conclusion : il est statistiquement moins dangereux de prendre l’autoroute en sens inverse !!!!!! Iheb BougmizaLes statistiques descriptives11

13 I ) la notion de variables et de mesure 1. Définitions  Une variable est une propriété commune aux individus de la population étudiée (taille, poids, glycémie, genre…) et qui varie en fonction du temps, du lieu et de l’individu  Les modalités d'une variable sont les différentes valeurs que celle-ci peut prendre — variable situation familiale : célibataire, marié, veuf.. — variable genre: homme, femme. — variable prénom : El Fehem, Mohamed, Salah… Iheb BougmizaLes statistiques descriptives12

14 I) la notion de variables et de mesure 2. Types de variables Iheb BougmizaLes statistiques descriptives13  Variable quantitative :les modalités s’expriment par des valeurs numériques — Variable continue :prend un nombre infini de valeurs à l’intérieur d’un intervalle donné (nombre réel)  Taille, poids, glycémie… — Variable discrète : prend un nombre fini de valeur à l’intérieur d’un intervalle donné (nombre entier)  Nbr de lits dans un hôpital, nbr d’enfants dans une famille  On transforme parfois une variable continue en une variable discrète = Discrétisation = groupement par classe (plus simple mais perte de l’information)

15 I) la notion de variables et de mesure 2. Types de variables Iheb BougmizaLes statistiques descriptives14  Variable qualitative : les modalités s’expriment par des qualités (genre, système ABO, état civil...) — ordinale : s’exprime en classes qui peut être ordonnée selon une échelle de valeurs (degré de satisfaction, niveau d’étude, NSE, taille vestimentaire) — Nominales : les classes ne peuvent pas être hiérarchisées. L’ordre de précision est arbitraire (ABO, état civile, religion…) — Binaires ne prennent que 2 valeurs (H/F, malade/sain…) appelées aussi: Variables dichotomiques, Variables booléennes: vrai ou faux ou Variables de Bernouilli (0/1)

16 I) la notion de variables et de mesure 2. Types de variables (résumé) Iheb BougmizaLes statistiques descriptives15

17 Iheb BougmizaLes statistiques descriptives16 QUALITATIVE QUANTITATIVE continue discrète temporelle ordinale nominale binaire I) la notion de variables et de mesure 2. Types de variables (résumé)

18 Iheb BougmizaLes statistiques descriptives17 Applications : indiquer pour chaque variable l’échelle de mesure appropriée VariablesÉchelle Age de l’enfant en mois Gnre de l’enfant : G/F Poids de l’enfant en gr Origine : Monastir, Sousse, Mahdia État vaccinal : non vacc/incomplet/complet Profession père : Agricult/Comercant/autres …… ….. …… Indiquez le type et l’échelle de mesure

19 Iheb BougmizaLes statistiques descriptives18 Applications : indiquer pour chaque variable l’échelle de mesure appropriée VariablesType et échelle Date de naissance Age en classe Statut tabagique (Fumeur/Non Fumeur) Couleur des yeux Le nombre de dents Nationalité …… ….. …… Indiquez le type et l’échelle de mesure

20 II) La présentation des données brutes Iheb BougmizaLes statistiques descriptives19  Comment les structurer et les interpréter ? Age (ann é es)Groupes 32 ; 35 ; 40 ; 42 ; 43 ; 43 ; 49 ; 50 ; 55 ; 58 A 22 ; 26 ; 27 ; 27 ; 29 ; 30 ; 31 ; 31 ; ; 36 ; 38 ; 39 ; 39 ; 42 ; 44 ; 46 ; 51 ; 53 B 20 ; 20 ; 21 ; 22 ; 23 ; 24 ; 24 ; 24 ; 26 ; 28 ; 28 ; 28 ; 29 ; 29 ; 30 ; 32 ; 33 ; 33 ; ; 41 ; 43 ; 45 ; 45 C

21 Iheb BougmizaLes statistiques descriptives20  Il faut présenter l’effectif absolu (faire un tri à plat)  Il faut présenter la proportion d’individus dans une modalité par rapport au total = fréquence relative qui peut s’exprimer en pourcentages ou non Situation familiale Effectif (ou fréq. absolue) Fréquence relative Fréquence relative (%) Marié3900,4646% célibataire4630,5454% Total8531,00100% C’est la même chose ! II) La présentation des données 1. Méthode tabulaire

22 Iheb BougmizaLes statistiques descriptives21  Il faut faire attention aux données manquantes +++  Elles peuvent êtres liées : — Au refus de réponse — A des mesures non pratiquées ou oublis de saisie  Tenter de récupérer le maximum de données manquantes  En tenir compte dans le tableau de fréquences II) La présentation des données 1. Méthode tabulaire

23  Méthode visuelle pour saisir rapidement la forme d’une distribution  Le choix du graphique est déterminé par l’échelle de mesure de la variable  Les Variables qualitatives : — Diagramme en bâtons — Diagramme en secteur  Les Variables quantitatives — Histogrammes — polygones de fréquence Iheb BougmizaLes statistiques descriptives22 II) La présentation des données 2. présentation graphique

24 Iheb BougmizaLes statistiques descriptives23 II) La présentation des données 2. Méthode graphique (diagramme en bâtons)

25 Iheb BougmizaLes statistiques descriptives24 II) La présentation des données 2. Méthode graphique (diagramme en secteurs)

26 Iheb BougmizaLes statistiques descriptives25 Année de 1ère inscription Effectif II) La présentation des données 2. Méthode graphique (Polygone de fréquences)

27 Iheb BougmizaLes statistiques descriptives26 Minimum Maximum Médiane Q1 Q3 II) La présentation des données 2. Méthode graphique (Boite à moustaches)

28  Ce sont des valeurs numériques qui résument les mesures d’une variable quantitative  Paramètres de tendance centrale — Des mesures qui localisent « le centre » d’une distribution  Paramètres de dispersion — Renseignent sur l’étalement de la série autour de la mesure de tendance centrale Iheb BougmizaLes statistiques descriptives27 III) Les paramètres de réduction 1. Définition et types

29 Iheb BougmizaLes statistiques descriptives28 Fréquences Tendancescentrales Dispersion MOYENNE MODE MEDIANE ETENDUE ECART-TYPE III) Les paramètres de réduction 1. Définition et types

30 Iheb BougmizaLes statistiques descriptives29 III) Les paramètres de réduction 2. Les paramètres de tendance centrale Où situeriez-vous le "centre" ? A la valeur 6, qui est la plus fréquente ? ou bien plus à droite, par exemple de façon à partager les observations en paquets égaux ? Si oui, où, exactement ? 7, 8, 9 ?

31 Iheb BougmizaLes statistiques descriptives30  Mesure la plus connue  Division de la somme de toutes les valeurs de l'échantillon par sa taille (n).  Le point auquel il faudrait placer un support pour que la "planche" reste en équilibre. III) Les paramètres de réduction 2. Les paramètres de tendance centrale (la Moyenne)

32 Iheb BougmizaLes statistiques descriptives31 III) Les paramètres de réduction 2. Les paramètres de tendance centrale (la Moyenne)

33 Iheb BougmizaLes statistiques descriptives32  On compare deux classes de 10 élèves III) Les paramètres de réduction 2. Les paramètres de tendance centrale (la Moyenne) Classe A est meilleure que la classe B ?????

34 Iheb BougmizaLes statistiques descriptives33  Inconvénient de la moyenne +++  Sensibilité aux valeurs extrêmes — erreurs — cas particuliers les danseuses ont de quoi se faire du sushi III) Les paramètres de réduction 2. Les paramètres de tendance centrale (la Moyenne)

35 Iheb BougmizaLes statistiques descriptives34 Oops !!!!!!! Existe-t-il un paramètre meilleur que la moyenne pour synthétiser l’information ?

36  Valeur pour laquelle il y a autant d'observations à gauche qu'à droite.  La meilleure mesure de TC pour les variables ordinales  Pour la calculer : — on classe les observations par ordre croissant — on cherche quelle est la valeur qui divise les observations en deux groupes égaux ?  Si le nombre d'observations est pair: la médiane est la moyenne entre les observations n/2 et n/2 + 1  Si le nombre d'observations est impair: la médiane est la valeur (n+1)/2. Iheb BougmizaLes statistiques descriptives35 III) Les paramètres de réduction 2. Les paramètres de tendance centrale (la Médiane)

37 Iheb BougmizaLes statistiques descriptives36 50% III) Les paramètres de réduction 2. Les paramètres de tendance centrale (la Médiane)

38 Iheb BougmizaLes statistiques descriptives37 III) Les paramètres de réduction 2. Les paramètres de tendance centrale (la Médiane)

39 Iheb BougmizaLes statistiques descriptives38 La médiane se situe entre174 et 176 cm. III) Les paramètres de réduction 2. Les paramètres de tendance centrale (la Médiane)

40 Iheb BougmizaLes statistiques descriptives39 III) Les paramètres de réduction 2. Les paramètres de tendance centrale (la Médiane)

41 Iheb BougmizaLes statistiques descriptives40  La valeur la plus fréquente dans un échantillon. Si l'échantillon est divisé en classes, la classe modale constitue la classe la plus fréquente.  Distributions bimodales, ou multimodales le mode est 6 III) Les paramètres de réduction 2. Les paramètres de tendance centrale (le mode)

42 Iheb BougmizaLes statistiques descriptives41 Exemple : 156, 178, 189, 178, 152, 1, 34 : le mode = ?? III) Les paramètres de réduction 2. Les paramètres de tendance centrale (le mode)

43 Iheb BougmizaLes statistiques descriptives42  Quartiles : 3 valeurs qui partagent la distribution en 4 — 1 er quartile : divise d’un coté les 25 % des valeurs les plus faibles et de l’autre coté les 75 % restants — 2 ème quartile = Médiane — 3 ème quartile : divise l’échantillon en ¾ - ¼  Déciles (9 valeurs : 10 %, 20 % ……., 90 %)  Percentiles (1%, 2% %) III) Les paramètres de réduction 2. Les paramètres de tendance centrale (les quartiles, déciles et percentiles)

44 Iheb BougmizaLes statistiques descriptives43 1 – On range en premier lieu les données par ordre croissant Ordre Valeur Me 2 – On calcule la position de Q1 et Q3 P (q1) = n +1/ 4 = 2,75 P (q3) = (n +1/ 4) x 3 = 8,25 q1 = entre 112 et 122 mm q3 = entre 139 et 147 mm 130, 124, 147, 160, 139, 105, 112, 137, 122, 134 III) Les paramètres de réduction 2. Les paramètres de tendance centrale (les quartiles, déciles et percentiles)

45  Problème : — moyenne identique — étalement différent des données +++  Nécessité de mesurer la dispersion des données Iheb BougmizaLes statistiques descriptives44 III) Les paramètres de réduction 2. Les paramètres de dispersion

46 Iheb BougmizaLes statistiques descriptives45  Mesure l'écart entre la valeur la plus élevée et la plus petite — Exemple : 220 cm cm = 49 cm. Etendue (Et.) = Valeur maximale (Vmax) -Valeur minimale (Vmin) III) Les paramètres de réduction 2. Les paramètres de dispersion (l’étendue)

47 Iheb BougmizaLes statistiques descriptives46  Mesure l'écart entre la valeur la plus élevée et la plus petite — Exemple : 220 cm cm = 49 cm. Etendue (Et.) = Valeur maximale (Vmax) -Valeur minimale (Vmin) III) Les paramètres de réduction 2. Les paramètres de dispersion (l’étendue) Inconvénient : l’étendue ne tient pas compte de l’ensemble des valeurs

48 Iheb BougmizaLes statistiques descriptives47  Moyenne des carrés des écarts à la moyenne  La variance n’est pas dans la même unité que les données — m  m 2 — kg  kg 2 XX-M(X-M) 2 1-5,328,2 3-3,310,9 3-3,310,9 4-2,35,3 5-1,31,7 5-1,31,7 6-0,30,1 70,70,5 81,72,9 92,77,2 103,713,6 103,713,6 114,722,0 Moyenne0,09,1 III) Les paramètres de réduction 2. Les paramètres de dispersion (la variance)

49 Iheb BougmizaLes statistiques descriptives48  Caractérise la dispersion des valeurs de part et d’autre de la moyenne.  Plus l'écart-type est grand, plus la dispersion est grande également.  racine carrée de la variance  même unité que les données  Formule : III) Les paramètres de réduction 2. Les paramètres de dispersion (l’écart-type)

50 Iheb BougmizaLes statistiques descriptives49 Relation entre les trois indices (1)  La relation dépend de la forme la distribution  Distribution symétrique (ou à peu près) : mode = médiane = moyenne So ?

51 Iheb BougmizaLes statistiques descriptives50 Relation entre les trois indices (2)  Distribution asymétrique — Etalée à gauche : mode < médiane

52 Iheb BougmizaLes statistiques descriptives51 Relation entre les trois indices (3)  Distribution asymétrique — Etalée à droite : mode > médiane > moyenne Yuuuk !!!

53 Notions essentielles…  La variabilité est une caractéristique de toutes les mesures  Pour la description d’une population — Méthode tabulaire — Méthode graphique (dépend de la nature des variables) — Méthode numérique : il est indispensable de définir des indices synthétiques  Les paramètres de tendance centrale  Les paramètres de dispersion Iheb BougmizaLes statistiques descriptives52

54 Iheb BougmizaLes statistiques descriptives53


Télécharger ppt "Iheb BougmizaLes statistiques descriptives1 Faculté de médecine de Sousse Module : Biostatistique PCEM2 2011-2012 Les statistiques descriptives Iheb Bougmiza."

Présentations similaires


Annonces Google