La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 Introduction aux Données Biologiques et Médicales.

Présentations similaires


Présentation au sujet: "1 Introduction aux Données Biologiques et Médicales."— Transcription de la présentation:

1 1 Introduction aux Données Biologiques et Médicales

2 2 Plan 1. Mesures biologiques et médicales 2. Données (variables) quantitatives 3. Données (variables) qualitatives 4. Données (variables) censurées 5. Description des données

3 3 1. Données Biologiques et Médicales permettent détudier des phénomènes biologiques/médicaux –distinguer le normal du pathologique –mesurer/prévoir lévolution dune maladie

4 4 Ces mesures sont dites des « variables » –car elles varient dun individu à lautre –variable : « Any quantity that varies. Any attribute, phenomenon, or event that can have different values » A dictionary of Epidemiology (JM Last, Oxford University Press, 1995)

5 5 Données/variables de plusieurs types : quantitatives qualitatives censurées

6 6 2. Données (variables) quantitatives mesurables sur une échelle … avec une unité de valeurs réelles: donnée continue –poids, taille, âge, PA, glycémie,... de valeurs isolées: donnée discrète –dilutions, nombres denfants, de métastases, âge au dernier anniversaire...

7 7 relativeNotion de continuité relative à léchelle de mesure et à la précision de la mesure : Age –Échelle continue –Échelle discrète (ans) : 10, 15, 65 Taille –Échelle continue –Échelle discrète (cm) : 115, 165, 187

8 8 Données continues ou discrètes ? On peut grouper une donnée continue ou discrète en classes de valeurs : donnée ordinale –ex : âge < 20, 20-25, 25-30, 30 –ex : nb cigarettes/j = 0, 1-10, 11-20, > 20 –ex : PAS (mm Hg) < 140 ou 140 binarisation perte dinformationmais au prix dune perte dinformation

9 9 non mesurables sur une échelle (notion de jugement), mais... avec relation dordre : données ordinale (semi-quantitative) –intensité dune douleur (0, +, ++, +++) –stades d un cancer : I, II, III, IV –consommation de tabac : absence, modéré, important 3. Données (variables) qualitatives

10 10 sinon : données catégorique (nominale) –homme/femme –marié/célibataire –fumeur/non fumeur –localisations tumorales –groupes sanguins : A/B/AB/O

11 11 Attention : une donnée ordinale nest pas une donnée quantitative discrète –ex : –intensité dune douleur (0, +, ++, +++) –Nombre denfants : 1, 2, 3, 4, 5+ Notion despacement inter-classes

12 12 4. Données (variables) censurées Abusivement appelée « données de survie » Elles définissent le délai de survenue dun événement en « tout ou rien » Survival analysis is the phrase used to describe the analysis of data that correspond to the time from a well-defined time origin until the occurrence of some particular event or end-point. Collett D. Modelling survival data in medical research, Chapman & Hall, 1994

13 13 Une date origine –ex : date de diagnostic homogénéité nécessaire sur lensemble des patients

14 14 Un événement binaire (en tout ou rien ) –ex : décès, rechute … événement parfaitement défini et reproductibilité inter-centres délai : entre la date origine et la survenue de lévénement le plus précis possible suivi ad hoc des patients

15 15 Date de point : date à laquelle on fait le point –Tout sujet chez qui lévénement dintérêt na pas été observé à la date de point est censuré à cette date –Un sujet perdu de vue à la date de point sera censuré à la date de dernière nouvelle

16 16 Sujet 1 Sujet 2 Sujet 3 Sujet 4 Sujet 5 01/01/0101/01/02

17 17 6 mois1 an Sujet 1 Sujet 2 Sujet 3 Sujet 4 Sujet 5 Diagnostic

18 18 Durée de survie de patients atteints dun lymphome malin non Hodgkinien –(Diagnostic décès) Durée dattente dune nouvelle transfusion de plaquettes chez des patients en aplasie post chimiothérapie en onco-hématologie –(Transfusion de plaquettes nombre de plaquettes en deçà dune valeur seuil)

19 19 Durée de survenue dune aggravation dune occlusion veineuse rétinienne –(Hémodilution faisant suite à un diagnostic dhémodilution passage dune forme non ischémique de locclusion à une forme ischémique) Durée de survenue dune récidives locales post reconstruction mammaire –(Reconstruction mammaire récidive locale)

20 20 5. Description des données Variables continues –mesures de position/centralité –mesures de la variabilité/dispersion Variables qualitatives –Distributions de fréquence Variables censurées –Courbes de survie

21 Histogramme Données quantitatives continues Suite de rectangles dont la surface est proportionnelle aux fréquences dans des intervalles de valeurs (classes) s h l

22 22 Si toutes les classes ont même largeur (l), la hauteur des rectangles est directement proportionnelle à leffectif de la classe (h = n) s h l

23 23 Distribution de la créatinine plasmatique dans le PR

24 24

25 25 Si toutes les classes nont pas la même largeur (l), seule la surface des rectangles est directement proportionnelle à leffectif de la classe (h = n/l) s h l

26 26 S = h x lh = S/l = n/l Classeslh /5= /5= /6= /2= /5= /35= /20=5.1 a b

27 27 Lhistogramme a (incorrect) suggère la classe comme étant la plus concernée par les accidents de la route alors que lhistogramme b (correct) indique que ce sont les classes 17, 18-19, En effet, la fréquence des accidents de la route par année dâge est plus importante dans ces dernières classes!

28 Caractéristiques des distributions Distributions synthétisées par des quantités –de tendance centrale Mode/classe modale Médiane Moyenne –de dispersion Etendue Intervalle inter-quartiles Variance, écart-type

29 29 Mode(s) Définition valeur(s) la (les) plus fréquente(s) –sommet(s) de la distribution –le plus facile à calculer –dépend du regroupement (arbitraire) en classes –parfois non unicité

30 30 Mode : classe [ ]Mode : classe [ ] Mode : regroupement en classes

31 31 Mode : non unicité

32 32 Médiane (50ème percentile) Définition valeur centrale de la distribution –partage la distribution en 2 parties égales –peu sensible aux valeurs extrêmes –difficile à manipuler mathématiquement

33 33 Exemple : âge de 5 étudiants (n = 5) {19, 20, 22, 20, 21} âgeeffectif effectif cumulé médiane = 20

34 34 Exemple : âge de 5 étudiants (n = 5) âgeeffectifeffectif cumulé médiane = 20

35 35 Moyenne (expérimentale) Définition moyenne arithmétique des observations –centre de gravité –utilise toute linformation –sensible aux valeurs extrêmes –manipulation mathématique

36 36 Exemple : âge des 5 étudiants (n = 5) {19, 20, 20, 21, 22} valeur non observée sensible aux valeurs extrêmes

37 37 n = 5 {19, 20, 20, 21, 42} n = 5 {19, 20, 20, 21, 15}

38 38 Positions relatives mode, médiane, moyenne Si distribution unimodale, symétrique –les 3 coïncident Mode = Médiane = Moyenne

39 39 Si distribution dissymétrique à droiteà gauche mode < médiane < moyennemoyenne < médiane < mode Notes Histogramme Mode Médiane Moyenne Mode Médiane Moyenne

40 40 Etendue Définition différence entre les valeurs extrêmes (minimale, maximale) observées étendue = valeur maximale - valeur minimale –dépend entièrement de 2 observations –nest pas manipulable mathématiquement

41 41 Valeur min = 45µmol/l Valeur max = 939 µmol/l Etendue = 894 µmol/l Valeur min = 45µmol/l Valeur max = 572 µmol/l Etendue = 527 µmol/l

42 42 Variance Estimation –estimée à partir des carrés des écarts à la moyenne (écart quadratique moyen)

43 43

44 44 Exemple : âge de 5 étudiants n = 5{19, 20, 20, 21, 22}

45 45 Ecart-type Estimation : racine carrée positive de la variance mesure lécart à la moyenne –sexprime avec la même unité que la variable

46 46 Min: st Qu.: 23.7 Mean: 25.0 Median: rd Qu.: 26.3 Max: 30.8 Std Dev.: % 95% - 1DS- 2DS+ 1DS+ 2DS

47 47 Min : er Qu. : 36.9 Moyenne : 37.3 Médiane : em Qu. : 37.7 Max : 38.6 écart-type: Box-and-Whisker plot Min 25ème percentile ou Q1 Médiane 75ème percentile ou Q1 Max IQR = Q3 - Q1 = 0.8

48 48 Min: st Qu.: 23.7 Mean: 25.0 Median: rd Qu.: 26.3 Max: 30.8 Std Dev.: 2.0 IQR = = 2.6 Box-and-Whisker plot : distribution symétrique Age

49 Distributions de fréquence Figure (ou distribution de fréquence) qui donne le nombre (le %) dindividus selon les valeurs de la mesure Moyen le plus simple de caractériser les variables qualitatives Fréquences relatives ou cumulées

50 50 Motif dadmission en réanimation MotifFréquence Fréquence % relativecumuléerelatifcumulé Respiratoire %36.2% Neurologique %56.5% Hémodynamique %73.9% Métabolique %88.4% Traumatologique5667.2%95.6% Divers3694.3%100% Total %100%

51 51 Distribution de fréquence : effectifs Diagramme en bâtons Motif : n Respiratoire : 25 Neurologique : 14 Hémodynamique : 12 Métabolique : 10 Traumatologique : 5 Divers : 3 n total = 69 n

52 52 Motif (%) Respiratoire (36%) Neurologique (20%) Hémodynamique (17%) Métabolique (14%) Traumatologique (7%) Divers (4%) Distribution de fréquence : % Diagramme en bâtons %

53 53 Diagramme en secteurs

54 Courbe de survie Estimation de la fonction de survie = fonction de non-survenue de lévénement considéré au cours du temps ( survival curve ) Approche classique : estimateur de Kaplan- Meier (1958) ( the product-limit estimate ) Fonction en escalier

55 55 Courbe de survie globale à partir du début de la première ligne de chimiothérapie chez des patients atteints de cancer colorectal (86 patients - 76 décès) Patients à risque M0M12M24M36M48M60M

56 56 Paramètres de survie Estimation de statistiques descriptives : –médiane de survie –taux de survie à une date donnée

57 57 Médiane de survie = 24 mois Taux de survie à 3 ans = 37,5%


Télécharger ppt "1 Introduction aux Données Biologiques et Médicales."

Présentations similaires


Annonces Google