La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Initiation à la recherche clinique et épidémiologique (Les différents types denquête) Initiation à lanalyse de données (Comment présenter les données ?)

Présentations similaires


Présentation au sujet: "Initiation à la recherche clinique et épidémiologique (Les différents types denquête) Initiation à lanalyse de données (Comment présenter les données ?)"— Transcription de la présentation:

1 Initiation à la recherche clinique et épidémiologique (Les différents types denquête) Initiation à lanalyse de données (Comment présenter les données ?) (Pourquoi a-t-on besoin des tests ?) Dr Benoît Lepage Dr Vanina Bongard Département dEpidémiologie, Economie de la Santé et Santé Publique Université Toulouse III – Paul Sabatier Master de Santé Publique, Toulouse III

2 I)Les outils statistiques -Description de données -Sondages, échantillons, inférence -Estimations -Tests II)Les principaux types denquêtes -Essais cliniques -transversales -Cohortes -Cas témoins

3 Unités statistiques : éléments faisant lobjet de létude : personnes, temps de mesures, département, … Variables statistiques : Paramètre pouvant prendre différentes valeurs dune unité statistique à lautre variable qualitative = variable catégorielle –variable qualitative nominale (sans relation dordre) –variable qualitative ordonnée (relation dordre) Variable quantitative –variable quantitative discontinue = discrète –variable quantitative continue I. Outils statistiques Comment présenter les données ?

4 Tableaux de fréquence Fréquence absolue : nombre de cas Fréquence relative : pourcentage Sexe, n (%) hommes femmes Tabagisme, n (%) non fumeurs anciens fumeurs fumeurs 80 (53,3 %) 70 (46,7 %) 77 (51,3 %) 28 (18,7 %) 45 (30,0 %) N = 150 a. Représentation synthétique dune variable qualitative Variable booléenne, dichotomique, binaire, à 2 modalités

5

6 Diagrammes en secteurs Graphiques => faire ressortir une vision synthétique (mais souvent moins précise que les tableaux)

7 Diagrammes en barres

8 Histogrammes (variables discrètes) b. De la variable qualitative à la variable quantitative

9 Histogrammes

10 Courbes de distribution

11 1. Paramètres de position ou de tendance centrale –moyenne arithmétique et géométrique –médiane –mode 2. Paramètres de dispersion –variance –écart type, erreur standard –quantiles –intervalle interquartile –Extrêmes, étendue c. Représentation synthétique dune variable quantitative POSITION DISPERSION

12 Distribution gaussienne: Nb de cas La moyenne correspond aux valeurs les plus fréquentes Distribution non gaussienne: bon indicateur de tendance centrale La moyenne ne correspond pas aux valeurs les plus fréquentes mauvais indicateur de tendance centrale Moyenne arithmétique 1. Paramètres de position

13 Médiane : plus adaptée si distribution asymétrique Valeur centrale séparant léchantillon en deux moitiés 50 % des valeurs sont au dessus 50 % des valeurs sont en dessous rang de la médiane : (n + 1) / 2 si n est pair n/2 si n est impair Mode Valeur la plus représentée (variables quantitatives discrètes +) 1. Paramètres de position

14 Exemple médiane (1) Poids en Kg dune série de 80 sujets (après classement par ordre croissant) Moyenne de la 40ème et 41ème valeur Médiane = (73+74)/2 = 73,5 kg (ne nécessite pas de connaître toutes les valeurs)

15 Exemple médiane (2) Une série de 7 sujets : Ici, n est impair, la médiane est la valeur de rang (n+1)/2 = la valeur de rang 4 La médiane est 58

16 Dispersion

17 Variance i = 1 n (X i - ) 1 n 2 = 2 La variance est la moyenne des carrés des écarts des valeurs par rapport à la moyenne. Lunité de la variance est lunité de la variable étudiée au carré. Ecart Type, déviation standard, SD Lunité de lécart type est identique à lunité de la variable étudiée. = 2

18 68% 95% - 1DS- 2DS+ 1DS+ 2DS Moy ± 1ET contient 68% des observations Moy ± 2ET contient 95% des observations Moy ± 3ET contient 99% des observations Si une variable suit une distribution normale :

19 Quantiles (k – 1) valeurs séparant léchantillon en k zones comportant le même nombre dobservations k = 3 : tertiles k = 4 : quartiles k = 10 : déciles k = 100 : centiles ou percentiles Un intervalle entre deux quantiles correspond à un intervalle interquantile

20 Exemple : quartiles Poids en Kg dune série de 80 sujets (après classement par ordre croissant) er quartile = (¼,¾) = 69 kg 2 ème quartile = Médiane = 73,5 kg 3 ème quartile = (¾,¼) = 77 kg

21 Population cible : ensemble des individus auxquels on sintéresse Population source : ensemble des individus à partir desquels on effectue le tirage au sort Echantillon : ensemble des individus effectivement étudiés Notion dinférence = tirer une conclusion au niveau dune population inaccessible à partir dobservations faites sur un échantillon

22 Un sondage est un procédé qui consiste à nobserver quune partie de la population étudiée (échantillon) et à tirer de cette observation des informations sur la population entière. N sujets n sujets n < N Population source représentative de la population cible Echantillon

23 Fluctuations déchantillonnage Malade Non malade

24 AVANTAGES dun sondage : Le sondage est plus rapide, moins cher et plus facilement réalisable quune enquête exhaustive sur la population cible. INCONVENIENT dun sondage : Incertitude de lextrapolation à la population cible des observations faites sur léchantillon. CONTRAINTES dun sondage : Léchantillon doit être représentatif de la population cible. Léchantillon doit être composé dunités statistiques en nombre suffisant.

25 Il faut bien distinguer un biais des fluctuations normales déchantillonnage erreur systématique erreur aléatoire Conduit à définir un intervalle de confiance du paramètre à estimer Estimation biaisée

26 Déformation des faits due au hasard de léchantillonnage : erreur non systématique due au hasard (fluctuations déchantillonnage ) Estimation précise et non biaisée Estimation peu précise mais non biaisée Déformation des faits due à un biais : erreur systématique allant toujours dans le même sens (biais) Estimation précise mais biaisée Estimation peu précise et biaisée Biais et erreurs aléatoires

27 Estimation : Définition (1) Tenter de définir les paramètres dune population à partir des paramètres observés sur un échantillon

28 Estimation : Définition (1) Tenter de définir les paramètres dune population à partir des paramètres observés sur un échantillon 1.Valeur observée valeur inconnue de la population

29 Estimation : Définition (1) Tenter de définir les paramètres dune population à partir des paramètres observés sur un échantillon 1.Valeur observée valeur inconnue de la population 2.Valeur observée proche de la valeur inconnue si échantillon représentatif

30 Estimation : Définition (1) Tenter de définir les paramètres dune population à partir des paramètres observés sur un échantillon 1.Valeur observée valeur inconnue de la population 2.Valeur observée proche de la valeur inconnue si échantillon représentatif 3.En répétant léchantillonnage, autres valeurs proches les unes des autres

31 Valeur observée (échantillon) Valeur exacte (population générale) Estimation : Définition (2) Incapable de connaître la vraie valeur !!! Objectif de lestimation en statistique => calculer des bornes où se trouve la valeur inconnue du paramètre (avec une confiance suffisamment grande) = Intervalle de confiance +++

32 Estimation dune moyenne inconnue (1) On sait calculer la moyenne observée dune variable quantitative sur un échantillon Problème: Estimer la moyenne inconnue de la population doù est extrait léchantillon

33 Estimation dune moyenne inconnue (2) Utiliser un échantillon représentatif de la population (obtenu par tirage aléatoire) Estimation de à partir de l échantillon 1 : – est estimée par m 1 = ( x i ) / n 1 –où x i = {x 1, x 2, …, x n1 } les n 1 valeurs de X dans l échantillon 1 –m 1 observée inconnue –Mais à quelle distance, de quel côté de ?

34 Estimation dune moyenne inconnue (2) Échantillon représentatif de la population (obtenu par tirage aléatoire) –m 1 observée inconnue –Mais à quelle distance, de quel côté de ? 2 ème échantillon (par tirage aléatoire) –m 2 proche de m 1 –m 2 observée inconnue –Mais à quelle distance, de quel côté de ?

35 Estimation dune moyenne inconnue (2) Échantillon représentatif de la population (obtenu par tirage aléatoire) –m 1 observée inconnue –Mais à quelle distance, de quel côté de ? 2 ème échantillon (par tirage aléatoire) –m 2 proche de m 1 –m 2 observée inconnue –Mais à quelle distance, de quel côté de ? 3 ème échantillon : idem...

36 Estimation dune moyenne inconnue (3) Si on dispose de la totalité des échantillons possibles tirés de la population générale

37 Estimation dune moyenne inconnue (3) Si on dispose de la totalité des échantillons possibles tirés de la population générale On obtiendrait une moyenne m pour chaque échantillon

38 Estimation dune moyenne inconnue (3) Si on dispose de la totalité des échantillons possibles tirés de la population générale On obtiendrait une moyenne m pour chaque échantillon Fluctuations déchantillonnage de la moyenne

39 Estimation dune moyenne inconnue (3) Lestimation m de la moyenne inconnue est une variable aléatoire puisquelle varie dun échantillon à lautre Fluctuations déchantillonnage de lestimation de la moyenne Distribution de la variable X dans la population Distribution des moyennes de X dans chaque échantillon

40 Estimation dune moyenne inconnue (3) Lestimation m de la moyenne inconnue est une variable aléatoire puisquelle varie dun échantillon à lautre Distribution de la variable X dans la population On peut estimer la moyenne de lestimation de la moyenne Et la variance de lestimation de la moyenne

41 Estimation dune moyenne inconnue (4) m1m2m3m4m5m6m7m8m9…mkm1m2m3m4m5m6m7m8m9…mk Moyenne de la population Si on calcule lintervalle de confiance auprès dun très grand nombre déchantillons, la vraie moyenne de la population est comprise dans 95 % des intervalles de confiance Dans un échantillon, on sait calculer un intervalle de confiance à 95%

42 Intérêt des tests Les tests servent à extrapoler les résultats observés sur des échantillons à lensemble des populations dont ils sont issus +++ –Échantillon : image ponctuelle Intérêt majeur des tests : –Économie de moyens +++ –En permettant de déceler des différences sur un nombre réduit dobservations

43 Principe des tests de comparaison Principe général : Regarder si la différence quon observe dans un échantillon est due au hasard ou si au contraire cette différence est telle quil est fort peu probable de lobserver par hasard 2 hypothèses sont posées : –Hypothèse nulle = « il ny a pas de différence » –Hypothèse alternative = « il y a une différence » (dans la population à laquelle on veut généraliser le résultat)

44 Principe des tests de comparaison Illustration : vous pariez à pile ou face avec un ami, il vous tend une pièce. –Hypothèse nulle H0 : la pièce nest pas faussée, et jai une chance sur deux de gagner P(joueur 1 gagne) = P(joueur 2 gagne) –Hypothèse alternative H1 : la pièce est faussée, un des joueurs à une probabilité plus élevée de gagner que lautre joueur : P(joueur 1 gagne) P(joueur 2 gagne)

45 Principe des tests de comparaison Illustration : vous pariez à pile ou face avec un ami, il vous tend une pièce. –Au premier essai, vous perdez Vous pensez que vous navez pas eu de chance cette fois ci, vous ne remettez pas en cause lhypothèse nulle selon laquelle la pièce nest pas faussée, et vous acceptez de refaire une partie en espérant rattraper la mise.

46 Principe des tests de comparaison Illustration : vous pariez à pile ou face avec un ami, il vous tend une pièce. –Au premier essai, vous perdez Vous pensez que vous navez pas eu de chance cette fois ci, vous ne remettez pas en cause lhypothèse nulle selon laquelle la pièce nest pas faussée, et vous acceptez de refaire une partie en espérant rattraper la mise. –Au deuxième essai, vous perdez à nouveau Vous pensez que vous navez vraiment pas de chance, vous ne remettez pas en cause lhypothèse nulle selon laquelle la pièce nest pas faussée, et vous acceptez de refaire une partie en espérant rattraper la mise.

47 Principe des tests de comparaison Illustration : vous pariez à pile ou face avec un ami, il vous tend une pièce. –Au premier essai, vous perdez Vous pensez que vous navez pas eu de chance cette fois ci, vous ne remettez pas en cause lhypothèse nulle selon laquelle la pièce nest pas faussée, et vous acceptez de refaire une partie en espérant rattraper la mise. –Au deuxième essai, vous perdez à nouveau Vous pensez que vous navez vraiment pas de chance, vous ne remettez pas en cause lhypothèse nulle selon laquelle la pièce nest pas faussée, et vous acceptez de refaire une partie en espérant rattraper la mise. –Vous continuez à jouer, vous perdez 5 fois de suite. Vous commencez à avoir de sérieux doute et à remettre en cause la validité de lhypothèse nulle selon laquelle la pièce nest pas faussée

48 Principe des tests de comparaison Illustration : vous pariez à pile ou face avec un ami, il vous tend une pièce. –Au bout du 10 ème essai, vous avez perdu 10 fois de suite, vous décider darrêter de jouer, la probabilité que la pièce ne soit pas faussée (que lhypothèse nulle soit vraie) est trop faible : vous rejetez cette hypothèse et acceptez lhypothèse alternative H1 (la pièce est faussée) vous prenez le risque de vous fâcher avec votre ami (le risque de se fâcher alors que la pièce était en réalité normale est devenu beaucoup trop faible). Il y a un seuil à partir duquel, on décide de rejeter lhypothèse nulle

49 2éme Exemple : La prévalence du diabète est-elle supérieure chez les sujets en surcharge pondérale par rapport aux sujets de poids normal ? Sondage dans la population cible pour obtenir un échantillon représentatif. Exemple dutilisation dun test Principe général des tests de comparaison : Regarder si la différence quon observe dans un échantillon est due au hasard ou si au contraire cette différence est telle quil est fort peu probable de lobserver par hasard

50 Hypothèse nulle H 0 : La prévalence du diabète dans la population cible est identique parmi les sujets de poids normal et parmi les sujets en surcharge pondérale. P 1 = P 0 ou D = P 1 – P 0 = 0 Hypothèse alternative H 1 : La prévalence du diabète dans la population cible est différente parmi les sujets de poids normal et parmi les sujets en surcharge pondérale. P 1 P 0 ou D = P 1 – P 0 0

51 Si léchantillon est de taille suffisante et représentatif : - sous H 0 : d = p 1 – p 0 devrait être petite - sous H 1 : d = p 1 – p 0 devrait être grande On réalise un test statistique pour savoir si d peut être considérée comme grande (significativement différente de 0). Autrement dit on réalise un test statistique pour savoir sil est vraisemblable de rejeter lhypothèse nulle.

52 Population cible échantillon Conclusion vraieConclusion fausse Conclusion vraieConclusion fausse absence de différence D = 0 existence dune différence D 0 d petite d grande Il y a toujours un risque de se tromper dans notre conclusion => risque derreur

53 Risque de première espèce ( seuil de significative p) : Probabilité de rejeter à tort lhypothèse nulle (probabilité de conclure à tord à lexistence dune différence entre les groupes). Risque de seconde espèce : Probabilité de conserver à tort lhypothèse nulle (probabilité de conclure à tord à labsence de différence entre les groupes). Puissance du test : Probabilité de mettre en évidence une différence qui existe vraiment entre les groupes : Puissance = 1 -

54 Population cible échantillon Conclusion vraie 1 - Conclusion fausse Conclusion vraie 1 - Conclusion fausse absence de différence D = 0 existence dune différence D 0 d petite test non significatif d grande test significatif Un test significatif permet de conclure à lexistence dune différence. Un test non significatif ne permet pas dexclure lexistence dune différence. Le classement en « d petite » ou « d grande » se fait à partir de la p-value (degré de signification) du test : Si p <, on considère que d est petite

55 II. Principaux types denquêtes Une enquête est une opération qui consiste à recueillir de linformation, puis à lanalyser en vue de résoudre une ou plusieurs questions spécifiée(s) à lavance. Enquêtes exhaustives (sur lensemble de la population) Enquête sur échantillon (obtenu par sondage)

56 Principaux types denquêtes descriptives enquêtes transversales cohortes non comparatives analytiques enquêtes transversales enquêtes cas - témoins enquêtes de cohorte (« exposés - non exposés » ou « longitudinale ») Lexposition nest pas contrôlée par linvestigateur Enquêtes dobservation Lexposition est contrôlée par linvestigateur Enquêtes expérimentales randomisées essais cliniques phase III non randomisées essais cliniques phase I et II enquêtes avant - après

57 La vie du médicament découverte dune molécule études pré-cliniques (animal) phase I (volontaires sain) phase II (volontaires malades) phase III (volontaires malades : essais comparatifs) Autorisation de Mise sur le Marché (A.M.M.) Phase IV (pharmacovigilance, pharmaco-épidémiologie, pharmaco-économie) pharmacologie clinique 8 – 12 ans Essais cliniques Principaux types denquêtes

58 Essais cliniques Essais non randomisés : - Phase I : étude de la première administration chez lhomme - volontaires sains, - évaluation des effets indésirables => sécurité - et effets pharmacodynamiques -Phase II : étude de lefficacité pharmacologique - volontaires malades - pharmacologie (posologie efficace, dose-effet) - pharmacocinétique Principaux types denquêtes

59 Principes méthodologiques des essais de phase III 1. principe de comparaison par rapport à un placebo ou par rapport à un médicament de référence indispensable pour distinguer lefficacité du médicament de lévolution naturelle de la maladie Principaux types denquêtes Objectif : évaluer lefficacité thérapeutique dune intervention

60 2. principe du tirage au sort (randomisation) La répartition des sujets dans chaque groupe se fait par tirage au sort. indispensable pour assurer la comparabilité des deux groupes les groupes sont comparables en tout point, sauf pour lattribution du traitement Principaux types denquêtes Principes méthodologiques des essais de phase III

61 3. principe du double aveugle Le patient ne sait pas sil prend le placebo ou le traitement testé. Le médecin ne le sait pas non plus. indispensable pour maintenir la comparabilité des groupes au cours de létude Principaux types denquêtes Principes méthodologiques des essais de phase III

62 Principaux types denquêtes Enquête dobservation transversale temps Exposition ? Maladie ? Au moment de lenquête, on recueille au même moment les informations sur la présence dune exposition et la présence dune maladie Souvent : un échantillon représentatif dune population et nest pas sélectionné en fonction de lexposition ou de la maladie

63 Principaux types denquêtes Enquête dobservation transversale Estimation de la prévalence dune maladie Proportion de sujets atteints dune maladie dans une population à un instant donné t. P = M M + N P : prévalence de la maladie dans la population à linstant t M : nombre de malades dans la population à linstant t N : nombre de non malades dans la population à linstant t effectif total de la population à linstant t

64 Principaux types denquêtes Enquête dobservation longitudinale = Enquête de cohorte Les sujets sont suivis dans le temps (on connaît les dates des évènements mesurés) temps Exposition ? Maladie ? Début détude : Recueil prospectif Début détude : Recueil rétrospectif (cohorte « historique »)

65 Principaux types denquêtes Enquête dobservation longitudinale = Enquête de cohorte Parfois linclusion des sujets au départ se fait en fonction dune exposition dichotomique : enquête « exposé – non exposé » temps Exposition ? Maladie ? Début détude : Recueil prospectif Début détude : Recueil rétrospectif (cohorte « historique »)

66 Principaux types denquêtes Enquête dobservation longitudinale = Enquête de cohorte On peut estimer lincidence dune maladie Vitesse moyenne de production de nouveaux cas dune maladie dans une population pendant un intervalle de temps [t; t+ t]. TI = nombre de nouveaux cas sur [t; t+ t] effectif moyen des sujets à risque sur [t; t+ t] TI : taux dincidence de la maladie dans la population pendant [t; t+ t] Effectif moyen des sujets à risque sur [t; t+ t] : 2 N t + N t+ t

67 Principaux types denquêtes Enquête dobservation longitudinale = Enquête de cohorte On peut calculer le risque relatif (RR) : comparer les taux dincidence entre différentes expositions Le risque relatif dune exposition (par rapport à labsence dexposition) :

68 Principaux types denquêtes Enquête dobservation longitudinale = Enquête de cohorte On peut calculer le risque relatif (RR) : comparer les taux dincidence entre différentes expositions - Si RR > 1 : le risque de maladie est augmenté chez les sujets exposés - Si RR < 1 : le risque de maladie est diminué chez les sujets exposés - Si RR=1 : le risque de maladie est le même chez les sujets exposés et non-exposés

69 exposés non exposés % de malades ? étude exposés - non exposés Principaux types denquêtes Exemple dans une enquête exposés – non exposés, avec la même durée de suivi pour tout le monde :

70 Principaux types denquêtes Estimation dun risque relatif de maladie ab cd exposés non exposés maladesnon malades m1m1 m0m0 n1n1 n0n0 RR = R e / R ne = I e / I ne = (a/n 1 ) / (c/n 0 ) Exemple dans une enquête exposés – non exposés, avec la même durée de suivi pour tout le monde :

71 Principaux types denquêtes Enquête cas - témoins On va comparer la fréquence de lexposition antérieure chez des malades (cas) et des non-malades (témoins) temps Exposition ? Maladie ? Début détude : Sélection des malades et témoins Recueil rétrospectif de la présence dune exposition antérieure

72 cas = malades témoins = sains % dexposés ? étude cas - témoins % dexposés ? Principaux types denquêtes Enquête cas - témoins

73 Principaux types denquêtes Dans une enquête de cohorte ou une enquête transversale, la sélection ne dépend pas de la présence de la maladie : Les exposés et non-exposés dans léchantillon sont représentatifs des exposés et non-exposés de la population on peut estimer le risque dêtre malade chez les exposés et non exposés et calculer un risque relatif Dans une enquête cas témoins le pourcentage de malades est choisi arbitrairement par linvestigateur : on ne peut pas estimer le risque dans la population ni le risque relatif, il faut calculer un odds ratio (OR) = rapport de cote

74 Principaux types denquêtes Estimation dun odds ratio de maladie OR = [e 1 /(1-e 1 )] / [e 0 /(1-e 0 )] = ad / bc avec e 1 et e 0 fréquences de lexposition chez les malades et les non malades : ab cd exposés non exposés maladesnon malades m1m1 m0m0 n1n1 n0n0 OR = [R e /(1-R e )] / [R ne /(1-R ne )] Enquête cas - témoins

75 Indispensable ++++ Avant la mise en place dune étude : quelque soit le schéma Toujours commencer par lécriture du protocole détude : - Contexte - hypothèses à évaluer - lobjectif précis - les méthodes à mettre en œuvre : - population (critères dinclusion, dexclusion) - critères de jugement - variables dexposition - autres variables à prendre en compte - méthodes de mesures des différentes variables - calcul de leffectif nécessaire pour répondre à lobjectif - méthodes statistiques envisagées

76 Prendre en compte la variabilité +++ –Variabilité biologique (entre-sujet et intra-sujet) –Variabilité instrumentale (expérimentale, liée à linstrument lui-même) variabilité biologique inter-sujet + variabilité biologique intra-sujet + variabilité instrumentale + variabilité inter- et intra-examinateur …_____________________________ = Variabilité totale Dernier point important pour les sciences de la vie : la notion de variabilité

77 Variabilité biologique inter-individuelle –Durée de la gestation, taille à lâge adulte, poids de naissance Variabilité biologique intra-individuelle –Cortisol, glycémie, urée, tension artérielle Variabilité liée à la méthode de mesure –TA chez lobèse, mesure sur une échographie (liée à lappareil et au clinicien) Variabilité liée à lexpérimentation –Effet centre, effet placebo, environnement Variabilité : exemples

78 Rechercher une différence : Variabilité : conséquences Facile de montrer une différence entre les deux moyennes Difficile de montrer une différence entre les deux moyennes

79 Rechercher une corrélation : Facile de montrer une corrélation entre les deux variables Difficile de montrer une corrélation entre les deux variables


Télécharger ppt "Initiation à la recherche clinique et épidémiologique (Les différents types denquête) Initiation à lanalyse de données (Comment présenter les données ?)"

Présentations similaires


Annonces Google