1 Biostatistique et lecture critique d’articles médicaux Pr A Venot UFR SMBH Université Paris 13
2 Historique de la recherche clinique Scorbut et agrumes – James Lind à bord du Salisbury en 1747 –Marins atteints de scorbut –6 groupes (cidre, élixir vitriol,…,oranges et citrons) Tuberculose pulmonaire et streptomycine – Austin B. Hill, 1948 –Tirage au sort –Insu –Prise en compte de tous les participants
3 La recherche clinique On ne peut se passer d’une méthode pour se mettre en quête de la vérité des choses (René Descartes) Etudes épidémiologiques (maladies, incidences, prévalence, facteurs de risque, cohortes, cas témoins) Essais thérapeutiques (médicaments, chirurgie…) Etudes des performances de méthodes diagnostiques (biologie, imagerie…)
4 Biostatistique et articles médicaux Définition du problème Conception d’un essai Clinique Réalisation Analyse des résultats Rédaction d’un article Article :- Introduction (Contexte et objectifs) - Matériel et Méthodes (randomisation, nombre de sujets dans l’étude, tests statistiques utilisés) - Résultats (statistiques descriptives, intervalles de confiance, résultats de tests) - Discussion (significativité, tendance, répétition des tests)
5 Pourquoi une méthodologie en recherche clinique ? La variabilité inter et intra individuelle –Qu’est ce que la variabilité inter et intra individuelle ? –Pourquoi complique t’elle tout ? Nécessité d’une méthodologie Biostatistique –Pour la conception des protocoles des essais cliniques –Pour décrire les résultats et tirer des conclusions –Pour l’écriture des résultats et pour discuter de leur validité
6 Plan du cours Notions de population et d’échantillon, fluctuations d’échantillonnage Les différents types de variables (nominale, ordinale, quantitative) mesurées au cours d’essais cliniques Les principaux indices pour résumer les mesures de ces variables La représentation graphique des différents types de variable La notion d’intervalle de confiance Les grands principes de construction des tests statistiques La biostatistique et l’analyse des différentes sections d’un article
7 Notion de population dans un essai clinique Ensemble de sujets sur lesquels on veut obtenir des informations. En général la taille d’une population est très grande et il n’est pas possible d’interroger tous ses individus Exemples : ensemble des sujets hypertendus, diabétiques… ensemble des patients suspects d’embolie pulmonaire ensemble des sujets obèses en France
8 Notion d’échantillon dans un essai clinique Le plus souvent on ne peut pas expérimenter sur toute la population On va travailler sur un sous ensemble d’individus issus de la population Par tirage au sort (randomisation) on va obtenir un « échantillon représentatif » Nécessité d’avoir un nombre de sujets assez grand dans l’échantillon
9 Les fluctuations d’échantillonnage Différents échantillons tirés au sort sont proches, mais ils n’ont pas exactement les mêmes caractéristiques Exemples : On tire un échantillon n de 10 valeurs soit : La moyenne m est Voici deux autres échantillons de 10 valeurs chacune de cette même distribution de probabilité : moyenne = moyenne =
10 Notion de variable mesurée sur chaque individu de l’échantillon Ce qui est observé ou mesuré sur les individus d’une population. Caractéristique ou facteur susceptible de prendre une valeur différente selon les individus Exemples : Le taux de cholestérol du patient, sa taille… La profession des personnes interrogées pour une enquête,
11 Les différents types de variables Les variables quantitatives : s'expriment par des nombres réels sur lesquels les opérations arithmétiques courantes (somme, moyenne...) ont un sens (age, taille). Une variable quantitative est discrète si elle ne peut prendre que des valeurs isolées, généralement entières (nombre d’enfants dans la fratrie). Une variable quantitative est continue si ses valeurs peuvent être n'importe lesquelles d'un intervalle réel (taille).
12 Loi de distribution d’une variable quantitative dans une population La loi normale : C ’est un modèle de distribution théorique ( quand on a un grand nombre de causes de variabilité). Elle s’applique aux variables quantitatives continues Elle est centrée autour de la moyenne (médiane=moyenne) La probabilité d ’observer une valeur comprise entre -1,96 écart type et +1,96 écart type autour de la moyenne est de 95% La probabilité d ’observer une valeur comprise entre -1 écart type et +1 écart type autour de la moyenne est de 68%
13 Loi normale: répartition des tailles
14 Les différents types de variables Les variables ordinales Ce sont des variables qualitatives Dont on peut ordonner les différentes catégories. La médiane peut être calculée (pas la moyenne) Exemple : Douleur d’intensité faible, moyenne, élevée, très élevée
15 Les différents types de variables Les variables nominales Il s’agit de variables qualitatives pour lesquelles il n'y a aucune raison d'écrire les modalités possibles dans un ordre plutôt que dans un autre On peut calculer des pourcentages. Exemple : Couleur des yeux (bleu, vert, marron) Survie à cinq ans (vivant ou décédé)
16 Les principaux indices résumés La moyenne n’est calculable que pour les variables quantitatives La variance expérimentale est égale à : L’écart type : racine carrée de la variance
17 Les principaux indices résumés La médiane doit être utilisée pour les variables ordinales ; elle peut aussi être calculée pour les variables quantitatives C’est la valeur de la variable statistique qui partage en deux effectifs égaux les individus de la population, supposés rangés par valeur croissante du caractère Exemple : (10) , la médiane a pour valeur 10.
18 Les principaux indices résumés Les quartiles et percentiles sont utilisés pour caractériser la dispersion des mesures pour les variables quantitatives ou les variables ordinales Les quartiles (1er, 2ème, 3ème) sont les valeurs qui partagent l’échantillon en 4 groupes de même effectif Les centiles : valeurs qui partagent l’échantillon en cent groupes de même effectif Exemple : Soit la série On l ’ordonne (3, 7, 19 sont les 1er, 2ème et 3ème quartiles de la série)
19 Les représentations graphiques des variables Variable qualitative Diagramme circulaire : chaque modalité est représentée par un secteur circulaire dont l'angle (et donc la surface) est proportionnel à son effectif. Le rayon du cercle est arbitraire. Diagramme en barre: chaque rectangle a une base constante et une hauteur proportionnelle à l’effectif de la modalités (ni) ou à la fréquence de la modalité (fi)
20 Situation familiale Effectifs Célibataire30 Marié80 Divorcé20 Veuf20 Total :150 Situation familiale Effectif s Fréquenc es % Célibataire Marié Divorcé Veuf Total :150 1 100 Pour "célibataires" l'angle est de 72°. Pour " Marié " l'angle est de 192°. Pour " Divorcé " l'angle est de 48°. Pour " Veuf " l'angle est de 48°.
21 Les représentations graphiques des variables Variable quantitative Histogramme des effectifs : –Si les classes sont de même amplitude, on place en ordonnée les effectifs et on obtient des rectangles dont la surface est proportionnelle à l'effectif associé. –Si les classes ne sont pas de même amplitude, on met en ordonnée le rapport effectif/amplitude de sorte que chaque observation soit représentée par la même unité de surface (c'est ce que l'œil retient de l'histogramme)
22 Classes de tailles (en cm)Effectifs [ [1 [ [5 [ [21 [ [ 29 [ [4
23 Notion d’intervalle de confiance L’inférence statistique A partir de la valeur d’une moyenne obtenue sur l’échantillon, que puis-je dire sur la valeur vraie dans la population ? Je ne peux pas la connaître avec certitude du fait des fluctuations d’échantillonnage Je peux calculer la probabilité qu’elle se trouve dans un intervalle de valeur fortement probable
24 POPULATION Echantillon de n individus = Moyenne théorique ? ² = Variance théorique ? m=Moyenne expérimentale s²=Variance expérimentale X X Induction Statistique inférentielle: Il y a 95% de chance que la moyenne théorique soit comprise l’intervalle [a-b] (intervalle de confiance)(5% de chance de se tromper= risque ) (n 30) ? ?
25 POPULATION Echantillon de n individus P = Proportion théorique ? p o =Proportion expérimentale X X Induction Statistique inférentielle: Il y a 95% de chance que la proportion théorique soit comprise l’intervalle [a-b] (intervalle de confiance)(5% de chance de se tromper= risque ) (np inf 5, np sup 5, n(1-p inf ) 5, n(1-p sup ) 5) ?
26 La construction des tests statistiques Les hypothèses nulle H0 et alternative H1 Exemple : on veut comparer l’efficacité de deux médicaments, On va quantifier l’efficacité sur des échantillons de patients. Mais on souhaite pouvoir émettre des conclusions de portée générale qui ont de bonnes chances d’être vraies pour toute la population. C’est le but des tests d’hypothèses en statistique.
27 Les hypothèses nulles H0 et alternative H1 dans les tests statistiques On définit deux hypothèses H0 et H1 qui jouent toujours des rôles dissymétriques : Une de ces hypothèses doit être précise. C'est elle qui sera H0 et on l'appelle hypothèse nulle. Exemple : les deux traitements comparés ont la même efficacité.
28 Les hypothèses nulles H0 et alternative H1 dans les tests statistiques L'autre hypothèse est généralement plus imprécise ; elle regroupe toutes les hypothèses, hormis H0. C'est H1 et on l'appellera hypothèse alternative. Exemple : Les deux traitements à comparer ont des efficacités différentes.
29 Les risques de première et deuxième espèce dans un test Un test statistique va consister à effectuer un calcul pour rejeter ou non l’hypothèse nulle (quand elle est vraie) avec une certaine probabilité p de se tromper. On fixe en général le risque (dit risque de première espèce) de se tromper à 5% pour accepter de rejeter l’hypothèse nulle. Le risque de première espèce est donc le risque de rejeter à tort l’hypothèse nulle quand elle est vraie
30 Les risques de première et deuxième espèce dans un test Exemple : Risque d’affirmer que l’efficacité des deux antihypertenseurs est différente alors que leur efficacité est en fait la même et que les différences observées dans les valeurs moyennes des abaissements de pression artérielle sont juste liées à l’effet du hasard. Lorsqu’on rejette l’hypothèse nulle, on dit qu’on observe une différence significative entre les deux échantillons. Quand on effectue un test statistique, on peut être amené à rejeter l’hypothèse nulle avec plus ou moins de force. Cette « force » peut être quantifiée par le degré de signification p du test.
31 Les risques de première et deuxième espèce dans un test L'aptitude d'un test à rejeter l'hypothèse nulle alors qu'elle est fausse est limitée. On appelle puissance d’un test la probabilité de rejeter l'hypothèse nulle alors qu'elle est fausse. La valeur (1 – puissance) est la probabilité de ne pas rejeter l'hypothèse nulle alors que l'hypothèse alternative est vraie. Cette valeur s'appelle le risque de deuxième espèce.
32 L’importance d’avoir un nombre de sujets suffisant dans une étude En recherche clinique, on doit s’assurer que le nombre de sujets inclus dans l’étude est suffisant pour conduire à une puissance du test satisfaisante (au moins 80%). Si la puissance est insuffisante, on n’arrivera pas à rejeter l’hypothèse nulle et à affirmer que les deux traitements ont des efficacités différentes dans les cas où ils ont effectivement des efficacités différentes.
33 Le calcul du nombre de sujets nécessaires dans une étude C’est le nombre de sujets qui permettra de mettre en évidence une différence minimale escomptée. Ce nombre est calculé a priori ; il est lié au risque alpha, au risque bêta et à la différence A moyenne que l'on souhaite être en mesure de mettre en évidence.
34 Risques de 1 ère et 2 ème espèce REALITE H0 VRAIEH0 FAUSSE décision correcte risque (1- ) Non rejet à tort de H0 risque Non rejet H0 rejet à tort de H0 risque Décision correcte risque (1- )= puissance du test Rejet H0
35 Analyse de la section « Introduction » d’un article Justification de l’étude proposée –L’échantillon étudié n’était pas représentatif de la population à traiter –Les études précédentes n’étaient pas randomisées –Les études précédentes manquaient de puissance –Les résultats de différentes études étaient contradictoires
36 Analyse de la section « Méthodes » d’un article Y a-t-il une randomisation dans la construction des échantillons étudiés ? Les critères d’inclusion et d’exclusion sont ils décrits avec précision ? Quelle est la nature du critère principal d’évaluation ? Le calcul du nombre de sujets nécessaires est-il présenté ? Les tests statistiques utilisés pour analyser les résultats sont ils décrits (valeur des risques de 1 ère et 2 ème espèce, dénomination des tests)
37 Analyse de la section « Résultats » d’un article Quels sont les principaux résultats ? A-t-on inclus suffisamment de sujets dans l’étude ? Les index résumés et graphiques utilisés sont ils adaptés à la nature des variables explorées dans l’essai ? Les différences mises en évidence sont elles très significatives ? A-t-on de simples tendances ?
38 Analyse de la section « Discussion » d’un article Discussion de la validité de l’étude –D’éventuelles tendances sont elles discutées? –La puissance de l’étude est elle analysée ? –Les problèmes liés à d’éventuelles répétitions de tests sont ils discutés ? Comparaison à d’autres études –Les populations des études étaient elles comparables ? –Les résultats sont ils similaires ou contradictoires avec ceux d’études précédentes (intervalles de confiance) ?