Statistiques appliquées aux études médicamenteuses cliniques Pierre BOUTOUYRIE Pharmacologie HEGP
Grands principes méthodologiques Tout dépend de la formulation de la question scientifique Exemple : on veut comparer l’efficacité de deux médicaments dans l’hypertension artérielle Premier médicament : IEC Deuxième médicament : Bêtabloquant vasodilatateur Comment définit on l’efficacité ? Pourcentage de patients normalisés (<140 et <90 mmHg) Baisse de la PA dans les deux groupes Atteinte des organes cibles Fréquence des événements cardiovasculaires
Pari statistique Beaucoup de choses sont basées sur le pari statistique au sens de Fisher Hypothèse nulle : il n’y a pas de différence entre les deux groupes Pari : quelle est la probabilité de se tromper ? Risque alpha (première espèce) : par convention 5% (p<0.05) Deuxième pari : quel est la probabilité de ne pas voir une différence qui existe pourtant? Risque beta (deuxième espèce) puissance statistique =1-b L’immense majorité des tests statistiques sont interchangeables (chi-², T-tests, ANOVA , corrélations) Même modèle de base, le GLM (General Linar Model) Seule la congruence de plusieurs approches est rassurante
Heureusement, tout ne se limite pas au pari statistique Le seuil de signification est arbitraire Probabilité d’erreur+++ en aucun cas Sens physiologique statistique Importance du résultat : une différence minime peut être statistiquement significative Les statistiques sont des outils d’investigation Les statistiques multivariées permettent de prendre en compte des paramètres confondants multiples Les statistiques sont des outils de prédiction Contrôle qualité Modélisation des nouvelles expériences Aide à la décision
Prérequis : tout se joue dans la conception de l’étude Rationnel Définir les objectifs scientifiques précisément Définir le schéma expérimental Définir LE critère principal de jugement Correctement dimensionner l’étude Définir les critères secondaires de jugement Ecrire le plan d’analyse statistique Dessiner la figure de l’article… Schéma d’étude Randomisation Doit assurer la comparabilité des groupes Stratification Groupes parallèles Plus facile à manier que les plans plus complexes Insu Double insu toujours préférable Insu dans l’évaluation du critère de jugement
Celimene study a randomized double blind parallel group study Effet Traitement Comparabilité des groupes M0 M5 M9 30 days single blind placebo run-in M1 M2 M3 M7 Epaisseur artérielle Pression artérielle If DBP>90 mmHg Enalapril 10 mg 20 mg 40 mg Celiprolol 200 mg 400 mg 600 mg + HCTZ 12.5 mg 25 mg or Randomization Effet TEMPS
Comparabilité des groupes Variables qualitatives Exemple : sexe Question posée : est ce que la proportion de femmes et d’hommes est identique dans les deux groupes enalapril et celiprolol? Présentation des données En vue de l’analyse Tableau de résultat Test proposé : chi-² Id Sexe Tt Tart.em F Ena Pion.zig H Celi… H F Ena 25 Celi 32 15… P=0.07
Comparabilité des groupes Variable quantitative Exemple : âge Test proposé : comparaison de deux moyennes Normalité des données : non normale pour énalapril Test T de Student : p=0.87 Wilcoxon Rank test : p=0.59 N Mean±SD Celi 47 50.9±9.3 Ena 50 50.5±14.9
Est-ce une non normalité?
Toujours regarder graphiquement les données individuelles avant de faire le moindre test
Comparabilité des groupes après correction de la valeur abbérente Variable quantitative Exemple : âge Test proposé : comparaison de deux moyennes Normalité des données : normale pour les 2 groupes Paramétrique : Test T de Student : p=0.64 Non paramétrique : Wilcoxon Rank test : p=0.58 N Mean±SD Celi 47 50.9±9.3 Ena 50 50.8±9.4
Effet des traitements sur la pression artérielle Pour simplifier, je néglige la période M5
Pourcentage de patients normalisés à M9 (<140 et <90 mmHg) Variables qualitatives Contrôlés oui/non Test proposé Comparaison de deux proportions Chi-2 P=0.00267 Non Oui Celi 33 10 Ena 22 26… Non Oui Celi 77% 23% Ena 46% 54%… Doit on conclure à la supériorité de l’énalapril?
Valeurs de pression artérielle à M9 Mean±SD Celi 47 146±19 Ena 50 137±19 Variables quantitatives Test proposé Paramétrique : Test T de Student si distribution normale Non paramétrique : Wilcoxon Rank test si distribution non normale Distribution non normale Wilcoxon Rank test p=0,006 Doit on conclure à la supériorité de l’énalapril?
Prise en compte de l’effet temps
Analyse de variance en mesure répétée Prise en compte de la valeur initiale de pression, patient par patient Chaque patient est son propre témoin Beaucoup de contraintes Normalité des données Accepte mal les valeurs manquantes Plus difficile à interpréter Effet traitement : ? entre les 2 traitement, temps Effet temps : ? f(temps) Interaction+++ : 2 traitements se comportent ils de manière différente au cours du temps Ne corrige pas pour la “régression vers la moyenne”
Expression des résultats Rep-Meas ANOVA Analysis of Variance Table Source Sum of Mean Prob Power Term DF Squares Square F-Ratio Level (Alpha=0.05) A: Tt 1 5198.191 5198.191 5.22 0.024607* 0.618214 B(A): Id 95 94675.48 996.584 C: Per 2 14851.26 7425.631 48.38 0.000000* 1.000000 AC 2 390.7675 195.3838 1.27 0.282358 0.274110 BC(A) 190 29160.94 153.4787 S 0 Total (Adjusted) 290 144439.7 Total 291 * Term significant at alpha = 0.05
Blood pressure response to treatment 80 100 120 140 160 Baseline 5 months 9 months Brachial BP (mmHg) P<0.001 ns 40 60 80 100 Baseline 5 months 9 months Carotid pulse pressure (mmHg) P<0.001 ns Celiprolol Enalapril
Autre méthode pour la prise en compte de l’effet temps Travailler sur les variations entre valeurs de référence et fin de traitement Calculer delta M0-M9 Ajuster sur la valeur M0 Utiliser les modèles de corrélations multivariées Effet traitement (codés dummy 0-1) Ajustement sur âge, valeur de départ… Réduit les phénomènes de régression vers la moyenne
Loi du niveau initial PAS >160 BL PAS <160 BL -9 mmHg -25 mmHg 178 162 153 220.00 220.00 185.00 145 136 134 185.00 150.00 150.00 115.00 115.00 -9 mmHg -25 mmHg 80.00 80.00 1 2 3 1 2 3 Per Per
Analyse multivariée avec selection pas à pas (stepwise)
L’enalapril est il plus efficace que le celiprolol pour baisser la pression artérielle systolique
Pas évident Taux de contrôlés à M9 Valeurs moyennes à M9 Chi-² Ena>celi, p=0.00267 Valeurs moyennes à M9 Wilcoxon rank test Ena>celi, p=0.006 146±19 vs 137±19 Rep meas ANOVA Valeurs PAS Ena < Celi, Baisse en cours d’essai Pas d’interaction Ena=celi Multivariée ajustée sur traitement et valeur initiale Dépend niv initial PAS 1mmHg delta PAS = 0.4 mmHg Ena >Celi (delta 8.73±2.68 mmHg, p<0.001) Niveau initial PAS explique 28% de la réponse Traitement explique 8% de la baisse de pression en cours d’essai
Heureusement, tout ne se limite pas au pari statistique Le seuil de signification est arbitraire Probabilité d’erreur+++ en aucun cas Sens physiologique statistique Importance du résultat : une différence minime peut être statistiquement significative Les statistiques sont des outils d’investigation Les statistiques multivariées permettent de prendre en compte des paramètres confondants multiples Les statistiques sont des outils de prédiction Contrôle qualité Modélisation des nouvelles expériences Aide à la décision
Les leçons Toujours planifier l’expérience en fonction de la manière de l’analyser Dimensionner correctement l’analyse en fonction de la différence que l’on veut mettre en évidence Savoir ce que l’on fait quand on détermine (a priori) le plan d’analyse statistique Savoir recouper entre eux les tests statistiques pour “affiner” ou “purifier” le résultat Bien connaître les pièges, en particulier la présence de valeurs abbérantes et la présence de facteurs confondants