Preuve de l’efficacité des antibiotiques: Les essais cliniques ECOLE NATIONALE VETERINAIRE T O U L O U S E Preuve de l’efficacité des antibiotiques: Les essais cliniques Pour aller sur notre site si vous avez récupéré nos dia ailleurs P.L. TOUTAIN Update mars 2012
Pourquoi des essais cliniques Apporter la preuve de concept dans les conditions réelles d’usage de l’antibiotique et pour valider des données précliniques et notamment : le schéma posologique vis-à-vis des effets thérapeutiques des effets sur les flores commensales de la prévention d’émergence de résistance
Ce que doit faire, peut faire et ne peut pas faire un essai clinique par rapport au schéma posologique
Ce que peut faire et ne sait pas faire un essai clinique par rapport au schéma posologique Paramètres préclinique clinique Dose: détermination oui non Intervalle de dosage : détermination Durée du traitement Oui Posologie : confirmation Optimisation des modalités d’administration (facteurs biologiques comme optimiser la biodisponibilité) (facteurs opérationnels comme les modalités pratiques d’administration)
Difficultés et limites de l’essai clinique Difficultés techniques Valeur des informations publiées
Pour en savoir plus sur les essais cliniques des antibiotiques
Les difficultés techniques liés à l’essai clinique et propres aux antibiotiques Biologiques Effet placebo Des Relations dose-effet « plates » Méthodologiques Conception des essais (non infériorité, équivalence, supériorité) Puissance des essais Critères de jugement
Antibiothérapie et effet placebo (guérison naturelle) Guérison spontanée Guérison sous antibiotique 100 Prophylaxie, Métaphylaxie 50 % patients D1 D2 Time
Efficacité des antibiotiques
Les difficultés techniques liées à l’essai clinique et propres aux antibiotiques La relation dose-effet est « plate » Les essais cliniques seront peu sensibles Par exemple ils seront incapables de discriminer 2 niveaux de dose ou 2 stratégies d’administration (dose totale administrée 1 ou 2 fois par jour)
Relation dose-effet plate Modèle d’infection expérimentale Ceftiofur 90 Mortalité Pas de différence entre les niveaux de doses lorsque la mortalité est le critère de jugement 60 Réponse % 30 0.5 2 16 64 Dose (mg/kg)
Les critères de jugement pour tester un antibiotique: bactériologiques ou cliniques?
Guérison : clinique vs. bactériologique l'effet Pollyanna But ultime de l'antibiothérapie : éradication bactérienne au site d'infection et non pas la seule « guérison clinique »
L’effet Pollyanna Effet de l’antibiotique Otite moyenne 89% 74% Discordance entre les résultats cliniques et bactériologiques Effet de l’antibiotique Otite moyenne 100% 100% 89% 80% 74% 60% Succès cliniques Efficacy (%) 40% 27% 20% Effet Placebo 0% Guérison bactérienne Merchant et al. Pediatrics 1992
L’effet Pollyanna Résponse % Ceftiofur – voie orale Mortalité 90 Mortalité Excrétion bactérienne 60 Résponse % 30 0.5 2 16 64 Dose (mg/kg) Yancey et al. 1990 Am. J. Vet.Res.
Le problème de la puissance des essais cliniques
Erreur de Type I (alpha) (erreur qui pénalise le patient) H0 (hypothèse nulle): antibiotique=placebo On réalise l’essai contre le placebo Il y a un risque de conclure faussement à une efficacité qui n’existe pas Rejet de l’hypothèse nulle Erreur sérieuse si le critère de jugement est un taux de mortalité L’erreur de type I est classiquement fixée à 0.05
Erreur de Type II (beta) (erreur qui pénalise l’industriel) Risque de ne pas être capable de montrer un effet (différence d’avec un placebo) qui existe réellement Acceptation de l’hypothèse nulle Erreur fréquente liée à la taille insuffisante des essais (un manque de puissance) Pas très grave si on peut répéter l’essai Risque souvent fixé à 0.1 - 0.2
Effectifs d’animaux nécessaires par groupe Test bilatéral; alpha=bêta=5% % succès placebo % succès antibiotique Effectif nécessaire 50% 60% 641 70% 153 80% 63
Essais cliniques de confirmation: importance de la formulation des hypothèses statistiques
Formulation des hypothèses nulles d’un essai clinique
1-Essai de supériorité contre placebo Formulation de H0 Antibiotique=placebo Conclusions possibles L’antibiotique est supérieur au placebo (p<0.05) L’antibiotique n’est pas supérieur au placebo (p>0.05) On ne voit quasiment jamais ce genre d’essai (sauf dans les feedlots US) avec l’invocation de raisons éthiques
2-Essai de supériorité contre un antibiotique de référence Formulation de H0 Antibiotique « nouveau » =Antibiotique « référence » Conclusions possibles L’antibiotique « nouveau » est significativement supérieur à l’antibiotique de référence (p<0.05) L’antibiotique « nouveau » n’est pas significativement supérieur à l’antibiotique de référence (P>0.05) ou que la différence entre les 2 antibiotiques n’est pas significativement différente (ce qui n’est pas la même chose que d’en conclure que le 2 antibiotiques sont équivalents ) On voit rarement ce genre d’essai dans les dossiers. Ils peuvent être détournés en terme de communication avec des phrases du genre « le bon antibiotique de référence n’est pas statistiquement supérieur au nouvel antibiotique » , l’agent marketing ayant rédigé cette conclusion espérant que le prescripteur en conclura que le nouvel antibiotique est équivalent à l’antibiotique de référence
Les essais cliniques des antibiotiques équivalence vs. différence Essais comparatifs : A (référence) contre B (nouveau) H0: A=B On réalise l’essai Conclusion : Il n'y a pas de différence significative entre A et B (p>0.05) Cela ne veut pas dire que l'antibiotique A est égal (équivalent) à l'antibiotique B ! Cela veut simplement dire que l’on n’a pas pu conclure (rejeter notre H0) soit parce qu’effectivement les 2 antibiotiques sont équivalents soit parce que l’essai manquait de puissance pour garantir le risque α
3-Essai d’équivalence Il consisterait à démontrer, statistiquement, que le nouvel antibiotique est équivalent à un antibiotique de référence Pb: Définition de ce qu’est l’équivalence avec un delta possible entre les 2 antibiotiques. On ne voit jamais ce genre d’essai
4-Essai de non-infériorité Il est rare en MV de voir un essai concluant à la supériorité d’un nouvel antibiotique sur l’antibiotique (ancien) de référence ou à son équivalence On se contente de tester la non-infériorité!!!
Principe des essais de non infériorité Montrer que le nouvel antibiotique n’est pas pire que l’antibiotique avec une marge d’infériorité de (Δ) Observed success rate between test and reference drug Observed Δ (e.g.-x %) 95% confidence interval LB UB A priori Δ=-10%
Essai de non-infériorité Il consiste à démontrer, statistiquement, que le nouvel antibiotique n’est pas inférieur à l’antibiotique de référence. Formulation de H0 % de guérison de l’antibiotique nouveau ≤ % de l’Antibiotique de référence-Δ% Ex:% guérison de nouveau ≤ [% guérison de référence] -10% Conclusion possible L’antibiotique test n’est pas inférieur de 10% en terme de pourcentage de guérison à l’antibiotique de référence (p<0.05)
Limites de l’essai de non-infériorité Choix de Δ (% de guérison) Plus il est large, plus il sera facile de conclure à la non-infériorité mais le prescripteur ignore généralement cela. Choix de l’antibiotique de référence Plus il sera médiocre, plus facile sera la démonstration de la non-infériorité Par essence les nouveaux antibiotiques seront comparés à de vieux antibiotiques plus ou moins usés par le temps
Biais des essais de non-infériorité Les biais spécifiques qui affectent l’essai de non-infériorité sont ceux qui concourent à faire disparaître l’effet des traitements étudiés. La situation est inversée par rapport à l’essai de supériorité où ces situations n’entraînent pas de biais mais simplement une perte de puissance. Exemple: On va retenir une modalité d’administration qui entraîne une mauvaise biodisponibilité pour les 2 antibiotiques; du coup le nouvel antibiotique (qui en réalité est plus mauvais que l’antibiotique de référence) n’apparaîtra pas comme étant inférieur à l’antibiotique de référence (car l’antibiotique de référence ne peut pas développer son potentiel) et on conclura à la non-infériorité du nouvel antibiotique avec P<0.05. Le taux de guérison sera celui de l’effet placebo pour les 2 antibiotiques Dans un essai de supériorité on aurait conclu que le nouvel antibiotique n’était pas supérieur à l’antibiotique de référence (P>0.05)
Biais des essais de non-infériorité Essais réalisés sur des pathologies très légères Un traitement de référence a démontré son efficacité remarquable sur des diarrhées sévères mais on réalise l’essai de non-infériorité avec le nouvel antibiotique sur une diarrhée banale Régression à la moyenne ou après la pluie, le beau temps
Essai de non infériorité: choix des bornes Deux % sont à considérer: l’amplitude de l’effet du produit de référence contre un placébo (30%) et la marge de la non-infériorité qui se veut garantir au moins 50% de l’effet du produit de référence contre un placébo soit ici M2=15% lire la diapo suivante pour la suite des explications
Essai de non infériorité: choix des bornes
Biais des essais de non-infériorité: analyse des résultats en « intention de traiter » ou en « per protocole »
Biais des essais de non-infériorité: analyse des résultats en « intention de traiter » ou en « per protocole » L’analyse dite en « intention de traiter » (pragmatique) donne-t-elle les mêmes résultats que l’analyse dite « per protocole » ? L’analyse en intention de traiter (c’est-à-dire en gardant tous les sujets qu’il y ait ou non respect du protocole) est conservatrice et a tendance à faire disparaître les différences. Exemple: on réalise un essai bien sale (erreur de dose, permutation des traitements, durée des traitements modifiés etc.) et on analyse l’essai en intention de traiter; il sera plus facile de conclure à la non-infériorité Dans l’essai de non-infériorité, l’analyse per-protocole est la plus sensible et la moins biaisée car on ne garde que les sujets ayant observé le protocole. Cependant, elle ne reflète pas la vraie vie. L’analyse en intention de traiter est plus représentative de la pratique courante, Il convient donc de considérer simultanément ces deux analyses pour avoir à la fois une vue non biaisée et représentative de la réalité.
Les essais cliniques vus par des coureurs cyclistes
Essai de supériorité On place les 2 cyclistes (en fait les 2 équipes dont les équipiers représenteraient les malades) traités par A, l’antibiotique et B, le placebo au pied d’un col (la maladie) et on regarde les quels arrivent les premiers et on conclura que A est significativement supérieur à B si les A arrivent en haut du col (statistiquement) avant les B A B
Essai de de non d’infériorité Comme dans l’essai précédent on place les 2 cyclistes (en fait les 2 équipes dont les équipiers représenteraient les malades traités par A qui est l’antibiotique de référence et B qui est le nouvel antibiotique ) au pied d’un col (la maladie) et on regarde les quels arrivent les premiers et on conclura que les B ne sont pas inférieurs aux A si les B arrivent en haut du col avec un retard qui n’excède pas 1 heure A B
Essai de non-infériorité: B non inférieur à A; P<0.05 Biais dans un essai de non infériorité lié aux conditions expérimentales On va tester le nouvel antibiotique (pas très bon) contre un antibiotique de référence (bon) dans la descente du col (maladie peu grave) plutôt que dans la montée col (maladie grave) en espérant que la différence entre A et B sera moins cruelle dans la descente que dans la montée B Dans la descente : Essai de non-infériorité: B non inférieur à A; P<0.05 A
Biais dans un essai d’équivalence On va conclure que A (l’antibiotique de référence) est équivalent à B (le nouvel antibiotique) en les faisant batifoler dans la campagne A B
Biais dans un essai lié au critère de jugement On va juger les 2 antibiotiques avec un critère peu pertinents mais pour lequel le mauvais antibiotique n’est pas trop pénalisé (ex un indice de consommation alimentaire plutôt qu’un pourcentage de guérison)
Biais dans un essai de non infériorité lié au conditions de réalisation de l’essai et à l’analyse des données dite « en intention de traiter » ou ITT Dans un essai de non infériorité, on va juger les 2 antibiotiques en « intention de traiter » et non en « per protocole » Dans une course cycliste on pourra conclure que B n’est pas inférieur à A malgré que la course se soit effectuée après un orage (conditions inacceptables de réalisation d’un essai clinique ) et si A (l’antibiotique de référence) a été obligé de prendre un passant sur son porte bagage; dans ces conditions l’analyse est faite en ITT c’est-à-dire que l’on considère les résultats quelque soient les circonstances; en revanche si la course cycliste avait été jugée en « per protocole », cette situation aurait été exclue (course neutralisée) car le « protocole course» n’est pas une épreuve de natation B A Analyse en intention de traiter B pas inférieur à A mais biais dans la réalisation de la course
La lecture critique d’un compte-rendu d’essai thérapeutique Un exemple vétérinaire:
Draxxin vs. Micotil by Pfizer Micotil vs . Draxxin by Elanco
Draxxin vs Micotil by Pfizer Take home message: Draxxin superior to Micotil P<0.00x Micotil vs . Draxxin by Elanco Take home message: Micotil not significantly different of Draxxin for most endpoints (P>0.05) but Micotil is more cost-effective (CAN$8/animal) and the lower initial BRD treatment costs in the DRAX group did not offset the higher metaphylactic cost of DRAX
Draxxin vs. Micotil: risk communication Both companies are scientifically sound BUT: What is the opinion of the layman What is the opinion of human doctors (those working at the WHO to suppress our antibiotics) when they learn that the cost-effectiveness is a (pivotal) endpoint? Is it an argument for the prudent use of antibiotics
Draxxin vs. Micotil: Risk communication for the layman Only Florfenicol (Resflor Gold) is 5 stars
Transparence et sincérité (biais) des résultats Contrôle exclusif par l’industriel Publications dans des congrès Toujours flateurs Necessité de méta-analyses
Revues méthodiques & méta-analyses Essai 1 Essai 2 Méta-analyse Revue systématique Essai 3 Méta-analyses et revues méthodiques sont réalisées par des spécialistes de ce type de travail et selon une méthodologie formalisée La méta-analyse peut faire appel à des outils statistiques capables de créer de la nouvelle information à partir des documents primaires (ex: rendre significatif des résultats qui individuellement ne l’étaient pas) Essai 4
Pyramide des évidences Méta-Analyse Revues systématiques Essais cliniques contrôlés études de cohorte Études cas/contrôle Série de cas, rapport de cas Données précliniques. Opinion d’experts (le non expérimental)
Comment s’approprier de façon critique et utile les données publiées Un exemple pour illustrer la nécessité de maîtriser certains concepts
Comment s’approprier de façon critique et utile les données publiées Un premier exemple (inventé) pour illustrer une difficulté d’ordre conceptuelle Le problème: Un confrère a l’habitude d’utiliser des aiguilles recyclées pour faire ses injections IM à des porcs; Dans un élevage, les porcs ont développé des abcès au point d’injection et le propriétaire trouve que l’occurrence de ces abcès est anormale; il demande réparation; les assureurs du propriétaire et du confrère demandent un avis à leurs experts respectifs sur une éventuelle faute professionnelle afin de discuter de la répartition des dédommagements Deux études ont été publiées sur ce sujet par des journaux de référence et les deux experts vont fonder leurs conclusions sur ces deux mêmes études
Interprétation des données de la littérature par l’expert de l’assureur du propriétaire Essais Usage de l’aiguille A: unique B: recyclées conclusion 1 Effectif observé 5000 8000 A<B résultat 1% 2% 2 30000 1000 4% 5% Conclusion: les aiguilles recyclées sont plus dangereuses que les aiguilles à usage unique et il y a eu faute professionnelle
Interprétation des données de la littérature par l’expert de l’assureur du confrère Essais usage A: unique B: recyclées conclusion 1 Effectif observé 5000 8000 A<B résultat 1% 2% Effectif positif 50 160 2 30000 1000 4% 5% 1200 essais usage A: unique B: recyclées conclusion 1+2 Effectif total observé 5000+30000=35000 8000+1000=9000 A>B Positif total 50+1200=1250 160+50=210 Résultat global 1250/35000=3.57% 210/9000=2.3% Conclusion: les aiguilles recyclées sont moins dangereuses que les aiguilles à usage unique et il n’y a pas faute professionnelle
Le paradoxe de Simpson Pourquoi cette inversion: Un pourcentage moyen n’est pas la moyenne des pourcentages! 2 conditions pour rencontrer le paradoxe de Simpson Des différences dans les taux dans les 2 essais considérés Des groupes de tailles différentes Conséquences: cela crée des déséquilibres (unbalanced data), l’un des essais pouvant avoir un impact disproportionné sur les résultats globaux
Le paradoxe de Simpson N’est pas un paradoxe mais un résultat surprenant et contre-intuitif Ce paradoxe correspond à l’inversion des conclusions selon que l’analyse porte individuellement sur chaque groupe ou sur l’ensemble des données qui ont été fusionnées en un seul groupe Ne pas faire d’analyse a posteriori en sous groupe
Conséquences du paradoxe de Simpson L’analyse d’un essai clinique en formant, a posteriori, des sous groupes peut conduire à des biais de conclusion
Essais cliniques : conclusions Ne sont pas des outils appropriés pour définir un schéma posologique Doivent vérifier (valider) que le schéma posologique sélectionné par d'autres approches précliniques est efficace (essai de confirmation) et qu’il est non promoteur d’antibiorésistance