Nombre de sujets nécessaires en recherche clinique FRT C6
Types d’études Problème d’estimation Problème de comparaison : Nombre de sujets pour une précision de l’estimation Problème de comparaison : Nombre de sujets pour une puissance suffisante pour montrer une différente attendue Problème de prédiction Nombre de sujets pour mettre en évidence un niveau de risque attendu
Problème d’estimation Etude d’un échantillon représentatif de n sujets pour extrapoler les résultats observés à la population entière dont est issu l’échantillon
Problème d’estimation Etude d’un échantillon représentatif de n sujets pour extrapoler les résultats observés à la population entière dont est issu l’échantillon Estimation sur l’échantillon de la mesure Évènement en terme de fréquence pobservé avec son écart-type pq/n (1) Mesure d’une variable quantitative sous forme de moyenne avec son écart-type sem (s²/n) (2)
Problème d’estimation Etude d’un échantillon représentatif de n sujets pour extrapoler les résultats observés à la population entière dont est issu l’échantillon Estimation sur l’échantillon de la mesure Évènement en terme de fréquence pobservé avec son écart-type pq/n (1) Mesure d’une variable quantitative sous forme de moyenne avec son écart-type sem (s²/n) (2) On montre que la mesure dans la population a 95 % de chances de se situer dans l’intervalle (1) po poqo/n (2) m s/n = 1,96 pour =5%
Précision d’une estimation Soit i la précision i correspond à l’intervalle autour de l’estimation ponctuelle : pq/n ou sn Pour une fréquence : i = pq/n, en montant tout au carré i² = ² p q /n n = ²p q / i² Pour une moyenne : i = s/n, en montant tout au carré i² = ²s² /n n = ²s² / i²
Exemples Observatoire de malades traités pour hépatite C : estimer le % d’adéquation à l’AMM Hypothèse : 80 %, précision 5 % au risque 5% n = (1,96² x 0,80 x 0,20)/ 0,05²= 246 Hypothèse : 60 %, précision 3 % au risque 5% n = (1,96² x 0,60 x 0,40)/ 0,03²= 1025 . Estimer le nombre de CD4 des malades sous HAART. une petite étude préliminaire a montré une variance de 4900 (s = 70) - précision de la moyenne à 20 au risque 5% n = (1,96² x 4900)/ 20² = 48 - précision de la moyenne à 15 au risque 2% n = (2,326² x 4900)/ 15² = 118
Problème de comparaison (1) de moyennes Rappel sur le principe des tests
Problème de comparaison (1) de moyennes Rappel sur le principe des tests Formuler les hypothèses : H0 : µ1 = µ2 H1 : µ1 ≠ µ2 formulation bilatérale
Problème de comparaison (1) de moyennes Rappel sur le principe des tests Formuler les hypothèses : H0 : µ1 = µ2 H1 : µ1 ≠ µ2 formulation bilatérale Calculer la probabilité des observations sous H0, connaissant la loi de distribution de la différence m1-m2
Problème de comparaison (1) de moyennes Rappel sur le principe des tests Formuler les hypothèses : H0 : µ1 = µ2 H1 : µ1 ≠ µ2 formulation bilatérale Calculer la probabilité des observations sous H0, connaissant la loi de distribution de la différence m1-m2 Choisir la règle de décision : on rejette ou non H0 avec un certain risque d’erreur, càd pour une valeur seuil L telle que ll > L
Problème de comparaison (1) de moyennes Rappel sur le principe des tests Formuler les hypothèses : H0 : µ1 = µ2 H1 : µ1 ≠ µ2 formulation bilatérale Calculer la probabilité des observations sous H0, connaissant la loi de distribution de la différence m1-m2 Choisir la règle de décision : on rejette ou non H0 avec un certain risque d’erreur, càd pour une valeur seuil L telle que ll > L Les 2 risques d’erreur De 1ère espèce : = P(rejet H0 si H0 vraie) = P(ll > seuil L si H0 vraie) De 2ème espèce : = P(non rejet H0 si H1 vraie) = P(ll < seuil L si H1 vraie). 1- = puissance d’un test = P(rejet H0 si H1 vraie)
Comparaison (1) de moyennes On ne peut pas calculer exactement car on ne connaît pas la valeur exacte de = µ1- µ2 H1 est une hypothèse composite : il faut spécifier une hypothèse particulière. Il y a une valeur de pour chaque valeur de µ1- µ2 Réalité Conclusion du test valeur de rejet de H0 non rejet de H0 H0 est vraie = 0 1- H1 est vraie H1 1 - ’H1 1 - ’ ’
Comparaison de 2 moyennes Distribution de la différence observée = m1-m2 selon que H0 est vraie ou H1 est vraie en supposant même ²
Comparaison de 2 moyennes Sous H0, µ1- µ2 suit une loi Normale de moyenne 0 et on rejettera H0 si m1-m2 > L P[(m1-m2)>lLl/H0] = L-0 = L = 1/n1+1/n2 ²1/n1+1/n2 Sous H1 on attend une différence µ1- µ2 = , différence minimale que l’on souhaite montrer; on ne rejettera pas H0 si m1-m2 < L’, P[(m1-m2)<L’/H1] = L’ - =-2 si <50% L’ = -21/n1+1/n2 ²1/n1+1/n2 Si on fait correspondre L et L’ on obtient 1/n1+1/n2 = - 21/n1+1/n2
Comparaison de 2 moyennes n1n2 = ²(+2)² et si n1=n2 alors n1n2/ n1+n2 = n/2 n1+n2 ² n = 2 ²(+2)² ² Si on inclut dans chaque échantillon un nombre n’<n, on peut calculer a posteriori la puissance qu’avait l’étude de montrer la différence attendue : 2= n ² - 1,96 d’où on tire en lisant dans la table 2 ² la valeur de 2 puis la puissance 1-
Ex : 2= 1,0 2 ≈ 0,32, ≈ 0,16, d’où une puissance de 0,84
Problème de comparaison (2) de pourcentages Les hypothèses s’écrivent : H0 : P1=P2 H1 : P1≠P2 On observe p1 et p2. On ne peut pas faire l’hypothèse d’égalité des variances, P1Q1/n étant forcément différent de P2Q2/n si H1 est vraie changement de variable : p y = Arcsinusp (Arcsinus est la fonction inverse de la fonction sinus : p = sin(y)) Cette transformation angulaire permet : Y suit une distribution proche de la Normale Var(Y) tant vers une constante 1/4n dès que n > 20 Dans la formule de comparaison de moyennes, on remplace ² par ¼ par (Arcsinusp1 - Arcsinusp2)
Comparaison de 2 pourcentages Pour un test bilatéral : n (+2)² 2(Arcsinusp1 - Arcsinusp2)² et 2 = 2n(Arcsinusp1 - Arcsinusp2) – 1,96 =
Table d’Arcsinus
Cas des effectifs inégaux Essai thérapeutique : 2 fois plus de malades dans le groupe nouveau Ttt que dans le groupe placebo Étude épidémiologique : 2 témoins pour un cas en partant de 1/n1 + 1/n2 = 2/n en cas d’effectifs égaux Pour n2/n1 = 2 on obtient : n1 = n/2 (1+1/2) et n2 = n/2(1+2) Et de façon plus générale, pour n2/n1 = n1 = n/2 (1+1/ ) et n2 = n/2(1+ ) On calcule d’abord n, effectifs égaux, puis n1 et n2 en fonction de n1 + n2 est toujours supérieur à 2n
Problème de prédiction M+ M- E+ a b R1 risque de maladie chez E+ E- c d R0 risque de maladie chez E- P 1-P Pour quantifier l’association entre exposition et maladie : Risque relatif RR = R1 / R0 Odds ratio OR R1 / (1 - R1) estimé par ad/bc R0 / (1 - R0) En l’absence d’association RR et OR = 1 En cas d’association positive RR et OR > 1 Principe : calculer le nombre de sujets nécessaires E+ et E- pour montrer un OR choisi, avec une puissance définie, connaissant la fréquence de la maladie (R0) chez les E- =
Exemples numériques Evaluation du risque de cancer du foie sur cirrhose chez les sujets atteints d’hémochromatose Hypothèse : le risque de cancer du foie chez les cirrhotiques non hémochromatosiques est de 5 % Combien de malades pour montrer un risque 3 fois plus grand avec une puissance de 80 % Résolution E- = cirrhoses sans hémochromatose E+ = cirrhoses sur hémochromatose R0 = 0,05, OR attendu = 3 On lit dans des tables : il faut inclure 168 malades par groupe Si l’on craint des PDV ou sujets non évaluables, il faut majorer d’un % dépendant du problème. Ici 10 %, il faut donc 185 sujets/groupe
Exemples numériques Essai thérapeutique pour tester 2somnifères S1 et S2 Soit par la durée de sommeil l1 - 2l = 1 heure en supposant les variances égales de valeur 1,5²quel nombre de sujets pour montrer 1 ≠ 2 avec = 5 %, = 10 % et n1 = n2 Soit par le % de sujets ayant une durée de sommeil d’au moins 6 heures. Avec S1 on sait que ce taux est de 30 %, on désire qu’il soit d’au moins 50 % avec = 5 %, = 10 % et n1 = n2
Exemples numériques Essai thérapeutique pour tester 2somnifères S1 et S2 Soit par la durée de sommeil l1 - 2l = 1 heure en supposant les variances égales de valeur 1,5²quel nombre de sujets pour montrer 1 ≠ 2 avec = 5 %, = 10 % et n1 = n2 Résolution Test bilatéral de comparaison de moyennes n = (2 x 1,5²)/1² x (1,96 + 1,282)² = 47,3 soit n = 48 sujets/groupe Si l’on craint des PDV ou sujets non évaluables, il faut majorer d’un % dépendant du problème. Ici 10 %, il faut donc 53 sujets/groupe
Exemples numériques Essai thérapeutique pour tester 2somnifères S1 et S2 Soit par le % de sujets ayant une durée de sommeil d’au moins 6 heures. Avec S1 on sait que ce taux est de 30 %, on désire qu’il soit d’au moins 50 % avec = 5 %, = 10 % et n1 = n2 Résolution Test unilatéral de comparaison de pourcentages n = (1,645 + 1,282)²/2x(0,785 – 0,580)² = 101,9 donc 102 sujets /groupe En majorant de 10 % pour les sujets non évaluables il faut 113 sujets par groupe Même problème, critère de jugement différent, il faut 2 fois plus de malades pour montrer une différence de 20% que d’1 heure
Exemples numériques En fait, le nombre de malades recrutés est plus faible que prévu et seuls sont analysables n1=n2=30 On observe : m1 = 5,8 (s = 1,6) p1 = 0,30 m2 = 6,5 (s = 1,7) p2 = 0,53 le test = 1,64, non rejet H0 le test ² = 3,36, non rejet H0 Quelle était la puissance pour montrer les différences attendues sous les mêmes hypothèses ? 1. 2= n ² - 1,96 2 = 0,622 2 0,51 0,255 2 ² et la puissance 1- = 0,745 2. 2 = 2n(Arcsinusp1 - Arcsinusp2) – 1,645 = 0,175 2 0,86 0,43 et la puissance 1- = 0,57
Ce qu’il ne faut pas faire Un essai thérapeutique est mis en place sur 3 centres. Le nombre de sujets prévu est de 98 par groupe pour montrer une différence de 20% (60 vs 40) en test bilatéral, avec 5% et 20% Un des 3 centres inclut la moitié soit 50 malades par groupe et observe 58 vs 40 % de bons résultats. Il décide d’analyser et de publier lui-même ses propres résultats ² = 3,24, p = 0,072, NS L’ensemble des résultats sur les 3 centres montre des taux de réponses de 57 vs 41% ² = 5,23, p < 0,03