SENSIBILITE & SPECIFICITE Dr Degani BANZULU – UNIKIN Kinshasa 2015
Un test de dépistage se doit d’être non seulement valide et fiable mais également simple à utiliser, rapide, peu coûteux et acceptable par les sujets (Bimes-Arbus, Lazorthes & Rouge, 2006 ; Malek et al., 2000). Ne répondant pas aux mêmes objectifs, test de dépistage et test diagnostique (confirmatoire) n’ont donc pas les mêmes impératifs à respecter et leurs caractéristiques seront différentes. Le premier doit limiter le nombre de faux négatifs afin de ne pas négliger un sujet à risque. Inversement, le second doit limiter le nombre de faux positifs afin de poursuivre la procédure de diagnostic uniquement pour les sujets concernés.
Dans le domaine de la santé, de nombreux travaux se sont intéressés à mesurer le degré d’efficacité d’un test, soit pour en ajouter un nouveau, soit pour éliminer un test dont la qualité est insuffisante. La question est alors de savoir si la nouvelle méthode est performante par rapport à la méthode classique (test de référence ou test standard).
Les mesures de la performance d’un test sont diverses et englobent de nombreux indices tels la sensibilité (Se ou taux de vrais positifs), la spécificité (Sp), le taux de faux positifs (1-Sp), la valeur prédictive positive (VPP), la valeur prédictive négative (VPN), etc. (Grenier, 1999)
La sensibilité correspond à la probabilité que le test soit positif sachant que le sujet est malade (ou que le sujet présente le trait que l’on cherche à détecter). Elle mesure donc la capacité d’un test à détecter les malades. Plus la sensibilité est proche de l’unité, moins il y a d’erreurs de détection des sujets malades (faux négatifs).
La spécificité est la probabilité que le test soit négatif sachant que le sujet est sain (ou que le sujet ne présente pas le trait que l’on cherche à détecter). Elle mesure donc la capacité d’un test à détecter les individus sains. Plus la spécificité est proche de l’unité, moins il y a de faux positifs.
Se=VP/(VP+FN) Trait à dépister + (Malades) Trait à dépister – (Non malades) Trait de dépistage + (Test+) Vrais Positifs (VP) Faux Positifs (FP) Trait de dépistage – (Test -) Faux Négatifs (FN) Vrais Négatifs (VN) Sp=VN/(VN+FP)
Quelle information apporte un examen ou un test? Quelle valeur a cette information pour classer une individu dans un catégorie (clinique) ? 2 types d’information : Quantitative ou Qualitative Qualitatif (binaire) : une réponse de type "oui"/"non" ou "positif"/"négatif" ou "présence"/"absence" : Exemples : Présence de sang dans les urines oui/non, Sérologie HIV positive/négative, Bacille acido-alcoolo résistant au tubage gastrique présent/absent. Quantitatif : Avec application d’un seuil : Quantitatif transformé en Qualitatif
Selon que le seuil fixé est trop élevé ou trop bas, le test sera fortement sensible ou fortement spécifique (ou inversement selon que le test est proportionnel ou inversement proportionnel)
X% 0% 0% X% Idéalement !!! Habituellement !!! <100% 100% 100% Trait à dépister + (Malades) Trait à dépister – (Non malades) Trait de dépistage + (Test+) Vrais Positifs (VP) Faux Positifs (FP) Trait de dépistage – (Test -) Faux Négatifs (FN) Vrais Négatifs (VN) <100% 100% X% 0% X% 0% 100% <100%
Le test idéal est donc celui qui permet de séparer totalement et sans erreur tous les positifs des négatifs (Landais & Jais, 2002). Ce test serait donc caractérisé par une sensibilité et une spécificité égales à 1. Mais il s’agit là d’un cas d’école puisqu’aucun test n’est parfait.
Dans la réalité, la meilleure valeur seuil d’un test est celle qui optimise simultanément sa sensibilité et sa spécificité. En d’autres termes, c’est la valeur qui permettra de discriminer au mieux les sujets en minimisant le taux de faux positifs et de faux négatifs. Le choix de la valeur seuil résulte dès lors d’un compromis incontournable entre sensibilité et spécificité (Morin, Morin, Mercier, Moineau & Codet, 1998) et dépend de l’objectif recherché.
En effet, une bonne sensibilité est requise lorsqu’il est « coûteux » de ne pas détecter de « déficit » (Martinot, Dubos & Hue, 2005) (p.ex détecter tous les sujets HIV+ et minimiser au maximum les faux négatifs). Un test à haute sensibilité est donc utilisable dans les situations de dépistage (Perneger & Perrier, 2004)
À l’opposé, un test à forte spécificité est requis lorsqu’il est « coûteux » de traiter une personne déclarée à tord comme ayant un « déficit ». Si le test possède une bonne spécificité, il conduit à un résultat négatif chez presque tous sujets n’ayant pas le trait. Il pourrait donc être utilisé en tant qu’examen de confirmation (Valleron, 2001).
Antagonisme entre sensibilité et spécificité : – 2 valeurs à prendre en compte simultanément – Comment résumer les 2 en un seul indicateur ? Des indicateurs existent et qui prennent en compte à la fois ces deux valeurs : ROC L'indice de Youden Le rapport de vraisemblance Coefficient Q de Yule La statistique de test du khi²
La courbe ROC (Receiver Operator Characteristic) est une représentation graphique de la relation existant entre la sensibilité et la spécificité d’un test, calculée pour toutes les valeurs seuils possibles (Delacour, Servonnet, Perrot, Vigezzi & Ramirez, 2005). Lorsque le test est non informatif en ce sens qu’il ne permet pas de distinguer les négatifs des positifs, la courbe ROC se réduit à une diagonale bissectrice rejoignant les deux coins opposés du graphe. Plus le test est performant, plus la courbe ROC se rapproche de l’angle supérieur gauche du graphique puisque le taux de vrais positifs s’approche de 1 (Se = 1) et le taux de faux positifs tend vers 0 (Sp = 1). Au point supérieur gauche qui est le plus éloigné de la diagonale bissectrice correspond habituellement la meilleure valeur-seuil (Tipples, 2002).
L’aire sous la courbe ROC (AUC) est une mesure globale de la performance du test parmi les plus utilisées. Elle varie entre 0.5 dans le cas d’un test non informatif à 1 dans le cas d’une performance parfaite. Ainsi, une AUC de 0,50 signifie que le test est mauvais et qu’il ne fait pas mieux que la chance pour classer les individus. Plus l’aire sous la courbe est élevée, plus le test est performant. Lorsque plusieurs tests sont étudiés simultanément, leurs aires sous la courbe peuvent aussi être utilisées pour comparer leurs performances (DeLong, DeLong & Clarke-Pearson, 1988)
D’autres indices tels les rapports de vraisemblance (positif ou négatif) ou la capacité d’information attendue (CIA), sont aussi utilisés en complément de la mesure globale (Grenier, 1999). Les rapports de vraisemblance englobent la sensibilité et la spécificité du test dans un même chiffre.
Le rapport de vraisemblance positif est le rapport (RVP = Se/[1-Sp]) ou rapport des vrais positifs sur les faux positifs, décrit combien de fois un résultat positif du test est plus probable chez un malade que chez un non-malade (ratio > 1). Lorsque le test n’apporte aucune information, ce rapport vaut 1. Interprétation: un sujet a «RVP fois plus de risque d'avoir un test positif s'il est atteint de la maladie étudiée que s'il n'est pas atteint de la maladie.
Le rapport de vraisemblance négatif (RVN = [1-Se]/Sp) résulte du rapport des faux négatifs sur les vrais négatifs et décrit combien de fois un résultat négatif du test est moins probable chez un malade que chez un non malade (ratio < 1) (Martinot et al., 2005). Interprétation : un sujet a «RVN fois » plus de risque d'avoir un test négatif s'il n’est pas atteint de la maladie étudiée que s'il est atteint de la maladie.
Leurs valeurs, plus généralement exprimées sous forme du logarithme naturel, sont alors appelées Valeur Informative Positive (Vi+) et Valeur Informative négative (Vi-). Plus ces valeurs prises de manière absolue sont grandes, meilleure est la capacité de discrimination du test.
La valeur prédictive positive : VP/VP+FP Trait à dépister + (Malades) Trait à dépister – (Non malades) Trait de dépistage + (Test+) Vrais Positifs (VP) Faux Positifs (FP) Trait de dépistage – (Test -) Faux Négatifs (FN) Vrais Négatifs (VN)
VPP= Capacité de la présence d’un trait associé à un test ou à un examen de diagnostic à prédire la présence de la maladie (ou du trait que l’on cherche à détecter) Chez les positifs, sachant que le test est positif, quelle est la probabilité d’avoir la maladie ? (d’avoir le trait?)
La valeur prédictive négative : VN/VN+FN Trait à dépister + (Malades) Trait à dépister – (Non malades) Trait de dépistage + (Test+) Vrais Positifs (VP) Faux Positifs (FP) Trait de dépistage – (Test -) Faux Négatifs (FN) Vrais Négatifs (VN)
VPN= Capacité d’un trait associé à un test ou à un examen de diagnostic à prédire l’absence de la maladie (ou du trait que l’on cherche à détecter) Chez les sujets négatifs, sachant que le test est négatif, quelle est la probabilité de ne pas avoir la maladie? (de ne pas avoir le trait?)