SENSIBILITE & SPECIFICITE

Slides:



Advertisements
Présentations similaires
Indicateurs de Suivi, Risques & Mesure d’Associations
Advertisements

Analyse d’items Ensemble de procédés statistiques dont le but est d ’évaluer la qualité d’un instrument de mesure et des items qui le composent. Ensemble.
La mesure des inégalités
Gestion de portefeuille
Gestion de portefeuille
GESTION DE PORTEFEUILLE chapitre n° 7
RECONNAISSANCE DE FORMES
Présentation des programmes de terminale STG Juin 2006.
Test statistique : principe
Comment évaluer la valeur d’un examen complémentaire?
5 critères de qualité d'un test
Évaluation des examens complémentaires dans la démarche médicale : Prescriptions utiles et inutiles F. KOHLER.
Lecture d’article. Evaluation diagnostique
Évaluation des examens complémentaires dans la démarche médicale : Prescriptions utiles et inutiles F. KOHLER (septembre 2005)
Collecte de données F. Kohler.
Inférence statistique
Tests de dépistage biologiques : Sensibilité, spécificité, valeur prédictive Jeremy Chobriat ( ENC 2005 )
Discrimination Validation
Dépistage de la trisomie 21 en 2008…
Optimisations des performances
Une mesure de l ’évolution dans le temps
Christelle Scharff IFI 2004
Les élasticités (de la demande) Par Patrice Cuperty (S.E.S au Lycée V.Hugo à Colomiers) L’élasticité mesure la sensibilité d’une grandeur à la variation.
Objectifs du chapitre 8: Mesures verbales en psychologie
Zone de rejet et scoring
Chiffres de références Rudwaleit (2004, Ann Rheum dis) : Pool d’ études Lombalgies inflammatoires vs sujets sains Lombalgies inflammatoires vs lombalgies.
TRAVAIL SUR DOCUMENTS.
Groupe 1: Classes de même intervalle
B Souda Abdelhafidh Mai 2006 Lévaluation est-elle une innovation en Tunisie B souda Abdelhafidh Élève inspecteur au CENAFFE.
Introduire la dérivée en 1re S comme réponse à une question
Méthodes de prévision (STT-3220)
La corrélation et la régression
La corrélation et la régression
LE DÉPISTAGE GEAPI 14 DMG Poitiers, GEAPI 14 dépistage,
Structure discriminante (analyse discriminante)
Objectifs Chapitre 8: Mesure en psychologie
CHAPITRE 2 LES SITUATIONS FONCTIONNELLES
Évaluation des procédures de diagnostic ou de dépistage
ANALYSE DE DONNEES TESTS D’ASSOCIATION
Codage des nombres en informatique : le système binaire.
Probabilités et cannabis
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
Évaluation des examens complémentaires
BACCALAUREAT PROFESSIONNEL
Evaluation multicentrique du dosage semi- quantitatif de la h-FABP (Cardio Detect®) au laboratoire central : intérêt dans le diagnostic de l’infarctus.
VARIABLES ET MESURES DE FREQUENCES Pr. KELLIL M 1.
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Evaluation des performances des tests diagnostiques en absence de Gold Standard Christophe Combescure Laboratoire de Biostatistique, IURC.
1.  On souhaite comparer deux traitements dans le cadre d’un essai randomisé sur les lombosciatiques :  corticoïdes par infiltrations  placebo  Critère.
Post-optimisation, analyse de sensibilité et paramétrage
Régression linéaire (STT-2400)
STATISTIQUES.
FICHE METHODOLOGIQUE n°3
D’après un article du Dr Anne Schillings Clinique du sein – Ottignies Glem 19/05/2010.
des savoir-faire applicables aux données quantitatives
Détecter les groupes à hauts risques cardiaques à partir de caractéristiques telles que l’alimentation, le fait de fumer ou pas, les antécédents familiaux.
CHAPITRE 2 LES SITUATIONS FONCTIONNELLES
PERFORMANCES D’UN TEST DIAGNOSTIQUE
ED LCA Dr. GIGNON Année universitaire 2009 / :
Examen psychologique de l‘adulte et du sujet âgé Examen psychologique de l‘adulte et du sujet âgé UPJV Département de Psychologie Cours du 6 novembre 2013.
Procédures de diagnostic et de dépistage
ED diagnostic et dépistage
Evaluation et gestion de risque Année
Evaluation des examens complémentaires dans la démarche médicale
Risques d’investissement Plus qu’une histoire de marchés boursiers.
LCA UFR SMBH (DCEM)1 Analyse critique d ’articles évaluant l ’intérêt de nouveaux tests à visée diagnostique Alain Venot UFR SMBH Campus virtuel SMBH
Les tests diagnostiques J Ateudjieu, MD, MPH,. Objectifs A la fin de ce cours, l’étudiant devra être capable de : 1.Définir et différentier test diagnostique.
1 Plan du cours Introduction Notions de mécanique : force, énergie, travail, puissance… Température et chaleur Systèmes, transformations et échanges thermodynamiques.
IFT 501 Recherche d'information et forage de données Chapitre 4 : Classification concepts de base, arbres de décision et évalution des modèles Partie 3.
Transcription de la présentation:

SENSIBILITE & SPECIFICITE Dr Degani BANZULU – UNIKIN Kinshasa 2015

Un test de dépistage se doit d’être non seulement valide et fiable mais également simple à utiliser, rapide, peu coûteux et acceptable par les sujets (Bimes-Arbus, Lazorthes & Rouge, 2006 ; Malek et al., 2000). Ne répondant pas aux mêmes objectifs, test de dépistage et test diagnostique (confirmatoire) n’ont donc pas les mêmes impératifs à respecter et leurs caractéristiques seront différentes. Le premier doit limiter le nombre de faux négatifs afin de ne pas négliger un sujet à risque. Inversement, le second doit limiter le nombre de faux positifs afin de poursuivre la procédure de diagnostic uniquement pour les sujets concernés.

Dans le domaine de la santé, de nombreux travaux se sont intéressés à mesurer le degré d’efficacité d’un test, soit pour en ajouter un nouveau, soit pour éliminer un test dont la qualité est insuffisante. La question est alors de savoir si la nouvelle méthode est performante par rapport à la méthode classique (test de référence ou test standard).

Les mesures de la performance d’un test sont diverses et englobent de nombreux indices tels la sensibilité (Se ou taux de vrais positifs), la spécificité (Sp), le taux de faux positifs (1-Sp), la valeur prédictive positive (VPP), la valeur prédictive négative (VPN), etc. (Grenier, 1999)

La sensibilité correspond à la probabilité que le test soit positif sachant que le sujet est malade (ou que le sujet présente le trait que l’on cherche à détecter). Elle mesure donc la capacité d’un test à détecter les malades. Plus la sensibilité est proche de l’unité, moins il y a d’erreurs de détection des sujets malades (faux négatifs).

La spécificité est la probabilité que le test soit négatif sachant que le sujet est sain (ou que le sujet ne présente pas le trait que l’on cherche à détecter). Elle mesure donc la capacité d’un test à détecter les individus sains. Plus la spécificité est proche de l’unité, moins il y a de faux positifs.

Se=VP/(VP+FN) Trait à dépister + (Malades) Trait à dépister – (Non malades) Trait de dépistage + (Test+) Vrais Positifs (VP) Faux Positifs (FP) Trait de dépistage – (Test -) Faux Négatifs (FN) Vrais Négatifs (VN) Sp=VN/(VN+FP)

Quelle information apporte un examen ou un test? Quelle valeur a cette information pour classer une individu dans un catégorie (clinique) ?   2 types d’information : Quantitative ou Qualitative Qualitatif (binaire) : une réponse de type "oui"/"non" ou "positif"/"négatif" ou "présence"/"absence" : Exemples :   Présence de sang dans les urines oui/non,  Sérologie HIV positive/négative,  Bacille acido-alcoolo résistant au tubage gastrique présent/absent. Quantitatif : Avec application d’un seuil : Quantitatif transformé en Qualitatif

Selon que le seuil fixé est trop élevé ou trop bas, le test sera fortement sensible ou fortement spécifique (ou inversement selon que le test est proportionnel ou inversement proportionnel)

X% 0% 0% X% Idéalement !!! Habituellement !!! <100% 100% 100% Trait à dépister + (Malades) Trait à dépister – (Non malades) Trait de dépistage + (Test+) Vrais Positifs (VP) Faux Positifs (FP) Trait de dépistage – (Test -) Faux Négatifs (FN) Vrais Négatifs (VN) <100% 100% X% 0% X% 0% 100% <100%

Le test idéal est donc celui qui permet de séparer totalement et sans erreur tous les positifs des négatifs (Landais & Jais, 2002). Ce test serait donc caractérisé par une sensibilité et une spécificité égales à 1. Mais il s’agit là d’un cas d’école puisqu’aucun test n’est parfait.

Dans la réalité, la meilleure valeur seuil d’un test est celle qui optimise simultanément sa sensibilité et sa spécificité. En d’autres termes, c’est la valeur qui permettra de discriminer au mieux les sujets en minimisant le taux de faux positifs et de faux négatifs. Le choix de la valeur seuil résulte dès lors d’un compromis incontournable entre sensibilité et spécificité (Morin, Morin, Mercier, Moineau & Codet, 1998) et dépend de l’objectif recherché.

En effet, une bonne sensibilité est requise lorsqu’il est « coûteux » de ne pas détecter de « déficit » (Martinot, Dubos & Hue, 2005) (p.ex détecter tous les sujets HIV+ et minimiser au maximum les faux négatifs). Un test à haute sensibilité est donc utilisable dans les situations de dépistage (Perneger & Perrier, 2004)

À l’opposé, un test à forte spécificité est requis lorsqu’il est « coûteux » de traiter une personne déclarée à tord comme ayant un « déficit ». Si le test possède une bonne spécificité, il conduit à un résultat négatif chez presque tous sujets n’ayant pas le trait. Il pourrait donc être utilisé en tant qu’examen de confirmation (Valleron, 2001).

Antagonisme entre sensibilité et spécificité : – 2 valeurs à prendre en compte simultanément – Comment résumer les 2 en un seul indicateur ? Des indicateurs existent et qui prennent en compte à la fois ces deux valeurs : ROC L'indice de Youden Le rapport de vraisemblance Coefficient Q de Yule La statistique de test du khi²

La courbe ROC (Receiver Operator Characteristic) est une représentation graphique de la relation existant entre la sensibilité et la spécificité d’un test, calculée pour toutes les valeurs seuils possibles (Delacour, Servonnet, Perrot, Vigezzi & Ramirez, 2005). Lorsque le test est non informatif en ce sens qu’il ne permet pas de distinguer les négatifs des positifs, la courbe ROC se réduit à une diagonale bissectrice rejoignant les deux coins opposés du graphe. Plus le test est performant, plus la courbe ROC se rapproche de l’angle supérieur gauche du graphique puisque le taux de vrais positifs s’approche de 1 (Se = 1) et le taux de faux positifs tend vers 0 (Sp = 1). Au point supérieur gauche qui est le plus éloigné de la diagonale bissectrice correspond habituellement la meilleure valeur-seuil (Tipples, 2002).

L’aire sous la courbe ROC (AUC) est une mesure globale de la performance du test parmi les plus utilisées. Elle varie entre 0.5 dans le cas d’un test non informatif à 1 dans le cas d’une performance parfaite. Ainsi, une AUC de 0,50 signifie que le test est mauvais et qu’il ne fait pas mieux que la chance pour classer les individus. Plus l’aire sous la courbe est élevée, plus le test est performant. Lorsque plusieurs tests sont étudiés simultanément, leurs aires sous la courbe peuvent aussi être utilisées pour comparer leurs performances (DeLong, DeLong & Clarke-Pearson, 1988)

D’autres indices tels les rapports de vraisemblance (positif ou négatif) ou la capacité d’information attendue (CIA), sont aussi utilisés en complément de la mesure globale (Grenier, 1999). Les rapports de vraisemblance englobent la sensibilité et la spécificité du test dans un même chiffre.

Le rapport de vraisemblance positif est le rapport (RVP = Se/[1-Sp]) ou rapport des vrais positifs sur les faux positifs, décrit combien de fois un résultat positif du test est plus probable chez un malade que chez un non-malade (ratio > 1). Lorsque le test n’apporte aucune information, ce rapport vaut 1. Interprétation:  un sujet a «RVP fois  plus de risque d'avoir un test positif s'il est atteint de la maladie étudiée que s'il n'est pas atteint de la maladie.

Le rapport de vraisemblance négatif (RVN = [1-Se]/Sp) résulte du rapport des faux négatifs sur les vrais négatifs et décrit combien de fois un résultat négatif du test est moins probable chez un malade que chez un non malade (ratio < 1) (Martinot et al., 2005). Interprétation :  un sujet a «RVN fois » plus de risque d'avoir un test  négatif s'il n’est pas  atteint de la maladie étudiée que s'il est atteint  de la maladie.

Leurs valeurs, plus généralement exprimées sous forme du logarithme naturel, sont alors appelées Valeur Informative Positive (Vi+) et Valeur Informative négative (Vi-). Plus ces valeurs prises de manière absolue sont grandes, meilleure est la capacité de discrimination du test.

La valeur prédictive positive : VP/VP+FP Trait à dépister + (Malades) Trait à dépister – (Non malades) Trait de dépistage + (Test+) Vrais Positifs (VP) Faux Positifs (FP) Trait de dépistage – (Test -) Faux Négatifs (FN) Vrais Négatifs (VN)

VPP= Capacité de la présence d’un trait associé à un test ou à un examen de diagnostic à prédire la présence de la maladie (ou du trait que l’on cherche à détecter) Chez les positifs, sachant que le test est positif, quelle est la probabilité d’avoir la maladie ? (d’avoir le trait?)

La valeur prédictive négative : VN/VN+FN Trait à dépister + (Malades) Trait à dépister – (Non malades) Trait de dépistage + (Test+) Vrais Positifs (VP) Faux Positifs (FP) Trait de dépistage – (Test -) Faux Négatifs (FN) Vrais Négatifs (VN)

VPN= Capacité d’un trait associé à un test ou à un examen de diagnostic à prédire l’absence de la maladie (ou du trait que l’on cherche à détecter) Chez les sujets négatifs, sachant que le test est négatif, quelle est la probabilité de ne pas avoir la maladie? (de ne pas avoir le trait?)