Pr. François Kohler kohler@medecine.uhp-nancy.fr Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr.

Slides:



Advertisements
Présentations similaires
L’échantillonnage & Ses Fluctuations
Advertisements

Indicateurs de Suivi, Risques & Mesure d’Associations
Probabilités et statistiques au lycée
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Risques d’erreur statistique et test statistique
RECONNAISSANCE DE FORMES
Test statistique : principe
Comment évaluer la valeur d’un examen complémentaire?
5 critères de qualité d'un test
Évaluation des examens complémentaires dans la démarche médicale : Prescriptions utiles et inutiles F. KOHLER.
Lecture d’article. Evaluation diagnostique
Évaluation des examens complémentaires dans la démarche médicale : Prescriptions utiles et inutiles F. KOHLER (septembre 2005)
Collecte de données F. Kohler.
Inférence statistique
Comparaison de courbes de survies
Inférence statistique
Probabilités (Probability)
Faculté de médecine de Nancy - SPI-EAO - Pr. F. KOHLER
Comparaison d'une distribution observée à une distribution théorique
Comparaison de deux pourcentages observés
Courbes de survie C1 Statistiques.
Les TESTS STATISTIQUES
Epidémiologie : types d’enquêtes
Tests de comparaison de pourcentages
Les TESTS STATISTIQUES
Dr DEVILLE Emmanuelle J D V 12/07/2006
Tests de dépistage biologiques : Sensibilité, spécificité, valeur prédictive Jeremy Chobriat ( ENC 2005 )
Système formel Nous avons introduit : signes de variables (x, y, z, …), de constantes (0, 1), d’opérations (+, ), de relations (=, ) Axiomes : ce sont.
Discrimination Validation
Les tests diagnostiques. Dépistage / Confirmation
Valeurs diagnostiques des examens complémentaires (imagerie, biologie…) F. KOHLER N’Djamena 2011.
Fluctuations d’une fréquence selon les échantillons, Probabilités
Quelques calculs de probabilités
2. Expériences aléatoires et modélisation
COURS 5 Les tableaux croisés, le chi-carré et la corrélation
Les liens entre les variables et les tests d’hypothèse
Paul-Marie Bernard Université Laval
Fonction puissance Montage préparé par : André Ross
Introduction aux probabilités
Cours ‘ Interprétation de la preuve ’ (5)
La corrélation et la régression
LE DÉPISTAGE GEAPI 14 DMG Poitiers, GEAPI 14 dépistage,
Objectifs Chapitre 8: Mesure en psychologie
Calcul de probabilités
Introduction aux probabilités
Régression linéaire multiple : hypothèses & interprétation
De la prescription à l’exploitation des résultats aux Urgences
Évaluation des procédures de diagnostic ou de dépistage
Probabilités et cannabis
Évaluation des examens complémentaires
Fabienne BUSSAC PROBABILITÉS 1. VOCABULAIRE
Évaluation – Panorama 15 À l’étude…. Unité 15.1 Tu dois être capable de :  différencier la probabilité théorique de la probabilité fréquentielle  calculer.
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
CHAPITRE 3. Acquisition d’information et révision des croyances
1.  On souhaite comparer deux traitements dans le cadre d’un essai randomisé sur les lombosciatiques :  corticoïdes par infiltrations  placebo  Critère.
SENSIBILITE & SPECIFICITE
PERFORMANCES D’UN TEST DIAGNOSTIQUE
Plan 1. Probabilités conditionnelles 2. Indépendance en probabilité
ED LCA Dr. GIGNON Année universitaire 2009 / :
Procédures de diagnostic et de dépistage
ED diagnostic et dépistage
ECHANTILLONAGE ET ESTIMATION
Comparaison de plusieurs moyennes observées
ETUDES PRONOSTIQUES Pr Ganry.
Evaluation des examens complémentaires dans la démarche médicale
Statistiques: mesures de liaisons tests d’hypothèse
Scénario Quatre hipsters entrent en collision un dans l'autre dans un ascenseur plein de personnes. En conséquence ils laissent tomber leurs téléphones.
Introduction aux statistiques Intervalles de confiance
TP1: Statistique application chapitre 2. Le tableau suivant reprend le taux d'intérêt (en %) payé par 20 banques sur les dépôts d'épargne de leurs clients.
Transcription de la présentation:

Pr. François Kohler kohler@medecine.uhp-nancy.fr Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr

Expérience aléatoire, événement aléatoire Une expérience est dite aléatoire (random experiment-random trial) lorsqu'on ne peut pas en prévoir exactement les résultats du fait que tous les facteurs qui déterminent ce résultat ne sont pas maîtrisés ou contrôlés. Un événement aléatoire est un événement qui peut ou ne pas se réaliser au cours d'une expérience aléatoire. Exemple : expérience aléatoire "traverser la route" - événement aléatoire "se faire écraser".

Définition classique Si m résultats peuvent se produire avec des chances égales et si k résultats correspondent à la réalisation de l'événement, la probabilité de l'événement est le rapport k/m : nombre de cas favorables sur nombre de cas possibles. Par exemple, dans un jeu de 52 cartes, on a 13 coeurs, si toutes les cartes ont des chances égales d'être tirées, la probabilité d'extraire un cœur est 13/52 = 0,25

Définition fréquentielle Si une expérience a été répétée un grand nombre de fois dans des conditions uniformes, on constate généralement que la fréquence relative (% de réalisation) d'un événement (fi) se stabilise. Ce phénomène est connu sous le nom de régularité statistique. Ce nombre fixe est par définition la probabilité mathématique de l'événement considéré.

Définition fréquentielle La probabilité ainsi définie est une forme idéalisée de la fréquence relative. Une estimation pragmatique de la probabilité d’un événement est fournie par la fréquence relative, la précision de cette estimation peut être fournie par son intervalle de confiance pour un risque donné. Dans de nombreux cas, la probabilité peut être modélisée par une loi.

Expérience, événement, propositions, logique… Evénement : toute proposition logique associée aux résultats de l’expérience. Représentation ensembliste : Diagramme de Venn S ensemble des événements possibles A sous-ensemble de S B sous-ensemble de S ….

Evénements exclusifs Les événements A et B ne peuvent se produire simultanément. Pour tous couples (A,B) l'ensemble A* B est vide. Exemple : extraire un cœur ou un carreau. Si 2 événements sont exhaustifs et mutuellement exclusifs (mort-vivant) La non-réalisation de l’un implique la réalisation de l’autre.

Evénements non exclusifs Les événements peuvent se produire simultanément . L’intersection n’est pas vide. Exemple : Extraire une dame et un carreau Avoir un diabète et rouler avec des pneus lisses. Avoir un diabète et une angine. Ne pas confondre événements exclusifs et événements indépendants.

Opérateurs logiques On note Vrai 1, Faux 0. 1 A B A ou B; A U B; A+B A et B; AÇB; A*B Non(A) Non(B) Non(AouB) Non(AetB) Non(A) et Non(B) Non(A) ou Non(B) 1

Rappel de logique A et B A ou B A B Non(A) Non(B) Non(A et B) Non(A ou B)

Rappels de logique Théorèmes de De Morgan Non(A et B) = Non(A) ou Non(B) Non(A ou B) = Non(A) et Non(B) La plupart des problèmes de probabilités n’ont comme difficulté que l’interprétation logique de l’énoncé.

Axiomes élémentaires 0 < P(A) < 1 : Une probabilité est toujours comprise entre 0 et 1. P(A) = 1 : L’événement est toujours réalisé. P(A) = 0 : L’événement est impossible. Si 2 événements sont exclusifs : P(A ou B) = P(A + B) = P(A U B) = P(A) + P(B) Exemple : Probabilité d'extraire un cœur ou un carreau = P(Cœur ou Carreau) = 0,25 + 0,25 = 0,5. Généralisation P(A+B+C) = P(A)+P(B)+P(C). Si 2 événements sont mutuellement exclusifs (mort-vivant) et constituent l’ensemble des possibles : on a P(A)+P(B) = 1 => P(A) = 1-P(B). La probabilité de survie à un moment donné est égale à 1 moins la probabilité de décéder à ce moment.

Evénements non exclusifs Les événements peuvent se produire simultanément. Exemples : « avoir un infarctus du myocarde », « être diabétique ». P(A ou B) = P(B ou A) = P(A) + P(B) - P(A et B) Ceci se déduit des relations : P(A ou B) = P(A sans B) + P(B sans A) + P(A et B) P(A sans B) = P(A) - P(A et B) P(B sans A) = P(B) - P(A et B) En conclusion : P(A ou B) < P(A) + P(B) P(A ou B ou C) = P(A) + P(B) + P(C) - P(A et B) - P(B et C) - P(A et C) + P(A et B et C)

Probabilités conditionnelles et indépendance En médecine, l’utilisation des probabilités conditionnelles est fréquente et apparaît naturelle. On dira que « un individu a 5 fois plus de chances de développer une maladie coronarienne s’il fume un paquet de tabac par jour que si il ne fume pas »… La connaissance n’est pas figée : avant la réalisation d’un test, la probabilité d’une maladie est p. Que devient-elle si on sait que le test est positif ?

Probabilité conditionnelle Soit deux événements non exclusifs A et B : On regarde la probabilité que l’un se réalise alors que l’autre est déjà réalisé. On note P(A/B) la probabilité de A si B est réalisé, l’inversement du conditionnement P(B/A) est la probabilité de B si A est réalisé. Quelle est la probabilité d’avoir une douleur de la fosse illiaque droite alors que l’on a une appendicite ? Quelle est la probabilité d’avoir une appendicite alors que j’observe une douleur dans la fosse iliaque droite ?

Probabilité conditionnelle Eléments de base : Indépendance : Deux événements sont indépendants si la réalisation de l’un n’influence pas la réalisation de l’autre. Exemple : Pluie, rouler avec des pneus lisses : a priori indépendant; pluie, avoir un accident a priori non indépendant.

Indépendance P(A/B) = P(AB)/P(B) = P(A) => P(AB) = P(A)*P(B) Si et seulement si deux événements sont indépendants alors P(A et B) = P(A) * P(B)

Inversion du conditionnement Intérêt : évaluation des examens complémentaires. Théorème de Bayes : A Non A P(A/B) B Non B P(B) A Non A P(A)/nonB)

Le tableau à 4 cases En médecine, 2 tableaux à 4 cases sont très utilisés et renvoient au conditionnement. Evaluation des signes et examens complémentaires. Recherche de facteurs de risque.   Maladie + Maladie - Total Test + A (VP) B (FP) T+=A+B=VP+FP Test - C (FN) D (VN) T-=C+D=FN+VN M+ = A+C = VP+FN M-=B+D=FP+VN n P(T+/M+); P(T-/M-); P(M+/T+); P(M-/T-)   Maladie + Maladie - Total Exposés A B E+=A+B Non exposés C D E-=C+D M+ = A+C M- = B+D A+B+C+D P(M+/E+); P(M+/E-); P(E+/M+);P(E-/M-)

Les arbres de décision Un homme se présente aux urgences. Quelle est la probabilité qu’il ait une sténose coronarienne ? ( Coro+) = P (EE+  Coro+) + P (EE-  Coro+) = 0,8*0,6 + 0,4*0,3 = 0,48 + 0,12 = 0,60

Evaluation des examens complémentaires Il n’existe pas de signe ou d’examen parfait qui serait toujours présent en cas de présence de la maladie et absent en cas d’absence de la maladie.   Maladie + Maladie - Total Test + A (VP) B (FP) T+=A+B=VP+FP Test - C (FN) D (VN) T-=C+D=FN+VN M+ = A+C = VP+FN M-=B+D=FP+VN N=A+B+C+D Fréquence de la maladie = Prévalence=P(M+) = (VP+FN)/N Sensibilité = P(T+/M+) = VP/(VP+FN) Spécificité = P(T-/M-)= VN/(VN+FP) VPP = P(M+/T+) = VP/(VP+FP) VPN = P(M-/T-) = VN/(VN+FN)

Evaluation des examens complémentaires La prévalence de la maladie dépend de différents facteurs notamment : Zone géographique : le paludisme est beaucoup plus fréquent en Afrique qu’en France. De la sélection réalisée par le premier niveau de soins (la prévalence dans le groupe sélectionné est égale à la VPP du test qui a servi à la sélection). …. La prévalence est la probabilité d’avoir la maladie avant d’avoir fait le test : probabilité pré-test.

Evaluation des examens complémentaires Sensibilité (probabilités des tests positifs chez les malades) et spécificité (probabilités des tests négatifs chez les non malades) sont des caractéristiques intrinsèques du test. Elles supposent le problème résolu puisqu’ un test de référence (gold standard) a permis de déterminer si la personne était malade ou non. Elles sont influencées notamment par le stade évolutif de la maladie.

Evaluation des examens complémentaires La valeur prédictive positive (VPP = probabilité d’avoir la maladie si le test est positif) et la valeur prédictive négative (VPN = probabilité de ne pas avoir la maladie si le test est négatif) sont les éléments qui servent à la décision médicale. La VPP est la probabilité post-test. Dans le groupe des sujets ayant un test positif, elle représente la probabilité d’avoir la maladie. Si le généraliste utilise la positivité du test pour adresser les sujets au spécialiste, la fréquence de la maladie (prévalence) dans le groupe adressé au spécialiste sera la VPP.

Valeurs prédictives Les valeurs prédictives dépendent de : La sensibilité du test, La spécificité du test, La prévalence du test. En conséquence, le même test (même sensibilité et spécificité) aura des VPP et VPN très différentes en fonction de la prévalence de la maladie.

Valeurs prédictives Malade Non Malade Prévalence 1 - Prévalence Test Positif Test Négatif Sensibilité 1 - Sensibilité 1 - Spécificité Spécificité VPP et VPN correspondent à l’inversion du conditionnement de la sensibilité et de la spécificité. L’arbre des probabilités permet facilement cette opération.

VPP et VPN en fonction de la prévalence Pour une sensibilité et une spécificité donnée : Une augmentation de la prévalence entraîne une augmentation de la VPP. Une augmentation de la prévalence entraîne une diminution de la VPN.

Exemple Le paludisme a une prévalence de 90% en Afrique et de 0,001 en France. Un test biologique est utilisé pour le diagnostic avec une sensibilité de 95% et une spécificité de 85%. Quelles seront les probabilités pour des patients Africains et Français d’avoir le paludisme quand le test est positif et inversement de ne par avoir la maladie quand le test est négatif ? Conclusion : si le test est positif en Afrique, on est quasiment certain que le patient a le paludisme alors qu’en France on ne peut rien conclure. Par contre si le test est négatif, on est quasiment certain qu’en France le patient n’a pas de palu alors qu’en Afrique, on ne peut rien dire. => Attention au transfert d’expérience.

Rapports de vraisemblance RV+ : L = Un sujet a L fois plus de chance d'avoir le test positif s'il est atteint de la maladie que dans le cas contraire. RV- : L'apport diagnostique d'un résultat positif du test est d'autant plus grand que le RV+ (L) est plus élevé. L'apport diagnostique d'un résultat négatif d'autant plus grand que le RV- est plus petit et proche de zéro. B.Grenier

Diagramme de Fagan Permet, sans calcul, de déterminer la probabilité post-test à partir de la prévalence (probabilité pré-test) et du rapport de vraisemblance. (source HAS) Prévalence = 10% L = 12

Dépistage, Confirmation diagnostique S’adresse à des sujets ne se plaignant de rien à priori sains. Prendre un test à sensibilité élevée (peu de FN, VPN très grande) . Éventuellement suivi d’un test de confirmation. Ne pas oublier les autres éléments : Acceptabilité, Risque, Coût Confirmation d’une maladie suspectée : Prendre un test avec une spécificité élevée (peu de FP, VPP très grande) d’autant plus que le coût du faux positif est élevé.   Maladie + Maladie - Total Test + A (VP) B (FP) T+=A+B=VP+FP Test - C (FN) D (VN) T-=C+D=FN+VN M+ = A+C = VP+FN M-=B+D=FP+VN N=A+B+C+D

Valeurs diagnostiques d’un test Si un test a une spécificité élevée, un résultat positif confirme l’hypothèse diagnostic. Si un test a une sensibilité élevée, un résultat négatif élimine le diagnostic . (Règles de Sacket) Gain diagnostic positif : C’est la différence entre la probabilité pré-test (prévalence) de la maladie et la probabilité post-test (valeur prédictive positive). Gain positif = VPP – prévalence.

Et si le test consiste à comparer une valeur quantitative à une limite ? Si le résultat du test biologique ou du signe clinique est une variable quantitative (glycémie - diabète; tension artérielle systolique - hypertension ...), la sensibilité et la spécificité vont dépendre du seuil que l'on choisit pour dire que le test est positif ou négatif. Pour chaque valeur de la limite, on aura une valeur de la sensibilité et une valeur de la spécificité. Ceci conduit à la courbe de ROC.

Spécificité et sensibilité en fonction de la limite Ici si l’on déplace la limite vers la droite, la spécificité va augmenter et le sensibilité va diminuer (diabète et glycémie par exemple). Attention, il existe des cas inverse : taux d’hormones et hypothyroidie.

Courbe de ROC Sensibilité A chaque valeur de la limite L du critère quantitatif, on a une valeur de la sensibilité et de la spécificité. On obtient ainsi 1 point de la courbe. En faisant varier la limite L, on obtient d’autres points. La courbe joignant les points est la courbe de ROC. Les valeurs de sensibilité et spécificité en fonction de L peuvent être obtenues par l’observation ou par la modélisation du phénomène par une loi de probabilité. 1 1-Spécificité

Courbe de ROC Aire sous la courbe : AROC Entre 0,5 (examen au hasard : pile ou face) et 1 (examen parfait). Instrument privilégié d’évaluation et de comparaison des performances diagnostiques des examens complémentaires.

Importance de l’indépendance Indépendance est opposé à liaison. Deux phénomènes sont indépendants si la réalisation de l’un n’influence pas la réalisation de l’autre. Deux phénomènes sont liés si la réalisation de l’un influence la réalisation de l’autre. Attention : Liaison ne veut pas dire causalité. Indépendance = hypothèse nulle du test du Khi2 sous laquelle sont calculés les effectifs théoriques.

Application à la reproductibilité Problème fréquent en santé : Deux médecins donnent un avis sur l’opportunité de réaliser une intervention chirurgicale. Si la reproductibilité était parfaite les deux médecins seraient toujours d’accord. Mais… Médecin A Oui Non Total Médecin B 10 20 30 5 45 50 15 65 80 La concordance observée est : (10+45)/80 = 0,69

Reproductibilité Médecin A Oui Non Total Médecin B 10 20 30 5 45 50 15 65 80 Si les deux jugements étaient indépendants, quels auraient été les résultats ? Les probabilités peuvent être approchées par les fréquences. Sous l’hypothèse d’indépendance, on obtient le tableau : Médecin A Oui Non Total Médecin B 5,6 24,4 30 9,4 40,6 50 15 65 80

Reproductibilité Médecin A Oui Non Total Médecin B 10 20 30 5 45 50 15 65 80 Concordance observée Cobs=(10+45)/80 = 0,69 Concordance sous hypothèse d’indépendance Cthéo =(5,6+40,6)/80 = 0,58 Coefficient de Kappa Médecin A Oui Non Total Médecin B 5,6 24,4 30 9,4 40,6 50 15 65 80 Si Kappa > 0,6 : bonne concordance

Application à la survie Soit les événements Morts-Vivants P(Vivant) = 1 - P(Mort) La probabilité d'être vivant au jour J et au jour J+1 est égale au produit des probabilités d'être vivant au jour J et J+1. Jour Exposés DCD PDV P(DCD) P(Viv.) Pcum(Viv) 0 100 0 0 0 1 1 1 100 3 0 0,03 0,97 1*0,97 6 97 2 0 2/97=0,0206 0,9794 0,97*0,9794 = 0,95002 7 95 0 3 0 1 0,95002 10 92 … … … … …