Zone de rejet et scoring

Slides:



Advertisements
Présentations similaires
Mais vous comprenez qu’il s’agit d’une « tromperie ».
Advertisements

Introduction aux statistiques Intervalles de confiance
Probabilistic Record Linkage (PRL). Base SAMU Base hôpital Base unique Enrichissement des bases locales Combiner plusieurs ensembles de données en un.
Notions de fonction Initiation.
Distance inter-locuteur
Apprentissage supervisé à partir de séquences
RECONNAISSANCE DE FORMES
Test statistique : principe
Raisonnement et logique
5 critères de qualité d'un test
Lecture d’article. Evaluation diagnostique
Comparaison d'une distribution observée à une distribution théorique
Les K plus proches voisins
Nombre de sujets nécessaires en recherche clinique
1. Les caractéristiques de dispersion. 11. Utilité.
Tests de dépistage biologiques : Sensibilité, spécificité, valeur prédictive Jeremy Chobriat ( ENC 2005 )
1 Intégration numérique garantie de systèmes décrits par des équations différentielles non-linéaires Application à l'estimation garantie d'état et de paramètres.
Les tests d’hypothèses
Discrimination Validation
Statistiques et probabilités en première
Statistique descriptive
Estimation de la survie comparaison des courbes de survie FRT C3.
Dépistage de la trisomie 21 en 2008…
Le Fscore est-il une critère pertinent pour évaluer la terminologie ?
Programmes du cycle terminal
Christelle Scharff IFI 2004
Reconnaissance des formes cours de D.E.A. Introduction
Statistiques et Probabilités au lycée
LES ÉLASTICITÉS DE LA DEMANDE ET DE L’OFFRE
Méthodes de Biostatistique
RECONNAISSANCE DE FORMES
Cours de physique générale I Ph 11
L’inférence statistique
Cours Corporate finance Eléments de théorie du portefeuille Le Medaf
Nombre de sujets nécessaires en recherche clinique
Comprendre la variation
DEA Perception et Traitement de l’Information
Construction de modèles visuels
DEA Perception et Traitement de l’Information
RECONNAISSANCE DE FORMES
TECHNIQUES QUANTITATIVES APPLIQUEES A LA FINANCE
Accélération.
LES ERREURS DE PRÉVISION e t = X t - P t X1X2X3X4 X5 X6…X1X2X3X4 X5 X6…X1X2X3X4 X5 X6…X1X2X3X4 X5 X6… P5P6P5P6P5P6P5P6 e5e6e5e6e5e6e5e6.
Activité mentale Indiquer vos nom et prénom sur votre feuille
Objectifs du chapitre sur les distributions déchantillonnage Comprendre la relation entre les distributions déchantillonnage et les tests dinférence statistique.
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
ÉCHANTILLONNAGE AU FIL DES PROGRAMMES Stage : nouveaux programmes de première Novembre 2011.
Filtrage de Kalman et aperçu probabiliste
Régression linéaire (STT-2400)
Les Graphiques de Vélocité
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
DEA Perception et Traitement de l’Information
Régression linéaire multiple : hypothèses & tests. Partie 3.
Introduction à la reconnaissance:
Évaluation des procédures de diagnostic ou de dépistage
Comment construire un graphique ?
Probabilités et Statistiques Année 2009/2010
Activité 1 sommaire Vous avez redécouvert ce que l'on appelle le principe 68%-95%-99,7% : Ce principe est valable pour des distributions de fréquences.
Classification : objectifs
Évaluation des examens complémentaires
Intervalles de confiance pour des proportions L’inférence statistique
S. Canu, laboratoire PSI, INSA de Rouen
PROGRAMMATION Déplacements:
Méthode ABC ou Analyse de Pareto
Fusion de paramètres en classification Parole/Musique Julie Mauclair – Equipe Parole Julien Pinquier – Equipe SAMoVA.
SENSIBILITE & SPECIFICITE
Evaluation des examens complémentaires dans la démarche médicale
IFT 501 Recherche d'information et forage de données Chapitre 4 : Classification concepts de base, arbres de décision et évalution des modèles Partie 3.
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
23/05/2016 Déterminer la taille des échantillons notion sous-jacente : puissance d'un test Claire Chabanet fonction F4, étendre l'écran configurer le diaporama,
Transcription de la présentation:

Zone de rejet et scoring

Introduction Classifieur permet de décider Quelle est la qualité de cette décision? Exemple: Règle de Bayes dit « X est Malade » Et vous?

(c’est la forme voiture) (vecteur de caractéristiques) Autre exemple Classifieur voiture/vélo Décision (c’est la forme voiture) classifieur x Donnée (vecteur forme) Vecteur forme (vecteur de caractéristiques) Cadre de discernement: C={Voiture,Vélo}

 Décision: x est une voiture classifieur x  Décision: x est une voiture

 Décision: x est un vélo classifieur x  Décision: x est un vélo

 Décision: x est une voiture!!! classifieur x  Décision: x est une voiture!!! Rappel : cadre de discernement: C={Voiture,Vélo}

Introduction de la notion de rejet Rejet d’ambiguïté Rejet en distance Un peu de prudence dans un monde d’incertitude !

Règle de décision classique Cas paramétrique On connaît les ddp Règle de décision classique (Bayes)

Exemple Décision Décision réalité réalité erreur x x’ Bonne classification = 88,5%

Exemple (suite) Décision Décision réalité réalité Même problème vu du côté

Règle de décision avec rejet Cas paramétrique On connaît les ddp Règle de décision avec rejet (Chow, 1957) d0 : rejet du résultat du classifieur rA : seuil de rejet

Règle de Chow 1 rA 1/2 x classe 0 rejet classe 1 Définition : Rejet règle de décision du maximum a posteriori (MAP) 1 Lois a posteriori rA 1/2 Rejet d’ambiguité densités x classe 0 rejet classe 1

Exemple de rejet avec rA=0,75 0.75 Bonne classification = 94,5% ; points rejetés = 15,2%

Exemple de rejet avec rA=0,75 Même problème vu du côté de la distribution

Exemple de rejet avec rA=0,85 0.85 Bonne classification = 96,3% ; points rejetés = 24,2%

Exemple de rejet avec rA=0,85 Même problème vu du côté de la distribution

Exemple de rejet avec rA=0,89 0.89 Bonne classification = 98,5% ; points rejetés = 43,0%

Exemple de rejet avec rA=0,89 Même problème vu du côté de la distribution

Exemple de rejet avec rA=0,99

Exemple de rejet avec rA=0,9

Exemple de rejet avec rA=0,8

Exemple de rejet avec rA=0,6

Exemple de rejet avec rA=0,51

Extension de la notion de rejet Rejet précédent = rejet d’ambiguïté Mais… ?

Rejet en distance

avec rejet d’ambiguïté et de distance Rejet en distance Règle de décision avec rejet d’ambiguïté et de distance (Dubuisson, 1990) rD : rejet du résultat du classifieur si le point x appartient à une zone éloignée des zones « usuelles » des classes. Cd: seuil de rejet en distance d0 : résultat du classifieur rA : seuil de rejet d’ambiguïté

Rejet en distance 1 rA 1/2 rD x Si rD = 0 et rA = .5 : règle du MAP Lois a posteriori rA Si rD = 0 et rA = .5 : règle du MAP (Bayes pour le coût 0-1) 1/2 densités rD x rejet de distance classe 0 rejet classe 1 rejet de distance

Exemple 0.025 rA=0,75 ; Cd = 0,025

Exemple rA=0, 85 ; Cd = 0,025

Exemple rA=0, 85 ; Cd = 0,025

Mesure de performances et qualité de l’utilisation du rejet Comment mesurer les performances d’une règle de décision ? Matrice de confusion, intervalle de confiance  Exemple: Courbe ROC : performances vs. rejet Matrice de confusion : vérité w1 w2 prévi-sion 204 54 19 55 Probabilité d'erreur estimée : (54+19)/332=0.22=p Intervalle de confiance à 95 % : [0.18, 0.27]

Courbe ROC Courbe ROC Les courbes ROC (Receiver Operating Characteristic) permettent d'étudier les variations de la spécificité et de la sensibilité d'un test pour différentes valeurs du seuil de discrimination. Le terme de courbe ROC peut être envisagé comme une "courbe de caractéristiques d'efficacité". La courbe ROC est avant tout définie pour les problèmes à deux classes (les positifs et les négatifs), elle indique la capacité du classifieur à placer les positifs devant les négatifs. Elle met en relation dans un graphique les taux de faux positifs (en abscisse) et les taux de vrais positifs (en ordonnée).

Courbe ROC Matrice de confusion

Courbe ROC + + Courbe ROC Performances d'un classifieur (sur les points non rejetés) en fonction du pourcentage de points rejetés + +