Le Fscore est-il une critère pertinent pour évaluer la terminologie ?

Slides:



Advertisements
Présentations similaires
Mais vous comprenez qu’il s’agit d’une « tromperie ».
Advertisements

Les carrés et les racines carrées
RELATIFS Bernard Izard 4° Avon RE I - ADDITION SOUSTRACTION
Probabilistic Record Linkage (PRL). Base SAMU Base hôpital Base unique Enrichissement des bases locales Combiner plusieurs ensembles de données en un.
Notions de fonction Initiation.
Présentation de la circonscription Année 2011/2012 Jeudi 24 novembre 2011.
Additions soustractions
Distance inter-locuteur
1 Tournée Capital Souffle - du 03 octobre au 13 novembre Analyse des questionnaires recueillis sur les stands lors des actions régionales Capital.
INFORSID'04 - Biarritz 1 Étude de Mesures de Qualité pour Classer les Termes Extraits de Corpus Spécialisés Mathieu Roche, Oriane Matte-Tailliez, Yves.
Mathieu Roche Equipe Inférence et Apprentissage - LRI 11 février 2005
JADT'04 - Mars 2004, Belgique 1 EXIT: un système itératif pour l'extraction de la terminologie du domaine à partir de corpus spécialisés Mathieu Roche,
EXIT : EXtraction Itérative de la Terminologie
Test statistique : principe
Raisonnement et logique
Les numéros 70 –
Les Prepositions.
5 critères de qualité d'un test
Dépistage organisé du cancer colorectal en Moselle
Discrimination Validation
ACTIVITES MENTALES Collège Jean Monnet Question 1 Ecris 28 sous la forme dune somme de deux termes.
LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.
Estimation de la survie comparaison des courbes de survie FRT C3.
Correspondances en Onco-Urologie - Vol. III - n° 3 – juillet-août-septembre VESSIE Daprès James ND et al., N Engl J Med 2012;366:16:
Technologies et pédagogie actives en FGA. Plan de latelier 1.Introduction 2.Les technologies en éducation 3.iPads 4.TNI 5.Ordinateurs portables 6.Téléphones.
La relève et le sondage sur la tarification et les revenus Une présentation de François Gauthier.
Révision (p. 130, texte) Nombres (1-100).
1 7 Langues niveaux débutant à avancé. 2 Allemand.
Contexte – cas de tuberculose multirésistante par an dans le monde (5 % des cas de tuberculose) –Traitement difficile : 4 à 6 molécules, parmi lesquelles.
Relations entre élastométrie, marqueurs biologiques et ponction biopsie hépatique chez 67 patients Sénégalais avec charge virale VHB ≥3.2 log UI/mL.
CALENDRIER PLAYBOY 2020 Cliquez pour avancer.
15. 1 MILLION $ $ $ $ $ $ $ $ $ $ 04.
Zone de rejet et scoring
Classification Multi Source En Intégrant La Texture
Présentation générale
Les puissances de 10 - Sommaire
Si le Diaporama ne s'ouvre pas en plein écran Faites F5 sur votre clavier.
CLL11 : chlorambucil (CLB) versus CLB + rituximab (R)
Les chiffres & les nombres
1.Un rang de données multicolores 2. Deux permutations des n premiers entiers 3. b permutations des k premiers entiers 4. Choix de n points dans [0,1]
Planification Projet NavInc
CALCUL MENTAL Entraînement Séance 5 Collège F Mauriac.
La statistique descriptive
L’étrange ballet de la planète MARS
Tournoi de Flyball Bouin-Plumoison 2008 Tournoi de Flyball
Année universitaire Réalisé par: Dr. Aymen Ayari Cours Réseaux étendus LATRI 3 1.
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
C'est pour bientôt.....
Tableau de bord des infections nosocomiales Année 2007.
Inéquations du second degré à deux variables
SUJET D’ENTRAINEMENT n°4
Aire d’une figure par encadrement
Écart moyen et écart type
Les fondements constitutionnels
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
(analyse en modèle de Cox multivarié - HR [IC95])
LUNDI – MARDI – MERCREDI – JEUDI – VENDREDI – SAMEDI – DIMANCHE
1/65 微距摄影 美丽的微距摄影 Encore une belle leçon de Macrophotographies venant du Soleil Levant Louis.
LES COURSES SUR PISTE.
CALENDRIER-PLAYBOY 2020.
Comment construire un graphique ?
Les Chiffres Prêts?
La formation des maîtres et la manifestation de la compétence professionnelle à intégrer les technologies de l'information et des communications (TIC)
Comment construire un graphe ?
Comment construire un graphe ?
Réalisé par : Mr IRZIM Hédi Mr JRAD Firas
Évaluation des examens complémentaires
Méthodes d’apprentissage : application au tri de complexes protéines-protéines Jérôme Azé.
Transcription de la présentation:

Le Fscore est-il une critère pertinent pour évaluer la terminologie ? Mathieu Roche et Yves Kodratoff 05 avril 2005 Atelier "Evaluation des outils terminologiques" Conférence TIA 2005 - Rouen

Contexte Problématique : listes de collocations ordonnées, en utilisant, par exemple, des mesures statistiques. collocation pertinente = collocation qui représente une trace linguistique de concept pour une tâche en cours. Comment évaluer la qualité des listes de collocations ? TIA, 05/04/2005

2. Classement des collocations [Roche et al. , JFT'03 ; Roche et al 2. Classement des collocations [Roche et al., JFT'03 ; Roche et al., INFORSID'04] Rang Collocations Nb 1 2 3 4 ... 50 63 64 69 Rang Collocations Nb 1 2 3 4 ... 43 67 74 144 mise en place 111 mise en place 111 traitement de textes 57 traitement de textes 57 assistante de direction 60 assistante de direction 60 hôtesse de caisse 28 hôtesse de caisse 28 chalon sur saône 4 chalon sur saône 4 jéjunum de rat 3 jéjunum de rat 3 beurre de karité 3 beurre de karité 3 puy en velay 3 puy en velay 3 Rapport de Vraisemblance Information Mutuelle TIA, 05/04/2005

Quelques critères d'évaluation des listes de collocations (1/2) Précision : Courbe d'élévation ("lift chart") : précision en fonction du nombre de collocations extraites TIA, 05/04/2005

Quelques critères d'évaluation des listes de collocations (2/2) Rappel Fscore TIA, 05/04/2005

Les courbes ROC (1/4) Utilisation des courbes ROC (Receiver Operating Characteristic): courbe dont le taux de vrais positifs est représenté en ordonnées et le taux de faux positifs est représenté par l'axe des abscisses. Avantage : pas de sensibilité dans le cas d'un déséquilibre entre les classes. 1 taux de faux positifs taux de vrais positifs AUC TIA, 05/04/2005

Les courbes ROC (2/4) s1 s2 A : + ++++--++-+--+-- Intérêt décroissant Vrais positifs (VP) S1 A VP = 1/8 FP = 0 B S2 VP = 4/8 FP = 0 VP = 3/8 FP = 2/8 Faux positifs (FP) TIA, 05/04/2005

Les courbes ROC (3/4)  Rangs (+,.) A : +++++--++-+--+-- Maximiser l’aire sous la courbe ROC  minimiser la somme des rangs des ex. positifs FP VP Rangs (+, A) : 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Rangs (+, B) : 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16  Rangs (+,.) A : +++++--++-+--+-- 57 B : + --++--++-++--+- 65 Intérêt décroissant TIA, 05/04/2005

Les courbes ROC (4/4) Exemples de courbes ROC h1: ++++++---- rangs = 21 rangs = 25 rangs = 26 h1: ++++++---- h2 : +++-+++--- h3 : ++-+-++-+- TIA, 05/04/2005

Comparaison Fscore/courbe ROC (1/2) 1 positif et 99 négatifs 50 positifs et 50 négatifs Fscore TIA, 05/04/2005

Comparaison Fscore/courbe ROC (2/2) 1 positif et 99 négatifs 50 positifs et 50 négatifs Courbes ROC TIA, 05/04/2005

Conclusions et perspectives Avantage des courbes ROC comme critère d'évaluation : pas de sensibilité d'un éventuel déséquilibre entre les classes (nombre d'exemples positifs et négatifs). Méthode : utilisation de méthodes d'apprentissage supervisé fondées sur les courbes ROC pour apprendre des fonctions de rangs [Roche et al., ROCAI'04 ; Azé et al., ASMDA'05] TIA, 05/04/2005