Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parLaurentin Faure Modifié depuis plus de 11 années
1
EXIT : EXtraction Itérative de la Terminologie
Mathieu Roche, Thomas Heitz, Oriane Matte-Tailliez, Yves Kodratoff LRI Session "Poster" - EGC'04
2
Collocations verbales
Processus global Collocations nominales Termes nominaux Termes Nom-Prép-Nom avec l’information mutuelle au cube 1. mise en place (111) 2 traitement de texte (57) 3 tableau de bord (23) 4. contrat de qualification (31) Exemples : Termes Nom-Prép-Nom avec l’information mutuelle 1. beurre de karité (3) 2. jéjunum de rat (3) 3. puy en velay (3) 4. chalon sur saône (4) Termes variants Corpus brut Corpus nettoyé Corpus étiqueté avec ETIQ [Amrani et al., 2004] Termes variants Termes verbaux Collocations verbales Session "Poster" - EGC'04
3
Corpus Corpus de Ressources Humaines (société PerformanSe) Ko (en français). Corpus de CV (groupe VediorBis) Ko (en français). Corpus d’introductions d’articles sur la Fouille de Données Ko (en anglais). Corpus de résumés d’articles sur la Biologie Moléculaire Ko (en anglais). Session "Poster" - EGC'04
4
Expérimentations : mesures d’évaluation
La précision (1) 1. real world 2. neural network 3. frequent itemset 4. remote sensing 5. naive bayes … Termes extraits 1. real world 2. neural network 3. frequent itemset 4. remote sensing 5. naive bayes … Session "Poster" - EGC'04
5
Expérimentations : mesures d’évaluation
La précision (2) Les courbes d’élévation (« lift chart ») : variation de la précision en fonction du nombre de termes proposés à l’expert Session "Poster" - EGC'04
6
Expérimentations : Corpus des Ressources Humaines
Session "Poster" - EGC'04
7
Perspectives Calculer le rappel et la courbe ROC sur un sous-ensemble des corpus Session "Poster" - EGC'04
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.