La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Session "Poster" - EGC'04 1 EXIT : EXtraction Itérative de la Terminologie Mathieu Roche, Thomas Heitz, Oriane Matte-Tailliez, Yves Kodratoff LRI.

Présentations similaires


Présentation au sujet: "Session "Poster" - EGC'04 1 EXIT : EXtraction Itérative de la Terminologie Mathieu Roche, Thomas Heitz, Oriane Matte-Tailliez, Yves Kodratoff LRI."— Transcription de la présentation:

1 Session "Poster" - EGC'04 1 EXIT : EXtraction Itérative de la Terminologie Mathieu Roche, Thomas Heitz, Oriane Matte-Tailliez, Yves Kodratoff LRI

2 Session "Poster" - EGC'04 2 Processus global Corpus étiqueté avec ETIQ [Amrani et al., 2004] Collocations nominales + + + Termes nominaux + + + Termes verbaux Collocations verbales + + + Termes variants + + + Corpus brut --------------- --------------- --------------- ----------- Corpus nettoyé --------------- --------------- --------------- ----------- Termes variants + + + Termes Nom-Prép-Nom avec linformation mutuelle au cube 1. mise en place (111) 2 traitement de texte (57) 3 tableau de bord (23) 4. contrat de qualification (31) Exemples : Termes Nom-Prép-Nom avec linformation mutuelle 1. beurre de karité (3) 2. jéjunum de rat (3) 3. puy en velay (3) 4. chalon sur saône (4)

3 Session "Poster" - EGC'04 3 Corpus Corpus de Ressources Humaines (société PerformanSe) - 3784 Ko (en français). Corpus de CV (groupe VediorBis) - 2470 Ko (en français). Corpus dintroductions darticles sur la Fouille de Données - 369 Ko (en anglais). Corpus de résumés darticles sur la Biologie Moléculaire - 9424 Ko (en anglais).

4 Session "Poster" - EGC'04 4 Expérimentations : mesures dévaluation La précision (1) 1. real world 2. neural network 3. frequent itemset 4. remote sensing 5. naive bayes … 1. real world 2. neural network 3. frequent itemset 4. remote sensing 5. naive bayes … Termes extraits

5 Session "Poster" - EGC'04 5 Expérimentations : mesures dévaluation La précision (2) Les courbes délévation (« lift chart ») : variation de la précision en fonction du nombre de termes proposés à lexpert

6 Session "Poster" - EGC'04 6 Expérimentations : Corpus des Ressources Humaines

7 Session "Poster" - EGC'04 7 Perspectives Calculer le rappel et la courbe ROC sur un sous-ensemble des corpus


Télécharger ppt "Session "Poster" - EGC'04 1 EXIT : EXtraction Itérative de la Terminologie Mathieu Roche, Thomas Heitz, Oriane Matte-Tailliez, Yves Kodratoff LRI."

Présentations similaires


Annonces Google