La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Mamadou Dieye, Mohamed Rafik Doulache,

Présentations similaires


Présentation au sujet: "Mamadou Dieye, Mohamed Rafik Doulache,"— Transcription de la présentation:

1 Construction d’un dictionnaire multilingue de biodiversité à partir de dires d’experts
Mamadou Dieye, Mohamed Rafik Doulache, Mustapha Floussi, Julie Chabalier, Isabelle Mougenot, Mathieu Roche Université Montpellier 2, Espace-Dev, Natural Solutions, LIRMM

2 Plan Introduction Processus global de Fouille de Textes (FdT)
Résultats préliminaires Perspectives / Conclusion

3 1. Introduction Objectif à long terme :
Construction d’un glossaire trilingue (français, anglais, arabe) des termes de l'écologie Travail en cours : (1) Extraction de termes dans les articles scientifiques (2) Expertise des termes (3) Transfert lexical

4 2. Processus de FdT Nettoyage Etiquetage Conversion Corpus brut
Corpus brut Corpus nettoyé Nettoyage Etiquetage Conversion Corpus étiqueté

5 2. Processus de FdT : Etiquetage
The/DT processes/NNS of/IN domestication/NN of/IN plant/NN and/CC animal/NN ... The processes of domestication of plant and animal … Étiqueteur de Brill Utilisation de lexiques, règles lexicales, règles contextuelles

6 Extraction de la terminologie
2. Processus de FdT Corpus brut Corpus nettoyé Nettoyage Etiquetage Extraction de la terminologie Conversion Corpus étiqueté Termes

7 2. Processus FdT : Extraction des candidats termes
EXIT (EXtraction Itérative de la Terminologie) Termes candidats Corpus étiqueté Types de termes : Nom-Nom Adjectif-Nom Nom-Préposition-Nom ...

8 3. Résultats préliminaires
 200 termes évalués

9 Dice(exp,cand) = 2 X nb(exp, cand) / (nb(exp) + nb(cand))
4. Perspectives Organisation de la terminologie : (1) IHM pour la validation des termes (2) Organisation de la terminologie acquise (SKOS) Transfert lexical (anglais/français) : (1) Extraction des candidats à la traduction : Mediterranean landscapes / Paysages Méditerranéens ✓ Mediterranean landscapes / Andrea Navagero ✗ (2) Classement des candidats : Dice(exp,cand) = 2 X nb(exp, cand) / (nb(exp) + nb(cand))

10 Extraction de la terminologie
Processus de FdT Corpus brut Corpus nettoyé Nettoyage Etiquetage Extraction de la terminologie Conversion Corpus étiqueté Termes


Télécharger ppt "Mamadou Dieye, Mohamed Rafik Doulache,"

Présentations similaires


Annonces Google