Mamadou Dieye, Mohamed Rafik Doulache,

Slides:



Advertisements
Présentations similaires
Sommaire Définition du rapport Structurer le contenu
Advertisements

Les apports du co-enseignement
L'interopérabilité dans l'innovation 2
OPIR & SES OUTILS Mme Annick Weizman, Adjointe scientifique
Production de lénergie électrique à partir de lénergie A REMPLIR Insérez ici une photo descriptive de lénergie à présenter Lycée Louis Armand
Sandrine Peraldi (ISIT) Jean-Philippe KOTOWICZ (INSA Rouen)
Extraction des règles dassociation à partir dun corpus spécialisé Jérôme AZÉ & Mathieu ROCHE Laboratoire de Recherche en Informatique EGC, Lyon janvier.
Fouille de textes : Extraction Itérative de la Terminologie
1 Extraction de la terminologie Mathieu Roche Cours Polytech 21 novembre 2005.
INFORSID'04 - Biarritz 1 Étude de Mesures de Qualité pour Classer les Termes Extraits de Corpus Spécialisés Mathieu Roche, Oriane Matte-Tailliez, Yves.
JADT'04 - Mars 2004, Belgique 1 EXIT: un système itératif pour l'extraction de la terminologie du domaine à partir de corpus spécialisés Mathieu Roche,
EXIT : EXtraction Itérative de la Terminologie
Olivier Kraif, Agnès Tutin LIDILEM
UNIVERSITÉ PARIS 3 ─ SORBONNE NOUVELLE
Évaluation et scénarios territoriaux
Par Aline Mahot et Charlyne Routier
OLST — Université de Montréal
L'étiquetage morpho-syntaxique d'un corpus oral Claudia-Mariana Ionescu Ripoll.
Les démarches de développement
Reconnaissance et validation en Pologne
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
d’un article scientifique
Paradigme constructiviste
Building an Electronic Dictionary of Computer Science Terminology
Olivier CANTIN, Tassadit AMGHAR, Bernard LEVRAT
Proposition pour lévaluation du processus de recherche partenariale Proposal for Evaluating the Research Partnership Process 1 er juin 2010 Colloque étudiant.
J-P. Charpy / D. Carnet Faculté de Médecine de Dijon
REPRISE DES DONNEES DE BASE
Le langage oral en maternelle
Scientific Data Preservation Project Call: Mastodons
Les Produits de Qualité Liée à lOrigine et aux Traditions en Méditerrannée Quality Food Products Linked to Geographical Origin and Traditions in the Mediterranean.
OUTILEX Présentation des résultats
Yasmina ABBAS EDF - Division Recherche et Développement (Division R&D)
Une approche intégrée pour la normalisation des extragrammaticalités de la parole spontanée Mohamed-Zakaria KURDI CLIPS – IMAG.
TERMINOLOGIE APPLIQUEE Analyse du traitement de exsolved magmatic gas Amandine Elchinger 3 février 2010.
Le Superlatif.
Pascal Robichaud Chris Harris presenting Les défis associés à l’évalution des credits obtenus hors province ou à l’international.
Sylvie Gendron, Ph.D. Faculté des sciences infirmières Université de Montréal 3e colloque international de programmes locaux et régionaux de santé : des.
Méthodologie dictionnaire ou traducteur?
Direction de la normalisation terminologique (DNT) Mai 2010 La terminologie : une passion, des métiers !
FRE 2645 Workshop MADONNE : 27 Mai 2004 Système contextuel de reconnaissance structurelle de symboles, basé sur une méthodologie de construction d'objets.
FRE 2645 CIFED’04 : Jeudi 24 Juin 2004 Système contextuel de reconnaissance structurelle de symboles, basé sur une méthodologie de construction d'objets.
CoRRecT : Démarche coopérative pour l’évaluation de systèmes de reconnaissance de termes Chantal Enguehard IRIN – Université de Nantes 2 rue de la Houssinière.
L’utilisation d’outils de traitement automatique de la langue naturelle dans le domaine de la terminologie: une voie d’optimisation de ressources 1.
Yuanyuan XU 1er Avril 2010 – 30 Septembre 2010
Jacques Vergne GREYC - Université de Caen
Natures / classes grammaticales INTRODUCTION
La Fin de l’Unité: l’Écologie QU’EST-CE QUE C’EST, LA GÉRANCE DE L’ENVIRONNEMENT? Notre responsabilité personnel de s’occuper de la Terre et de ses ressources.
Modélisation N-morphes en classification des textes de Wikipedia
Les Prépositions.
RETRO v2 « Analyse Fonctionnelle » Octobre 2007 JYR.
Mardi le 23 septembre. Sur le test… Les expressions de la classe La famille Les parties du corps Les articles définis (le/la/les/l’) et indéfinis (un/une/des)
LES ÉCOLES BIZARRES DES RÈGLES BIZARRES DANS DES PAYS DIFFÉRENTS
Erasmus rencontre 3 Comment travailler le lexique.
Pile/Face élève. Comment ça s’ecrit? (How is that spelled?)
Consolidation de grands réseaux lexicaux
Conférences (CR) PACLING'03 Pacific Association for Computational LINGuistics 22 au 25 août 2003 Halifax, côte Est Canada RANLP Recent Advances in Natural.
Application pratique Patchwork Work in progress. Traduire un site Website Web Nous avons reçu une commande de traduction d’un site Web de patchwork vers.
Mais d’abord rappelez-vous!!
Reforme éducative Article scientifique.
Architecture et construction. Sommaire Introduction Cahier des charges du clients Contraintes du PLU Solutions pour construire à énergie zéro Conclusion.
Contractions with the Prepositions à and de. Differences and Similarities Faire du vélo Faire de la vidéo Jouer au golf Jouer aux cartes Each verb takes.
effets sources  Il est préférable de baser une analyse sur les effets des erreurs que l’on peut détecter à partir du texte analysé, que de travailler.
PROBLÈMES EN SUISSE TAKING IT GLOBAL MEMBRE DU GROUPE: Julie Zhao, Michael Wang, Carl Wang, Rain Xu PPT made by Rain Xu, Michael Wang.
NEDERLEX : un outil en ligne d'aide à la lecture de textes en langue étrangère. G. Deville - M. Miceli (Ecole des Langues Vivantes - FUNDP) L. Dumortier.
Mise en oeuvre d’un outil original d’aide en ligne à la lecture de textes en langue étrangère. G. Deville - M. Miceli (Ecole des Langues Vivantes - FUNDP)
1 4th International Conference on Arabic Language Processing, May 2–3, 2012, Rabat, Morocco Titre Mohamed El Amine ABDERRAHIM Mohamed Alaedine ABDERRAHIM.
The consequences of the.
Transcription de la présentation:

Construction d’un dictionnaire multilingue de biodiversité à partir de dires d’experts Mamadou Dieye, Mohamed Rafik Doulache, Mustapha Floussi, Julie Chabalier, Isabelle Mougenot, Mathieu Roche Université Montpellier 2, Espace-Dev, Natural Solutions, LIRMM

Plan Introduction Processus global de Fouille de Textes (FdT) Résultats préliminaires Perspectives / Conclusion

1. Introduction Objectif à long terme : Construction d’un glossaire trilingue (français, anglais, arabe) des termes de l'écologie Travail en cours : (1) Extraction de termes dans les articles scientifiques (2) Expertise des termes (3) Transfert lexical

2. Processus de FdT Nettoyage Etiquetage Conversion Corpus brut - - - - - Corpus brut Corpus nettoyé Nettoyage Etiquetage Conversion Corpus étiqueté

2. Processus de FdT : Etiquetage The/DT processes/NNS of/IN domestication/NN of/IN plant/NN and/CC animal/NN ... The processes of domestication of plant and animal … Étiqueteur de Brill Utilisation de lexiques, règles lexicales, règles contextuelles

Extraction de la terminologie 2. Processus de FdT - - - - - Corpus brut Corpus nettoyé Nettoyage Etiquetage Extraction de la terminologie Conversion Corpus étiqueté Termes

2. Processus FdT : Extraction des candidats termes - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - EXIT (EXtraction Itérative de la Terminologie) Termes candidats Corpus étiqueté Types de termes : Nom-Nom Adjectif-Nom Nom-Préposition-Nom ...

3. Résultats préliminaires  200 termes évalués

Dice(exp,cand) = 2 X nb(exp, cand) / (nb(exp) + nb(cand)) 4. Perspectives Organisation de la terminologie : (1) IHM pour la validation des termes (2) Organisation de la terminologie acquise (SKOS) Transfert lexical (anglais/français) : (1) Extraction des candidats à la traduction : Mediterranean landscapes / Paysages Méditerranéens ✓ Mediterranean landscapes / Andrea Navagero ✗ (2) Classement des candidats : Dice(exp,cand) = 2 X nb(exp, cand) / (nb(exp) + nb(cand))

Extraction de la terminologie Processus de FdT - - - - - Corpus brut Corpus nettoyé Nettoyage Etiquetage Extraction de la terminologie Conversion Corpus étiqueté Termes