La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

EDF Electricité de France Yasmina ABBAS EDF - Division Recherche et Développement (Division R&D) LEXTER Logiciel dextraction de terminologie WORLDTREK.

Présentations similaires


Présentation au sujet: "EDF Electricité de France Yasmina ABBAS EDF - Division Recherche et Développement (Division R&D) LEXTER Logiciel dextraction de terminologie WORLDTREK."— Transcription de la présentation:

1 EDF Electricité de France Yasmina ABBAS EDF - Division Recherche et Développement (Division R&D) LEXTER Logiciel dextraction de terminologie WORLDTREK ED Interface dédition de terminologie

2 EDF Electricité de France 29/11/99Journées ATALA - CHU de la Pitié- Salpêtrière 2 Développement initial ( ) – Thèse de D. Bourigault à EDF - Direction Etudes et Recherches (DER) Utilisation et développement à EDF - DER ( ) Depuis 1996 – Utilisation à EDF - DER – Utilisation et développement à lERSS de Toulouse Disponibilité – Propriété d EDF – Licences délivrées aux laboratoires de recherches Contacts – Henry – Daniela Le contexte

3 EDF Electricité de France 29/11/99Journées ATALA - CHU de la Pitié- Salpêtrière 3 analyseur syntaxique robuste dédié au repérage de syntagmes nominaux pour corpus spécialisé pour la constitution de ressources terminologiques – thesaurus – index – référentiels terminologiques – ontologies LEXTER

4 EDF Electricité de France 29/11/99Journées ATALA - CHU de la Pitié- Salpêtrière 4 Conversion des fichiers textes format RTF en HTML 1 Macro Word 2 Rtf_to_Html 3 Html_to_UT Nettoyage des fichiers Word et enregistrement en format RTF Découpage des fichiers HTML en unités textuelles précédées d un identifiant 4 Etiquetage ( Sylex ®, Cordial ®...) Etiquetage des phrases Le pré-traitement du corpus

5 EDF Electricité de France 29/11/99Journées ATALA - CHU de la Pitié- Salpêtrière 5 Deux étapes –découpage : identification de syntagmes nominaux maximaux par repérage de frontière. –décomposition : décomposition syntaxique binaire (Tête Expansion) des syntagmes nominaux maximaux. Principe : apprentissage endogène –acquisition automatique dinformation de sous-catégorisation pour résoudre les ambiguïtés de rattachement. Sortie : un réseau de candidats termes Réseau exploitable par : –ZELLIG (B. Habert) –LEXICLASS (H. Assadi) –FASTR (C. Jacquemin) –SYNOTERM (T. Hamon) Le traitement LEXTER

6 EDF Electricité de France 29/11/99Journées ATALA - CHU de la Pitié- Salpêtrière 6 HTL Boutons de validationCandidats termes Unités textuellesDécomposition

7 EDF Electricité de France 29/11/99Journées ATALA - CHU de la Pitié- Salpêtrière 7 WORLDTREK ED

8 EDF Electricité de France 29/11/99Journées ATALA - CHU de la Pitié- Salpêtrière 8 Le Référentiel Méthodologique dIngénierie (RMI-DE) Le projet : Harmonisation et mise en cohérence de lensemble des documents liés aux métiers de lingénierie (doctrines, dictionnaires, thesaurus, …) de la Direction de lEquipement dEDF ( aujourdhui Division Ingénierie & Services ) Lapplication : Construction dune terminologie de référence dans le cadre de ce projet pour être intégrée dans une application daide à la rédaction. Le corpus : Dossiers de Systèmes Elémentaires (DSE) (documentation des centrales nucléaires) représentant pages de documents organisés par systèmes élémentaires. Ils sont multi-auteurs et homogènes sur le plan de la structure. Le traitement : Analyse du corpus, extraction des candidats termes, validation auprès des experts de la Direction de lEquipement et structuration des termes en domaines et sous-domaines. Les Systèmes de Consultation de la Documentation technique (SCDT) Des exemples dapplications à EDF

9 EDF Electricité de France 29/11/99Journées ATALA - CHU de la Pitié- Salpêtrière 9 Service informatique de l hôpital Broussais Société ANACOM Centre de terminologie et néologie (CTN) du LLI Paris XIII Centre de Recherches en Ingénierie Multilingue (CRIM) de l Inalco XEROX Grenoble (XRCE), CRIM de l Inalco et CTN Société LEXICON PLANETE Département informatique de l hôpital de la Pitié-Salpêtrière Groupe « terminologie et intelligence artificielle » Projet de recherches sur l aide au codage des comptes rendus d anatomie pathologique Travaux pratiques dalignement terminologique (DESS) Projet de construction d un lexique bilingue français-anglais sur les droits de l Homme Evaluation des méthodes dalignement terminologique développées au Centre de recherches XEROX de Grenoble Construction dun glossaire pour une société d assurances Tests pour lenrichissement dun dictionnaire bilingue Construction de l index dun ouvrage collectif sur l Ingénierie des conaissances publié chez Eyrolles Participation à un projet de construction de thesaurus sur l ingénierie linguistique pour le Web (soutenu par la Délégation Générale à la Langue Française Des exemples dapplications hors EDF


Télécharger ppt "EDF Electricité de France Yasmina ABBAS EDF - Division Recherche et Développement (Division R&D) LEXTER Logiciel dextraction de terminologie WORLDTREK."

Présentations similaires


Annonces Google