Yasmina ABBAS EDF - Division Recherche et Développement (Division R&D)

Slides:



Advertisements
Présentations similaires
Qu’est-ce que LingPro ? LingPro est la branche ingénierie linguistique de i-KM La collaboration i-KM / LingPro est le résultat d’un partenariat sous forme.
Advertisements

Terminologie, glossaires et banques de données. Quest-ce que la terminologie? La terminologie est l'ensemble des termes relatifs à un système notionnel.
Automatisation des processus dans IIJCan par François HARVEY (Programmeur-analyste)
Sémantique et droit de la Fonction publique une boucle verticale
Sandrine Peraldi (ISIT) Jean-Philippe KOTOWICZ (INSA Rouen)
ASSTICCOT, RTP-DOC, Paris
Constitution de produits terminologiques à partir de corpus
Rencontre avec… DICTIONNAIRES EN LIGNE ET OUTILS DE TRADUCTION
Département Informatique Responsable :M. Huchard Responsables adjoints : A. Jean-Marie, F. Koriche, P. Séébold.
Olivier Kraif, Agnès Tutin LIDILEM
UNIVERSITÉ PARIS 3 ─ SORBONNE NOUVELLE
LA GESTION DE PROJETS APPLIQUÉE AU SECTEUR DE LA TRADUCTION
Thésaurus juridique, catégorisation de textes
Henry Boccon-Gibod IA « faible » et « forte » Efficacité dune conciliation des approches.
Urbanisation des Systèmes d'Information - Henry Boccon-Gibod1 Urbanisation de système d'information PLM 4 (Product Lifecycle Management) Préoccupation.
Urbanisation de Systèmes d'Information
Site Internet 29 Mai Le site internet aujourdhui 2.
2002 Compétitif XMiner : Plate-forme de structuration texte libre multi-approches par balisage XML de Tags Actifs Lobjectif du projet est de développer.
1 er décembre 2005Projet ILD&ISTC1 Langues et documents Perspectives.
Traduction française des formats UNIMARC
TRAITEMENT AUTOMATIQUE DES LANGUES : LES PRINCIPAUX PROGRAMMES
Les outils du TAL Par RIGAUD Anaïs RALLIER Armelle SANTIAGO Gwendoline
Par Aline Mahot et Charlyne Routier
Travaux pratiques sur Nooj
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
Journée Technique Régionale PSSI
Control des objectifs des technologies de l’information COBIT
DCL 5501: Méthodologie de la recherche juridique Cecilia Tellis, Bibliothécaire de droit 17 septembre 2008.
Building an Electronic Dictionary of Computer Science Terminology
Ingénierie Linguistique en Entreprise ?
La communication de ce document est soumise à autorisation de France Télécom R&D (Nom du fichier) - D1 - 01/03/2000 France Télécom R&D Énoncé Représentation.
Traducteur Technique en Interne Christophe Jovelin DESS ILTS 2005
OUTILEX Présentation des résultats
1 DTSI / Service Cognitique Robotique et Interaction OUTILEX Démonstrateur du CEA-LIST : moteur d'interrogation crosslingue (français, anglais, espagnol)
Date / references Systèmes Terre et Interarmées Projet OUTILEX Rapport détude final Octobre 2006.
Le Sémiographe Outil générique pour effectuer des opérations texte sens texte ou texte sens actions
Mise en oeuvre dun outil original daide en ligne à la lecture de textes en langue étrangère. G. Deville - M. Miceli (Ecole des Langues Vivantes - FUNDP)
Titre de la diapositive Unité mixte de recherche 7118 Accueil diaporama.
Introduction à lutilisation des corpus 1. Quest-ce quun corpus? Alexandra VOLANSCHI
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
Introduction théorie et pratique
École de bibliothéconomie et des sciences de linformation 1 Gestion de linformation électronique (GIE) Maîtrise en sciences de linformation EBSI Université.
L’emploi et la qualité du français dans les sites Web
Les techniques des moteurs de recherche
Vers une génération automatique du mapping de sources biomédicales
Réunion de lancement du 18 janvier constitution, alignement, comparaison et exploitation d’ontologies géographiques hétérogènes Réunion de lancement.
Direction de la normalisation terminologique (DNT) Mai 2010 La terminologie : une passion, des métiers !
Supports de formation au SQ Unifié
CoRRecT : Démarche coopérative pour l’évaluation de systèmes de reconnaissance de termes Chantal Enguehard IRIN – Université de Nantes 2 rue de la Houssinière.
Agenda de la présentation
Réunion des directeurs d’unités ST2I 30 octobre 2007 Réseau Doc-ST2I Missions et perspectives (MI2S)
Martine Toussaint Desir
Master 2 COGNITION LANGAGE EMOTIONS, Spécialité CLE Responsable : Pr.F.Labrell Laboratoire d’adossement : CLEA (Cognition, Langage, Emotions et Acquisitions)
Tel : +33 (0) Création L&M : 2002 Capital : € Lauréat OSEO-ANVAR 2001 et er Prix LangTech.
1 Management des unités commerciales Management des unités commerciales LANGUE VIVANTE ÉTRANGÈRE I - coefficient 3 L’usage d’un dictionnaire bilingue est.
Dominique LAURENT Patrick SEGUELA
Présentation Finale Spirit 07 / 03 / 2011 Groupe Vert 1 Equipe Verte.
Recherche d’information
Stratégie de maintenance S8
1 PAM – HTML5 - Sémantique. 2 Contexte Groupe IHE-PAM-Fr publie annuellement au format Pdf l’annexe française du profil PAM. Ce document contient la spécification.
TEXT MINING Fouille de textes
1 Construction de ressources terminologiques à partir de textes : études de cas Nathalie AUSSENAC-GILLES (CNRS, Toulouse) Didier BOURIGAULT (CNRS, Toulouse)
Une méthode pour la construction d’ontologies à partir de textes
ETI Département de traitement informatique multilingue Présentation ASTTI Neuchâtel, 7 juin 2011 Les outils d’aide à la traduction: peut-on s’équiper à.
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
Le Traitement Automatique des Langues (TAL)
I-expo 9 juin 2004 Les référentiels métier à l’heure de la mobilité professionnelle et géographique Table Ronde.
Architectures articulant des représentations hétérogènes L’exemple de Gate (Mini tutoriel, journée Atala du 12 février 2005) Thierry Poibeau LIPN (CNRS.
Introduction générale
CURSUL 9 VI. LES COMPÉTENCES DE L’APPRENANT Le Développement des compétences linguistiques, sociolinguistiques, pragmatiques.
Transcription de la présentation:

Yasmina ABBAS EDF - Division Recherche et Développement (Division R&D) LEXTER Logiciel d’extraction de terminologie WORLDTREK ED Interface d’édition de terminologie Yasmina ABBAS EDF - Division Recherche et Développement (Division R&D)

Journées ATALA - CHU de la Pitié-Salpêtrière Le contexte Développement initial (1990 - 1994) Thèse de D. Bourigault à EDF - Direction Etudes et Recherches (DER) Utilisation et développement à EDF - DER (1994 - 1996) Depuis 1996 Utilisation à EDF - DER Utilisation et développement à l’ERSS de Toulouse Disponibilité Propriété d ’EDF Licences délivrées aux laboratoires de recherches Contacts Henry Boccon-Gibod henry.boccon-gibod@edf.fr Daniela Garcia daniela.garcia@edf.fr 29/11/99 Journées ATALA - CHU de la Pitié-Salpêtrière

Journées ATALA - CHU de la Pitié-Salpêtrière LEXTER analyseur syntaxique robuste dédié au repérage de syntagmes nominaux pour corpus spécialisé pour la constitution de ressources terminologiques thesaurus index référentiels terminologiques ontologies 29/11/99 Journées ATALA - CHU de la Pitié-Salpêtrière

Journées ATALA - CHU de la Pitié-Salpêtrière Le pré-traitement du corpus Nettoyage des fichiers Word et enregistrement en format RTF 1 Macro Word Conversion des fichiers textes format RTF en HTML 2 Rtf_to_Html Découpage des fichiers HTML en unités textuelles précédées d ’un identifiant 3 Html_to_UT 4 Etiquetage ( Sylex® , Cordial®...) Etiquetage des phrases 29/11/99 Journées ATALA - CHU de la Pitié-Salpêtrière

Journées ATALA - CHU de la Pitié-Salpêtrière Le traitement LEXTER Deux étapes découpage : identification de syntagmes nominaux maximaux par repérage de frontière. décomposition : décomposition syntaxique binaire (Tête Expansion) des syntagmes nominaux maximaux. Principe : apprentissage endogène acquisition automatique d’information de sous-catégorisation pour résoudre les ambiguïtés de rattachement. Sortie : un réseau de candidats termes Réseau exploitable par : ZELLIG (B. Habert) LEXICLASS (H. Assadi) FASTR (C. Jacquemin) SYNOTERM (T. Hamon) 29/11/99 Journées ATALA - CHU de la Pitié-Salpêtrière

Journées ATALA - CHU de la Pitié-Salpêtrière HTL Boutons de validation Candidats termes Unités textuelles Décomposition 29/11/99 Journées ATALA - CHU de la Pitié-Salpêtrière

Journées ATALA - CHU de la Pitié-Salpêtrière WORLDTREK ED 29/11/99 Journées ATALA - CHU de la Pitié-Salpêtrière

Journées ATALA - CHU de la Pitié-Salpêtrière Des exemples d’applications à EDF Le Référentiel Méthodologique d’Ingénierie (RMI-DE) Le projet : Harmonisation et mise en cohérence de l’ensemble des documents liés aux métiers de l’ingénierie (doctrines, dictionnaires, thesaurus, …) de la Direction de l’Equipement d’EDF ( aujourd’hui Division Ingénierie & Services ) L’application : Construction d’une terminologie de référence dans le cadre de ce projet pour être intégrée dans une application d’aide à la rédaction. Le corpus : Dossiers de Systèmes Elémentaires (DSE) (documentation des centrales nucléaires) représentant 18.000 pages de documents organisés par systèmes élémentaires. Ils sont multi-auteurs et homogènes sur le plan de la structure. Le traitement : Analyse du corpus, extraction des candidats termes, validation auprès des experts de la Direction de l’Equipement et structuration des termes en domaines et sous-domaines. Les Systèmes de Consultation de la Documentation technique (SCDT) 29/11/99 Journées ATALA - CHU de la Pitié-Salpêtrière

Journées ATALA - CHU de la Pitié-Salpêtrière Des exemples d’applications hors EDF Service informatique de l ’hôpital Broussais Société ANACOM Centre de terminologie et néologie (CTN) du LLI Paris XIII Centre de Recherches en Ingénierie Multilingue (CRIM) de l ’Inalco XEROX Grenoble (XRCE), CRIM de l ’Inalco et CTN Société LEXICON PLANETE Département informatique de l ’hôpital de la Pitié-Salpêtrière Groupe « terminologie et intelligence artificielle » Projet de recherches sur l ’aide au codage des comptes rendus d ’anatomie pathologique Travaux pratiques d’alignement terminologique (DESS) Projet de construction d ’un lexique bilingue français-anglais sur les droits de l ’Homme Evaluation des méthodes d’alignement terminologique développées au Centre de recherches XEROX de Grenoble Construction d’un glossaire pour une société d ’assurances Tests pour l’enrichissement d’un dictionnaire bilingue Construction de l ’index d’un ouvrage collectif sur l ’Ingénierie des conaissances publié chez Eyrolles Participation à un projet de construction de thesaurus sur l ’ingénierie linguistique pour le Web (soutenu par la Délégation Générale à la Langue Française 29/11/99 Journées ATALA - CHU de la Pitié-Salpêtrière