1 DTSI / Service Cognitique Robotique et Interaction OUTILEX Démonstrateur du CEA-LIST : moteur d'interrogation crosslingue (français, anglais, espagnol)

Slides:



Advertisements
Présentations similaires
France Telecom Matthieu Leclercq
Advertisements

1Er Partie Intervenants : Nuno Barata Alain Joly Thierry Belvigne
« Les Mercredis du développement » Introduction Office « 12 » Présenté par Bernard Fedotoff Microsoft Regional Director Agilcom.
Open Days 2006 Le Web 2.0 demain: produits, technologies, outils.
Affichage interactif, bidimensionnel et incrémental de formules mathématiques Hanane Naciri et Laurence Rideau INRIA Sophia Antipolis CARI'2000.
Virtualisation dorchestration de services TER Master 1 Infomatique 4 Avril 2008 Encadrant : Philippe Collet.
Introduction Aux Systèmes dInformation et Multimédia T. Bourdeaudhuy S. Collart-Dutilleul P. Kubiak IG 2 I - Saison 2006/2007 ASP / Pages Web Statiques.
Cours n°2M2. IST-IE (S. Sidhom) UE 303 Promo. M2 IST-IE 2005/06 Conception dun système d'information multimédia Architecture trois-tiers : PHP/MySQL &
Les outils du TAL Par RIGAUD Anaïs RALLIER Armelle SANTIAGO Gwendoline
Par Aline Mahot et Charlyne Routier
VI50 – TP3 Introduction à Virtools. Virtools Virtools Media Design 3DS, Maya, Lightwave… Sound Design wav, mp3… Texture, 2D interface jpg, bmp… Specific.
11:16:331 Programmation Web Programmation Web : Formulaires HTML Jérôme CUTRONA
Travaux pratiques sur Nooj
Cordial, le TAL et les aides à la rédaction
Introduction à l'informatique linguistique
Projet 29 Product Tagger Tuteur : Michel Benoît Groupe : - Simon Giron - Vincent Reuss - Jérémie Simian Annee :
D1 - 19/05/2014 Le présent document contient des informations qui sont la propriété de France Télécom. L'acceptation de ce document par son destinataire.
Algo-Prog en Ada TD2 2 MIC Romaric GUILLERM
Services fournis par le SI et technologies associées
La communication de ce document est soumise à autorisation de France Télécom R&D (Nom du fichier) - D1 - 01/03/2000 France Télécom R&D Énoncé Représentation.
Project de la langue française
Vers des composants TAL réutilisables
Moteur de recherche d’information
Les applications évoluées (traduction automatique) nécessitent beaucoup d'informations lexicales : délimitation des mots composés, lemmes... Cela fait.
OUTILEX Présentation des résultats
24 Novembre 2006 Laboratoire dInformatique de Paris 6 Moteur de recherche XML pour la plateforme Outilex.
Démonstrateur Lingway
Date / references Systèmes Terre et Interarmées Projet OUTILEX Rapport détude final Octobre 2006.
Le Sémiographe Outil générique pour effectuer des opérations texte sens texte ou texte sens actions
Yasmina ABBAS EDF - Division Recherche et Développement (Division R&D)
Utilisation et utilité d’un extracteur de dépendances
Révisions - IA Généralité: problèmes de lIA Recherche Logique Traitement de lincertitude Apprentissage Langue naturelle.
Web dynamique PhP + MySQL AYARI Mejdi 2006
Forum des Industries de la Langue, 17 mars 2010
Module 5 : Publication de ressources dans Active Directory
Chapitre 3 Syntaxe et sémantique.
Chapitre 2 La description du langage
Le portail web netUniversité
Introduction à lutilisation des corpus 1. Quest-ce quun corpus? Alexandra VOLANSCHI
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
Recherche par mots-clés vs recherche en langue naturelle.
Patrons de conceptions de créations
L’enseignement des compétences grammaticales
Supports de formation au SQ Unifié
Jeu de Librairies Virtuelles « DLL » Windows pour la réalisation de programmes informatiques.
1 Présentation. 2 Sommaire Flots de données Evolutions Conclusions.
Plan Définitions et exemples Composants de cluster
Réalisé par : Mr IRZIM Hédi Mr JRAD Firas
L’observation réfléchie de la langue
L’utilisation d’outils de traitement automatique de la langue naturelle dans le domaine de la terminologie: une voie d’optimisation de ressources 1.
Théories, formalismes, modèles Sylvain Kahane Modyco, Université Paris 10 - Nanterre Mosaïque, Paris, 1/12/2006.
Architecture d’une application WEB Statique:
Dominique LAURENT Patrick SEGUELA
Présentation Finale Spirit 07 / 03 / 2011 Groupe Vert 1 Equipe Verte.
Présentation Finale Spirit 07 / 03 / 2011 Groupe Vert 1 Equipe Verte.
MOCK.
Moteur de recherche sémantique basé sur les fonctions lexicales
Toolkit WEB de contrôle en SVG Equipe Koala d’ILOG Encadré par Colas Nahaboo Isabelle LAFAYE.
Initiation à Oracle Server
Les outils Multidimensionnels SAS ® 9 Atelier Technique SAS ® Eric WOLFF Jeudi 2 juin 2005.
ORGANISATION DE L’ENSEIGNEMENT
Apéro Techno Romain Maragou - Aliou Sow Web sémantique.
Architectures articulant des représentations hétérogènes L’exemple de Gate (Mini tutoriel, journée Atala du 12 février 2005) Thierry Poibeau LIPN (CNRS.
Introduction à la Recherche
Internet Le Réseau des Réseaux Découverte & utilisation.
Visual Information Solutions IDL 7.0 Pour une utilisation optimale d’IDL.
Les bases de données Séance 4 Construction du Modèle Physique (la BDD)
ARIANE : Interopérabilité sémantique et accès aux sources d'information sur Internet Sylvain Aymard, Michel Joubert, Dominique Fieschi, Marius Fieschi.
Révisions pour l’exam L2 Informatique Obligatoire.
Transcription de la présentation:

1 DTSI / Service Cognitique Robotique et Interaction OUTILEX Démonstrateur du CEA-LIST : moteur d'interrogation crosslingue (français, anglais, espagnol) Romaric Besançon 24/11/2006

2 DTSI / Service Cognitique Robotique et Interaction Moteur d'interrogation crosslingue du CEA-LIST

3 DTSI / Service Cognitique Robotique et Interaction Moteur d'interrogation crosslingue du CEA-LIST Intégration OUTILEX

4 DTSI / Service Cognitique Robotique et Interaction Analyseur linguistique LIMA traitement modulaire chaîne de traitements unités de traitements se passant la structure d'analyse du texte (graphe du texte analysé) chaîne dépendant de la langue Intégration des librairies OUTILEX création de nouvelles unités de traitements faisant appel aux librairies OUTILEX structure d'analyse : automate du texte conversion de structure pour la désambiguïsation morpho- syntaxique et l'analyse syntaxique

5 DTSI / Service Cognitique Robotique et Interaction Intégration d'OUTILEX dans l'analyseur LIMA tokeniseur dictionnaire expressions idiomatiques entités nommées Pos-tagging analyse syntaxique

6 DTSI / Service Cognitique Robotique et Interaction Intégration d'OUTILEX dans l'analyseur LIMA tokeniseur dictionnaire expressions idiomatiques entités nommées Pos-tagging analyse syntaxique tokeniseur dictionnaire expressions idiomatiques entités nommées conversion structure tokeniseur OUTILEX dictionnaire OUTILEX grammaires OUTILEX grammaires OUTILEX

7 DTSI / Service Cognitique Robotique et Interaction Adaptations des ressources linguistiques Définitions des propriétés linguistiques définition du fichier de configuration des propriétés linguistiques de la langue (lingdef) Dictionnaires de langue conversion des dictionnaires au format OUTILEX Règles de reconnaissance des expressions idiomatiques, verbes composés et entités nommées conversion des règles au format CEA-LIST (expressions régulières avec déclencheur) en règles au format OUTILEX beau:&avoir$L_V [$L_ADV?]:faire:IDIOM:

8 DTSI / Service Cognitique Robotique et Interaction Démonstrateur Moteur d'interrogation crosslingue français, anglais, espagnol dépêches de l'AFP collectées en août 2006 (entre 400 et 800 par langue) architecture client-serveur et interface Web