Démonstrateur Lingway

Slides:



Advertisements
Présentations similaires
La recherche documentaire
Advertisements

PROBLÉMATIQUE DU BILINGUISME Programme de Travail
Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.
Thème 3 : plate-forme de modélisation et de gestion de référentiels XML étapes modélisation des structures (UML) gestion du référentiel de modélisation.
Maîtrise de chimie : Travaux d Etudes et de Recherche Découvrir la nécessité, à partir dun exemple sur internet, détayer une information, un résultat,
Olivier Kraif, Agnès Tutin LIDILEM
Thésaurus juridique, catégorisation de textes
Urbanisation de Systèmes d'Information
Utilisation didactique des extractions lexicales des corpus
2002 Compétitif XMiner : Plate-forme de structuration texte libre multi-approches par balisage XML de Tags Actifs Lobjectif du projet est de développer.
ANDRE Marine DABIN Julie WATERLOT Amandine
TRAITEMENT AUTOMATIQUE DES LANGUES : LES PRINCIPAUX PROGRAMMES
SYSTRAN Un outil du TAL Victoria AUPERT Marjorie LORSUNG.
Les outils du TAL Par RIGAUD Anaïs RALLIER Armelle SANTIAGO Gwendoline
Base de Données "Titres" Projet "Visu" Réalisée dans le cadre de la maîtrise IL.
Apprentissage initial de la lecture
Indexation textuelle : Systèmes de recherche d’informations
Proposition de projet I4, ESIEE, Novembre 2012
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
Quelques règles à respecter pour concevoir une présentation dynamique et sobre Dans un cadre scolaire D. G. Formation APEP
1 Bienvenue Démonstration flash.
Les échelles.
GED Masters: Gestion Électronique de Documents
Pour un système formel de description linguistique
Comment trouver sur Internet?
Il faut… DES SAVOIR-FAIRE!!!
Loïc Thibaut, 05/2002 STATBASE un outil générique pour la gestion de statistiques de pêche dorigines multiples THIBAUT Loïc, CHAVANCE Pierre, DAMIANO Alain.
Présentation du document programme. Fonction du document programme Une feuille de route fixant : Les axes stratégiques La démarche daccompagnement Les.
Bases de données lexicales
Vers des composants TAL réutilisables
Moteur de recherche d’information
Projet Lucene 22 avril 2011 Acquisition de Connaissances 2
Gouvernement du Québec Présentation par : Alain Thibault : PDG Efoé Wallace : Directeur du développement.
OUTILEX Présentation des résultats
24 Novembre 2006 Laboratoire dInformatique de Paris 6 Moteur de recherche XML pour la plateforme Outilex.
1 DTSI / Service Cognitique Robotique et Interaction OUTILEX Démonstrateur du CEA-LIST : moteur d'interrogation crosslingue (français, anglais, espagnol)
Date / references Systèmes Terre et Interarmées Projet OUTILEX Rapport détude final Octobre 2006.
Le Sémiographe Outil générique pour effectuer des opérations texte sens texte ou texte sens actions
Yasmina ABBAS EDF - Division Recherche et Développement (Division R&D)
Mise en oeuvre dun outil original daide en ligne à la lecture de textes en langue étrangère. G. Deville - M. Miceli (Ecole des Langues Vivantes - FUNDP)
Titre de la diapositive Unité mixte de recherche 7118 Accueil diaporama.
Travail préparatoire > Processus de recherche dinformation LeBlanc, L.; Boisvert, D.; Séguin, C. ; Laframboise, M.-R. et Tardif, G. (2007). Méthodes de.
Le projet de terminologie
Recherche par mots-clés vs recherche en langue naturelle.
DEMONSTRATIONS – (si internet ne marche pas)
Qu'est ce que savoir lire ?
Les techniques des moteurs de recherche
Qu’est ce que lire? L’apprentissage de la lecture passe par le décodage et l’identification des mots conduisant à leur compréhension. Déchiffrer des mots.
Réaliser et diffuser un projet intégrant les TIC
Existe-t-il une rééducation de la dyslexie ?
Vers une analyse syntaxique à granularité variable Tristan Van rullen
L’observation réfléchie de la langue
1/20 19/04/2015 Visualisation et Navigation dans les Bases de Données dictionnairiques Mathieu Mangeot-Lerebours XRCE & GETA-CLIPS
Services en Text Mining. Introduction : Qui est Mentis ? Mentis a été fondée en 2005 comme une société spin-off du Laboratoire d'I ntelligence Artificielle.
TEXT MINING Fouille de textes
Panorama fonctionnel et technique des outils avancés
Se repérer et organiser sa veille dans la recherche en éducation Module 2 « Maîtriser l’accès aux ressources scientifiques en éducation » Introduction.
Le Traitement Automatique des Langues (TAL)
Les outils Multidimensionnels SAS ® 9 Atelier Technique SAS ® Eric WOLFF Jeudi 2 juin 2005.
Architectures articulant des représentations hétérogènes L’exemple de Gate (Mini tutoriel, journée Atala du 12 février 2005) Thierry Poibeau LIPN (CNRS.
Introduction à la Recherche
Marie-Claude Corriveau Octobre 2015 Formation documentaire COM-7009 Méthodologie.
NEDERLEX : un outil en ligne d'aide à la lecture de textes en langue étrangère. G. Deville - M. Miceli (Ecole des Langues Vivantes - FUNDP) L. Dumortier.
Qu’est-ce que la géographie ? o Le travail du géographe o Les documents de la géographie o Le vocabulaire de la géographie La Classe des gnomes.
Bertrand Richet ENS Lyon, 24 janvier 2012 Des nombres en lumière - ENS Lyon, 24 janvier
KOSMOS 1 Outils transversaux Module 7 1.L’annuaire 2.La recherche d’informations 3.La réservation de ressources.
L’enseignement moral et civique
CURSUL 9 VI. LES COMPÉTENCES DE L’APPRENANT Le Développement des compétences linguistiques, sociolinguistiques, pragmatiques.
GEOMETRIE du cycle 1 au cycle 3 quelques pistes
Transcription de la présentation:

Démonstrateur Lingway Projet RNTL Outilex Démonstrateur Lingway

>participation à Outilex Intérêt: disposer d’outils puissants et rapides pour l’analyse locale des phrases Reconnaissance « floue » de mots composés Syntaxe locale (« chunking ») Pour utiliser pleinement le dictionnaire dans un moteur de recherche « orienté métier » C’est-à-dire intégrant une forte proportion de vocabulaire spécifique (« jargon »)

>résultats Un module de reconnaissance de mots composés « flou » intégré dans l’analyseur linguistique de Lingway Composant commun à tous les produits Lingway Un module d’extraction de candidats termes intégré dans le produit Lingway KM Visible sur http://demo.lingway.com/lkm

>Reconnaissance de mots composés Variabilité du phénomène Du composé figé (« pomme de terre ») … à l’entrée de thésaurus (« politique agricole ») Importance de reconnaître les composés Pour leur associer d’autres mots dans le lexique « politique agricole » -> PAC Sous une grande diversité de formes Combinatoire à gérer par des règles Besoin d’efficacité

>exemple Sur Lingway KM http://demo.lingway.com/lkm Requête: « politique économique et agricole européenne » Analyse: « politique économique et politique_agricole européenne »

>chunking (en français: « analyse en syntagmes élémentaires ») Notion introduite par Abney en 1991 Utilisation de règles simples pour identifier des termes libres dans un texte Règles formalisables comme des expressions régulières sur les mots (ou leurs catégories) Intérêt: associer des axes de navigation dans le moteur de recherche à partir de l’analyse des textes

>Implémentation dans Lingway KM Les « chunks » sont extraits des textes analysés Des algorithmes statistiques permettent de sélectionner Les bons termes pour un document donné Les bons termes pour le corpus Présentation comme axes de navigation ou sous forme graphique

>actualité de la PAC…