Utilisation et utilité d’un extracteur de dépendances

Slides:



Advertisements
Présentations similaires
MOT Éditeur de modèles de connaissances par objets typés
Advertisements

La recherche documentaire
Les formateurs en documentation Rectorat de Lille Maîtrise de linformation au collège Compétences informationnelles et disciplines partenaires.
Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.
Olivier Kraif, Agnès Tutin LIDILEM
BCDI UTILISER LE THESAURUS POUR FAIRE UNE RECHERCHE
Le Contexte Fédération des acteurs des montagnes françaises pour la promotion et la communication touristique générique de celles-ci pour les quatre saisons.
C’est vs. Il est/Elle est, C’est vs. ça, c’est vs. ce sont
Gérer l'autoformation guidée
Indexation vidéo Indexation multimédia
DEME - La méthode d’enquête – introduction
Etude de la dynamique des groupes et des objets intermédiaires de conception, en s’appuyant sur la dynamique de l’émergence des état problèmes Reza MOVAHEDKHAH,
Utilisation de l’information brevets dans
SYSTRAN Un outil du TAL Victoria AUPERT Marjorie LORSUNG.
Les outils du TAL Par RIGAUD Anaïs RALLIER Armelle SANTIAGO Gwendoline
Université Paris XII - IUP SIAL maîtrise Breton Elodie – Royer Gwladys
La démarche clinique infirmière
Jean-Christophe PAZZAGLIA
ETAPES DE LA RECHERCHE DOCUMENTAIRE
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
ORGANISATION INTERNATIONALE DU TRAVAIL Service des conditions de travail et demploi (TRAVAIL) 2012 Module 13: Evaluation de la protection de la maternité
Initiation à la conception des systèmes d'informations
Sandra Breux Université Laval
LITTERATURE SCIENTIFIQUE STRATÉGIES DE RECHERCHE PMSS
UE : 3.4. S4 Initiation à la démarche de recherche
I NTRODUCTION AU P LAIDOYER : G UIDE DE F ORMATION Ritu R. Sharma Women Thrive Worldwide Ritu R. Sharma Women Thrive Worldwide.
Annotations sémantiques pour le domaine des biopuces
Recherche Documentaire et traitement de l’information
VOC 1 CE2 Je sais utiliser des mots de la vie quotidienne.
A L I M E N T A T I O N A G R I C U L T U R E E N V I R O N N E M E N T Réseau BD 11/12/08 Hibernate Search Réunion dunité – 23/10/2008 Erik Kimmel.
MOT Éditeur de modèles de connaissances par objets typés
Moteur de recherche d’information
Reconnaissance Vocale
IFT313 Introduction aux langages formels Froduald Kabanza Département dinformatique Université de Sherbrooke Grammaires attribuées.
1 DTSI / Service Cognitique Robotique et Interaction OUTILEX Démonstrateur du CEA-LIST : moteur d'interrogation crosslingue (français, anglais, espagnol)
Le Sémiographe Outil générique pour effectuer des opérations texte sens texte ou texte sens actions
Systeme Question-Reponse SQR
Les techniques des moteurs de recherche
Recherche en corpus de réponses à des questions définitoires Véronique Malaisé Thierry Delbecque Pierre Zweigenbaum TALN 2005, Dourdan.
Les pronoms relatifs.
Sujet Objet Les pronoms interrogatifs et relatifs
Improving large-scale search engines with semantic annotations Damaris Fuentes-Lorenzo, Norberto Fernández, Jesús A. Fisteus, Luis Sánchez.
Dominique LAURENT Patrick SEGUELA
Recherche d’information
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
Reveal-This Ou comment générer des métadonnées utiles automatiquement.
Le verbe être je suis tu es …en forme il/elle est …fatigué(e)
La recherche.
LITTERATURE SCIENTIFIQUE STRATEGIES DE RECHERCHE PMSS
+ Français 2 SAY WHAT??. + Dans une question…? To express the question « what » in French, we use qu’est-ce qui or qu’est-ce que. Quelle est la différence?
Services en Text Mining. Introduction : Qui est Mentis ? Mentis a été fondée en 2005 comme une société spin-off du Laboratoire d'I ntelligence Artificielle.
TEXT MINING Fouille de textes
JDD 2005 Utilisation et Constitution de Ressources Sémantiques pour la Recherche d'Informations Précises. Vincent Barbier, groupe LIR Langues, Information.
Moteurs et métamoteurs de recherche
8 Les pronoms interrogatifs et relatifs Les normes: Communication 1.2 Comparisons 4.1 Les questions essentielles: - What are the 2 ways to ask the question.
Le Traitement Automatique des Langues (TAL)
Modélisation de l’inférence et application à un système de question-réponse Anne-Laure Ligozat Groupe LIR Directrice : Michèle Jardino Encadrante : Isabelle.
8 Les pronoms interrogatifs et relatifs Les normes: Communication 1.2 Comparisons 4.1 Les questions essentielles: - What are the 2 ways to ask the question.
Cette animation présente la méthode à utiliser en SVT
IFT – Ingénierie des connaissances Exposé d’article
Apéro Techno Romain Maragou - Aliou Sow Web sémantique.
Appariement syntaxique question-réponse Séminaire groupe LIR 21/10/2003.
Superlatives Regular and Irregular. Overview Superlative adverbs express the idea that something is “the most __________” OR “the least ___________.”
Introduction à la rédaction Scientifique
 Persuasive Essay Unité 1- Les valeurs sociales et les traditions Le Télétravail.
MES STRATÉGIES DE LECTURE
KOSMOS 1 Outils transversaux Module 7 1.L’annuaire 2.La recherche d’informations 3.La réservation de ressources.
1 4th International Conference on Arabic Language Processing, May 2–3, 2012, Rabat, Morocco Titre Mohamed El Amine ABDERRAHIM Mohamed Alaedine ABDERRAHIM.
Compétences informationnelles Choisir ses sources Connaître les outils de repérage.
Active Learning for Natural Language Parsing and Information Extraction, de Cynthia A. Thompson, Mary Elaine Califf et Raymond J. Mooney Philippe Gambette.
Transcription de la présentation:

Utilisation et utilité d’un extracteur de dépendances Claude Roux

Analyse Syntaxique L’analyse syntaxique représente traditionnellement l’information sous la forme d’un arbre. La configuration de l’arbre est aussi une interprétation sémantique. Difficulté de représenter une information dispersée (Latin) Pulchram domina rosam amat

Représentation sous la forme d’un graphe de dépendance Qu’est qu’une dépendance ? C’est une relation entre les mots d’une phrase, indépendemment de la position de ces mots. La maîtresse aime la belle rose Pulchram domina rosam amat Épithète(rose,belle) Épithète(rosam,pulchram) Sujet(aime,maîtresse) Sujet(amat, domina)

Extraction de dépendances Première phase: le groupage La dame aime la belle rose Pulchram domina rosam amat

Extraction de dépendances Deuxième phase: l’extraction Par configuration de noeuds épithète(rose,belle) Sur la base de traits semblables épithète(rosam,pulcram)

Différentes générations d’outils IFSP (Incremental Finite-State Parser) Salah Ait-Mokhtar & Jean-Pierre Chanod (1998) Anglais Français Espagnol XIP (Xerox Incremental Parser) Salah Ait-Mokhtar, Jean-Pierre Chanod, Claude ROUX (2001)

Désambiguïsation sémantique Frédérique Segond, Caroline Brun XRCE Grenoble Définition (cf. (Ide&Véronis98)) Associer à un mot dans un texte une définition ou un sens qui se distingue des autres sens potentiellement associables à ce mot. 2 étapes sont nécessaires : déterminer tous les sens d’un mot assigner le sens approprié à ce mot dans le contexte du discours

Désambiguïsation sémantique United State federal agents seized a surface-to-air rocket launcher, a rocket motor, rangefinders and a variety of military manuals. Analyse syntaxique donne: SUJET(seize,agent) COD(seize,launcher) Règle (construite grâce au dictionnaire): Si Sujet(seize,humain) et COD(seize,arme) Alors SENS(I.4)=saisir seize Sens I Verb. Trans. 4. Jur saisir [arm,drugs]

Extraction d’information Campagne Amaryllis (2000) David Hull, Eric Gaussier, Gregory Greffenstette, Claude Roux Recherche d’information en français et traitement automatique des langues (TAL 2000) Utilisation d’information syntaxique dans la recherche d’information Les documents sont indexés sur la base des mots qu’ils contiennent plus les dépendances qui lient ces mots entre eux. Exemple: Les joueurs convient les membres de leur équipe. Indexation sur les chaînes suivantes: joueur, convier, membres, équipe, SUJET(convier,joueur), COD(convier,membre), COMPNOM(membre,équipe)

Extraction d’information Campagne Amaryllis (2000) David Hull, Eric Gaussier, Gregory Greffenstette, Claude Roux Recherche d’information en français et traitement automatique des langues (TAL) Mesure de rappel et de précision n’est pas vraiment améliorée. En revanche, un résultat important: L’examen des dix premiers documents montre que l’utilisation de cette méthode d’indexation augmente la pertinence de ceux-ci. Autrement dit, dans le cadre d’une recherche d’information, on améliore la présentation des documents, en propulsant en tête, les documents les plus pertinents. Cela correspond aux habitudes des utilisateurs des moteurs de recherche qui examinent rarement les pages situées au-delà du premier écran de réponse.

Munnin Denys Proux (Thèse de doctorat 2000) Extraction de faits sur la génétique à partir d’articles sicentifiques dans le domaine (en anglais) Les gènes et les protéines peuvent être identifiées en fonction de leur contexte syntaxique Utilisation de patrons syntaxiques

Munnin Denys Proux Synthesis: Sélection d’un extrait d’un article scientifique: “Pka-C1 is a component of the signalling pathway that represses dpp expression in the anterior compartment in appendage imaginal discs and anterior to the morphogenetic furrow in eye discs. ” Extraction d’information repress (Acteur) (Cible) dpp ? (relier_à) (Lieu) imaginal disc eye Pka-C1 Synthesis: Action: repress Acteur: Pka-C1 Cible: dpp Lieu : imaginal disc Lieu: eye disc

Conclusion L’analyse syntaxique permet d’affiner la recherche d’information Elle offre aussi un concours précieux dans le cadre de l’extraction d’information en offrant des patrons plus raffinés que le simple pattern matching Démonstration de Xerox Incremental Parser