1 Un dérivé de l’Extraction d’Information Les systèmes de Question/Réponse (Question Answering / Answer Extraction)

Slides:



Advertisements
Présentations similaires
Proposition de recherches sur ABI (Pro Quest) Lise Herzhaft (Urfist de Lyon) et MH Prévoteau (Bibliothèque Université Paris 2) Mise en forme par Nolwenn.
Advertisements

Corese Moteur de recherche sémantique pour RDF
Le langage de requêtes SPARQL SPARQL Protocol And RDF Query Language
Understanding, building and using ontologies. Understanding Ontologie : la définition des concepts utilisés dans un langage donné Première approche (Gruber)
Les ressources documentaires électroniques : Cemadoc et le portail IST Emilie Gentilini Journée des nouveaux arrivants 3 mai 2010.
1 TICE 2000 / Troyes / octobre 2000 Des moteurs de recherche efficaces pour des systèmes hypertextes grâce aux contextes des nœuds Des moteurs de.
La Recherche en Ligne.
External Communication Plan Energy Europe Division March 2009
Contrôles d'accès aux données
En classelundi 8 octobre La voix passive Looking at the passive voice and introducing all the tenses for AS/A2.
Du dictionnaire informatisé au système dinformation lexical intégré Serge Verlinde Institut des langues vivantes K.U.Leuven X papier Le dictionnaire nouveau.
Annotations sémantiques pour le domaine des biopuces
Comment optimiser la visibilité de vos contenus sur les principaux moteurs de recherches ? Rédaction de contenus SEO friendly Publication on-line.
OIL & UPML DREVET - HUMBERT Introduction OIL : un langage de description dontologies UPML : un langage de description de systèmes à base.
G-RDF WEB SEMANTIQUE.
BIO1530 Lab2 Littérature scientifique. Objectifs de lexercice Après avoir complété cet exercice, vous devriez être en mesure de: Déterminer si une publication.
Systeme Question-Reponse SQR
NOTES: R 4, R 5, R 6, & MAKE UP QUIZZES Over F 1 vocab, song. Time? Over pg orally for oral points! H/W: Study French 1 vocabulary & R4-6 for vocabulary.
La recherche sur le Web Améliorer sa performance Compétences informationnelles – Activité 13 - Documentation Module 3: les moteurs académiques: Google.
La recherche sur le Web Améliorer sa performance Compétences informationnelles – Activité 13 - Documentation Module 3: les moteurs académiques: Google.
Introduction à lutilisation des corpus 2. Comment constituer un corpus?
1 Example of a test Go S. Onillon
IFT6255 – Recherche d’information Jian-Yun Nie
Comment réaliser une recherche documentaire
Introduction dans la Programmation Web
2.1 Le sujet et la question de recherche
Aujourd’hui, c’est mercredi, le 2 mai Objectifs: use aller + infinitive to tell what you are going to do in the near future; use the prepositions to/in/at.
Présentation du projet edot Revue intermédiaire - 29 Juin 2004.
Objectifs  Auteur non mentionné  Informations erronées  Mise à jour peu fréquente  Navigation difficile  Publicité intrusive  Atteinte à la vie.
Littérature scientifique
Les moteurs de recherche Paul de Theux. Sommaire Google: leader presque incontesté Fonctionnement Syntaxe Limites.
UFD 62. EC2 : cours n° 3 Gestion Electronique des Documents Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de recherche KIWI – LORIA
Bibliothèque Saint-Jean Session de formation sur Web of Science® 6.1 vendredi, 16 janvier 2003 Présentée par: Diane DeLongchamp et Kim Frail.
TPE P ersonnel (BO du MEN n°41 du 10 nov 2005, Définition des modalités d’évaluation des TPE au baccalauréat, séries ES, L et S) “Recherche de sources.
© 2011 Association for Computing Machinery Présentation générale de la Librairie Numérique (DL) d’ACM DL The ACM Digital Library is the world’s leading.
Réunion de lancement du 18 janvier constitution, alignement, comparaison et exploitation d’ontologies géographiques hétérogènes Réunion de lancement.
Soutenance de Thèse Mardi 13 Décembre 2005 Analyse des documents graphiques, une approche par reconstruction d’objets Mathieu Delalandre Mardi 13 Décembre.
MEMOIRE INDUSTRIEL ESIEA
C’est combien ? Les euros
II. Nouvelles tendances en RI
Improving large-scale search engines with semantic annotations Damaris Fuentes-Lorenzo, Norberto Fernández, Jesús A. Fisteus, Luis Sánchez.
Dominique LAURENT Patrick SEGUELA
Recherche d’information
AFNOG Rabat MAROC1 Perte du Mot de passe Enable.
Reveal-This Ou comment générer des métadonnées utiles automatiquement.
Forming questions in French
Les Mots Interrogatifs
 Formulaires HTML : traiter les entrées utilisateur
Soutenance du mémoire de synthèse
WALT: how to talk about your timetable
La mémoire(1): Comment bien travailler
Le 4-7 novembre. Qui est présent? Quelle heure est-il? La feuille pour étudier L’examen La Jéopardie!
Christina Arecy April 10 th  In the standard dictionary, the term legacy is define as a gift by will especially of money or other personal property.
Objectifs: To say what you would like to do and why. To do this we will: refer accurately to the present and future extend sentences by giving reasons.
TEXT MINING Fouille de textes
Le Traitement Automatique des Langues (TAL)
la classe de français le 11 mai, 2015
1. Est-ce que Est-ce que, literally translated "is it that," can be placed at the beginning of any affirmative sentence to turn it into a question: Je.
J’ai une question! Objectifs: 1) Poser une question de 3 manières différentes 2) Parler de votre famille.
Apéro Techno Romain Maragou - Aliou Sow Web sémantique.
Conférences (CR) PACLING'03 Pacific Association for Computational LINGuistics 22 au 25 août 2003 Halifax, côte Est Canada RANLP Recent Advances in Natural.
A L I M E N T A T I O N A G R I C U L T U R E E N V I R O N N E M E N T ProdInra en Web sémantique Esther Dzalé Y. Kaboré Sophie Aubin Hugues Leiser.
Dossier 2 depuis, il y a, pendant, pour. If you are asking a question about the duration of an action that began in the past and still continues in the.
Faire un dossier documentaire
Nous allons maintenant sélectionner le bouton pour le format MEDLINE et retenir les options 20 résultats par page et Sort by Most Recent (tri par plus.
O WHY IS IT IMPORTANT TO PLAN AHEAD FOR THE FUTURE?
J’ai une question! Objectifs: 1) Poser une question de 3 manières différentes 2) Parler de vos vacances.
Transcription de la présentation:

1 Un dérivé de l’Extraction d’Information Les systèmes de Question/Réponse (Question Answering / Answer Extraction)

2 Tâche : Interroger une base documentaire (web, base « métier »…) pour obtenir des information « on line » Exemples de Requêtes (1) « Qui est l’auteur de ‘ Annie Hall ’, Quels autres films a-t-il réalisé récemment ? » (2) « Comment fait-on pour changer les droits d’accès (man. Unix) ? que fait la commande ‘tar’ » Corpus Documents sur le Web / Manuels techniques (ou autre docs spécialisés)… Résultat de l ’analyse - La « réponse » (question answering): Woody Allen —Break Point, Vicky Cristina Barcelona - ou : Des phrases ou passages (fenêtres de n mots) contenant la (une) réponse (answer extraction)

3 Différents types de requêtes Simples : QUI/OU/QUAND -Où est le Taj Mahal ? -Quelle est la population actuelle de Tucson ? -Qui était le premier secrétaire d'Etat de Nixon ? Listes -Nommer 30 personnes ayant participé au cabinet de G.W. Bush. -Quels sont les acteurs du film Z ? -Nommer 4 pays producteurs de diamants.

4 Ouvertes - Biographie résumée de Colin Powell (personnage public) ? nom, surnoms, adresse, date de naissance, formation… - Que savons nous de la société Y ? structures organisationnelle, lignes de produits, dirigeants… - Comment fait-on pour changer les droits d’accès (man. Unix) ? que fait la commande ‘tar’ « Contexte » -Quelle cépage est utilisé dans le Château Petrus ? combien coûte le cru 1999 ? où le propriétaire a-t-il fait ses études ? quel domaine possède-t-il en Califormie ? - Combien existe-t-il d'espèces d'araignées ? combien sont venimeuses ? quel pourcentage de piqûres sont fatales ?

5 Test 1) sur Google who directed Annie Hall / les petits mouchoirs, Little Budha Last palme d’or à Cannes Palme d’or in1988 Who was the president of usa in 1940? 2) Sites spécifiques

6 Méthodes Deux types (± combinées éventuellement) : - type EI : compréhension assez complète de la question et analyse linguistique du texte type RD : appariement basé sur de cooccurrence de mots

7 Exemple 1 : Méthodes de RD + analyse simple de la question « A question answering System Supported by Information Extraction », R. Srihari, W. Li « Who won the 1998 Peace Nobel Prize » þPattern : Asking point : PERSON Key words : {won, 1998, Peace,Nobel Prize} þRepérage dans le texte d’un entité PERSON dans un contexte contenant les mots-clés.

8 Exemple 2 : Analyse plus structurelle de la question et du texte - Reconnaissance de motifs QUALC (B. Grau, LIMSI) Motif (patron) à reconnaître dans le texte Entité : Personne « Annie Hall » Connecteur ≈‘ réaliser ’ Qui a réalisé le Annie Hall ?

9 Exemple 3 : Méthodes proches de la compréhension automatique « Extrans, an answer extraction system », TAL, 41-2, Auteurs : D. Molla, R. Schwittler, M. Hess, R. Fournier (Université de Zurich) - Manuels techniques. P. ex. Man Unix : « Comment fait-on pour changer les droits d’accès? que fait la commande ‘cp’ » - Analyse sémantique du texte cp copies files holds(e1) & object(cp, x1) & evt(copy,e1,[x1,x2]) & object(file, x2) - Appariement « logique » avec la question Does cp coies files ? ?- evt(copy,E,[X,Y]) & object(cp,X) & object(file,Y)

Conclusion Un tâche ambitieuse –Lang Nat –Connaissances –Raisonnement (cf. True Knowledge) Accéder à l’information faiblement structurée –EI : pour fabriquer de l’information structurée BD, Web Sémantique (RDF, OWL…) – –QA : traiter les Bases Documentaire « comme » une BD Degré de faisabilité ? Avenir ? Domaines d’application « réalistes » ? 10

Interrogation « on line » ou remplissage de BdeK ? Question Answering and Information Extraction have been studied over the past decade; however evaluation has generally been limited to isolated targets or small scopes (i.e., single documents). The Knowledge Base Population (KBP) Track at TAC 2010 will explore extraction of information about entities with reference to an external knowledge source. Using basic schema for persons, organizations, and locations, nodes in an ontology must be created and populated using unstructured information found in text. A collection of Wikipedia Infoboxes will serve as a rudimentary initial knowledge representation. (TAC 2010)TAC 2010Wikipedia Infoboxes 11

Site des conférences TAC (Text Analysis Conferences) = ± suite de MUC Document Understanding Conferences (DUC) : entre MUC et TAC : Et site général sur la recherche d’informations (Conférences TREC) 12