JDD 2005 Utilisation et Constitution de Ressources Sémantiques pour la Recherche d'Informations Précises. Vincent Barbier, groupe LIR Langues, Information.

Slides:



Advertisements
Présentations similaires
2.2.2 : Participation à un programme d’accueil :
Advertisements

Prof. Assist. Dr Penphan THIPKONG
A Transparent n o 1 Saut Quantique 12 octobre 2000 Gestion de projet Ghislain Gravel ing.
ASSTICCOT, RTP-DOC, Paris
Constitution de produits terminologiques à partir de corpus
UNIVERSITE DE TECHNOLOGIE COMPIEGNE GE 15 LA RECHERCHE DOCUMENTAIRE SUR LE NET Béatrice KONIG – BUTC Tél. : Mars 2007.
Olivier Kraif, Agnès Tutin LIDILEM
La recherche documentaire sur le réseau Internet
Quelques pistes pour arriver à mettre des élèves en autonomie
La géographie ça sert à voyager
S’approprier, comprendre et pouvoir « parler » son école.
Apprendre à lire.
ETAPES DE LA RECHERCHE DOCUMENTAIRE
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
L’observation réfléchie de la langue au cycle 3
Lutilisation de la langue est liée à laction et donc à des capacités de faire.
La trace écrite Patricia MULLER
Classification automatique de documents XML : le système Semistix Alexandre Termier Marie-Christine Rousset Michèle Sebag Séminaire du 23/01/2001 Université
Annotations sémantiques pour le domaine des biopuces
Olivier CANTIN, Tassadit AMGHAR, Bernard LEVRAT
Construction de modèles visuels
Le langage oral en maternelle
Evaluation des activités interdisciplinaires
Moteur de recherche d’information
Moteur de recherche d’information
Thales Research and Technology Filtrage et Extraction dInformation 1 Évaluation comparative de ressources générales et de ressources spécifiques pour l'extraction.
Systeme Question-Reponse SQR
Plan de la rencontre #6 Approches pédagogiques pour l ’utilisation des NTIC Scénarios d ’utilisation des NTIC Logiciels-outils et écriture Activité: Réalisation.
Introduction à lutilisation des corpus 1. Quest-ce quun corpus? Alexandra VOLANSCHI
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
SEMINAIRE NATIONAL Réforme de la série Gestion-Administration de la voie professionnelle Lyon, 10 et 11 mai 2012 Atelier du jeudi après-midi (S. Anxionnaz,
IFT6255 – Recherche d’information Jian-Yun Nie
Les techniques des moteurs de recherche
L’enseignement des compétences grammaticales
Human Knowledge La nouvelle génération de moteurs sémantiques.
CoRRecT : Démarche coopérative pour l’évaluation de systèmes de reconnaissance de termes Chantal Enguehard IRIN – Université de Nantes 2 rue de la Houssinière.
Aide à la rédaction. Plan L’aide à la rédaction : principes et outils La correction orthographique –Historique –Modélisation linguistique –Evaluation.
Journée formateurs Connaissance de la maternelle
Aide personnalisée Démarche Constat : Eléments d’évaluation, puis la différenciation s’avère une aide insuffisante. Définition d’objectifs s’inspirant.
La recherche documentaire
Recherche en corpus de réponses à des questions définitoires Véronique Malaisé Thierry Delbecque Pierre Zweigenbaum TALN 2005, Dourdan.
Arkhênum Patrimoine du Futur. Répartitions par types d’erreurs mineures.
Sylwia Ozdowska1, Vincent Claveau2
Dominique LAURENT Patrick SEGUELA
Recherche d’information
23 Nov. 2005Colloque Médiathèques1 Nouvelles méthodes d’accès assisté à l’information Approches sémantiques Documents textuels et multimédia Patrice Enjalbert.
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
d'une situation d'apprentissage et d'évaluation
Comment travailler la maîtrise de la langue ?
Équipe ISLanD Laboratoire GREYC Université de Caen / Basse-Normandie Des outils pour chercher sur la Toile Fête de la Science 2005.
G ROUPE IRIUM ™ N°1 européen des PGI pour Distributeurs, Loueurs & Importateurs de Machines Les Bases de Connaissances Knowledge Base Maxime HILAIRE 07/05/2008.
Services en Text Mining. Introduction : Qui est Mentis ? Mentis a été fondée en 2005 comme une société spin-off du Laboratoire d'I ntelligence Artificielle.
TEXT MINING Fouille de textes
A chacun sa maison. Une affiche Une brochure à l’intention des enseignants A commander sur la page de notre site :
Le Traitement Automatique des Langues (TAL)
Modélisation de l’inférence et application à un système de question-réponse Anne-Laure Ligozat Groupe LIR Directrice : Michèle Jardino Encadrante : Isabelle.
Construire une évaluation avec le socle commun de compétences:
Classification automatique des messages électroniques
Initiation à des recherches dans le domaine de l’enseignement
les compétences des élèves dans le domaine du vocabulaire
Progression/Programmation – Français (1/3)
Progressivité de l’enseignement grammatical A partir d’un document rédigé par : - Claudine GARCIA-DEBANC - Véronique PAOLICCI - Nicole RAMIREZ - Pierre.
INTRODUCTION AUX BASES DE DONNEES
Architectures articulant des représentations hétérogènes L’exemple de Gate (Mini tutoriel, journée Atala du 12 février 2005) Thierry Poibeau LIPN (CNRS.
CONSTRUIRE UN COURS (De la séquence à la séance… )
Appariement syntaxique question-réponse Séminaire groupe LIR 21/10/2003.
Personnalisation de l’apprentissage des langues en ligne Marie-Noëlle Godin Conceptrice pédagogique.
ANALYSE SUJETS BAC COMMUNICATION ET GRH PARTIE ECRITE.
1 4th International Conference on Arabic Language Processing, May 2–3, 2012, Rabat, Morocco Titre Mohamed El Amine ABDERRAHIM Mohamed Alaedine ABDERRAHIM.
ARIANE : Interopérabilité sémantique et accès aux sources d'information sur Internet Sylvain Aymard, Michel Joubert, Dominique Fieschi, Marius Fieschi.
Transcription de la présentation:

JDD 2005 Utilisation et Constitution de Ressources Sémantiques pour la Recherche d'Informations Précises. Vincent Barbier, groupe LIR Langues, Information et Représentations

● Recherche d'information classique : ● Ex : ''loutre de mer'' mange ● Problèmes : ● Comment tenir compte... ●... de la proximité des termes ●... des types de liens syntaxiques (ex : sujet-verbe) ●... des variations sémantiques (ex: synonymes) ● Réduire le temps nécessaire pour fouiller les documents rapportés.

Questions-Réponses Une surcouche langagière aux moteurs de recherche classiques filtrages analyse question requête Moteur de Recherche documents Critères de filtrage (ex : type de question type de la réponse) réponse Recherche d'information classique –Traitement d'informations linguistiques (verbe principal, focus de la question,liens syntaxiques, type de question, type attendu de la réponse) –Utilisation de ressources sémantiques successifs

Utiliser des Connaissances Sémantiques dans QR Deux buts : Améliorer le classement des documents dans les systèmes de Q-R Disposer d’un cadre permettant d’évaluer –les ressources sémantiques –Les systèmes d'acquisition de ces ressources

Utilisation de ressources sémantiques –Expansion de la requête. rapporter plus de documents : –Retrouver les variantes des termes de la question dans les documents rapportés. Question : Que mangent les loutres de mer ? Requête : manger ET loutre ET mer Requête étendue : (manger OU aliment OU nourriture OU se nourrir) ET loutre ET mer Question : What company makes the Bentley cars ? Réponse : Volkswagen A.G. The famous car maker, now owns the Bentley line.

Types de Ressources Sémantiques Variantes dans une catégorie grammaticale (Synonymie, hypéronymie/hyponymie, holonymie/méronymie) – Dictionnaires de synomymes – WordNet, EuroWordNet (exemple : score -> achieve -> succeed) Variations inter-catégorielles – Ressource théorique : lexique génératif de Pustejovsky patient soigner / chat miauler – EuroWordNEt : relations telles que hasRole(médecin,soigner) prévues mais non encore constituées. – morphologie. ex : construire constructeur – Besoin d'acquisition automatique (V. Claveau, O Ferret)

Bruit & Syntaxe ● L'utilisation de variantes engendre du bruit : Ambiguïté des termes de la question ● Reformulations potentiellement inadaptées. ● Il est donc nécessaire : D'estimer la fiabilité des reformulations effectuées. (corpus de questions réponses) D'imposer des contraintes fortes pour le filtrage des documents (critères de similitude syntaxique)

Travail réalisé Construction d'un corpus de questions réponses. (effectué) Ecriture d'une chaine d'apprentissage de mesures de proximité sémantique Test d'une mesure sémantique calculée dans le système de questions (Pas d'amélioration) Prise en compte des contraintes syntaxiques (Travail courant)

C'est Fini Questions?

Etapes Constitution automatique d’un corpus (stage de DEA) Apprentissage sur ce corpus d’une mesure de proximité sémantique (fin DEA + Thèse ) Insertion de la mesure dans la chaîne de QR (en ce moment, article à écrire ;-) Utilisation d’autres ressources (UTSA) Amélioration des Ressources. Constitutions de ressources nouvelles. Travail Futur :

Apprentissage d'heuristiques En Pratique et en Images ?R Docs TREC

En Pratique et en Images ?R Docs requête R analyse Sélection de passages mesures de prox. sémantique TREC

En Pratique et en Images ?R Docs requête R analyse Sélection de passages mesures de prox. sémantique =?=? SCORESCORE TREC

En Pratique et en Images ?R Docs requête R analyse Sélection de passages mesures de prox. sémantique =?=? SCORESCORE Ressourc e Sémantiq ue (ex : WN UTSAs) TREC

En Pratique et en Images ?R Docs requête R analyse Sélection de passages mesures de prox. sémantique =?=? SCORESCORE Corpus Q-R Docs pertinents Et non pertinents Ressourc e Sémantiq ue (ex : WN UTSAs) TREC

En Pratique et en Images ?R Docs requête R analyse Sélection de passages mesures de prox. sémantique =?=? SCORESCORE Corpus Q-R Docs pertinents Et non pertinents Ressourc e Sémantiq ue (ex : WN UTSAs) Apprentissage supervisé Mesure de prox. sémantique TREC

En Pratique et en Images ?R Docs requête R analyse Sélection de passages mesures de prox. sémantique =?=? SCORESCORE Corpus Q-R Docs pertinents Et non pertinents Ressourc e Sémantiq ue (ex : WN UTSAs) Apprentissage supervisé Mesure de prox. sémantique TREC

En Pratique et en Images ?R Docs requête R analyse Sélection de passages mesures de prox. sémantique =?=? SCORESCORE Corpus Q-R Docs pertinents Et non pertinents Ressourc e Sémantiq ue (ex : WN UTSAs) Apprentissage supervisé Mesure de prox. sémantique TREC

Points à régler manuellement ?R Docs requête R analyse Sélection de passages mesures de prox. sémantique =?=? SCORESCORE Corpus Q-R Docs pertinents Et non pertinents Ressourc e Sémantiq ue (ex : WN UTSAs) Apprentissage supervisé Mesure de prox. sémantique TREC