1 Modélisation, reformulation et interrogation dexpressions temporelles extraites de textes en langage naturel Ce travail est financé par lAgence Nationale.

Slides:



Advertisements
Présentations similaires
Validation sémantique d’objets à l’aide d’un modèle de référence et de contraintes • appliquée aux expressions temporelles • Cyril Faucher, Samnang Chea,
Advertisements

MOT Éditeur de modèles de connaissances par objets typés
Génération d’un métamodèle de composants graphiques à partir de la spécification d’une bibliothèque de composants Web Cyril Faucher, Frédéric Bertrand,
1 Modéliser Ou comment RE-présenter sa connaissance.
Mon carnet De comportement
Eléments de Génie Logiciel
Réunion de négociation du 27 octobre 2009
Les politiques dalimentation et de développement des Archives Ouvertes Atelier Archives Ouvertes – Monastir – 15 mai 2012 Jean-François LUTZ Université
Réflexivité et réseaux d’ information
1 Médiation chez NODS LSR-IMAG, Grenoble C. Collet, G. Vargas Solar Service de médiation –Configuration de systèmes de médiation Utilisation dontologies.
Modélisation d’informations temporelles
Urbanisation des Systèmes d'Information - Henry Boccon-Gibod1 Urbanisation de système d'information PLM 4 (Product Lifecycle Management) Préoccupation.
Urbanisation de Système d'Information
JXDVDTEK – Une DVDthèque en Java et XML
Educasources Paris, le 30 janvier 2007 Paris, le 30 janvier 2007.
Le Modèle Logique de Données
Electronique et rayonnements naturels au niveau du sol 2 e journées nationales consacrée à la mise en place de méthodologies de conception, de qualification.
Programmation Orientée Objet (POO)
1 B Système Enjeux et principes Cours DESS Nantes 04 Décembre 2002 Didier ESSAME.
Titre conférence lundi 27 mars 2017
Maîtrise des données et des métadonnées de l’ODS
ORGANISATION PRATIQUE DE L’EPREUVE DE LANGUE VIVANTE OBLIGATOIRE EN CCF (à partir de la session 2012) Vrai ou Faux ? Les citations en bleu sont des extraits.
Expertise et formation du lméca ESIA / Université de Savoie
MANAGEMENT PAR LA QUALITE Cours 4eme Année Finance ( )
L’inscription pédagogique dans le M1 Economie Semestre 2
Un système de médiation basé sur les ontologies
GIDEM : Gestion intégrée
Université Paris I – Panthéon Sorbonne
KANNERWIERK elisabeth Kannerwierk Nouveau concept de groupe Maison Relais 2012.
le profil UML en temps réel MARTE
Web Sémantique: Le Relief Actuel
Les conditions d’efficacité de l’enseignement magistral
LUNDI – MARDI – MERCREDI – JEUDI – VENDREDI – SAMEDI – DIMANCHE
COPIL SINP 28/03/2014 PRÉSENTATION DES APPLICATIONS OGAM (WEB ET NOMADE)
Recherche Documentaire et traitement de l’information
Modèle Logique de Données
SYSTEMES D’INFORMATION
SCIENCES DE L ’INGENIEUR
MOT Éditeur de modèles de connaissances par objets typés
CAssiopée, un système de vidéosurveillance bancaire
Expressions régulières et hash tables
Date / references Systèmes Terre et Interarmées Projet OUTILEX Rapport détude final Octobre 2006.
Ecaterina Giacomini Pacurar
Notre calendrier français MARS 2014
Web sémantique : Web de demain
Initiation aux bases de données et à la programmation événementielle
Observatoire de lUFR, janvier 2011 (Master Matériaux, 2 ème année ) 1 PROFIL DES ÉTUDIANTS Responsables de la spécialité: Ingénierie des surfaces.
Observatoire de lUFR, janvier 2011 (Master Matériaux, 2 ème année ) 1 PROFIL DES ÉTUDIANTS Responsable du parcours: Aziz DINIA Master STS MATÉRIAUX.
1 Couplage dun langage de contrôle de formatage avec un système de formatage existant DEA ISC : 1 avril 2003 Fateh Boulmaiz
Couplage d'un langage de contrôle un système de formatage existant
LUNDI – MARDI – MERCREDI – JEUDI – VENDREDI – SAMEDI – DIMANCHE
CALENDRIER-PLAYBOY 2020.
Réunion de lancement du 18 janvier constitution, alignement, comparaison et exploitation d’ontologies géographiques hétérogènes Réunion de lancement.
Supports de formation au SQ Unifié
Approches Formelles en Systèmes d'information
1 Spécification conjointe et cohérente de connaissances par des modèles objets et des ontologies - application aux expressions temporelles - Cyril Faucher.
François CARCENAC,Frédéric BONIOL ONERA-DTIM Zoubir MAMMERI IRIT
Modélisation et reformulation d’expressions temporelles extraites de textes en langage naturel Cyril Faucher1, Jean-Yves Lafaye1, Frédéric Bertrand1, Charles.
1 Initiation aux bases de données et à la programmation événementielle Responsable : Souheib BAARIR. (le sujet de votre .
Bruno Traverson (EDF R&D, pilote de ACCORD)
Stage à Ontomantics Master Pro TILDE
Cours MIAGE M1 « Urbanisation des Systèmes d’Information » Henry Boccon-Gibod Urbanisation des Systèmes d’Information Plan de cours.
LOGIQUE ET PROGRAMMATION LOGIQUE
Apéro Techno Romain Maragou - Aliou Sow Web sémantique.
INTRODUCTION AUX BASES DE DONNEES
Introduction Module 1.
R ETOURS SUR LE PROJET DISTIL ET PERSPECTIVES 2011 Sylvie Ranwez Gérard Dray.
Echanges de données géographiques Sandre Geography Markup Language (GML) GIGE 2014 – Dimitri MEUNIER.
ARIANE : Interopérabilité sémantique et accès aux sources d'information sur Internet Sylvain Aymard, Michel Joubert, Dominique Fieschi, Marius Fieschi.
Transcription de la présentation:

1 Modélisation, reformulation et interrogation dexpressions temporelles extraites de textes en langage naturel Ce travail est financé par lAgence Nationale de la Recherche (ANR-Contint, projet RelaxMultiMedias 2) Cyril Faucher, Jean-Yves Lafaye, Frédéric Bertrand L3i, Université de La Rochelle, France Master 2, 16/09/2010

Le doctorat La thèse cest un sujet faire létat de lart du domaine (bibliographie) des contributions expérimenter des approches, développer des applications valoriser son travail par des articles : conférences nationales / internationales et des revues (journaux) rédiger un mémoire de thèse Mais aussi participer à des groupes de travail, séminaires, etc enseigner à lUniversité, à lIUT, etc Débouchés principaux : Maître de Conférence, ingénieur de recherche (public ou privé), startup, etc 2

3 2 Thèse dans un contexte de projet de recherche avec des partenaires industriels

Plan 1. Contexte et objectifs 2. Modéliser des propriétés temporelles dévénements 3. Acquisition et Modélisation de Connaissances Temporelles : chaîne TKAM 4

1. Contexte Notion dévénements Nature des événements: culturels, touristiques Propriétés spatiales et temporelles Récurrence et périodicité Interopérabilité avec les standards du domaine (presse) IPTC (NewsML, EventsML) iCalendar 5 2

1. Objectifs Représenter de manière intégrée des événements et leurs données associées (métadonnées) Assurer la persistance dans une base de données / connaissances Aligner un modèle métier sur des ontologies existantes (donne accès à des raisonneurs, définit une sémantique de manière formelle et structurée) Formuler des requêtes avec des expressions contrôlées proche du langage naturel 6

1. Contexte et objectifs Chaîne dacquisition de connaissances temporelles A partir de textes (dépêches), extraire des événements Produire une reformulation du texte des dépêches, dans un langage formel non ambigu, proche du langage naturel initial => validation sémantique par lutilisateur => interrogation 7 Texte libre Evénements + propriétés temporelles Texte contrôlé

1. Contexte : utilisation de lIDM Utilisation des techniques de lIngénierie Dirigée par les Modèles pour assurer linteropérabilité dapplications métier (passerelles entre les applicatifs) lintégration de données hétérogènes la vérification de lintégrité dinstances / dinformation Exemple : transformation / reformulation / intégration 8 Texte Libre SGBDR Texte contrôlé Ontologie

2. Modéliser des propriétés temporelles dévénements : Comment ? Deux types de représentations des occurrences dévénements Concrète : un ensemble (en extension) contenant des dates identifiables dans un calendrier (une granularité est fixée, le calendrier est défini sur une base annuelle) Extension : { …, « de T14:00:00 à T16:00:00 », « de T14:00:00 à T16:00:00 », … } Abstraite : une formule décrit en intension lensemble précédent Particulièrement adapté aux événements périodiques ou pseudo périodiques (exceptions), et aussi aux événements définis relativement les uns par rapport aux autres Intension [Carnap] : « tous les jeudis de mai de chaque année de 14h à 16h » « tous les jours 3 heures avant la basse mer » 9

2. Modéliser des propriétés temporelles dévénements : avec quel modèle ? Modèle métier : Modèle daccessiblité [Battistelli, Teissèdre] Modèle dévénement : métadonnées sur les événements (IPTC) spatiales temporelles … Modèles temporels existants ISO standard : Time geometry: Instant, Period, Allens relations iCalendar format : Periodic interval, Exception (+ periodic exception) TimeML [Pustejovsky], OWL-Time [Pan] Modèle temporel proposé synthèse de lISO et diCalendar sous une forme objet position relative (3 heures avant la basse mer) une grammaire formelle 10

2. Modéliser des propriétés temporelles dévénements : extrait du Modèle Temporel Extension de lISO Fondé sur le concept de règle périodique (PeriodicRule) 11 Norme ISO 19108

Lutilisateur saisie des expressions temporelles avec un éditeur contextuel 2. Un langage textuel contrôlé pour exprimer des propriétés temporelles 12 Vue textuelle Peuplement

3. Workflow générique 13

6 ème semaine de chaque mois 6 ème semaine de chaque année Janvier 2010 suit décembre 2009 Décembre 2009 précède janvier Validation des expressions 14 Base de connaissance Modèle du calendrier Expressions temporelles vérification Définition de règles Espace technique : objet conception par contrats Espace technique : logique de description - un mois est composé de 4 à 5 semaines - une année est composée de 52 à 53 semaines - janvier suit décembre de lannée précédente - février suit janvier de la même lannée

3. Interrogation des expressions 15 Requêtes Est-ce quun musée est « ouvert le 20/05/2010 » ? Promotion : extension -> intension : « ouvert tous les jeudis » Recherche dans la base de connaissance des expressions du type « tous les jeudis » « tous les jours (changement de granularité) » Réponse du système : logique ternaire VRAI FAUX ? ( inconnu)

Export 3. Acquisition et de Modélisation de Connaissances Temporelles : chaîne TKAM 16 Instances du modèle temporel Instances du modèle linguistique iCalendar Texte contrôlé La chaîne de traitement a été expérimentée sur un corpus de 513 expressions fournies par RelaxNews Expression saisie : « Ouvert du lundi au vendredi, de 9h à 18h. Nocturne le jeudi jusqu'à 22h. Fermé le 18 mai. » - du texte en langage naturel au texte contrôlé -