Modélisation et reformulation d’expressions temporelles extraites de textes en langage naturel Cyril Faucher1, Jean-Yves Lafaye1, Frédéric Bertrand1, Charles.

Slides:



Advertisements
Présentations similaires
Validation sémantique d’objets à l’aide d’un modèle de référence et de contraintes • appliquée aux expressions temporelles • Cyril Faucher, Samnang Chea,
Advertisements

MOT Éditeur de modèles de connaissances par objets typés
Génération d’un métamodèle de composants graphiques à partir de la spécification d’une bibliothèque de composants Web Cyril Faucher, Frédéric Bertrand,
L'interopérabilité dans l'innovation 2
Temporalité dans les données de référence du SITG.
IREMIA : Institut de REcherche en Mathématiques et Informatique Appliquées Université de la Réunion Uniformisation des mécanismes de conception de SMA.
Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.
Réflexivité et réseaux d’ information
Spécification et qualité du logiciel
1 Modélisation, reformulation et interrogation dexpressions temporelles extraites de textes en langage naturel Ce travail est financé par lAgence Nationale.
Modélisation d’informations temporelles
19 septembre 2006 Tendances Logicielles IBM Rational Data Architect Un outil complet de modélisation et de conception pour SGBD Isabelle Claverie-Berge.
Cours MIAGE Henry Boccon-Gibod 1 XML, Extensible Mark up Language Un esperanto des langages informatiques.
2002 Compétitif XMiner : Plate-forme de structuration texte libre multi-approches par balisage XML de Tags Actifs Lobjectif du projet est de développer.
Les méthodes formelles en ingénierie des connaissances Damien Lhomme-Desages Jérémie Barlet.
Les Web Services.
Understanding, building and using ontologies. Understanding Ontologie : la définition des concepts utilisés dans un langage donné Première approche (Gruber)
Concevoir un système dinformation hospitalier évolutif, ouvert et adapté grâce à un processus de conception orienté modèle Benjamin Chevallereau Alain.
Alain Le Guennec Jean-Marc Jézéquel Action Triskell
Un système de médiation basé sur les ontologies
1 ARCHITECTURE DACCÈS la méthode générale modèle de données définitions module daccès / modules métiers construction des modèles les modules daccès, les.
le profil UML en temps réel MARTE
Web Sémantique: Le Relief Actuel
Spécification et Vérification de Modèles de Procédés de Développement
ÉVALUATION DES SCÉNARIOS POUR L’AIDE À LA CONDUITE DU PROJET
Services fournis par le SI et technologies associées
OIL & UPML DREVET - HUMBERT Introduction OIL : un langage de description dontologies UPML : un langage de description de systèmes à base.
MOT Éditeur de modèles de connaissances par objets typés
Karim-Cyril Griche LSR/IMAG
LSR Groupe de Travail AFADL du GDR ALP Journée de rencontre « Techniques Formelles pour le Génie Logiciel » 5 juin 2002 ENST – Paris Préparée par Yves.
Initiation aux bases de données et à la programmation événementielle
Programmation non procédurale Le projet ECOLE 2000
Sensibilisation a la modelisation
Vers un nouvel empirisme: l’ancien et le nouvel empirisme John Goldsmith Université de Chicago CNRS MoDyCo.
Réunion de lancement du 18 janvier constitution, alignement, comparaison et exploitation d’ontologies géographiques hétérogènes Réunion de lancement.
Unité 2 La grammaire d’Unité 2. L’accord o One must make agreement from the noun(s) to the verb: - Il coûte… - Elle coûte… - Ils coûtent… - Elles coûtent…
Requêtes homme-agent sur le fonctionnement Etudiantes: Anne DARME & Céline GIRARD Encadrant: Nicolas SABOURET Rapporteur: Vincent CORRUBLE Responsable:
1 Spécification conjointe et cohérente de connaissances par des modèles objets et des ontologies - application aux expressions temporelles - Cyril Faucher.
1 © Maris, IRIT 2009 Planification Temporelle Frédéric MARIS IRIT – Université Paul Sabatier – Toulouse.
François CARCENAC,Frédéric BONIOL ONERA-DTIM Zoubir MAMMERI IRIT
10 juin 2008 Journée Technologies et Enjeux de l'Apprentissage Mobile Equipe SIMBAD.
UVSQ EDF R&D Procédés de réutilisation pour les lignes de produits logiciels Yuanyuan XU, Bruno TRAVERSON - INFORSID Mai 2008.
Projet Campus AAR ANR-13-CORD Point d’avancement INA INA 1 juillet 2014.
Présentation de la taxonomie XBRL BE-fr-pfs-ci Bruxelles, le 25 janvier 2006 Camille Dümm Pascal Rodrique Centrale des bilans.
Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC – Equipe ISLanD Apport d’outils d’informatique documentaire à l’analyse de forums de.
1 Initiation aux bases de données et à la programmation événementielle Responsable : Souheib BAARIR. (le sujet de votre .
L’enseignement de spécialité SLAM
Vers une intégration plus poussée de la recherche Web avec les Systèmes d’Information Géographiques Adapté de «Toward Tighter Integration of Web Search.
Réalisé avec le soutien de Pied de page fixe Pied de page 1 Titre Sous titre.
Les Dates révision. Les Jours 0 lundi 0 mardi 0 mercredi 0 jeudi 0 vendredi 0 samedi 0 dimanche.
Sujet 5 : Intégration d’une loi d’ordonnancement dans un modèle
TEXT MINING Fouille de textes
Initiation aux SGBD Frédéric Gava (MCF)
Intégration des Tableaux Multidimensionnels en Pig pour
Stage à Ontomantics Master Pro TILDE
1 Structure en MC Principes Stockage des données dans la mémoire volatile d’un ordinateur Problèmes Stockage temporaire «Petits» volumes de données Langages.
Cours MIAGE M1 « Urbanisation des Systèmes d’Information » Henry Boccon-Gibod Urbanisation des Systèmes d’Information Plan de cours.
L’enseignement de l’Analyse Fonctionnelle et Structurelle S 5 en S. T
Séance /10/2004 SGBD - Approches & Principes.
Apéro Techno Romain Maragou - Aliou Sow Web sémantique.
INTRODUCTION AUX BASES DE DONNEES
Consolidation de grands réseaux lexicaux
Initiation aux bases de données et à la programmation événementielle
XML : un métalangage pour la description de documents structurés XML a été défini par le consortium W3 en fonction de 2 objectifs: Compenser les limitations.
Introduction Module 1.
Journée Annuelle Interop’Santé Jean-Charles DRON GAZELLE INTEROP’SANTE UNE RÉPONSE ALIGNÉE AVEC LES BESOINS DE NOS ADHÉRENTS 10/11/2015.
R ETOURS SUR LE PROJET DISTIL ET PERSPECTIVES 2011 Sylvie Ranwez Gérard Dray.
Echanges de données géographiques Sandre Geography Markup Language (GML) GIGE 2014 – Dimitri MEUNIER.
ARIANE : Interopérabilité sémantique et accès aux sources d'information sur Internet Sylvain Aymard, Michel Joubert, Dominique Fieschi, Marius Fieschi.
Transcription de la présentation:

Modélisation et reformulation d’expressions temporelles extraites de textes en langage naturel Cyril Faucher1, Jean-Yves Lafaye1, Frédéric Bertrand1, Charles Teissèdre2,3 1 L3i, Université de La Rochelle, France cyril.faucher@univ-lr.fr 2 MoDyCo - Université de Paris Ouest Nanterre La Défense – CNRS 3 Mondeca, France AFADL 2010 - du 9 au 11 juin 2010 – Poitiers Futuroscope Ce travail est financé par l’Agence Nationale de la Recherche (ANR-Contint, projet RelaxMultiMedias 2) 10es Journées Francophones Internationales sur les Approches Formelles dans l’Assistance au Développement de Logiciels)

Introduction Chaîne d’acquisition de connaissances temporelles A partir de textes (dépêches) Produire une reformulation des informations saisies, dans un langage formel non ambigu, proche du langage naturel initial => validation sémantique par l’utilisateur Sous forme de modèles Evénements + propriétés temporelles Texte libre Texte contrôlé This contribution aims to show how temporal properties from a human activities simulator can be externalized and modelled. Outputs of a simulation are maps for analizing human activities and for decision making, optimisation The use case is based on the Telline seashell digging.

Plan 1. Contexte et objectifs 2. Workflow générique 3. Modéliser des propriétés temporelles d’événements 4. Acquisition et Modélisation de Connaissances Temporelles : chaîne TKAM 5. Conclusion et perspectives

1. Contexte 2 Notion d’événements Nature des événements: culturels, touristiques Propriétés spatiales et temporelles Récurrence et périodicité Interopérabilité avec les standards du domaine (presse) IPTC (NewsML, EventsML) iCalendar 2 This contribution aims to show how temporal properties from a human activities simulator can be externalized and modelled. Outputs of a simulation are maps for analizing human activities and for decision making, optimisation The use case is based on the Telline seashell digging.

1. Contexte : utilisation de l’IDM Utilisation de (Méta-) Modèles pivots pour assurer l’interopérabilité d’applications métier (passerelles entre espaces techniques) l’intégration de données hétérogènes la vérification de l’intégrité d’instances / d’information Exemple : transformation / reformulation / intégration Texte Libre DSL (Domain Specific Language) MODELE PIVOT SGBDR Texte contrôlé Ontologie Langages formels, langages de preuve Langages de règles Applications

1. Objectifs Représenter de manière intégrée des événements et leurs métadonnées Assurer la persistance dans une base de données / connaissances Aligner un modèle métier sur des ontologies existantes (donne accès à des raisonneurs, définit une sémantique de manière formelle et structurée) Formuler des requêtes sur le Modèle Pivot, exécuter dans un autre espace (ex. base de connaissances) Visualiser des ensembles de données conformes au Modèle Pivot dans des environnements ad hoc (SimileExhibit, Google Agenda, etc)

Représentation dans le modèle pivot 2. Workflow générique Métier : linguistique Modèle pivot Représentation dans le modèle pivot Vérification de propriétés structurelle (invariant) et sémantique Texte contrôlé Reformulation en langage naturel contrôlé à l’aide d’une grammaire formelle Dépêches CU1 : Persistance Associer des propriétés temporelles aux Events Texte Libre Extraction de connaissance Obtention de propriétés temporelles valides Représentation dans un DSL CU2 : Résolution de requêtes Rechercher des expressions temporelles dans les bases Modèle linguistique : expressions temporelles pour les périodes d’accès

3. Modéliser des propriétés temporelles d’événements : Comment ? Deux types de représentations des occurrences d’événements Concrète : un ensemble (extension) contenant des dates identifiables dans un calendrier (une granularité est fixée, le calendrier est défini sur une base annuelle) Extension : { …, « de 2010-05-20T14:00:00 à 2010-05-20T16:00:00 », « de 2010-05-27T14:00:00 à 2010-05-27T16:00:00 », … } Abstraite : une formule décrit en intension l’ensemble précédent Particulièrement adapté aux événements périodiques ou pseudo périodiques (exceptions), et aussi aux événements définis relativement les uns par rapport aux autres Intension [Carnap] : « tous les jeudis de mai de chaque année de 14h à 16h » « tous les jours 3 heures avant la basse mer »

3. Modéliser des propriétés temporelles d’événements : avec quel modèle ? Modèle métier : DSL Modèle d’accessiblité [Battistelli, Teissèdre] Modèle d’événement : métadonnées sur les événements (IPTC) spatiales temporelles … Modèles temporels existants ISO 19108 standard : Time geometry: Instant, Period, Allen’s relations iCalendar format : Periodic interval, Exception (+ periodic exception) TimeML [Pustejovsky], OWL-Time [Pan] Modèle temporel proposé synthèse de l’ISO et d’iCalendar sous une forme objet position relative (3 heures avant la basse mer) une grammaire formelle

3. Modéliser des propriétés temporelles d’événements : Periodic Temporal Occurrence Extension de l’ISO 19108 Basé sur le concept de PeriodicRule Norme ISO 19108

3. Modéliser des propriétés temporelles d’événements : Position relative Définition d’un intervalle entre 2 expressions temporelles avec les relations d’Allen Expression relative: 3 heures avant la Basse Mer Allen’s relations 1 This model describes the part concerning the relative expressions and that shows the usage of the Allen’s relations to define relative position.

3. Un langage textuel contrôlé pour exprimer des propriétés temporelles L’utilisateur saisie des expressions temporelles avec un éditeur contextuel Techniques IDM : EMF, xText Peuplement Vue textuelle A textual controlled language to express periodical phenomena has been created in order to offer to the user a tool for editing models like a text. This tool is composed of a text editor with content assist to ease the typing of the temporal expressions.

3. Un langage textuel contrôlé pour exprimer des propriétés temporelles Temporal Model Grammar (xText) PeriodicRule : ('(identified by 'name=ID')')? (frequency=Frequency)? ('using a time span as ' validity+=PeriodicTimeSpan)* ('time extent ' ruleExtent=TM_Period )? ; FreqWithDurationRef : ( (times=INT 'times') | // times is fixed to 1 ('during one' referenceDuration=Duration 'period') | (times=INT 'times during one‘ referenceDuration=Duration 'period') ) ('and starts on' startTime=TM_Instant)? The controlled text is based on a grammar and this grammar is linked directly with the concepts in the model For the class Periodic Rule, the attribute ruleExtent, thus for each concept in the model we are able to associate it with a grammar part The Texts, that are using the grammar, are conform to the model. On the models, we can define constraints and check them to validate a model

4. Acquisition et de Modélisation de Connaissances Temporelles : chaîne TKAM Période d’accès d’un lieu exprimé en intension Le musée est ouvert tous les jours de 10h à 19h sauf le lundi Le restaurant est fermé les 1ère et 2ème semaines d’avril Le marché est exceptionnellement ouvert les 3ers dimanche de décembre

DSL des périodes d’accès 4. Acquisition et de Modélisation de Connaissances Temporelles : chaîne TKAM Métamodèle générique pour les Events Approche IDM Event ISO19108 Texte libre extension iCalendar DSL des périodes d’accès Métamodèle pivot pour les propriétés temporelles Grammaire formelle (xText) Données métier Instances du modèle pivot Textes contrôlés conforme à Solveur de requêtes Vérification de contraintes structurelle (invariant) et sémantique (modèle de calendrier)

Instances du modèle temporel Instances du modèle linguistique 4. Acquisition et de Modélisation de Connaissances Temporelles : chaîne TKAM - du texte en langage naturel au texte contrôlé - Expression saisie : « Ouvert du lundi au vendredi, de 9h à 18h. Nocturne le jeudi jusqu'à 22h. Fermé le 18 mai. » La chaîne de traitement a été expérimentée sur un corpus de 513 expressions fournies par RelaxNews iCalendar M D I Export Kermeta Instances du modèle temporel Instances du modèle linguistique M D I Texte contrôlé M D I

4b. Autre application : couplage d’un SMA avec le modèle temporel SMA : DAHU Requête temporelle TimeManager Réponse : pêche autorisée, interdite ou restreinte Agents pêcheurs Modèle Temporel Texte réglementaire : “Digging is prohibited each year, from 9 pm to 6 am between July 1st and August 31st. Out of these periods, digging is allowed from 3 hours before low tide up to 3 hours after the same low tide (according to the tide almanac in Douarnenez).” Faucher C., Tissot C., Lafaye J.Y., Bertrand F., "Benefits of a periodic temporal model for the simulation of human activities", GeoVA(t) (Geospatial Visual Analytics : Focus on Time) Workshop at AGILE 2010, 10-11 May 2010, Guimaraes (Portugal)

5. Conclusions Chaîne d’acquisition et de modélisation de connaissances temporelles D’un texte en langage naturel vers un texte contrôlé Un modèle générique d’expressions temporelles pour modéliser des phénomènes périodiques Extension de la norme ISO 19108 Expressions temporelles en intension (à l’inverse d’extension) Grammaire formelle Vérification structurelle et sémantique 2 cas d’utilisations pour expérimenter les approches dont 1 industriel

5. Perspectives Moteur de requêtes en formulant une requête sous forme d’expressions temporelles exprimer et calculer l’intersection de deux expressions sans calculer leurs extensions Traduire une règle périodique en requête (SQL/SPARQL…) sur la base de données ou de connaissance Filtrer les nuplets/graphes candidats de la base pour optimiser l’exécution de la requête

Merci de votre attention Modélisation et reformulation d’expressions temporelles extraites de textes en langage naturel Cyril Faucher1, Jean-Yves Lafaye1, Frédéric Bertrand1, Charles Teissèdre2,3 1 L3i, University of La Rochelle, France cyril.faucher@univ-lr.fr 2 MoDyCo - Université de Paris Ouest Nanterre La Défense - CNRS 3 Mondeca, France