La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Projet ANR Projet ANR e-WOK_HUB (Environmental Web Ontology Knowledge Hub) Partenaires : BRGM, EADS, ENSMP, IFP, INRIA, LISI/ENSMA/CRITT Colloque STIC.

Présentations similaires


Présentation au sujet: "Projet ANR Projet ANR e-WOK_HUB (Environmental Web Ontology Knowledge Hub) Partenaires : BRGM, EADS, ENSMP, IFP, INRIA, LISI/ENSMA/CRITT Colloque STIC."— Transcription de la présentation:

1 Projet ANR Projet ANR e-WOK_HUB (Environmental Web Ontology Knowledge Hub) Partenaires : BRGM, EADS, ENSMP, IFP, INRIA, LISI/ENSMA/CRITT Colloque STIC 2007

2 2 Objectifs scientifiques Projet ANR E-WoK_HUB Mettre en place un ensemble de portails communicants (les Hubs e-WOK), proposant à la fois : des applications web accessibles aux utilisateurs finaux à travers des IHM en ligne et des services webs accessibles aux applications à travers des interfaces programmatiques

3 3 Objectifs applicatifs Projet ANR E-WoK_HUB Gestion de la mémoire de plusieurs projets sur la capture et le stockage du CO2, avec exploitation des résultats de la veille technologique sur le domaine Intégration dinformations issues de bases différentes et de logiciels métiers

4 4 Les Hubs e-WOK Projet ANR E-WoK_HUB Hub e-WOK = serveur web sémantique et portail offrant un accès sémantique à des ressources documentaires, des données métiers et des services (génériques ou métiers) en utilisant des ontologies adéquates Indexation des contenus textuels des documents et des données Boîte à outils pour générer les annotations des ressources et les interfaces programmatiques des services utiles pour le domaine considéré Accès aux entités sémantiques et gestion de leur persistance Fonctionnalités de mise en réseau des portails pour accéder les uns aux autres et mutualiser leurs ressources Intégration dinterfaces homme machine pour gérer les échanges entre utilisateurs et le réseau de portails

5 5 Résultats attendus du projet Projet ANR E-WoK_HUB Au niveau scientifique : Éditeurs coopératifs et contextuels, Connexion entre les standards : –RDF(S)/OWL et EXPRESS/PLIB, –SPARQL et OntoQL Prise en compte de multiples points de vue dans les annotations et lors de la recherche dinformation, Exploitation de techniques linguistiques et probabilistes pour la création / enrichissement des annotations à partir de textes, Prise en compte de linfluence de lévolution de lontologie sur les annotations, Géolocalisation associée à la sémantique, Lien entre la gestion de la mémoire de projet et les résultats de la veille technologique.

6 6 Résultats attendus du projet Projet ANR E-WoK_HUB Au niveau applicatif : –Veille technologique sur la caractérisation des sites de stockage du CO2 –Application à dautres domaines thématiques dans le domaine des géosciences (risques naturels, eau souterraine…) ou dans des domaines en ingénierie nécessitant mémoire inter-projets ou veille technologique Au niveau exploitation : –CRITT : outils développés autour de PLIB –IFP et BRGM : exploitation des résultats

7 7 Résultats scientifiques et industriels Projet ANR E-WoK_HUB

8 8 BESOINS & SPECIFICATION LOT 1 (1/2) MISE EN PLACE DU E-WOK_HUB LOT 4 PERSISTANCE DES ONTOLOGIES ET DES REGLES LOT 3 EVALUA TION LOT 1 (2/2) OUTILS ET METHODES GENERIQUES LOT 2 Expériences & background Applications existantes Besoins (cas dutilisation) Démos & analyse des résultats Outils spécifiques à la persistance Outils génériques K-repository et applications Leader BRGM Leader EADS Leader LISI Leader INRIA Leader BRGM Besoins & Specs Vision globale du projet Projet ANR E-WOK_HUB

9 9 une annotation automatique Pas de charge de travail supplémentaire, succès de lutilisation un moteur de recherche performant une amélioration dans le principe de recherche : sémantique + géo-localisation un outil central pour la démarche de recherche élargir le périmètre des ressources actuelles (ressources du centre de documentation) en incluant des images, des services cartographiques, services web, des références de base de données collaboration entre organismes pour les données lamélioration de la connaissance une collaboration de ses agents pour parfaire la définition de la connaissance un outil de gestion des ressources, des requêtes et de leurs résultats, des différents projets une capitalisation des démarches intellectuelles un outil daide dans le suivi dun projet de consultation des référentiels de ressources. Use cases - Besoins Projet ANR E-WoK_HUB Résultats industriels – Lot 1

10 10 Use cases On porte une attention particulière aux aspects géologiques et géographiques et on lapplique sur le projet PICOREF. Use case amont (BRGM) : –Mémoire des projets CO2 –Annotations –Edition dontologies –Exemples de requêtes dans le projet PICOREF Use case aval (IFP) : –Cas détude IFP Projet ANR E-WoK_HUB Résultats industriels – Lot 1

11 11 1/ Retrouver les infos de localisation géographiques "globales" de chaque document. 2/ Retrouver les entités géologiques citées dans chaque document. 3/ Dater les entités géologiques repérées dans les documents. 4/ Localiser les entités géologiques repérées dans les documents 5/ Etendre la recherche des entités géologiques aux publications référencées dans le corpus de documents. 6/ Extraire des documents les "sections" " segments" et "fragments" qui décrivent les hypothèses chrono stratigraphiques associées aux entités géologiques et les présenter à l'utilisateur lors de la phase d'interprétation pour annoter ces interprétations ( Geological Knowledge Editor). Use Case amont : à partir du corpus de documents "BRGM/PICOREF" Projet ANR E-WoK_HUB Résultats industriels – Lot 1

12 12 Use-cases et ontologies obtenues – Exemples de questions Projet ANR E-WoK_HUB Résultats industriels – Lot 1 Question dopérateur: Je recherche les lignes sismiques qui ont été étudiées dans le cadre du projet PICOREF Question dexpert: Le Callovo-Oxfordien est-il une bonne couverture ? Question dusager: Existe-t-il des sites potentiels de stockage de CO2 à moins de 25 km de mon usine ? Dans un premier temps, les réponses seront fournies sous forme dune liste de documents permettant à lusager de répondre à la question posée. Plus dune centaine de questions identifiées

13 13 Use-cases et ontologies obtenues – Analyse du contenu dun document Projet ANR E-WoK_HUB Résultats industriels – Lot 1 On vise à mettre en œuvre une méthodologie plus performante que la recherche habituelle par mots-clés. La méthode repose sur lanalyse du contenu de documents entiers sans définition préalable de mots-clés. Extraction automatique de mots ou groupes de mots signifiants (plate-forme linguistique) (plate-forme linguistique, INRIA) Annotation Annotation des termes extraits en référence à des ontologies de domaine définies préalablement. Traitement statistique éventuel des termes annotés en vue de déterminer les éléments-clés du document considéré

14 14 Use-cases et ontologies obtenues Projet ANR E-WoK_HUB Résultats industriels – Lot 1 On part dun corpus de textes de référence (une dizaine de documents: articles, rapports, thèse etc.) que les experts annotent à la main. Ce travail de départ permet de définir les diverses ontologies de domaine qui devront être construites et de leur associer une première liste de concepts et de propriétés. On a défini: –une ontologie des termes géographiques (INSEE, BRGM) –une ontologie de la chronologie géologique (ENSMP) –5 ontologies relatives aux différentes sous-disciplines géologiques à prendre en compte (ENSMP)

15 15 Use-cases et ontologies obtenues – Ontologies définies pour la géologie Projet ANR E-WoK_HUB Résultats industriels – Lot 1

16 16 Use-cases et ontologies obtenues – Chronologie géologique Projet ANR E-WoK_HUB Résultats industriels – Lot 1

17 17 Use Case AVAL " IFP" : Schéma simplifié La Vue Utilisateur Archives Numériques (ex : fichiers RESCUE ) Extraire les données Stockage des données serveur IFP/BRGM mise à jour de données ou de connaissanc e geo modelisation Création d'une nouvelle archive numérique MISE A JOUR INCOMPLETE SYSTEMES D'INFORMATION des COMPAGNIES Rapports /textes /ppt Extraire la connaissance Stockage de la connaissance serveur e-wok_HUB RESULTS COMPLETED Compléter la connaissance Reconstitution d'une archive numérique EXPERTISE du GEOLOGUE Projet ANR E-WoK_HUB Résultats industriels – Lot 1

18 18 BESOINS & SPECIFICATION LOT 1 (1/2) MISE EN PLACE DU E-WOK_HUB LOT 4 PERSISTANCE DES ONTOLOGIES ET DES REGLES LOT 3 EVALUA TION LOT 1 (2/2) OUTILS ET METHODES GENERIQUES LOT 2 Expériences & background Applications existantes Besoins (cas dutilisation) Démos & analyse des résultats Outils spécifiques à la persistance Outils génériques K-repository et applications Leader BRGM Leader EADS Leader LISI Leader INRIA Leader BRGM Besoins & Specs Vision globale du projet Projet ANR E-WOK_HUB

19 19 Architecture des hubs : Approche de conception Les tâches des utilisateurs de_Wok_Hub sont organisées en projets Les connaissances « métier » constituent des ressources pour les projets Les partenaires « techniques » fournissent des services qui exploitent les ressources disponibles et produisent de nouvelles ressources Les applications opérationnelles sont construites par composition de services Les portails e-Wok donnent accès aux ressources et aux services disponibles pour conduire les projets ARCHITECTURE ORIENTEE SERVICES Projet ANR E-WoK_HUB Résultats scientifiques – Lot 4

20 20 Architecture proposée Applications Distribution et messaging Génériques Spécifiques Portail Interface utilisateur données sémantiquesdocuments Conception de Work-Flow Orchestration Services "Métier" Monitoring Configuration administration Supervision Sécurité Web Service XML WSDL WS-BPEL SOAP SPARQL OWL/RDFS RDF PLIB Services Techniques données techniques Analyse linguistique eWok Client Éditeur dontologies Annotation Sémantique Formatage de données Persistance dontologies ESB Petals Projet ANR E-WoK_HUB Résultats scientifiques – Lot 4

21 21 Architecture des hubs : linfrastructure dintégration Projet ANR E-WoK_HUB Résultats scientifiques – Lot 4 ESB = infrastructure conçue pour exposer, accéder, orchestrer, administrer les services Enterprise Service Bus Web Services Publication/ Abonnement Échange de fichiers Messagerie asynchrone XML ACORD PostgreSQL Oracle RPC synchrone Plates-formes hétérogènes Multiples langages de programmation Modèles et Formats de données disparates Word/Excel PDF ODT HTML txt Évaluation des ESB disponibles en open source : Petals Orchestration de services

22 22 Réseau de Hubs Projet ANR E-WoK_HUB Résultats scientifiques – Lot 4 ESB Réseau e-Wok Hub 1 Hub 2 Hub 3

23 23 BESOINS & SPECIFICATION LOT 1 (1/2) MISE EN PLACE DU E-WOK_HUB LOT 4 PERSISTANCE DES ONTOLOGIES ET DES REGLES LOT 3 EVALUA TION LOT 1 (2/2) OUTILS ET METHODES GENERIQUES LOT 2 Expériences & background Applications existantes Besoins (cas dutilisation) Démos & analyse des résultats Outils spécifiques à la persistance Outils génériques K-repository et applications Leader BRGM Leader EADS Leader LISI Leader INRIA Leader BRGM Besoins & Specs Vision globale du projet Projet ANR E-WOK_HUB

24 24 Rapport sur les services pour les ontologies Editeur contextuel et collaboratif ECCO Approche danalyse de corpus et de techniques linguistiques Spécifications de techniques denrichissement sémantique semi-automatique à partir de textes en reposant sur la « kernelisation » de champs aléatoires conditionnels Techniques basées sur des règles de détection dincohérence et restauration de cohérence pour traiter linfluence de lévolution dontologies Transformation entre le modèle dontologies RDF(S) / OWL Lite et le modèle PLIB Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2

25 25 Service dontologies – ECCO Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2 ECCO (Editeur Collaboratif et Contextuel dOntologies) Méthodologie: suivre les phases de conception dune ontologie À partir de lextraction de termes dans des sources de données … Jusquà lédition fine de lontologie

26 26 Service dontologies – ECCO (2) Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2 ECCO (Editeur Collaboratif et Contextuel dOntologies) Extraction collaborative de termes : chaque utilisateur visualise ses propres termes + ceux extraits par les autres utilisateurs. Extraction contextuelle: le contexte du terme extrait est attaché à celui-ci.

27 27 Service dontologies – ECCO (3) Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2 ECCO (Editeur Collaboratif et Contextuel dOntologies) (Méta) annotation des termes : représenter le statut de chacun des termes.

28 28 Service dontologies – ECCO (4) Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2 ECCO (Editeur Collaboratif et Contextuel dOntologies) (Méta) annotation des termes : permettre aux utilisateurs davoir un historique des discussions sur un terme donné.

29 29 Service dontologies – ECCO (6) Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2 ECCO (Editeur Collaboratif et Contextuel dOntologies) Technos utilisées: J2EE / Web 2.0 / Web sémantique Dépendances: pour les aspects web sémantique : Corese Semtags pour les aspects web : JSTL (Java Standard Tag Lib) pour les aspects graphiques: Yahoo UI, Extjs (future version)

30 30 Processus dévolution –Avec trace dévolution des ontologies Service dontologies – Evolution des ontologies Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2 ontologie O1 Représentation des changements dans trace (O1, O2) trace (O1, O2) ontologie O2 Base dannotations concernée Application des Stratégies dévolution Base dannotations mise à jour ontologie O1 Détection des annotations inconsistantes Règles de détection ontologie O2 Base dannotations concernée Correction des annotations inconsistantes Règles de correction Base dannotations mise à jour Gestion des annotations inconsistantes après évolution de lontologie. Approche suivie: – Sans trace dévolution des ontologies

31 31 Service dontologies – Evolution des ontologies (3) Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2 1er cas : Evolution des ontologies avec traces existantes Générateur de traces dévolution: ECCO Résolution à laide des stratégies: COSWEM

32 32 BESOINS & SPECIFICATION LOT 1 (1/2) MISE EN PLACE DU E-WOK_HUB LOT 4 PERSISTANCE DES ONTOLOGIES ET DES REGLES LOT 3 EVALUA TION LOT 1 (2/2) OUTILS ET METHODES GENERIQUES LOT 2 Expériences & background Applications existantes Besoins (cas dutilisation) Démos & analyse des résultats Outils spécifiques à la persistance Outils génériques K-repository et applications Leader BRGM Leader EADS Leader LISI Leader INRIA Leader BRGM Besoins & Specs Vision globale du projet Projet ANR E-WOK_HUB

33 33 Proposition dun modèle de persistance autour de la plate-forme OntoDB Modélisation dontologies de domaine Connexion à larchitecture E-Wok-HUB Service de persistance – Introduction Projet ANR E-WoK_HUB Résultats scientifiques – Lot 3

34 34 ONTODB Base de données à base ontologique pour PLIB »Structure de persistance pour les ontologies et leurs instances »Extension dune classe = une relation (une vue) Modèle de persistance (1) Projet ANR E-WoK_HUB Résultats scientifiques – Lot 3 Ontology Meta-Schema System Catalog Logical model

35 35 –ONTODB pour E-Wok-Hub Extension proposées »Représentation des données, ontologies et raisonnements spatiaux »Prise en compte des modèles, langages et formats du web sémantique »Représentation XML des données natives de ONTODB (OntoML) Mise en œuvre »Définition dun noyau commun des langages et des modèles dontologies »Expressions déquivalences : vues et opérateurs de logique de description »Caractéristiques de symétrie, inverse, contraintes, etc... Modèle de persistance (2) Projet ANR E-WoK_HUB Résultats scientifiques – Lot 3

36 36 –Construction de nouvelles ontologies et de bases de données à base ontologique –Représentation des données spatiales –Validation avec ONTODB –EarthModel, GeoTimeScale, Petrographer –Indexation de bases de données existantes –Rétro-conception de bases de données –Approche dannotation sémantique de bases de données existantes »Application aux données fournies par le BRGM avec prise en compte de données géographiques Service de persistance – Modélisation à base ontologique Projet ANR E-WoK_HUB Résultats scientifiques – Lot 3

37 37 Connexion au Hub –Utilisation de SPARQL comme langage daccès à la BDBO »Interprétateur OntoQL –Spécification des modules dimport/export ONTOML/RDF-S Service de persistance – Intégration dans l architecture E-Wok-Hub Projet ANR E-WoK_HUB Résultats scientifiques – Lot 3 Ontologie RDF-S SPARQLOntoQL Ontology Meta-Schema System Catalog Logical model

38 38 Travail en cours : Prototype Projet ANR E-WoK_HUB Plan de travail 1 er prototype sur le scénario 1 établi par IFP-BRGM format e-wok.doc,.pdf Filtrage sur la langue Processus dannotation géographique linguistique SIG KCRFgéométrique XML Phase 2: consultation Phase 1: annotation

39 39 Scénario opérationnel et annotation manuelle du corpus (ENSMP) Socle technique (EADS) Services métiers –Acquisition de documents Ewok Hub (IFP) –Analyse linguistiques (INRIA) –Annotation géographique par apprentissage (EADS) –Annotation toponymique et géométrique (IFP, BRGM, INRIA) –Stockage & Indexation dans un entrepôt sémantique (LISI) Interfaces Homme-Machine (BRGM): –E-Wok Client Prototype : Recherche sur critères géographiques Projet ANR E-WoK_HUB Plan de travail

40 40 Prototype : EWC - Ewok Client Projet ANR E-WoK_HUB Plan de travail Techno: Web 2.0

41 41 Prototype : EWC - Ewok Client Projet ANR E-WoK_HUB Plan de travail

42 42 Prototype : Recherche sur critères géographiques Projet ANR E-WoK_HUB Plan de travail E-WOK_HUB : projet pluridisciplinaire informatique et géosciences Questions?


Télécharger ppt "Projet ANR Projet ANR e-WOK_HUB (Environmental Web Ontology Knowledge Hub) Partenaires : BRGM, EADS, ENSMP, IFP, INRIA, LISI/ENSMA/CRITT Colloque STIC."

Présentations similaires


Annonces Google