Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte Trousse “Knowledge is Power” Modélisation des connaissances et Web sémantique
Modélisation des connaissances et Web sémantique PLAN Introduction Web sémantique XML Ontologie RDF, OWL Moteur de recherche sémantique Corese Applications Aspects ergonomiques et organisationnels Recherche d’information sur le Web Réutilisation de traces d'usages Extraction de connaissances à partir de données, raisonnement à partir de cas Modélisation des connaissances et Web sémantique
Web sémantique d’entreprise RENAULT : mémoire d’un projet véhicule pour en réutiliser les solutions lors de projets ultérieurs Deutsche Telekom : aide à l’insertion d’un nouvel employé CSTB : aide à la veille technologique IPMC : mémoire des expériences menées par un biologiste. Telecom Valley : cartographie des compétences inter-entreprises Modélisation des connaissances et Web sémantique
Modélisation des connaissances et Web sémantique Mémoire d’entreprise Matérialisation explicite et persistante des connaissances et informations cruciales (explicites ou tacites) d’une organisation pour faciliter leur accès, partage et réutilisation par les membres de l’organisation dans leurs tâches individuelles et collectives. Modélisation des connaissances et Web sémantique
Modélisation des connaissances et Web sémantique Mémoire d’entreprise Les Individus + l’Organisation + la Technologie Approche pluridisciplinaire Modélisation des connaissances et Web sémantique
Modélisation des connaissances et Web sémantique Notre vision Monde extérieur (Internet & Web...) Administrateur / Gestionnaire mémoire Utilisateur (tâche individuelle) (tâche collective) Auteur de doc. Système de Gestion des Connaissances Expert MEMOIRE D ’ENTREPRISE Ontologies Base de connaissances Veilleur / Documentaliste Doc. électronique BD Doc. multimédia Modélisation des connaissances et Web sémantique
IntraWeb & Mémoire d’entreprise Les technologies du Web permettent une large diffusion d’information. Les Intranets ou IntraWebs, basés sur les techno du Web, peuvent améliorer le partage d’infos et de conn. dans les entreprises. Besoin d’accéder à des pers. compétentes, de retrouver des infos pertinentes dans des documents, de découvrir des services utiles, de communiquer ou publier pour partager des conn. spécifiques …. Analogie entre les ressources du Web et les ressources de la mémoire d’entreprise. Modélisation des connaissances et Web sémantique
Modélisation des connaissances et Web sémantique Vers le Web Sémantique Langages pour représenter des metadonnées (ou annotations sémantiques) : RDF Vers un langage standard pour représenter des ontologies: RDF Schema, OIL, DAML, DAML+OIL OWL Méthodes & outils pour construction (semi)-automatique ou coopérative des ontologies & des annotations: WebOde, OntoEdit, Annotea... Langages de requêtes dédiés RDF : RQL... Outils dédiés à RDF : CORESE, ICS Forth RDFSuite, JENA, SESAME, TRIPLE Modélisation des connaissances et Web sémantique
Modélisation des connaissances et Web sémantique Vers le Web Sémantique Services d’inférence sur les métadonnées Passage à l’échelle & performance vs puissance d’expression & puissantes capacités d’inférence Le Web Sémantique vs plusieurs webs sémantiques interopérables Comparaison, Fusion, ou Intégration d’ontologies Web Sémantique et Web services: DAML-S Fouille du Web Sémantique Agents pour recherche d’info ou fouille Modélisation des connaissances et Web sémantique
Approche « Web sémantique d’entreprise » Mémoire d’entreprise matérialisée dans : des ressources (documents (XML, HTML, ...) ou logiciels ou matériels ou personnes ou services), des ontologies (décrivant le vocabulaire conceptuel partagé par une communauté), des annotations sémantiques sur ces ressources (i.e. le contenu des documents ou les caractéristiques des logiciels/matériels/services ou les compétences des personnes), en se basant sur ces ontologies, avec diffusion sur l’Intranet ou le Web. Modélisation des connaissances et Web sémantique
Spécificités d’un Web sémantique d’entreprise / au Web Sémantique Organisation limitée Accord plus facile sur une politique d’entreprise Ontologies & annotations plus faciles à créer Vérif. de la validité & fiabilité des sources d’info plus facile Profils utilisateurs plus précis Echelle plus réduite pour les corpus de documents, les ontologies… Mais: contraintes de sécurité & confidentialité Besoin de stabilité, compatibilité & facile intégration dans l’environnement interne de travail Modélisation des connaissances et Web sémantique
Ontologies et Annotations L’ontologie permet de capturer les aspects pertinents de la signification des concepts utilisés dans les scénarios d’application. Ontologies et annotations peuvent être représentées en: Graphes Conceptuels (langage de représentation des connaissances, utilisé en IA), ou RDF(S) (langage recommandé par le W3C pour la description des ressources sur le Web) traducteur entre ces langages Modélisation des connaissances et Web sémantique
Principe d’un Web sémantique d’entreprise Ontologies Annotations sémantiques Représent. RDF Schema <rdfs:Class rdf:ID=« Facteur-Accident »> <rdfs:suclassOf rdf:ressource=« http:/…> </rdfs: Class> <rdfs:Class rdf:ID=« Ambiguite-clignotant »> <rdfs:SuClassOf rdf:ressource=« #Facteur-Accident » /> </rdfs:Class> <accident> <date> 19 Mai 2000 </date> <description> <facteur>le facteur d ’accident mis en cause est un problème d ambiguïté clignotant sur une nationale très fréquentée</facteur> </description> </accident> Documents (XML) Recherche d’info utilisant les capacités des GC RDF Traduction RDF -> GC (CORESE) Modélisation des connaissances et Web sémantique
Rôles possibles de l’ontologie Un composant de la mémoire, destiné à être exploré par l’utilisateur final vs Une référence pour indexer/annoter sémantiquement la mémoire à des fins d’amélioration de la recherche de ressources ou d’information dans la mémoire vs Une base pour la communication et l'échange d’information entre des programmes, des agents logiciels Modélisation des connaissances et Web sémantique
Modélisation des connaissances et Web sémantique Thèmes de recherche Comment construire et faire évoluer les ontologies et les annotations ? Comment les représenter et raisonner dessus ? Comment les exploiter pour la recherche d’information ou pour la dissémination pro-active d’informations ? Comment gérer une mémoire distribuée ? Comment manipuler de multiples ontologies ou des annotations multi-points de vue ? Modélisation des connaissances et Web sémantique
Modélisation des connaissances et Web sémantique Projet Européen COMMA Système Multi-Agents de Gestion des Connaissances Mémoire distribuée Auteur Documents Annotations RDF Documents Ontologies, modèles d ’entreprise, modèles utilisateurs (RDFS), Créateur d ’ontologies Utilisateur final (Nouvel employé, Veilleur…) Modélisation des connaissances et Web sémantique
Modélisation des connaissances et Web sémantique Ontologie O ’CoMMA Méthode: Recueil, Phase terminologique, Structuration, Validation, Formalisation en RDFS Résultat: 470 concepts, 80 relations, 13 niveaux de profondeur Niveau spécifique Haut niveau médian Aspects Entreprise Document Utilisateur Domaine Modélisation des connaissances et Web sémantique
Modélisation des connaissances et Web sémantique CoMMA : Conclusions Méthode de construction de l’ontologie + Structure de l’ontologie Recherche d’infos par des agents guidés par des ontologies et des modèles : “agents Corese” Possibilité de distribution de la mémoire : distribution des annotations et distribution des requêtes Modélisation des connaissances et Web sémantique
Mémoire de projet véhicule (RENAULT) Objectif : Capitaliser les connaissances sur les problèmes d’un projet véhicule. Approche SAMOVAR : Exploiter un outil de traitement linguistique sur les champs textuels du Système de Gestion de Pbs Construire une ontologie (Problème, Pièce...) Annoter les descriptions de pb avec cette ontologie Exploiter le moteur de recherche CORESE pour la rech. d’infos Modélisation des connaissances et Web sémantique
Construction de l’Ontologie Problème Ontologie Pièce Enrichiss. ontologie Problèmes Candidats à insérer dans l’onto Problème Champs textuels de la base SGP Sorties Nomino UCN(A), N, ... Extraction Nomino Ontologie Problème Validation Interviews Bootstrap de l’ontologie Problème Initialisation ontologie Base règles heuristiquesterminol. Modélisation des connaissances et Web sémantique
Modélisation des connaissances et Web sémantique Organisation de SAMOVAR SAMOVAR I H M Ontologie RDFS Moteur de recherche CORESE Je cherche toutes les pièces sur lesquelles des problèmes de claquement ont été observés Base annotée RDF Modélisation des connaissances et Web sémantique
Recherche guidée par l’ontologie Zone Poste de Conduite Latéral Climatisation Instrumentation Planche de Bord Climatiseur Traverses Poste de Conduite Vide Poche Levier de vitesse Evacuation de condensation Volant de direction Tableau de bord ARCHITECTE G F E PIECES Extrait de l’ontologie Pièce Problème Montage Géométrie Fixation Centrage MEP Vissage Clipsage Agrafage Accostage Chaussage Extrait de l’ontologie Problème Modélisation des connaissances et Web sémantique
Modélisation des connaissances et Web sémantique SAMOVAR : Conclusions Ontologie dans une véritable application industrielle Méthode de construction d’une ontologie à partir de textes : Exploitation d’outils de TALN + validation humaine Méthode de construction d’une mémoire de projet Modélisation des connaissances et Web sémantique
Modélisation des connaissances et Web sémantique Projet RNRT « KMP » KMP = Knowledge Management Platform Objectifs : Concevoir un prototype d’un Serveur Web Sémantique de compétences pour le partenariat inter-firmes dans le domaine des télécommunications & Analyser les usages collectifs du prototype Exemple de requête visée : I am seeking for an industrial partner knowing how to design integrated circuits within the GSM field for cellular/mobile phone manufacturers Zone : Telecom Valley (Sophia Antipolis) Equipe multi-disciplinaire Conception centrée utilisateur et participative Modélisation des connaissances et Web sémantique
Modélisation des connaissances et Web sémantique Conclusions Approche « Web sémantique d’entreprise » : recherche d’info guidée par des ontologies et des annotations Comparable à d’autres projets : C-WEB, DECOR, FRODO, MESMUSES, OntoKnowledge,... Différents rôles de l’ontologie Applications : accidentologie, bâtiment, automobile, télécommunications, santé, biologie Scénarios : mémoire de projet, veille techno, cartographie des compétences... Perspectives : « Web sémantique inter-entreprises / inter-communautés » Passage à l’échelle + hétérogénéité + dynamique + services web sémantique Knowledge Web Modélisation des connaissances et Web sémantique