La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Le Web sémantique Marie-Christine ROUSSET LIG, Université de Grenoble.

Présentations similaires


Présentation au sujet: "Le Web sémantique Marie-Christine ROUSSET LIG, Université de Grenoble."— Transcription de la présentation:

1 Le Web sémantique Marie-Christine ROUSSET LIG, Université de Grenoble

2 MC ROUSSET – Université de Grenoble 2 Web sémantique : vision du Web du futur u Aujourd’hui : un immense gisement d’informations distribuées décrites par du texte –moteur de recherche par mots-clés –analyse statistique des textes et stockage de gros index de mots u Demain ? : un immense gisement d’informations distribuées décrites sémantiquement –à l’aide de balises porteuses de sens XML –à l’aide d’ontologies RDFS, OWL pour permettre la construction de moteurs de requêtes plus puissants et plus précis que les moteurs de recherche actuel pour faciliter l’intéropérabilité entre ressources du Web

3 MC ROUSSET – Université de Grenoble 3 Un scenario possible Art Painting Work Title Artist Date Museum > art, painting - Guernica Prado - La Fenêtre Antibes - Guitare... Picasso 1937

4 MC ROUSSET – Université de Grenoble 4 XML Semistructured data Tree data model (XML) Query language Lorel, XML-QL, XQL, XSL… select from where Picasso Guernica the bombing of the town... The Prado museum....

5 M2R- MC ROUSSET5 XML: User definable and domain specific markup Knowledge Management Teacher: Rudi Studer Students: Master Knowledge Management Teacher: Rudi Studer Students: Master HTML: Knowledge Management Rudi Studer Master XML :

6 M2R- MC ROUSSET6 XML: Document = labelled tree course teachertitlestudents namehttp............... = DTD: simple grammars to describe legal trees does not prevent from semantic heterogeneity node = label + attr/values + contents

7 MC ROUSSET – Université de Grenoble 7 Limitation of XML: no formal semantics CV name education work private

8 MC ROUSSET – Université de Grenoble 8 PhD Student AssProf AcademicStaff rdfs:subClassOf cooperate_with rdfs:range rdfs:domain Ontology Steffen Staab... http://www.aifb.uni-karlsruhe.de/WBS/sst Anno- tation Siegfried Handschuh... Web Page http://www.aifb.uni-karlsruhe.de/WBS/sha URL instance of Cooperate_with Ontology & Metadata Links have explicit meanings!

9 MC ROUSSET – Université de Grenoble 9 Ontologies : description de la sémantique de méta-données

10 MC ROUSSET – Université de Grenoble 10 Outils Web sémantique u Le web sémantique est possible grâce à des outils pour –Annoter des ressources web –Échanger et interroger des méta-données sur le web –Définir et partager des connaissances (ontologies) –Raisonner sur les ontologies et les méta-données

11 MC ROUSSET – Université de Grenoble 11 Outils Web sémantique u Protégé: google:protege –Université de Stanford, open source –Édition d’ontologies –Création de méta-données –Plateforme extensible (interface, formats de stockage, API) u Jena: google jena semantic web –HP Labs Semantic Web Programme, open source –Environnement de programmation (Java) pour RDF/RDFS et OWL –Stockage et interrogation RDF (SPARQL) u KAON –Université de Karlsruhe, open source –Création et gestion (distribuée) d’ontologies –Construction d’applications fondées sur le raisonnement avec des ontologies Tous ces outils sont fondés sur des standards (W3C) pour garantir l’indépendance des fournisseurs de matériel et de logiciels

12 MC ROUSSET – Université de Grenoble 12 Les acteurs du Web sémantique u Organisations: –W3C, OASIS, DERI, … –Rôle: élaboration de standard, dissémination u Industriels: –IBM, HP, Microsoft,… –Rôle: formulation des besoins, participation aux efforts de standardisation, développement d’outils u Chercheurs: –Universités et centres de recherche –Rôle: fondements scientifiques, participation aux efforts de standardisation, développement d’outils

13 MC ROUSSET – Université de Grenoble 13 Définition de la notion d’ontologies [Gruber 92] u Description explicite de connaissances partagées entre différents acteurs (personnes, applications, agents) u Représentation abstraite et simplifiée du monde réel avec un but (une application) précis(e)

14 MC ROUSSET – Université de Grenoble 14 Catégorisation d’ontologies

15 MC ROUSSET – Université de Grenoble 15 Ontologies u vocabulaires structurés –noms de concepts/classes –noms de propriétés u définis à l’aide de langages formels –pour la définition et typage des concepts et des propriétés –permettant de faire des inférences fondées sur une sémantique logique u peuvent être très simples … ou très complexes –universelles ou spécifiques d’un domaine –selon le niveau de finesse désiré pour la modélisation du domaine

16 MC ROUSSET – Université de Grenoble 16 Thesaurus versus ontologies Art&Architecture Thesaurus (AAT): 34000 concepts, 131 000 termes

17 MC ROUSSET – Université de Grenoble 17 Thesaurus

18 MC ROUSSET – Université de Grenoble 18 Ontologie sur la culture: illustration

19 MC ROUSSET – Université de Grenoble 19 SNOMED u Systemized Nomenclature of Medecine-Clinical Terms –357 000 concepts organisés en hiérarchies de navigation

20 MC ROUSSET – Université de Grenoble 20 Les langages du Web sémantique

21 MC ROUSSET – Université de Grenoble 21 RDF et RDFS u Premier standard de l’activité Web sémantique du W3C –Un modèle de méta-données: RDF (méta-données) et RDFS (schémas) –Plusieurs syntaxes XML pour l’échange des méta-données RDF et de leurs schémas RDFS u RDF (Resource Description Framework) : permet de définir des méta-données associées aux ressources du Web. –Une ressource peut être une page Web, mais aussi un concept (utilisé pour décrire une page Web) que l’on veut lui-même décrire. u RDFS : permet de décrire la sémantique de méta-données RDF –Définition du vocabulaire d’un domaine donné et des relations entre les objets de ce vocabulaire. –Avec une sémantique formelle associée

22 MC ROUSSET – Université de Grenoble 22 u Triple : u Relational :property(resource, value) u Graphical : RDF: un langage de méta-données resource value property http://www.louvre.fr "Le Louvre" MuseumName http://www.paris.fr Located " Paris" CityName

23 MC ROUSSET – Université de Grenoble 23 Application : le réseau social FOAF The Friend of a Friend (FOAF) project is about creating a Web of machine- readable homepages describing people, the links between them and the things they create and do. Distributed RDF/XML records describing people, who they know, projects they work on… © Steve Cayzer, HP Labs

24 MC ROUSSET – Université de Grenoble 24 FOAF - motivations u Augment e-mail filtering by prioritizing mails from trusted colleagues u Locate people with interests similar to yours u ‘Find an expert’ in knowledge communities u Social network analysis u Photo co-depiction © Steve Cayzer, HP Labs

25 MC ROUSSET – Université de Grenoble 25 A Simple FOAF Model Michael Souris foaf:Person mailto:mm@example.com foaf:name rdf:type foaf:mbox © Steve Cayzer, HP Labs

26 MC ROUSSET – Université de Grenoble 26 A More Complex FOAF Model Michael Souris foaf:Person mailto:mm@example.com foaf:name foaf:mbox Donald Canard foaf:Person rdf:type mailto:dd@example.com foaf:mbox rdf:type foaf:name foaf:knows © Steve Cayzer, HP Labs

27 MC ROUSSET – Université de Grenoble 27 Syntaxe XML

28 MC ROUSSET – Université de Grenoble 28 Un document RDF en XML u Un document XML dont l’élément racine a pour nom rdf:RDF. <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"http://www.w3.org/1999/02/22-rdf-syntax-ns# xmlns:monDom="http://www.inapg.fr/mon-rdf-ns#">http://www.inapg.fr/mon-rdf-ns# http://www.inapg.fr/omip/david.htm David Doussot u La représentation en syntaxe XML d’un document RDF impose une sérialisation des instructions RDF, mais l’ordre des instructions n’a pas d’importance.

29 MC ROUSSET – Université de Grenoble 29 Un document RDF-XML

30 MC ROUSSET – Université de Grenoble 30 Dublin Core Metadata Initiative u Forum ouvert (http://dublincore.org/) pour la définition de standards en matière de description de méta-données.http://dublincore.org/ u La liste des éléments de description d’une ressource Web est disponible à l’adresse http://dublincore.org/documents/dcmi- terms/.http://dublincore.org/documents/dcmi- terms/ <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"http://www.w3.org/1999/02/22-rdf-syntax-ns# xmlns:dc="http://purl.org/dc/elements/1.1/"http://purl.org/dc/elements/1.1/ xmlns:dcterms="http://purl.org/dc/terms/"http://purl.org/dc/terms/ > http://www.inapg.fr/omip/david.htm La page personnelle de David Doussot David Doussot fr 2005-10-18

31 MC ROUSSET – Université de Grenoble 31 Langages de requêtes RDF

32 MC ROUSSET – Université de Grenoble 32 RDFS : pouvoir d’expression Permet de définir - des classes et une hiérarchie de spécialisation sur les classes. - qu’une ressource RDF peut être une instance d’une classe RDFS (rdf:type). - des propriétés et une hiérarchie de spécialisation sur les propriétés. - des restrictions sur la valeur d’une propriété (range) et sur le type de ressource décrit par la propriété (domain).

33 MC ROUSSET – Université de Grenoble 33 ArtistName RDFS : illustration Located MadeBy Contains City CityName Literal Museum Work Artist MuseumName Literal Is-a ArcheologyMuseum Is-a ModernMuseum Literal CulturalPlace Is-a WorkName Literal

34 MC ROUSSET – Université de Grenoble 34 RDFS : langage simple mais pouvoir d’expression limité –classes et propriétés atomiques Pas de définition de classes complexes par combinaison (union, intersection ou complémentaire) d’autres classes On ne peut pas définir la classe Personne comme l’union des classes Homme et Femme –axiomes d’inclusion entre classes et propriétés –mais pas d’axiomes de disjonction entre classes On ne peut pas exprimer que Homme et Femme sont deux classes disjointes –pas de contrainte d’existence/cardinalité/unicité de valeurs de propriétés sur les classes On ne peut pas exprimer que toute Personne a une mère ni que toute Personne a exactement deux parents –Pas de contrainte sur les propriétés On ne peut pas dire que la propriété estPlusGrandQue est transitive, que le propriété estPèreDe est fonctionnelle, que la propriété estParentDe a pour inverse la propriété estEnfantDe

35 MC ROUSSET – Université de Grenoble 35 OWL: Ontology Web language u Etend les standards existants du Web –Tels que XML, RDF, RDFS u Fondé sur les Logiques de Description –issues de nombreux travaux en Représentation de Connaissances Sémantique formelle logique: fragments décidables de la logique du premier ordre avec égalité Algorithmes de raisonnement avec une étude approfondie de leur complexité Des systèmes implémentés (RACER, PELLET)

36 MC ROUSSET – Université de Grenoble 36 Les constructeurs de classes de OWL u OWL fait la distinction entre : –des propriétés abstraites (e.g. “friend” or “father”) –des propriétés concrètes (e.g. “age” or “weight”) Les datatypes de XML Schema peuvent être utilisés comme propriétés concrètes u Les constructeurs de classes peuvent être imbriqués –Person   haschild (  haschild.Doctor )

37 MC ROUSSET – Université de Grenoble 37 Les contraintes qui peuvent être déclarées en OWL

38 MC ROUSSET – Université de Grenoble 38 Full OWL, OWL-DL, OWL Lite

39 MC ROUSSET – Université de Grenoble 39

40 MC ROUSSET – Université de Grenoble 40 Applications des technologies du Web Sémantique u Annotation et indexation sémantique de documents –par des termes d’une ontologie u Interrogation de données via des ontologies u Intégration de sources de données hétérogènes –Une ontologie peut servir de schéma médiateur pivot Le contenu des sources est décrit à relativement à l’ontologie L’ontologie sert d’interface de requêtes pour les utilisateurs u Les requêtes doivent alors être reformulées et décomposées en des sous- requêtes exécutables sur les sources de données pertinentes u Un problème de raisonnement très étudié désormais bien compris

41 MC ROUSSET – Université de Grenoble 41 Ontologie du domaine : un ensemble de déclaration de classes en logique de description la classification résultante est calculée automatiquement Construction de médiateur: illustration sur le domaine du tourisme tirée du projet PICSEL

42 MC ROUSSET – Université de Grenoble 42 Hotel Location : France Service + Name City Price/Night/person Flight DeparturePlace : USA ArrivalPlace : France Stop ? : UK DepartureDay : WeekEnd Sémantique formelle Un ensemble de déclarations de vues Une vue : nom + formule logique associée qui définit ce nom Descriptions de sources de données HotelInSource1 FlightInSource2

43 MC ROUSSET – Université de Grenoble 43 annotation sémantique : illustration tirée du projet Webcontent

44 MC ROUSSET – Université de Grenoble 44 Ontologie: illustration

45 MC ROUSSET – Université de Grenoble 45 Vision diagramme de classes

46 MC ROUSSET – Université de Grenoble 46 Extrait en notation XML/RDF/OWL

47 MC ROUSSET – Université de Grenoble 47 Une autre ontologie : extrait

48 MC ROUSSET – Université de Grenoble 48 Le web sémantique aujourd’hui u Des standards du W3C pour décrire, échanger et interroger des méta- données « sémantiques » u Des outils pour faciliter l’édition d’ontologies et l’annotation sémantique de documents u des ontologies sur des différents domaines que l’on peut télécharger et enrichir/modifier –bibliothèque d’ontologies de Protégé –Ontoligua server u De nombreux travaux de recherche avec des résultats en cours de transfer –Contruction automatique d’ontologies –Alignement d’ontologies –Moteurs de recherche sémantiques (Swoogle)


Télécharger ppt "Le Web sémantique Marie-Christine ROUSSET LIG, Université de Grenoble."

Présentations similaires


Annonces Google