Web sémantique Par Lydia Carine Mampais KI Bamba SISSOKO Vincent GOURNAY Cours INF 7115 Professeur : Robert Godin
Plan de la présentation Problématique Définition Les 3 couches du web sémantique La couche « Ressources » La couche « Méta Données» RDF et RDF Schéma Ontologies La couche « Recherche de données » Web traditionnel versus Web sémantique Conclusion
Problématique du Web sémantique Web actuel de plus en plus volumineux et diversifié Informations et les services sont de moins en moins exploitables Web actuel n’est pas fait pour être manipulé de façon intelligente par les programmes informatiques Frustrations dans la recherche sur le web actuel Perte de temps considérable avant d’obtenir l’information désirée
Définition Selon le précurseur du web Tim Berners-Lee: « Le Web sémantique n'est pas un Web distinct mais bien un prolongement du Web que l'on connaît et dans lequel on attribue à l'information une signification clairement définie, ce qui permet aux ordinateurs et aux humains de travailler en plus étroite collaboration. » Rendre sémantique le web, c'est compléter les balises HTML par des balises porteuses de sens (XML) ; c'est multiplier et organiser les mots-clés dans le document même (sans que le lecteur ne voit de différence) À un niveau plus élevé, c'est travailler à l'indexation de toutes les ressources du web, documents et services (norme //Resource Description Framework//), pour une exploitation optimale. Présenter XML dans le rapport, parler du manque de sens des balises
Les 3 couches
La couche « Ressources » Objectif Identifier et localiser les diverses ressources du Web Moyen Associer un URI à chaque ressource Web URI (Uniform Resource Identifier) se compose d’un URL et d’un URN URL pour la localisation sur le réseau (http://www.cnn.com/) URN pour un nommage unique et permanent, même quand la ressource devient inaccessible. Forme : urn:NID:NSS - NID (Namespace Identifier) est un identificateur d'espace de nommage. - NSS (Namespace specific String) est la partie spécifique à l'espace de nommage identifié par le NID. L'interprétation syntaxique de cette partie dépend de l'espace de nommage. Exemple: URN:ISBN:0-395-36341-1 Une ressource: n’importe quelle information sur le web que l’on désire localiser Definition URI, URN, URL: http://users.info.unicaen.fr/~herve/ens0405/diaposURI/diapo5.html
Couche « Méta données » Cette couche contient: Un modèle d’assertion RDF (Resource Description Framework) permettant de décrire le contenu. Une normalisation des modèles de description de méta données (schémas RDF) Une ontologie offrant un vocabulaire plus riche basé sur RDF et RDF-schéma Méta donnée est une « Information associée à une ressource du web, permettant d'en favoriser l'utilisation par un agent humain, du fait de son exploitation par un agent logiciel » Les dossiers d’un catalogue de bibliothèque sont un exemple de méta donnée Modèle assertion est une outil nécessaire à la description des ressources. Ontologie = science de ce qui existe Une ontologie est un modèle d’organisation des connaissances dans un domaine donné. Une taxonomie est une exemple d’ontologie. Taxonomie est une classification basée sur les similarités naturelles pour l’homme qui fonctionne souvent par association et abstraction
RDF Resource Description Framework Permet des annotations sémantiques décrivant le contenu des documents Basé sur XML Ces descriptions se basent sur un modèle partagé : une ontologie Un moteur de recherche permet d’exploiter les annotations, de faire des inférences élémentaires et de trouver des documents pertinents
Exemple RDF Noter la syntaxe XML Sens : La ressource est un cours, un cours a des enseignants, l’enseignant est un chercheur de l’UQÀM, Exemple
RDF Schéma Permet de définir les classes et propriétés de ressources Permet la spécialisation de ces classes et de ces propriétés Il adopte une syntaxe XML
Exemple de classe <rdf:Description </rdf:Description> about=?http://www.essi.fr/cours/log11?> - <rdf:type rdf:resource='#Cours'/> - <titre>Modélisation des connaissances </titre> </rdf:Description> <rdfs:Class ID='Cours'/>
Exemple de spécialisation <rdfs:Class rdf:ID='Cours'/> <rdfs:Class rdf:ID='CoursDEA'> <rdfs:subClassOf rdf:resource='#Cours'/> </rdfs:Class> <rdfs:Class rdf:ID='CoursBac'>
Exemple de propriété <rdf:Property rdf:ID=?enseignant ?> <rdfs:domain rdf:resource='#Cours'/> <rdfs:range rdf:resource='#Personne'/> </rdf:Property> <rdf:Property rdf:ID='nom'> <rdfs:domain rdf:resource='#Personne'/> <rdfs:range rdf:resource=’&rdfs;Literal'/>
Ontologie Une ontologie est un modèle d’organisation des connaissances dans un domaine donné RDF Schéma est un simple langage d’ontologie qui fournit un vocabulaire simple OWL (Web Ontology Language) Basé sur RDF et RDF Schéma Étend les possibilités de RDF Schéma Ce qui permet de décrire des vocabulaires extrêmement riches
OWL En plus des notions RDF Schéma, il ajoute les notions suivantes: propriétés de classe équivalente propriété équivalente, identité de deux ressources, différences de deux ressources, contraire entre les ressources, Symétrie entre les ressources, transitivité, cardinalité, etc., permettant ainsi de définir des rapports complexes entre des ressources.
« Recherche de données » Assurer par les agents intelligents capables de faire des inférences Analyse des requêtes par les moteurs de recherche à l’aide des ontologies Recherche d’information grâce à la correspondance: Balise «--» Concept Cette couche est en cours de développement
Web actuel /web sémantique Non typé, ambigu Web sémantique -Ressources typées et relations bien définies entre les ressources. -L’information disponible est plus facile à traiter -Échange de connaissances plus efficace
Web actuel /web sémantique Web traditionnel Web Sémantique web informel web formalisé web quantitatif web qualitatif web opaque web transparent web anarchique web informatique web brouillon web indexé fait de mots fait de concepts contenus amorphes contenus structurés compréhensible par les humains compréhensible par les humains et les logiciels Accumulation intégration contenu quelconque contenu de valeur Concurrence complémentarité saturation Synergie
Conclusion Le Web Sémantique est une série de standards en cours d’élaboration. les ontologies ne sont pas clairement définies Le caractère global du Web versus la limitation nécessaire d’une ontologie. Quantité d’information à rendre « sémantique » Deux directions complémentaires : une ontologie minimaliste pour tous documents des ontologies riches mais limitées à un secteur Tension entre le caractère global du Web versus la limitation nécessaire d’une ontologie
Bibliographie www.w3.org/RDF www.oasis-open.org, Tim Berners-Lee, James Hendler and Ora Lassila (2001), ”The Semantic Web”, ScientifAmerican.com (www.sciam.com), May. http://websemantique.org/ http://www.spectrum.ieee.org/WEBONLY/ Frank Van Harmelen (2004), ”The Semantic Web : What, Why, How ”, IEEE Distributed Systems Online, March http://dsonline.computer.org/0403/d/o3004.htm