Corese Moteur de recherche sémantique pour RDF

Slides:



Advertisements
Présentations similaires
Mais vous comprenez qu’il s’agit d’une « tromperie ».
Advertisements

Le Nom L’adjectif Le verbe Objectif: Orthogram
ORTHOGRAM PM 3 ou 4 Ecrire: « a » ou « à » Référentiel page 6
LES NOMBRES PREMIERS ET COMPOSÉS
Licence pro MPCQ : Cours
Additions soustractions
Distance inter-locuteur
1 Plus loin dans lutilisation de Windows Vista ©Yves Roger Cornil - 2 août
11 Bienvenue Entrez le nom du groupe ou projet ici mardi, 17 novembre 2009.
Corese Moteur de recherche sémantique pour RDF
Le langage de requêtes SPARQL SPARQL Protocol And RDF Query Language
Web Sémantique RDF
Le langage de requêtes SPARQL SPARQL Protocol And RDF Query Language
1 Semantic Web Olivier Corby. 2 Semantic Web Évolution du Web pour permettre le traitement automatique des informations (par programme) Documents structur.
Ontologie Olivier Corby.
Les numéros 70 –
Les numéros
Les identités remarquables
Le, la, les words Possessive Adjectives MINE!!. 2 My in french is mon, ma,mes... Le word/ begins with a vowel: Mon La word: Ma Les word: Mes.
Demande globale, élasticités et équilibre de marché
Sirop de Liège « industriel »
Introduction à la logique
LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.
1 7 Langues niveaux débutant à avancé. 2 Allemand.
COTE DIVOIRE IMAGES DES ATROCITES COMMISES PAR ALASSANE DRAMANE OUATARA, SORO GUILAUMES ET LEURS HOMMES 1.
SERABEC Simulation sauvetage aérien avec un Hercule C130. Départ de St-Honoré le 4 octobre Durée de vol 3 heures. Premier vol en Hercule pour les.
La méthodologie………………………………………………………….. p3 Les résultats
Interagir avec un objet mixte Propriétés physiques et numériques Céline Coutrix, Laurence Nigay Équipe Ingénierie de lInteraction Homme-Machine (IIHM)
1 Cours numéro 3 Graphes et informatique Définitions Exemple de modélisation Utilisation de ce document strictement réservée aux étudiants de l IFSIC.
Jack Jedwab Association détudes canadiennes Le 27 septembre 2008 Sondage post-Olympique.
Le soccer & les turbans Sondage mené par lAssociation détudes canadiennes 14 juin 2013.
Web Sémantique: Le Relief Actuel
1 Guide de lenseignant-concepteur Vincent Riff 27 mai 2003.
GRAM 1 CE2 Je sais transformer une phrase affirmative en phrase négative.
Le drapeau canadien comme symbole de fierté nationale : une question de valeurs partagées Jack Jedwab Association détudes canadiennes 28 novembre 2012.
Session 7 1 IST/VIH/SIDA.
Le Concours de Conaissance Francais I novembre 2012.
Si le Diaporama ne s'ouvre pas en plein écran Faites F5 sur votre clavier.
Titre : Implémentation des éléments finis sous Matlab
RDF(S)
Projet poker 1/56. Introduction Présentation de léquipe Cadre du projet Enjeux Choix du sujet 2.
LES NOMBRES PREMIERS ET COMPOSÉS
VOC 1 CE2 Je sais utiliser des mots de la vie quotidienne.
Logiciel gratuit à télécharger à cette adresse :
Les chiffres & les nombres
1.Un rang de données multicolores 2. Deux permutations des n premiers entiers 3. b permutations des k premiers entiers 4. Choix de n points dans [0,1]
W3C OWL Ontology Web Language
RACINES CARREES Définition Développer avec la distributivité Produit 1
Représentation des systèmes dynamiques dans l’espace d’état
DUMP GAUCHE INTERFERENCES AVEC BOITIERS IFS D.G. – Le – 1/56.
La statistique descriptive
Année universitaire Réalisé par: Dr. Aymen Ayari Cours Réseaux étendus LATRI 3 1.
Web sémantique : Web de demain
Titre : Implémentation des éléments finis en Matlab
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
1 INETOP
Influenza: le modèle épidémiologique belge 29 Mai 2009
Aire d’une figure par encadrement
Comment rendre une femme heureuse…
P.A. MARQUES S.A.S Z.I. de la Moussière F DROUE Tél.: + 33 (0) Fax + 33 (0)
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
Traitement de différentes préoccupations Le 28 octobre et 4 novembre 2010.
1/65 微距摄影 美丽的微距摄影 Encore une belle leçon de Macrophotographies venant du Soleil Levant Louis.
Nom:____________ Prénom: ___________
Discussion autour du référentiel
Outil d’analyse des réseaux sociaux à base de Web sémantique
Commission paritaire de suivi des opérations de reclassement repositionnement dans le cadre du droit d’option Statistiques novembre 2010.
La formation des maîtres et la manifestation de la compétence professionnelle à intégrer les technologies de l'information et des communications (TIC)
INRIA, Sophia Antipolis
Transcription de la présentation:

Corese Moteur de recherche sémantique pour RDF Olivier.Corby@sophia.inria.fr Projet ACACIA INRIA, Sophia Antipolis http://www.inria.fr/acacia «Knowledge is Power»

COnceptual REsource Search Engine Corese COnceptual REsource Search Engine Moteur de recherche RDF Resource Description Framework (W3C)

Histoire 1992 Acacia : acquisition des connaissances à partir de documents structurés avec des graphes conceptuels 1998 : XML 1999 : RDF, 1er prototype de Corese 2000 ICCS : RDF et les graphes conceptuels 2000-2001 : Moteur Corese pour Comma, projet européen

Web Sémantique Extension du Web actuel où l’information serait munie d’une signification (meaning) bien définie Pour faciliter le travail en coopération homme-machine Un Web de données et de documents

Web Sémantique Évolution du Web pour permettre le traitement automatique des informations (par programme) Documents et données structurés (XML) Associer sémantique (sens) aux documents et aux données

W3C

Applications Préparer automatiquement un voyage, par l’Internet, en combinant des informations (hôtel, avion, voiture) Mémoire d’entreprise : web sémantique d’entreprise

XML Extensible Markup Language Langage de description et d’échange de : documents structurés données structurées W3C

XML Définit la structure (syntaxe) comme un arbre de syntaxe abstraite Mais rien sur la signification, le sens : la sémantique La sémantique permet de définir la signification des balises, donc des informations. Contraint les traitements

Sens <book> book a kind of Document <author> Documents have an author, which is a Person, <title> a title which is a Literal

Sens Décrire le sens avec un certain consensus En utilisant des vocabulaires conceptuels standardisés : ontologie

Ontologie Se mettre d'accord sur le sens des termes employés dans une organisation, une communauté, un métier Faire en sorte que les personnes et les logiciels se comprennent

Ontologie Identifier, modéliser les concepts et les relations d'un domaine, pertinents pour une/des applications Se mettre d'accord, au sein d'une communauté, sur les termes employés pour se référer à ces notions

Ontologie Identifier un domaine technique Recenser, classer les termes du vocabulaire Identifier les termes dénotant des objets des propriétés des relations Classer les objets

Ontologie Identifier les points de vue pertinents du domaine : Technique, Financier, Management Structurel, Fonctionnel

Ontologie Ontologie : modélisation des connaissances Au sens où une théorie physique est un modèle de la réalité Il peut y avoir plusieurs modèles d’une même réalité : expérience de la chute des corps théorie de la gravitation de Newton relativité générale d’Einstein

Connaissance Continuum : donnée, information, connaissance information : SOS connaissance : en cas d’alerte, déclencher les secours La connaissance permet de produire de nouvelles données, informations, connaissances : inférence

Connaissance Connaissances de résolution de problème : conception, diagnostic, évaluation, planification tâches, inférences Connaissances du domaine électronique, mécanique, médecine, etc. Concept, relation

Ontologie Composant réutilisable Réutilisation : généralité, abstraction (reuse) Partage : consensus, standardisation (sharing) Accord sur conceptualisation partagée : engagement ontologique (commitment)

RDF W3C Resource Description Framework Langage de description de meta données pour le web sémantique Modèle de triplets resource property value A l’échelle du web : utilise des URI Permet de classer les ressources

RDF Meta donnée pour décrire le contenu des documents Type de document Auteurs Origine Sujet Public cible

RDF Triples ex:doc ex:title “Theory of Justice” ex:doc rdf:type ex:Book ex:doc ex:author ex:jr ex:doc ex:subject ex:philosophy ex:jr ex:name “John Rawls” ex:jr rdf:type ex:Person

Syntaxe XML <ex:Book rdf:about=‘#doc’> <ex:author rdf:resource=‘#jr’/> <ex:title>Theory of Justice </ex:title> </ex:Book> <ex:Person rdf:about=‘#jr’> <ex:name>John Rawls</ex:name> </ex:Person>

RDF Schema Vocabulaire standard pour décrire des ressources Classes de ressources Propriétés et signatures

Classes ex:Book rdf:type rdfs:Class ex:Book rdfs:subClassOf ex:Document ex:Person rdf:type rdfs:Class ex:Person rdfs:subClassOf ex:Hominidae

Propriétés ex:author rdf:type rdf:Property ex:author rdfs:domain ex:Document ex:author rdfs:range ex:Person ex:name rdf:type rdf:Property ex:name rdfs:domain ex:Person ex:name rdfs:range rdfs:Literal

Inférence de type ex:doc ex:author ex:jr ex:author rdfs:domain ex:Document ex:author rdfs:range ex:Person  ex:doc rdf:type ex:Document ex:jr rdf:type ex:Person

Typage : class Si une ressource a pour type C, alors C est une classe : rdf:type rdfs:range rdfs:Class ex:olivier rdf:type ex:Person  ex:Person rdf:type rdfs:Class

Sous-propriété ex:nickName rdfs:subPropertyOf ex:name ex:jr ex:nickName “Joe”  ex:jr ex:name “Joe”

RDFS XML <rdfs:Class rdf:ID=‘Person’> <rdfs:subClassOf rdf:resource=‘#Hominidae’/> </rdfs:Class> <rdf:Property rdf:ID=‘name’> <rdfs:domain rdf:resource=‘#Person’/> <rdfs:range rdf:resource=‘&rdfs;Literal’/> </rdf:Property>

Ressource anonyme Ressource intermédiaire, sans identificateur Sémantique existentielle : il existe une ressource <ns:Cours> <ns:auteur> <ns:Person> <ns:name>O. Corby</ns:name> </ns:Person> </ns:auteur> </ns:Cours>

Relation n-aire Les propriétés sont des relations binaires Pour décrire une relation n-aire, utiliser une ressource anonyme : <ns:Mobile> <ns:vitesse rdf:parseType=‘Resource’> <rdf:value>130</rdf:value> <ns:unit>km/h</ns:unit> </ns:vitesse> </ns:Mobile>

Relation n-aire <ns:Mobile> <ns:vitesse> <rdf:Description> <rdf:value>130</rdf:value> <ns:unit>km/h</ns:unit> </rdf:Description> </ns:vitesse> </ns:Mobile>

Requêtes Trouver les cours dont O. Corby est enseignant ? Qui enseigne le cours LOG11 ? Y a-t-il un enseignant-chercheur ? Y a-t-il une Personne de l'INRIA ?

Requêtes A la OQL (Object Query Language) select c.num, p.nom from c Cours, p Personne where c.titre like ‘connaissance’ and p.institut = ‘INRIA’

Sémantique Tous les énoncés RDF sont considérés comme vrais, dans un même environnement, la conjonction des énoncés est considérée comme vrai également Il n’y a pas de contexte local (dans lequel quelque chose serait vrai) Il n’y a pas de négation RDF est monotone : ce qui est vrai reste vrai au fur et a mesure que l’on rajoute de l’information RDF est un sous-ensemble de la logique du premier ordre avec des prédicats binaires et des variables existentielles.

Graphes conceptuels Réseau sémantique Concept et relation Concepts et relations typés Hiérarchies de types de concept et de relation

GC [Book:doc]- -(author)-[Person:jr]- -(name)-[Literal:“John Rawls”] -(title)- [Literal:“Theory of Justice”]

GC - RDF Concept  ressource Relation  propriété Type  classe Signature de relation  domain, range Projection pour retrouver des ressources RDF comme format de GC

Différences RDF : relation binaire RDF : ressources peuvent avoir plusieurs types RDF distingue les littéraux et les ressources RDF est multilingue (xml:lang tag)

RDFS Ontologie Annotation RDF subClassOf range domain type subPropertyOf Property Resource Class Literal Ontologie Country Company Person employs subdivisionOf activity Inanimate Entity nationality domain range Annotation RDF www.T-Nova.de www.DeutscheTelekom.de subdivisionOf activity Telecom

Corese Construire une représentation d’un schema RDF et d’énoncés RDF Rechercher des ressources Classer des ressources par inférence de type Compléter la base de ressources par des inférences Serveur Web sémantique

Moteur de recherche Projection d’un graphe requête sur le graphe cible Opérateurs de recherche Projection approchée Groupement des résultats

Requête select d.title, p.name from d Document, p Person where d.title contains ‘XML’ and d.author = p

Requête <c:Document c:Title=‘~XML’> <c:author> <c:Person c:name=‘?x’/> </c:author> </c:Document>

Projection [Document] (author) [Creator] Trouve des occurrences spécialisées : [Paper] (author) [Person] [Report] (author) [Team]

Projection approchée Réponse tolère des concepts non spécialisés Query [TechnicalReport](author)[Person] vs Target : [ResearchReport] (author) [Team]

Distance ontologique Calcule une distance ontologique entre concept requête et concept cible Distance = longueur du plus court chemin le long de la relation de subsomption entre concept requête et cible Distance entre réponse et requête = somme des distances des concepts approchés

Distance entre des frêres : 2 Entre des cousins germains : 4 Distance ontologique Distance entre des frêres : 2 Entre des cousins germains : 4

Distance De plus, la distance diminue avec la profondeur La distance entre un père et un fils de profondeur n est de 1/2n Ainsi Homme est plus proche de Chimpanzé que Vertébré de Invertébré !

Opérateurs ~ contain ^ startWith = < <= >= > < <= >= > ! negation : != !~ | boolean or : ~XML | ~ RDF <: <=: =: >=: >: type

Opérateurs Document ?x =: TechnicalReport Un document de type égal à TechnicalReport

xsd:string xsd:float xsd:integer xsd:date Xsd:boolean XML Schema Datatypes xsd:string xsd:float xsd:integer xsd:date Xsd:boolean

RDF Datatype <!ENTITY xsd ”http://www.w3.org/2001/XMLSchema#” > <c:Person> <c:age rdf:datatype=‘&xsd;integer’>43</c:age> <c:name rdf:datatype=‘&xsd;string’>Laurent </c:name> </c:Person>

Groupement Une requête a pour réponse G1 .. Gn On peut grouper les graphes : distinct x1 .. xn group by x1 .. xn group by connex x1 .. xn count x (by y)

Distinct Une requête a pour réponse G1 .. Gn distinct x1 x2 G1 : x1=Jules, x2=Jim G2 : x1=Jim, x2=Jules Ne garder qu’un seul graphe

Group by Une requête a pour réponse G1 .. Gn group by x1 x2 Joindre les graphes qui ont même x1 et même x2 Ex : grouper les documents par auteur et par année

Group by connex Une requête a pour réponse G1 .. Gn group by connex x1 x2 Joindre les graphes qui ont même valeur pour x1 et/ou x2

Count Une requête a pour réponse G1 .. Gn Count x Compter les occurrences différentes de x dans le graphe résultat Ex : compter les ouvrages d’un auteur

Extensions OWL owl:TransitiveProperty owl:SymmetricProperty owl:inverseOf owl:intersectionOf owl:disjointWith

Intersection owl:Class Woman owl:intersectionOf owl:Class Human owl:Class Female Définit une équivalence entre Woman et l’intersection de Human et Female Human  Female  Woman

Inverse p1 owl:inverseOf p2 X p1 Y  Y p2 X hasParent owl:inverseOf hasChild John hasParent Jim  Jim hasChild John

Symétrie p rdf:type owl:SymmetricProperty X p Y  Y p X ex:sibling rdf:type owl:SymmetricProperty John ex:sibling Jack  Jack ex:sibling John

Transitivité owl:TransitiveProperty X p Y  Y p Z  X p Z ex:partOf rdf:type owl:TransitiveProperty ex:axis ex:partOf ex:engine ex:engine ex:partOf ex:car  ex:axis ex:partOf ex:car

Règles CG1  CG2 Si CG1 alors compléter l’occurrence de CG1, trouvée par projection, par CG2 [Person:?x] -(member)-[Team] -(participate)-[Consortium:?c]  [Participant:?x] –(participate)-[Consortium:?c]

Inférences Préciser le type d’un concept : [Person: ?x] -> [Participant: ?x] Relation entre concepts : [Participant: ?x]-(participate)-[Consortium :?c]

Règle de graphe règles de graphe conceptuel Pour appliquer une règle CD sur un graphe G : 1. Trouver C’, une occurrence de C dans G par projection : C’ C 2. Joindre la conclusion D au graphe G sur les concepts de C’ trouvés par projection

Syntaxe RDF <cos:rule> <cos:if> <c:Person rdf:about=‘?p’> <c:member> <c:Team> <c:participate> <c:Consortium rdf:about=‘?c’/> </c:participate> </c:Team> </c:member> </c:Person </cos:if>

Syntaxe RDF <cos:then> <c:Participant rdf:about=‘?p’> <c:participate rdf:resource=‘?c’/> </c:Participant> </cos:then> </cos:rule>

Serveur Web sémantique Moteur Corese intégré dans un serveur web Ontologie structure l’information

Applications 2000-2001 : Comma 2002 Corese pour Samovar avec Renault 2003-2004 : Corese pour KMP, projet RNRT Cartographie des compétences sur Sophia Antipolis Version de distribution http://www.inria.fr/acacia/soft/corese 2002-2004 : ODL Inria

Comma O’Comma : Corporate Memory Management through Agents Système multi agents (Jade) Ontology en RDF : Document, Entreprise, Domaine, Utilisateur Moteur de recherche Corese : RDF en graphe conceptuels Règles de graphe

Comma Méthode: Recueil, Phase terminologique, Structuration, Validation, Formalisation en RDFS Résultat: 470 concepts, 80 relations, 13 niveaux de profondeur

Comma Haut niveau médian Niveau spécifique Aspects Entreprise Document Utilisateur Domaine

KMP KMP : Knowledge Management Platform Cartographie des compétences en Télécom sur Sophia Antipolis Serveur Web sémantique de compétence Favoriser les partenariats Ontologie en RDF : Compétence, Organisation, Domaine

Projets Futurs eLearning, mémoire d’entreprise, génie civil, documentaire, web sémantique pour l’ énergie

Références http://www.inria.fr/acacia/cours/utt/corese.ppt http://www.inria.fr/acacia/soft/corese

Démo