Moteurs de recherche ontologiques Janvier 2007 Joëlle Krummenacher
Table des matière Problématique Une solution: l’ontologie Exemple dans une base de donnée Applications: OntoSearch SHOE Semantic Web Bibliographie
Problématique Les moteurs de recherche actuels par mots-clés ne comprennent pas le sens des mots de la recherche, ni des pages indexées. Les annuaires comme Yahoo prennent énormément de temps à remplir. Donc: résultats incohérents et/ou incomplets
Une solution Si le moteur de recherche avait une base de connaissance sous-jacente, il pourrait «comprendre» ce que l’utilisateur recherche et le contenu des pages et retourner une liste de pages plus ciblées. Par exemple: Semantic Web, ontologie
Ontologie Ensemble structuré de concepts organisés en graphe dont les relations peuvent être : sémantiques ; de composition et d'héritage (au sens objet) L'objectif premier d'une ontologie est de modéliser un ensemble de connaissances dans un domaine donné.
Exemple d’ontologie RDF(Resource Description Framework ) ou OWL(Web Ontology Language ),…
Exemple de fichier d’ontologie
Ontologie dans une base de donnée Projet NTIC et Mémoire – Base de donnée de photos en Egyptologie http://latlcui.unige.ch/~krummen2/search1.php Par exemple avec des synonymes (généraux ou différentes orthographes,…) de la hiérarchie (des époques pour les plages de temps, rois,…) L’avantage dans la recherche: on peut rechercher avec d’autres mots-clés que ceux entrés dans la base.
Limitations de l’ontologie Générer une base de connaissance (Knowledge Base - KB) dans un domaine donné est difficile et très long. D’où l’idée de pouvoir réutiliser les KB déjà existantes.
OntoSeach 2004 Donc il faut pouvoir rechercher une KB déjà existante, par exemple sur Internet. OntoSearch permet un affichage aisé des pages retournée par la recherche (Google) afin de trouver la KB qu’il nous faut.
OntoSearch2 - 2006
SHOE - Simple HTML Ontology Extentions Une autre option: annoter les pages avec un modèle à tag genre XML. Ici SHOE qui permet de donner un sens aux mots dans la page. 1: Sélectionner une ontologie 2: Utiliser le vocabulaire de l’ontologie pour décrire les concepts de la page à annoter. 3: SHOE indexe les pages annotées grâce à Web-crawler spécifique.
SHOE (suite) Rechercher dans les pages annotées: 1: A travers une applet Java, l’utilisateur sélectionne un contexte (qui correspond à une ontologie). 2: Sélectionner une catégorie 3: Entrer les mots-clés pour les catégories 4: Résultats: URLs
SHOE (suite) Limitations 1: on ne peut pas annoter tout le web. Et surtout il est très difficile d’imposer un standard de tag. Solutions du groupe de recherche SHOE: convaincre les webmasters de tagger les pages: « We feel that if the users can be convinced of the benefits of semantic markup, then they would be more willing to take the time to do it »
SHOE (suite) Limitations 2: Tout le web n’étant pas annoté, une page recherchée est probablement pas annotée SHOE. Le moteur de recherche standard SHOE ne va pas trouver cette page.
SHOE (suite) Solution: Avantages: Dans ce cas il existe la recherche Web. Il transforme la requête pour qu’elle ait la syntaxe des moteurs de recherche sur le web et la leur soumets. Avantages: Demande plus de détails que des mots-clés Tire parti des « features » (« », +, OR) de la recherche, souvent peu utilisés.
Semantic Web Le Semantic Web est un projet créé par le W3C (World Wide Web Consortium). Son but est de créer un moyen universel d’échange d’information par la publication de contenu compréhensible par les ordinateurs (sémantique) sur le Web. Dirigé par Tim Berners-Lee, le Semantic Web étant le Web à travers des standards, des langages (RDF, OWL,…) et des outils.
Aujourd’hui - Conclusion Swoogle 2006 – recherche les ontologies. http://swoogle.umbc.edu/ Conclusion: on trouve plusieurs moyen de rechercher des ontologies mais encore très peu de moteurs de recherche généraux se basant sur cette technologie. Et presque tous sont des projets de recherche.
Bibliographie OntoSearch: An Ontology Search Engine, Zhang, Vasconcelos, Sleeman, University of Aberdeen, 2004 www.csd.abdn.ac.uk/~sleeman/published-papers/p147-ai-2004-Yi-fin.pdf OntoSearch2: Searching and querying web Ontologies, Pan, Thomas, Sleeman, University of Aberdeen, 2006 http://dipper.csd.abdn.ac.uk/OntoSearch/ONTOSEARCH2%20-%20IADIS%20paper.pdf Searching the Web with SHOE, Heflin, Hendler, University of Maryland, 2000 www.cs.umd.edu/fs/www/projects/plus/SHOE/pubs/aiweb2000.pdf W3C – Semantic Web www.w3.org/2001/sw/ Wikipedia www.wikipedia.org/