Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007
Collaboration avec la BnF Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Contexte STITCH SemanTic Interoperability To access Cultural Heritage Échange et intégration de méta-données Projet de recherche appliqué au domaine patrimonial Collaboration avec la BnF 1 an (2006-2007)
KB Illustrated Manuscripts Web Sémantique et Interopérabilité des Vocabulaires Conceptuels KB Illustrated Manuscripts
KB Illustrated Manuscripts Web Sémantique et Interopérabilité des Vocabulaires Conceptuels KB Illustrated Manuscripts highly structured scheme 24000 concepts Up to 10 levels
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Mandragore hive
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Mandragore
Le problème: hétérogénéité des vocabulaires Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Le problème: hétérogénéité des vocabulaires Des objets conceptuels distincts avec des sens parfois comparables “Sainte Marie” / “la Vierge Marie” “ruines antiques” / “paysage avec ruines” Des représentations différentes Formats: XML ou pas, MARC, … Des modélisations différentes: classes, concepts, termes, etc.
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Le problème
Une solution en deux étapes Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Une solution en deux étapes 1. Homogénéiser la représentation des vocabulaires Représentation standard Représentation compatible avec l’alignement 2. Aligner les vocabulaires Trouver des correspondances sémantiques entre les éléments de vocabulaires différents “ruines antiques” ≈ “paysage avec ruines” “Sainte Marie” = “la Vierge Marie”
SKOS (Simple Knowledge Organisation System) Web Sémantique et Interopérabilité des Vocabulaires Conceptuels SKOS (Simple Knowledge Organisation System) World Wide Web Consortium (W3C) Modèle simple pour représenter des vocabulaires conceptuels (thesauri, classifications,…) sur le WS Comparable à Dublin Core, au niveau des vocabulaires SKOS propose des primitives pour créer des données XML/RDF Concepts et ConceptSchemes Propriétés lexicales (prefLabel, altLabel) Liens sémantiques (broader, related) Notes (scopeNote, definition)
Attention; c’est un standard, tout n’est pas représenté Web Sémantique et Interopérabilité des Vocabulaires Conceptuels SKOS: exemple http://[...]/mandragore/descripteurs/c_230 skos:Concept rdf:type skos:broader http://[...]/mandragore/descripteurs/c_235 skos:prefLabel “saints et bienheureux”@fr Attention; c’est un standard, tout n’est pas représenté Publication et échange de données Celles qui nous intéressent!
Alignement des vocabulaires Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Alignement des vocabulaires Trouver des correspondances sémantiques “ruines antiques” ≈ “paysage avec ruines” “Sainte Marie” = “la Vierge Marie” Le faire (semi-)automatiquement Inspiré de ce qui se fait pour le Web Sémantique alignement d’ontologies
Approches pour l’alignement de vocabulaires Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Approches pour l’alignement de vocabulaires Lexicales Structurelles Statistiques Utilisation de connaissances de contexte Pictures from Frank van Harmelen
Libellés des concepts, gloses Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Alignement lexical Libellés des concepts, gloses broaderMatch barque avancée à la perche Barque
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Après
http://prauw.cs.vu.nl/rp33333/MANDRA-SV-ICE-mandraNewNONE , amphibiens Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Démo http://prauw.cs.vu.nl/rp33333/MANDRA-SV-ICE-mandraNewNONE , amphibiens Blé http://stitch.cs.vu.nl/rp33333/MANDRA-SV-ICE-mandraBASE (login: bnf, mot de passe: PeG111).
Conclusions : Représentation Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Conclusions : Représentation Il est possible de produire des représentations WS standardisées (SKOS) des vocabulaires conceptuels Et des méta-données qui les utilisent Les techniques existantes pour accéder aux méta-données et vocabulaires (OAI-PMH, XML) facilitent le travail C’est utile Réutilisation/interopérabilité des composants applicatifs utilisant les vocabulaires Facilité de la représentation de liens avec des éléments extérieurs au vocabulaire représenté
Conclusions : Alignement Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Conclusions : Alignement Les techniques simples permettent d'obtenir des résultats rapides 12300 concepts de Mandragore “accessibles” depuis Iconclass Leur fiabilité ne permet pas de les considérer comme sources uniques Combinaison avec travail manuel (vérification, complétion) L’alignement sémantique est toujours un problème de recherche difficile Aucune technique n’est parfaite Il faut sélectionner/combiner, en fonction des cas applicatifs
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Merci !
Liens STITCH http://stitch.cs.vu.nl Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Liens STITCH http://stitch.cs.vu.nl Projets d’intégration dans le domaine des bibliothèques: MSAC http://sigma.nkp.cz MACS http://macs.cenl.org Liens Web Sémantique au W3C http://www.w3.org/2001/sw/ SKOS http://www.w3.org/2004/02/skos/ Semantic Web projects dans le domaine patrimonial MuseumFinland http://www.museosuomi.fi/ eCulture http://e-culture.multimedian.nl/ (links to RDF/S and OWL)
Subject vocabulary, collection 1 Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Demo (1) Subject vocabulary, collection 1 Subjects
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Demo (2) Hierarchical path from root to selected subject Possible specialization for selected subject
Semantic alignment of subjects activated Document from Collection 2 Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Demo (3) Semantic alignment of subjects activated Document from Collection 2
Subject from voc2 aligned to voc1:amphibians” Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Demo (4) Subject from voc2 aligned to voc1:amphibians” Back