La conception technique du système d’information, l’interopérabilité entre sources de données hétérogènes CNAM / 31 janvier 2012 Colloque INTD-CNAM (Dicen)
Problèmes d’intégration des outils de référencement dans les systèmes d’information Catalogue Catalogue collectif Périodiques en ligne Thèses en ligne e-books Ressources pédagogiques Ressources multimédias Bases de signets Enregistrements sonores Catalogues de bibliothèques associées ou partenaires Archives ouvertes
Sur le parcours de l’usager… rq1rq2rq3rq4rq5rq6rq7rq8rq9 OPAC Catalogue local Catalogue collectif Ressource électroniques Cédéroms Thèses en ligne Périodiques en ligne Ressource pédagogiques Images Documents sonores Bouquet 1Bouquet 2Bouquet 3 E-books
Alors que l’on aimerait avoir : OPAC Catalogue local Catalogue collectif Ressource électroniques Cédéroms Thèses en ligne Z39-50 E-books Périodiques en ligne Ressource pédagogiques Images Documents sonores Bouquet 1Bouquet 2 Bouquet 3 Point d’entrée unique (1) 1992, «Z3950 and the Scholar’s Workstation Concept » : rendre la recherche accessible dans un domaine donné à partir d’une interface unique [Phillips, Gary Lee] (1)
IGP Catalogue d’imprimés (oracle/Mysql) Surcouche web capable de « plonger » dans différentes sources (Interface Grand Public) OPAC Catalogue de périodiques en ligne (Mysql) Catalogue d’e- books (Mysql) connecteurs Ori-OAI Ressources pédagogiques Thèses électroniques Interopérabilité de niveau 1 Interopérabilité de niveau 2 Recherche frédérée Schémas de mise en œuvre de l’interopérabilité
Le système d’information documentaire est un dispositif informatique global d’accès à la documentation, aux ressources pédagogiques et à l’information multimédia, depuis un poste de travail ou de consultation banalisé, grâce à une interface unique rendant à l’usager transparents les différents langages et normes des systèmes agrégés constitutifs et lui permettant l’interrogation de bases de données et de différentes ressources, ainsi que l’accès à des services, tels que la commande, la réservation de documents ou d’autres prestations, un album personnel ; ainsi le catalogue Opac du SIGB, le réseau de CD-Rom, les documents internes numérisés (thèses, cours), les abonnements électroniques, les bases de données bibliographiques, textuelles, factuelles, les campus numériques, etc., sont disponibles, selon les habilitations des usagers (gérées par un annuaire central) sur l’Intranet de l’établissement d’enseignement supérieur ou sur Internet, localement ou à distance. Le SID est constitutif du système d’information de l’établissement (ou portail). Souvent, il en est la pierre angulaire. Il résulte d’une organisation et d’une architecture réfléchie au niveau de la direction de l’établissement et de la mise en commun des savoir-faire de la bibliothèque, du centre de ressources informatiques (CRI) et des enseignants-chercheurs pilotes dans les TICE.“ (Marie-Thérèse Rebat) SIGB (=Système intégré de gestion de bibliothèque) SID (=Système d’information documentaire) SID (=Système d’ingénierie documentaire) ?
Chargé de système d’information documentaire (F) Administrateur de systèmes d’information (E) Intégration de plusieurs logiciels Contrôler et assurer la cohérence du SI et le respect des standards utilisés Interaction entre applications Administration et gestion du SID Qualité, cohérence des informations Veiller au respect des standards Assurer le stockage, le référencement et l’accès aux ressources ( + continuum référencement > contenu) Gestion de bases de données (SGBDr, interaction avec DBA) Uniformisation des classes d’authentification Invention, création, innovation ? Quelle place pour l’architecture ? L’architecte de l’information existe-t-il ?
Peter Webster, Managing Electronic Resources : New and Changing Roles for Libraries, 2008
Catalogue local Catalogue collectif Périodiques en ligne Thèses en ligne e-books Ressources pédagogiques Ressources multimédias Bases de signets Enregistrements sonores podcasts Catalogues de bibliothèques associées ou partenaires Archives ouvertes Ok Catalogue de la bibliothèque Documentation scientifique et technique Bibliothèques / agences bibliographiques nationales Supports pédagogiques Documents multimédias Revues e-books Vidéos oai-pmh API OpenURL Z SRU Z WebService v v v v v v iso 2709 FORTE INTEROPERABILITE
L’interopérabilité, qu’est-ce que c’est ? « L’ interopérabilité est la capacité que possède un produit ou un système, dont les interfaces sont intégralement connues, à fonctionner avec d'autres produits ou systèmes existants ou futurs et ce sans restriction d'accès ou de mise en œuvre. » (AFUL) vs compatibilitéinteropérabilité Cela nécessite une grande transparence sur les mécanismes ou les formats employés… Importance du travail de modélisation des données pour l’évolution des SID
L’intéropérabilité en trois mouvements Elle met en jeu trois niveaux techniques complémentaires (1) : 1. Une description des ressources avec des sémantiques communes 2. Un contexte générique d’implémentation des descriptions dans des langages structurés standardisés, interprétables par des machines 3. Un ou plusieurs protocoles informatiques d’échange de ces données normalisées (1)Abderrazak Mkadmi, Imad Saleh, Bibliothèque numérique et recherche d’informations
Normes en vigueur dans les bibliothèques pour la description bibliographique : Z Catalogage des monographies - texte imprimé Z Catalogage des ressources continues Z Catalogage des monographies anciennes Z Catalogage des vidéogrammes Z Catalogage des enregistrements sonores Z Catalogage des documents cartographique Z Catalogage de la musique imprimée Z Catalogage des images fixes Z Catalogage des parties composantes Z Catalogage des ressources électroniques Z Catalogage des monographies - texte imprimé (description allégée ) Z Catalogage - Choix des accès à la description bibliographique Z Catalogage d’auteurs et d’anonymes : forme et structure des vedettes de collectivités auteurs Z Catalogage d’auteurs et d’anonymes : Forme et structure des vedettes noms de personne, des vedettes titres, des rubriques de classement et des titres forgés Z Catalogage - Forme et structure des vedettes titres musicaux Z Z Catalogage - Forme et structure des vedettes : Noms géographiques Z Documentation - Indexation analytique par matières Z Documentation - Références bibliographiques : contenu, forme et structure
La boîte à outils du bibliothécaire… UNIMARC (< Z et al.) ISO 2709 WAIS (Wide area information server) FTP Z39.50 DublinCore, MARCXML MODS METS EAD LOM (Learning Object Metadata) SCORM RDA XML URI RDF (Resource Description and Framework) W3C http (BNF) OAI-PMH SRU/SRW L’interopérabilité des systèmes d’informations combine 3 niveaux techniques Jeu de métadonnées : Cadre générique d’implémentation : Protocoles :
Production de service documentaire Production d’outils informatiques Interaction design Gestion de procédures Développement (codage) Catalogage Indexation Constitution de collection Achat de flux d’informations Processus métiers Négociation des accès Gestion de projet Tests Formations Produit Forte culture documentaire (métiers) Forte culture informatique (processus)
Les Bibliothèques nationales et l’accès à l’information : le rôle de TEL et de MACS / Genevieve Clavel-Merrin
SRU Termes de recherche : Ok Bibliothèque du Congrès JSTOR
SRU balzac literature | Termes de recherche : Ok v Bibliothèque du Congrès JSTOR
SRU balzac literature | Termes de recherche : Ok Construction d’une requête type SRU à partir des termes saisis : v Bibliothèque du Congrès ?version=1.1 &operation=searchRetrieve &query=balzac+and+literature &maximumRecords=2000 &recordSchema=marcxml = URL de base = version de la requête = opération demandée = paramètres de la requête = nb. max. de rép. souhaitées = format de réponse souhaité NB : ici, le format souhaité est le paramètre « marcxml ». Schéma dans lequel la notice doit être fournie. La valeur est l’URI du schéma ou son affichage abrégé défini par le serveur. JSTOR
aise+cendrars%22&version=1.1&operation=searchRetrieve&recordSchema=info%3 Asrw%2Fschema%2Fsrw_jstor&maximumRecords=20&startRecord=1&recordPacki ng=xml
Les « grammaires » de l’interopérabilité Jeu de métadonnéesCadre générique d’implémentation protocolesLangage(s) de requêtes DiversJ2EE – PHP – Html…APISQL – SQL + - MySQL MARC < Z … ISO 2709Z39.50Internes aux applications LOM – DC – TEF – MarcXml… XMLOAI-PMHHTTP - index RDFXMLSPARQL for RDFSPARQL Query for RDF DC – MarcXml …XMLSRU/SRW SOAP/REST CQL DC – XML -URLWebServices SOAP/REST Divers langages possibles
Interopérabilité : recherche fédérée vs recherche intégrée Recherche FEDEREE : interroge des ressources externes Faible contrôle des données Présentation et transport des données : TCP-IP / HTTP / Z3950 / SRU / API / Web services / Connecteurs Expositions des données par flux XML, sortie des données hors des bases Dialogue entre applications Sortie des données des SGBDR pour les exposer dans des formats plus volatiles et plus propices à la manipulation (RDF) Aujourd’hui la recherche fédérée se construit par intégration, pour permettre la manipulation des données recueillies
Architecture de l’Information ou… Construction d’une sémantique commune Mise en place de processus qualité Changements culturels (l’usager en question, structuration des services autour du numérique) Efforts de modélisation importants (Entente entre institutions / transparence) Conclusion Cohérence des catalogues malgré l’hétérogénéité des sources …penser autrement la reconquête de l’intermédiation Tout reste à inventer
Merci de votre attention !