Diffuser et valoriser les données de la recherche : exemples issus de l’expérience de la phonothèque de la Maison méditerranéenne des sciences de l’homme Véronique Ginouvès
La phonothèque de la MMSH 8000 heures d'archives 7000 notices cataloguées 6500 heures numérisées 2000 heures en ligne Accessibles sur la base de données Ganoub,
Ganoub : une base de données diffusée sur 4 plateformes 3 GANOUB Dublin core : Isidore, portail du patrimoine oral EAD- Encoded Archival Description : Calames EDM – Europeana Data Model : Europeana
Une histoire de l’interopérabilié, une histoire des financements une histoire du métier 2007Portail du patrimoine oral 2011 Moissonnage par Isidore 2013Intégration dans Calames 2014Europeana Une histoire de collaborations
Mercredi 30 octobre 2015Mercredi 30 octobre 2015 : Du dépôt au partage des archives sonores de la recherche, les évolutions du métier de phonothécaire, Françoise Acquier (CRESSON, Ecole d'architecture Grenoble), Ariane Néroulidis et Marine Soubrié (Phonothèque, Maison méditerranéenne des sciences de l’homme, MMSH, Aix en Provence)
2009 La synthèse des FREDOC : 6 bonnes raisons pour adopter l’OAI- PMH -simplicité -adaptation aux données de recherche -nouvelle cartographie de la connaissance -qualité des métadonnées -valeur ajoutée aux données -développement de nouveaux services Extraits de la conclusion “Retour sur les FREDOC 2009” Nouvelle cartographie de la connaissance et possibilité d’augmenter la masse critique de la recherche sur son domaine, cela même si la ressource numérique n’est pas au bout de la recherche. Une base de donnée constituée par moisson OAI-PMH permet au fournisseur de service de rendre accessibles des données descriptives de documents sans faire peser une lourde charge sur le serveur de chaque fournisseur de données. Par contre, les données exploitées par le fournisseur de service sont le reflet d’un état figé des données collectées. L’OAI-PMH est un bon modèle pour les grands réservoirs de données comme les bibliothèques universitaires. Pour réaliser la phase finale de ce protocole il faut une bonne qualité de métadonnées. Ce protocole est un outil simple et facile à mettre en place mais les fonctions annexes de normalisation et de retraitement des données peuvent être lourdes. Le partage des données va permettre de donner une valeur ajoutée par un contrôle de qualité. Avec ce protocole, les professionnels de l’information ont la possibilité de développer de multiples services en n’investissant en une seule fois dans la création de ressources.
2010 Un réseau documentaire associatif sur la source orale, lié aux musiques et danses traditionnelle (FAMDT), lance un portail collectif.
Plan national de numérisation Le réseau FAMDT documente des enquêtes de terrain enregistrées sur une large partie de l’hexagone, numérisées en partie dans le cadre du PNN.
Les centres de ressources liés à la FAMDT ont uniformisé leurs pratiques de catalogage dès 1994 en publiant des guides de bonnes pratiques /document
2008 Rédaction d’un cahier des charges pour créer un catalogue collectif.
fabrication du PPO Plus de notices décrivant des archives sonores et audiovisuelles réunies par 9 centres de ressources
Depuis 2011 des archives sonores en relation avec les données de la recherche Exemple de recherche : homme politique marseille sources de données numériques regroupées en 92 collections pour donner accès à ressources dont archives sonores ou audiovisuelles consultation le 19 septembre 2015
Depuis 2011, création du consortium “archives des ethnologues” LAS : Laboratoire d’Anthropologie Sociale LESC : Laboratoire d’ethnologie et de sociologie comparative MMSH - la Phonothèque CREDO : centre de recherche et de documentation sur l’Océanie IMAf : Institut des mondes africains CRBC : Centre de Recherche Bretonne et Celtique Centre d'études himalayennes IrAsia : institut de recherches asiatiques
2012, première participation de la phonothèque à une ANR L’accès aux données de la recherche est une demande institutionnelle ANR Colostrum (programme blanc ) : « L’alimentation pré-lactée (don et consommation néonatale du colostrum) : pratiques, représentations et enjeux de santé publique ». Chef de projet Joël Candau, Laboratoire d'Anthropologie et de Psychologie Cognitives et Sociales (LAPCOS, ex-LASMIC, Nice). ANR Histinéraires (programme blanc ), « La fabrique de l’histoire telle qu’elle se raconte. Etude des mémoires de synthèse des activités scientifiques, ». Chef de projet Patrick Garcia, Institut d’histoire du temps présent (IHTP, Paris).
2013 : entrée de la phonothèque dans Calames Catalogue en ligne des archives et des manuscrits de l'enseignement supérieur conçu et développé par les équipes de l'ABES (Agence bibliographique de l’enseignement supérieur). Evolution du Répertoire national des manuscrits littéraires français du vingtième siècle (Palme) et du Catalogue général des manuscrits des bibliothèques publiques de France, catalogue imprimé commencé sous la monarchie de Juillet Exemple de recherche : Henri Lhote
Poster sur HAL SHS : Les balises essentielles pour le catalogage des archives sonores en EAD
Calames Une plateforme de catalogage originale en cours d’évolution Un avis sur les plus – accès authentifié en ligne indépendant du poste – verrouillage des fragments en édition – consultation possible de tous les fichiers encodés par les autres participants – facilitation de la saisie en EAD – possibilité de publications intégrale ou partielles – lien des points d’accès aux autorités IdRef - Soutien d’une équipe de professionnels, plateforme d’aide en ligne et téléphonique - Communauté en soutien Un avis sur les moins – Repose sur des technologies Microsoft et l’usage exclusif du navigateur Internet Explorer – Une maintenance, performance et évolutivité de l’outil qui semblent difficiles – Pas d’imports – Pas d’accès au code XML créé – Problèmes variables d’accès réseau ou organisationnels (proxys, affichages, droits d’administration sur les postes…)
2014 Participation à Europeana Sounds Durée : 36 mois (février 2014-Janvier 2017) Objectif : 1M enregistrements sonores sur le portail Europeana en organisations participantes, dans 12 pays, sous la direction de The British Library (BL) 7 Work Packages : WP1 : Aggregation, WP2 : Enrichment & participation, WP3 : Licensing guidelines, WP4 : Channels development, WP5 : Technical infrastructure, WP6 : Dissemination & networking, WP7 : Project management & sustainability
Europeana Sounds : participants Allemagne : Deutsche Nationalbibliothek, Rundfunk Berlin-Brandenburg ; Autriche : Oesterreichische Nationalbibliothek, Austrian Institute of Technology, Technisches Museum Wien mit Osterreichischer ; France : BnF ; CNRS – MAE & MMSH - ; Grèce : National Technical University of Athens, Music Library of Greece ; Italie : Istituto Centrale per il Catalogo Unico delle Biblioteche, Net7 Srl ; Danemark : Statsbiblioteket ; Irlande : Irish Traditional Music Archive ; Comhaltas Ceoltoiri Eireann ; Lettonie : National Library of Latvia ; Lituanie : UAB DIZI ; Pays-Bas : Nederlands Instituut Voor Beeld en Geluid ; Max Planck Gesellschaft Zur Foerderung der Wissenschaften, Nederland Kennisland, Europeana ; Portugal : Faculdade de Ciencias Sociais e Humanas da Universidade Nova de Lisboa ; Royaume Uni : The British Library ; We Are What We Do ; Community Interest Company ; Sabhal Mor Ostaig.
Europeana Sounds : les objectifs -Augmenter la quantité de contenus sonores sur le portail Europeana, en particulier en direction du grand public : 1M en 2017 ; -Améliorer leur accès en enrichissant leur description et en développement des outils participatifs ; -Développer des canaux sonores spécifiques vers différents publics, pour améliorer le moteur de recherche, la navigation et l'expérience utilisateur ; -Promouvoir la réutilisation des enregistrements sonores ; -Améliorer les bonnes pratiques dans le domaine de la diffusion des données sonores, en publiant des recommandations et des préconisations ;
Europeana Sounds un travail collectif pour améliorer l’accès aux documents sonores et leur nombre avec un outil commun MINT -Structuration des données en EDM (Europeana data model), un modèle théorique de données pour présenter tous les types de documents, selon des pratiques différentes. -Définition d’une politique de sélection de contenu : Nombre de documents Qualité des documents mis en ligne Intérêt du public Questions éthiques et juridiques -Partage de référentiels : Thématique et typologies Langues Répartition géographique
MINT Metadata INTeroperability services MINT est une plate-forme web, au code source ouvert, pour l'interopérabilité des métadonnées Utilisée dans plus de 15 projets d’Europeana par plus de 300 organisations culturelles soit quelques 500 utilisateurs. MINT a permis de produire et de publier plus de enregistrements de métadonnées sur Europeana. Créé en 2008 pour le projet Athena : enregistrements de métadonnées, provenant de 23 musées et autres types d’institutions, ont été versées à Europeana
Zone du schéma DC (input) Zone du mapping Zone de navigation
MINT Metadata INTeroperability services -La qualité des métadonnées doit être améliorée mais la question du traitement documentaire du son n’a pas toujours été abordée -Beaucoup de fournisseurs ont des données sur les aspects techniques de l’enregistrement et sur les transferts numériques, peu sur les contenus -MINT est d’abord conçu pour l’image et n’a pas prévu l’organisation en collection -Les référentiels communs permettent de travailler sur le multilinguisme -L’essentiel est de pouvoir diffuser, le juridique domine l’éthique (cf limite de 30 secondes pour les enregistrements commerciaux vs les entretiens de terrain)
L'utilisateur peut - sélectionner un terme (par le thésaurus) qui sera appliqué à tous les articles - aligner ses valeurs internes à des termes choisis par le thésaurus.
Europeana embarque uniquement les métadonnées, les fichiers numériques sont diffusés par les fournisseurs de données.
MINT – Workflow actuel Harvesting Mapping MINT OAI Europeana Transformation Annotation Publication Statistics Import Mapping XSL Output Europeana A ➔ B ➔ … NoSQL Th. Portal RDBMS Triple store SPARQL LOD Diapositive de NTUA
L’expérience d’Eureopeana : pour mettre en avant les données sonores l’interopérabilité n’est pas suffisante… mais elle est essentielle ! Les métadonnées des fournisseurs sont hétérogènes, dans des langues et des alphabets multiples, le lien avec entre les vocabulaires spécifiques et les référentiels du web est une nécessité mais elle est difficile à réaliser d’autant plus que les objectifs des centres de ressources ne sont pas les mêmes. La production de métadonnées de haute qualité dépend toujours de l'utilisateur. Un outil ne peut que fournir des services malgré toute sa flexibilité. Les compétences à acquérir du côté des fournisseurs ne sont pas minimes.
Participer à des portails est essentiel mais le moissonnage n’est pas toujours possible, la collaboration doit être ouverte à tous.
Et facilitent l’écriture collective Être interopérable implique l’usage de bonnes pratiques qui facilitent la valorisation par d’autres modes : L’écriture collective
Être interopérable implique l’usage de bonnes pratiques qui facilitent la valorisation par d’autres modes : L’éditorialisation des données
Participer à des portails est essentiel parce que cela implique l’usage de bonnes pratiques qui facilitent la valorisation par d’autres modes : La publication des instruments de recherche
Organisation d’une journée participative ou “Edit-a-thon” à la MMSH le vendredi 23 octobre 2015 Être interopérable implique l’usage de bonnes pratiques qui facilitent la valorisation par d’autres modes : Organisation de journées participatives
2015 Et pour conclure, selon vous quelle sont les bonnes raisons de devenir interropérable ? Réajustement des raisons d’être interopérables évoquées en conclusion des FREDOC 2009 : -simplicité la veille n’a de cesse comme l’adaption aux évolution des modèles de données et du web ou la veille qualité -adaptation aux données de recherche : oui mais les projets culturels dominent -nouvelle cartographie de la connaissance : un des enjeux les plus importants qui n’a pas encore été développé -qualité des métadonnées : certes, mais les archivistes doivent aussi s’intéresser à tous les types de données -valeur ajoutée aux données : oui -développement de nouveaux services : l’éditiorialisation des données est au coeur des enjeux de valorisation.
L’expérience de la phonothèque à propos de l’interopérabilité : un apprentissage du partage des valeurs archivistiques et professionnelles ➢ Veiller à conserver l’intégrité des collections et la contextualisation des archives ; ➢ Envisager systématiquement les questions des droits des informateurs d’hier et d’aujourd’hui mais aussi ceux des utilisateurs de demain ; ➢ Ne jamais travailler hors des standards et des normes ; ➢ Aucun projet ne s’effectue seul-e, le travail productif est toujours le fruit d’une collaboration.
Merci de votre écoute, belles expériences interopérables... N’oubliez pas… Vous êtes bienvenu-e-s le 23 octobre prochain à Aix-en-Provence pour une nouvelle expérience de partage de données
Crédits photographiques Diapo 1 : Bill Smith de KOAC avec un magnétophone portable, 1955, Archives de l’Etat de l’Orégon (pas de restrictions de droit connues). D épôt des archives de Marceau Gast, Laure Principaud, Numérisation à NTRZ, Dar-es-Salam, Tanzanie, Véronique Ginouvès, Diapo 2 : MMSH, Pierre Monteil, Diapo 46 : photographie d’un Edit-a-Thon à Amsderdam, Diapo 49 : retour de pêche, île de Providencia, Colombie, Véronique Ginouvès, Merci aux collègues du résau de la FAMDT, CALAMES, ABES, Consortium des ethnologues, Europeana Sounds, NTUA, Nederlands Instituut voor Beeld en Geluid.