Journées OAIS pour l’archivage de la recherche en SHS Une grille pour l’archivage intermédiaire et à long terme des données numériques en SHS Lorène Béchard / Philippe Prat bechard@cines.fr / prat@cines.fr Journées OAIS pour l’archivage de la recherche en SHS 23-24 octobre 2012 1
Le Centre Informatique National de l’Enseignement Supérieur Basé à Montpellier (Hérault, France) EPA créé en 1999, succédant au CNUSC (Centre National Universitaire Sud de Calcul) – créé en 1980 Placé sous la tutelle de la DGRI (Direction Générale de la Recherche et de l’Innovation) et de la DGESIP (Direction Générale pour l’Enseignement Supérieur et l’Insertion Professionnelle) du Ministère de l’Enseignement Supérieur et de la Recherche Missions Calcul numérique intensif Archivage pérenne de documents électroniques Activité transversale : hébergement d'environnements informatiques Plus d’information : http://www.cines.fr/ 23-24 octobre 2012 Journées OAIS 2
L’archivage numérique au CINES : deux approches, deux infrastructures PAC : archivage intermédiaire et à long terme de données administratives, patrimoniales et scientifiques Mandat pour l’archivage des thèses électroniques soutenues en France (arrêté du 7 août 2006) Agréé pour l’archivage intermédiaire par le SIAF Périmètre opérationnel : données de l’enseignement supérieur et de la recherche Partenariat avec le TGE Adonis : archivage et diffusion des données numériques en SHS ISAAC : archivage intermédiaire de données scientifiques Dimensionné pour des petites structures ayant de grands volumes de données Une donnée organisée et validée par des communautés d’experts Un travail scientifique valorisé par le partage et la diffusion 23-24 octobre 2012 Journées OAIS 3
Le service d’archivage pérenne du CINES PAC : une plateforme d’archivage électronique + un service dédié de 11 personnes Une solution générique basée sur les normes et standards du domaine : Qualité technique (métadonnées, fichiers, stockage) Qualité organisationnelle (processus métiers, gestion des risques, certification) Une solution mutualisée et sécurisée Des contrôles à tous les niveaux : versement / stockage / communication Une démarche qualité basée sur des audits réguliers et l’obtention d’une certification En production depuis 2008 (PAC v2) – 10 services versants – 23 To archivés Dans le respect du contexte législatif et archivistique français 23-24 octobre 2012 Journées OAIS 4
L’architecture logique de la plateforme PAC Service de Contrôle PAC : Plateforme d’archivage du CINES Serveur de Transfert Serveur de Stockage Serveur d’Accès Utilisateur Producteur Service Versant Administrateur 23-24 octobre 2012 Journées OAIS
Zoom sur… l’expertise en formats de fichier Pour permettre le contrôle de la qualité d’un fichier, celui-ci doit être dans un format identifié et vérifiable : Format publié ; ex. WAV, SVG ; Format largement utilisé ; ex. XML, MPEG4 ; Format normalisé si possible ; ex. PDF (ISO 32000-1:2008), PNG (ISO 15948:2004). Pour pouvoir être lisibles dans le temps et convertibles, les fichiers doivent respecter à la lettre les spécifications de leur format. Les outils libres Jhove, ImageMagick, DROID, ODF Validator permettent une identification, validation et caractérisation des formats. Type Format Texte HTML, PDF, TXT, XML, ODT Image GIF, JPEG, TIFF, PNG, SVG Audio WAV, AIFF, AAC, VORBIS Vidéo MPEG4, THEORA, MKV 23-24 octobre 2012 Journées OAIS 6
Le projet d’infrastructure mutualisée pour l’archivage et la diffusion des données SHS Deux partenaires : le CINES et le TGE Adonis Le TGE Adonis est l’interlocuteur des laboratoires et des structures demandant à bénéficier de l’archivage à long terme Il labellise des projets de conservation à long terme de documents numériques Le CINES est l'opérateur qui assure la conservation, la pérennisation et les migrations futures Les données sont d’abord déposées au CINES qui vérifie notamment la conformité des fichiers à des formats de conservation définis à l'avance Accompagner la mise en forme des données pour l’archivage Garantir la lisibilité et la compréhension sur le long terme Faciliter la démarche d’assurance qualité de l’archivage Le TGE Adonis assure l’accès aux données Les données communicables sont accessibles depuis la plateforme de diffusion mise en place et gérée par le TGE Adonis 23-24 octobre 2012 Journées OAIS 7
L’infrastructure mise en place Plateforme d’Archivage Transfert Synchronisation Synchronisatio n Infrastructure Mutualisée (Grille de Données) Système de diffusion / communication Conversions Formats 23-24 octobre 2012 Journées OAIS
Le projet pilote du CRDO : bilan et perspectives Les objectifs du projet « pilote » CRDO Valider le schéma retenu pour les données orales, sur le plan Des fonctionnalités d'ensemble De la répartition des tâches et des responsabilités entre les acteurs Prouver la possibilité d’extension aux autres données des SHS créées, gérées et utilisées par différents Centres de Ressources Numériques Le bilan du projet « pilote » CRDO La plateforme est en production depuis Mars 2010 Au 31 Décembre 2011, près de 4000 documents multimédia versés Respect des normes du domaine (OAIS – ISO14721, etc.) Bilan du « pilote » validé par le Conseil Scientifique du TGE ADONIS en Septembre 2010 Agrément SIAF obtenu par le CINES le 14 Décembre 2010 Les perspectives Extension de l’infrastructure à d’autres services et laboratoires 23-24 octobre 2012 Journées OAIS 9