La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Larchivage pérenne du document numérique au CINES Mireille Gay(CINES) Formation STAR – 27 septembre 2013

Présentations similaires


Présentation au sujet: "Larchivage pérenne du document numérique au CINES Mireille Gay(CINES) Formation STAR – 27 septembre 2013"— Transcription de la présentation:

1 Larchivage pérenne du document numérique au CINES Mireille Gay(CINES) Formation STAR – 27 septembre 2013

2 Sommaire I. Le CINES. II. La problématique de larchivage numérique pérenne III. La plateforme darchivage du CINES: PAC La mission darchivage au CINES Architecture; Principe de fonctionnement Implémentation des procédures dassurance qualités (techniques et organisationnelles) Les données archivées; Volumétrie 2 Formation STAR, Paris – 27/09/2013

3 Le CINES 3 Centre Informatique National de lEnseignement Supérieur Basé à Montpellier (Hérault, France) EPA créé en 1999, succédant au CNUSC (Centre National Universitaire Sud de Calcul) – créé en 1980 Placé sous la tutelle de la DGRI (Direction Générale de la Recherche et de lInnovation) et de la DGESIP (Direction Générale pour lEnseignement Supérieur et lInsertion Professionnelle) du Ministère de lEnseignement Supérieur et de la Recherche Missions : – Calcul numérique intensif – Archivage pérenne de documents électroniques – Activité transversale : hébergement d'environnements informatiques Plus dinformation : Formation STAR, Paris – 27/09/2013

4 La mission darchivage du CINES Depuis 2004, le CINES a une mission nationale darchivage du patrimoine scientifique. – Arrêté du 7 août 2006 relatif aux modalités de dépôt, de signalement, de reproduction, de diffusion et de conservation des thèses ou des travaux présentés en soutenance en vue dun doctorat – Convention du 2 mai 2007 (faisant suite à celle du 15 octobre 2003) relative à la mise en ligne et larchivage pérenne de données numérisées dans le cadre du programme Persée – Lettre de cadrage du 12 février 2008 recentrant les activités du CINES autour de deux missions stratégiques : le calcul intensif et larchivage pérenne Pour la remplir, le CINES a mis en place le projet PAC, qui a doté le CINES dune plate-forme et dun service darchivage numérique pérenne Léquipe : 1 chef de projet, 8 ingénieurs, 1 archiviste, 2 techniciens (11 ETP) 4 Formation STAR, Paris – 27/09/2013

5 Le service darchivage pérenne du CINES Objectifs : la mise en place dune solution – Performante pour la conservation à moyen et long terme du patrimoine numérique des établissements – Economique et sécurisée Contraintes – Besoin dune solution générique, basée sur les normes du domaine ; – Adoption de standards facilite la démarche qualité pour la conservation ; – Veille technologique et de migration. Les données concernées sont : – Les données scientifiques – résultats dobservations ou de calcul – Les données patrimoniales – pédagogiques, publications, etc. – Les données administratives – archives intermédiaires Dans le respect du contexte législatif archivistique français 5 Formation STAR, Paris – 27/09/2013

6 Tous les projets darchives à long terme partagent la même plateforme – Mutualisation de linfrastructure matérielle darchivage ; – Protocole de versement générique ; – Diminution des coûts de mise en place et dexploitation. Le service darchivage bénéficie des infrastructure et de léquipe dexperts dun Centre Informatique National 4 salles machine (820 m2), 1 salle 500m2 en construction Alimentation électrique (lignes 2,6 MW et 10MW) secourue (groupe électrogène 1,5MW) Réseau RENATER (lien 10Gbits) La Plateforme darchivage pérenne au CINES – PAC v2.0 – Capacité actuelle 40 To + 10 To en reserve – En exploitation depuis Mai 2008 – Logiciel darchivage (Arcsys (Infotel)+développements spécifiques CINES) – Serveurs applicatifs et baie de stockage SUN – Oracle – Librairie de bandes IBM (2 x 1Po) PAC: Les infrastructures, supports et moyens de PAC Formation STAR, Paris – 27/09/2013 6

7 Le contexte, la problématique et les constats Quest-ce que larchivage électronique pérenne ? Larchivage pérenne des documents électroniques consiste à conserver le document et linformation quil contient : Dans son aspect physique comme dans son aspect intellectuel, Sur le très long terme soit 30 ans et au-delà, De manière à ce quil soit en permanence accessible et compréhensible. 7 Formation STAR, Paris – 27/09/2013

8 Le contexte, la problématique et les constats Formation STAR, Paris – 27/09/ Temps 4 risques inéluctables : – Connaissance perdue du contenu des fichiers ; – Format de fichier inconnu ; – Support physique détérioré ; – Logiciel ou matériel de lecture disparu. Archivage pérenne = Mise en place de procédures dassurance qualité pour atténuer limpact des risques lorsquils se réalisent

9 Voici un document que jai créé en 1998… De quoi sagit-il déjà ? Est-ce bien ce qui est indiqué sur la disquette ? La disquette est- elle toujours en bon état ? Mon portable, acheté en 2006, na pas de lecteur de disquette… Jai créé ce document avec Claris Works. Comment retrouver ce logiciel ? Quel est le format du document ? Jai trouvé le logiciel, mais puis- je linstaller et lutiliser sous Windows XP ? Ça marche ! Mais jai perdu toute ma mise en forme… SUPPORT : VEILLE + MIGRATION PHYSIQUE METADONNEES DESCRIPTIVES + IDENTIFICATION UNIQUE et PERENNE ENVIRONNEMENT MATERIEL : VEILLE TECHNO et ANTICIPATION ENVIRONNEMENT LOGICIEL : privilégier les FORMATS DURABLES + MIGRATION LOGIQUE SYSTÈME DEXPLOITATION INTEGRITE AUTHENTICITE 9 Les défis, orientations et choix pour larchivage au CINES

10 Les normes et standards utilisés OAIS - ISO : Reference model for an Open Archival Information System – Modèle purement conceptuel, ne fait aucune recommandation technique P2A Politique et pratiques darchivage (sphère publique) – Recommandations en termes darchitecture, moyens, sécurité, etc. Standard déchanges de données pour larchivage électronique, versement, communication, élimination Normes internationales de description archivistique – ISAAR-CPF – Norme Internationale sur les notices dautorité utilisées pour les Archives relatives aux collectivités, aux personnes ou aux familles – ISAD-G – Norme générale et internationale de description archivistique Métadonnées descriptives de larchive – DCMI – Dublin Core Metadata Initiative Identifiant unique et pérenne – Interne, séquentiel, basé sur le principe URI – Couplé à un identifiant persistant externe de type ARK Empreintes numériques – Hashing MD5, SHA-256, SHA-1 10 Formation STAR, Paris – 27/09/2013

11 Le CINES a une démarche de certification pour valider, mettre en avant les procédures dassurance qualité mises en œuvre : Qualité organisationnelle: La certification Formation STAR, Paris – 27/09/ – Plusieurs audits internes/externes depuis 2009 en collaboration avec le cabinet de consultants Ourouk – Agrément du SIAF pour la conservation darchives publiques intermédiaires (Arrêté du 14 décembre 2010) – Accréditation Data Seal of Approval - attribuée aux centres de préservation numérique ayant mis en place des procédures dassurance qualité afin de garantir laccessibilité et lintelligibilité des informations (15 Mars 2011) (16 critères) – Test audit ISO pour la certification de systèmes darchivage électronique dans le cadre du projet européen APARSEN (7 Juin 2011) dont le CINES est partenaire (48 critères) Objectif de certification du service à lhorizon 2014.

12 Présentant une valeur patrimoniale scientifique ou technique De préférence des objets dits « primaires » – Documents originaux, – Bruts de scan, etc. Dans un format identifié et vérifiable : Les types de documents à archiver de façon pérenne – Format publié – Format largement utilisé (ou promis à lêtre) – Format normalisé si possible Les formats doivent respecter les spécifications de leur format Le système PAC est interfacé avec les outils Jhove, ImageMagick, DROID, ODF Validator, MPlayer pour – Identifier, Valider, Caractériser le format des fichiers transférés TypeFormat TexteHTML, PDF, TXT, XML, ODT ImageGIF, JPEG, TIFF, PNG, SVG AudioWAV, AIFF, AAC, VORBIS VidéoMJPEG2000, MPEG4, THEORA 12 Formation STAR, Paris – 27/09/2013

13 Un outil en ligne pour valider les formats de fichier Outil en ligne permettant de valider les fichiers par rapport aux spécifications de leur format Les contrôles effectués sont les mêmes que ceux effectués lors dun dépôt de document Intègre les mêmes outils (Jhove, Imagemagick, DROID, Mplayer) que la plateforme darchivage PAC Permet une validation des fichiers avant dépôt de la part du producteur 13 FACILE – validation du Format dArchivage du CInes par anaLyse et Expertise Formation STAR, Paris – 27/09/2013

14 Fonds ou Projet darchives PAC: Qualité des métadonnées : Les niveaux de MD dans PAC PPDI.XML DocumentBIR,Bibliothèque dInformations de Représentation formats Spécifications des formats des fichiers archivés. Les schémas xsd, dtd … Projet PPDI, profil darchivage, convention, élimination … Métadonnees_m étier.XML SIP.XML / AIP.XML Spécifications doc techniques

15 La structure du document à archiver Document à archiver composé de deux pièces : 1. La description de larchive – Fichier sip.xml (schéma – 3 sections décrivant : Le document dans son projet darchives (DocDC) Le document proprement dit (DocMeta) Les fichiers du document (FichMeta) 2. Le dossier contenant les documents électroniques à archiver – Répertoire « DEPOT » – Sous-arborescence autorisée – Tout fichier présent doit être décrit dans le fichier sip.xml 15 Formation STAR, Paris – 27/09/2013

16 Les acteurs Le producteur – Personne physique ou morale, publique ou privée, qui a produit, reçu et conservé des archives dans lexercice de son activité. Le service versant – Organisation qui transfère une archive à un service darchives Le service de contrôle – Personne physique ou morale qui effectue le contrôle scientifique, juridique et technique des documents archivés, et éventuellement valide les demandes de communication darchives Le service darchives – Organisation recevant le document à archiver transféré et chargée de la conserver pour permettre à une communauté dutilisateurs/un service demandeur dy accéder et de lutiliser Lutilisateur – Toute personne ou système client en relation avec le service darchives pour trouver les informations archivées présentant un intérêt, et pour accéder au détail de ces informations, dans le respect de la législation applicable en matière de communication des archives. 16 Formation STAR, Paris – 27/09/2013

17 Les échanges Transfert darchives – Transmission physique dune archive ou dun ensemble darchives par un service versant à un service darchives Modification darchives – Modification des métadonnées et/ou du document pour en assurer la préservation Elimination darchives – Elimination des métadonnées et/ou du document à la demande du services darchives, du service versant ou du service de contrôle Restitution darchives – Transmission de documents par le service darchives au service versant ou au producteur afin de leur en restituer la garde Communication darchives – Transmission de copie de document à un utilisateur ayant lautorisation du service versant et /ou du service de contrôle 17 Formation STAR, Paris – 27/09/2013

18 Le modèle fonctionnel OAIS Formation STAR, Paris – 27/09/

19 Larchitecture logique de la plateforme PAC PAC : Plateforme darchivage du CINES Serveur de Transfert Serveur de Stockage Serveur dAccès ProducteurService Versant Administrateur Utilisateur Service de Contrôle 19 Formation STAR, Paris – 27/09/2013

20 Les principes de fonctionnement ServeursFonctions Transfert réception des SIPdétection dun nouveau transfert envoi dun accusé de réception contrôle des SIPstructure informatique conformité des métadonnées sip.xml par rapport au schéma sip.xsd correspondance entre la description sip.xml et les fichiers qui composent le document contrôle et validation du format des fichiers calcul de lempreinte numérique de chaque fichier création des AIPcréation de lidentifiant du document archivé mise à jour des métadonnées : sip.xml > aip.xml transfert de lAIP au serveur de stockage Stockage archivage des AIPcopie multiple de lAIP sur les différents médias ou supports envoi du certificat darchivage vérification périodique de lintégrité des AIP archivés migration technologique fourniture détats et de statistiques Accès contrôle de lauthentification de lutilisateur consultation du catalogue des AIP archivés communication dune copie dun document archivé 20 Formation STAR, Paris – 27/09/2013

21 Les étapes du versement darchives 21 Formation STAR, Paris – 27/09/2013

22 PAC: Qualité du stockage 22 La qualité du stockage garantit la conservation du train de bits composant les fichiers de données Copies multiples: 2 copies sur disques 1 réplication sur un site distant CC-IN2P3 2 copies sur bandes Indépendance des supports de copies (mélange disques/bandes, localisation géographique) Audit fréquent de lintégrité des copies Au niveau matériel : vérification des contrôleurs de disques, contrôleurs réseau etc. Migration physique. Au niveau logiciel : (Archeck module de supervision qui détecte les corruptions silencieuses,..) Calcul des empreintes numériques par échantillonnage et comparaison avec lempreinte initiale Utilisation dalgorithme de hachage (MD5, SHA-256), etc. Formation STAR, Paris – 27/09/2013

23 La stratégie de préservation des documents La stratégie de préservation des documents archivés repose sur la migration (pas démulation) Migration physique – La technologie évolue: changement du support de stockage Effectuée en tâche de fond par lapplication darchivage, pas darrêt de service, le service versant est informé Migration logique – Conversion de formats – Expertise et veille technologique pour la détection de lobsolescence dun format de fichier pris en charge sur la plateforme – Identification dun format offrant de meilleures garanties de pérennité – Migration après accord des services versants concernés – Pas de modification pour le service versant de lidentifiant unique attribué lors de larchivage – Conservation des versions 1 (initiale), n-1 et n dun document migré 23 Formation STAR, Paris – 27/09/2013

24 Larchivage au CINES en quelques dates… ères réflexions sur larchivage numérique Prestation de conseil en AE (2005) Arrêté du 7 août 2006 (Thèses) 1 ères thèses versées dans PAC_V1, une plateforme darchivage « maison » (arrêté du 07/08/2006) Convention pour larchivage du portail Persée (02/05/2007) Recadrage des activités du CINES (lettre du 12/02/2008) Mise en production de PAC_V2 (basée sur la solution Arcsys dInfotel et un client spécifique) « migration de plateforme » Archivage de HAL (Hyper Articles en Ligne), des données orales du CRDO (TGE- Adonis), de livres numérisés (Cujas, BIUS, BUPMC,BSG…) 2009 : 1 er To archivé Agrément du SIAF (14/12/2010) 2013 Archivage Cour des comptes, Inserm Accréditation DSA (2011) Certification ISO (en cours) 26 To archivés Formation STAR, Paris – 27/09/2013

25 Les utilisateurs de PAC 2511/07/2012

26 Les thèses : Volumétrie 12/01/2012 Formation STAR, Paris – 27/09/ Début septembre thèses déposées

27 Les thèses : Répartition des versions de formats Formation STAR, Paris – 27/09/ VersionNombrePourcentage PDF ,6% PDF ,8% PDF ,9% PDF ,6% PDF ,0% PDF ,8% XML ,4% WAV6592,4% TXT1060,4% PNG ,1% PNG ,1% AAC17966,7% MPEG-41180,4% JPEG NA970,4% JPEG ,1% JPEG ,1% GIF 89a290,1% FLAC10,0% TIFF 5.050,0% TIFF ,1% Total ,0%

28 Bilan des théses Formation STAR, Paris – 27/09/ MoisVolumétrie réelle (en Go)Cumul dépôts Dépôts mensuels 1 oct nov déc janv févr mars avr mai juin juil août sept oct nov déc janv févr mars avr mai juin juil août Dépôt sur les deux dernières années

29 29 Questions & Réponses Plus dinformation à ladresse : Formation STAR, Paris – 27/09/2013


Télécharger ppt "Larchivage pérenne du document numérique au CINES Mireille Gay(CINES) Formation STAR – 27 septembre 2013"

Présentations similaires


Annonces Google