StorageAcademy 21 juin 2007 StorageAcademy ® 1 StorageAcademy ITIFORUMS, 21 juin 2007 La conduite des projets d’archivage numérique Méthodes pour réussir : étude de cas Jean-Claude Maury
StorageAcademy 21 juin 2007 StorageAcademy ® 2 Projet d’archivage : étapes clés 1 Etapes préparatoires - Désignation d’un sponsor - Constitution de l’équipe projet pluridisc. - Elaboration du plan projet - Formation et information préliminaires 2 Etude de l’existant, identification et classification des besoins - Analyse et bilan de l’existant - Analyse des risques et des contraintes - Classification des données - Identification et classification des besoins d’archivage 3 Elaboration de la politique d’archivage - définition des processus d’archivage 4 Elaboration du projet d’architecture et définition fonctionnelle et technique 5 Demande d’information et de devis 6 Rédaction du cahier des charges - Définition des exigences fonctionnelles et techniques 7 Appel d’offres – consultation des fournisseurs 8 Dépouillement des réponses et sélection de la solution qui répond le mieux aux exigences 9 Etapes de pré-mise en œuvre - Formation des équipes - Mise en place de l’organisation d’archivage - Installation, test, pilote et validation de la solution - Mise en place des processus de revue et d’audit du système 10 Mise en œuvre de la solution - Déploiement puis exploitation de la solution d’archivage
StorageAcademy 21 juin 2007 StorageAcademy ® 3 Définition du cas BETA Profil de la société BETA centre de recherche scientifique environ 1000 personnes (+500 ingénieurs et chercheurs) La situation de BETA archivage dossiers papier pas de politique d’archivage électronique Objectifs du projet d’archivage archivage des données scientifiques et techniques en priorité et comme élément moteur du projet d’archivage solution recherchée complète et évolutive ( « clé en main »)
StorageAcademy 21 juin 2007 StorageAcademy ® 4 Cas BETA - Etapes préparatoires Activités réalisées Formation et information préliminaires Séminaire ½ journée partage d’un espace de communication commun formation des utilisateurs à la problématique et aux enjeux de l’archivage électronique Activités réalisées Formation et information préliminaires Séminaire ½ journée partage d’un espace de communication commun formation des utilisateurs à la problématique et aux enjeux de l’archivage électronique Activités absentes Désignation d’un sponsor Constitution de l’équipe projet Elaboration du plan projet 22 44 55 66 77 88 11 33 99 10
StorageAcademy 21 juin 2007 StorageAcademy ® 5 Cas BETA - Analyse de l’existant et identification des besoins Recueil d’informations auprès des directions opérationnelles, fonctionnelles et des responsables des programmes scientifiques interviews, documentation existante, mesures et calculs…. Etat des lieux : analyse des informations sur l'existant procédures : création, approbation, destruction des informations contraintes : de conformité, économiques, organisationnelles Identification et classification des besoins définition des classes de service d’archivage requises établissement des priorités (pré requis pour évaluer les solutions) Evaluation de l’infrastructure du système informatique en place Réseaux, systèmes, applications, sécurité, PRA/PCA…. Changements déjà engagés (architecture, technologie, exploitation…) 22 44 55 66 77 88 11 33 99 10
StorageAcademy 21 juin 2007 StorageAcademy ® 6 Menaces - conservation à long terme et croissance forte des volumes des données scientifiques et techniques - pertes d’informations essentielles - lois et réglementations sur les informations numériques auxquelles se conformer - contentieux potentiels (contenus sites web…) - archives et copies d’informations critiques insuffisantes pour reprise de certaines activités après sinistre Opportunités - maturité des solutions d’archivage du marché (technologies, processus et pratiques) - étude, pilotée par la DSI, de services d’archivage électronique - gains importants en termes de coût, de productivité et de conformité - adoption d’un système de gestion de contenu standard du marché Cas BETA - Etat des lieux de l’archivage : matrice SWOT Forces - efficacité du service d’archivage papier - existence d’une gestion documentaire GEIDE - conscience de l’importance de la conservation des informations numériques - utilisation individuelle de CD/DVD pour la conservation palliative des données (sites web, formation, etc.) - implication forte de la DSI dans la recherche d’une solution d’archivage adaptée Faiblesses - pas de véritable archivage numérique - utilisation des sauvegardes comme des archives numériques - pas de prise en compte des exigences liées à la conformité - pas de système d’archivage de messagerie -insuffisance du système de GEIDE (images, vidéo, contenus web et archives) -pas de politique de migration des données numériques conservées (support, format, etc.)
StorageAcademy 21 juin 2007 StorageAcademy ® 7 Cas BETA - Identification et classification des besoins (1) Classe1: Données scientifiques et techniques Echelle des volumes : 5 à 6To puis environ 3To/an Echelle des temps d’accès : Accès (presque) en ligne pour données de < 3 ans et <2heures pour autres données Durée de conservation : plusieurs années (3/5/10), et conservation patrimoniale Protection : classique contrôle d’accès et copies d’archives Formats de restitution : ASCII et formats propriétaires Classe1: Données scientifiques et techniques Echelle des volumes : 5 à 6To puis environ 3To/an Echelle des temps d’accès : Accès (presque) en ligne pour données de < 3 ans et <2heures pour autres données Durée de conservation : plusieurs années (3/5/10), et conservation patrimoniale Protection : classique contrôle d’accès et copies d’archives Formats de restitution : ASCII et formats propriétaires Classe2: Fichiers multimédias Echelle des volumes : de plusieurs centaines de GO jusqu’à 1TO Echelle des temps d’accès : depuis un accès en ligne à quelques heures suivant le type (web, documents..) et la classe de données Durée de conservation : de 5 ans jusqu’au-delà de 10 ans Protection : en fonction du type de données et de la classification du contenu Formats de restitution : formats des applications d’origine 22 44 55 66 77 88 11 33 99 10
StorageAcademy 21 juin 2007 StorageAcademy ® 8 Cas BETA - Identification et classification des besoins (2) Classe3: s Echelle des volumes : besoin de classification des e- mails en fonction de leur valeur pour évaluer l’échelle des volumes à archiver archiver une seule copie des pièces jointes (réduction de stockage) Echelle des temps d’accès : accès en ligne pour les s de l’année en cours et quelques minutes pour les mails des années antérieures Durée de conservation : plusieurs années suivant la classe de valeur Protection : suivant la classe de valeur Formats de restitution : formats de l’application Classe4: Bases de Données Echelle des volumes : quelques dizaines de GO Echelle des temps d’accès : accès en ligne pour les 3 années précédant l’année en cours ; accès hors ligne pour les années antérieures Durée de conservation : supérieure à 10 ans Protection : adaptée aux archives à valeur probante pendant 10 ans, puis conservation à valeur patrimoniale/historique Formats de restitution : fichiers Oracle 22 44 55 66 77 88 11 33 99 10
StorageAcademy 21 juin 2007 StorageAcademy ® 9 Cas BETA – Priorités et cadencement de réalisation du projet ETAPE 1 ETAPE 2 ETAPE 3 ETAPE 4 Priorité1 Priorité 2 Priorité 3 Priorité 4 22 44 55 66 77 88 11 33 99 10
StorageAcademy 21 juin 2007 StorageAcademy ® 10 Cas BETA – Politique et processus d’archivage Activités réalisées Recensement des bonnes pratiques du marché Définition des classes de service d’archivage électronique Spécification des composants fondamentaux pour la politique d’archivage Spécification de l’organisation ciblée modèle technique centralisé utilisation décentralisée et répartie entre les directions définition des rôles Activités réalisées Recensement des bonnes pratiques du marché Définition des classes de service d’archivage électronique Spécification des composants fondamentaux pour la politique d’archivage Spécification de l’organisation ciblée modèle technique centralisé utilisation décentralisée et répartie entre les directions définition des rôles Activités absentes Travail interne pour réaliser les synthèses conduisant à l’élaboration de la politique d’archivage électronique charte d’archivage et les procédures d’application le catalogue des services d’archivage la définition des processus d’archivage électronique l’infrastructure technique d’archivage 22 44 55 66 77 88 11 33 99 10
StorageAcademy 21 juin 2007 StorageAcademy ® 11 Cas BETA - Projet d’architecture Modélisation utilisée : Norme ISO 14721(OAIS*) S’adresse aux: concepteurs d’archives, gestionnaires d’archives, utilisateurs … Intérêt du modèle définit : une terminologie, un modèle d’information, un modèle fonctionnel aide à clarifier les questions de préservation et d’accès à long terme aide à évaluer les ressources nécessaires pour l’archivage numérique adresse des questions annexes (migrations, coopération entre archives…) * Open Archival Information System SIP : Paquet d’Information Soumis AIP : Paquet d’Information Archivé DIP : Paquet d’Information Disséminé 22 44 55 66 77 88 11 33 99 10
StorageAcademy 21 juin 2007 StorageAcademy ® 12 Cas BETA – Etapes d’analyse des réponses aux RFI 1. Analyse des grilles renseignées par les fournisseurs résultats bruts / réponses aux questions 2. Réalisation de tableaux comparatifs Qualification des réponses Ex d’échelle :« excellent (3) », « bon (2) », « acceptable (1) », « pas de réponse/non existant (0) », Positionnement relatif des offres comparées 3. Pondération des résultats 4. Considération de critères complémentaires de choix 22 44 55 66 77 88 11 33 99 10
StorageAcademy 21 juin 2007 StorageAcademy ® 13 Utilisateurs Validation des versements Consultation des archives Cas BETA –Exemple d’architecture proposée Site distant Librairie bandes Sauvegarde des métadonnées Données archivées Equipement initial: 17To UDO (60Go) Extensible à: 60To Serveur d’archivage Application d’archivage Serveur Web, Administration Jukbox optique Ecriture « en Y » BdD des métadonnées 500Go RAID1/FC Données critiques : 1To RAID1/SATA 22 44 55 66 77 88 11 33 99 10
StorageAcademy 21 juin 2007 StorageAcademy ® 14 Cas BETA – Budget prévisionnel à 3 ans pour le projet Le coût total d’acquisition est de 300 K€ (services d’installation, de formation, etc. inclus) Le poste matériel reste le plus élevé Le coût total de possession est de 400 K€ sur 3 ans Les coûts de maintenance totaux et d’achat de médias, pour les extensions de capacité de stockage, représentent 25 % du coût total de possession sur 3 ans Logiciel Matériel Services Coût d'achat 25 % 37.5 % 12.5% +25% Maintenance/3 ans + médias K€K€ +75% 22 44 55 66 77 88 11 33 99 10
StorageAcademy 21 juin 2007 StorageAcademy ® 15 Cas BETA – Points importants pour le cahier des charges Versement Mini workflow de validation avant les actions d’archivage Transfert de fichiers depuis les serveurs opérationnels Gestion Plan de classement reflétant les activités de la société Système d’indexation sur critères système et utilisateur Gestion des quotas par utilisateur Stockage Génération automatique d’une copie de secours de l’archive Scellement sur les médias (données et métadonnées) Gestion automatique d’une hiérarchie de stockage Gestion automatique du cycle de vie des médias Accès (recherche et restitution) Gestion des droits intégrée dans l’infrastructure de sécurité Intégration possible d’un moteur de recherche Administration Conservation d’un historique des opérations (et des migrations) Validation du sort final des données 22 44 55 66 77 88 11 33 99 10
StorageAcademy 21 juin 2007 StorageAcademy ® 16 Une méthodologie est nécessaire pour les projets d’archivage La clé pour réussir un projet : la méthodologie C’est elle qui permet de d’exploiter au mieux le couple (abstraction et pratique), de résoudre les problèmes et de mener à bien les actions permettant d’atteindre les objectifs Deux composantes de la méthodologie : une boîte à outils et un travail en équipe La difficulté relève de l’art de combiner l’abstraction et la pratique, ainsi que la boîte à outils et le travail en équipe La clé pour réussir un projet : la méthodologie C’est elle qui permet de d’exploiter au mieux le couple (abstraction et pratique), de résoudre les problèmes et de mener à bien les actions permettant d’atteindre les objectifs Deux composantes de la méthodologie : une boîte à outils et un travail en équipe La difficulté relève de l’art de combiner l’abstraction et la pratique, ainsi que la boîte à outils et le travail en équipe