Retour d'expérience Groupama sur la sauvegarde dé dupliquée sur baie EMC Data Domain OCTOBRE 2010
Groupama, un groupe multimarque
GROUPAMA SI : GIE Informatique de Groupama External Bunker: Externalisation journalière des K7 en dehors du site de Production New Recovery Data Center 300 m Production Data Center 800m2 + 600m2 Recovery Data Center Paris. .Mordelles Bourges . 250 KM The site of Bourges currently houses in its 2 buildings : 25 000 users connected every day 9.808 Mips on IBM Mainframe computers 5,6 million TPMC Unix on a dozen HP, IBM and SUN machines 1 680 servers including more than 600 virtual servers. 1 502 TeraBytes of disk capacity 365 TB Mainframe 627 TB SAN 510 TB NAS 30 000 slots / 9000 cartridges 22 routers and 281 CISCO Network commutators 205 daily applications up and running. 500 KM Montpellier .
Architecture générale des matériels de sauvegardes SL8500 Open/MFR SL8500 Open/MFR Destaging Destaging Destaging Destaging 6500 slots 6500 slots 12To cache 44To cache 12To cache 44To cache VSM5 SUN VTL SUN VSM5 SUN VTL SUN Bourges 2 Veloprocess Mainframe 1 Po de fichiers K7 8600 K7 68 lecteurs T10 / 9840 8290 slots Open 1,8 Po de fichiers K7 4486 K7 62 lecteurs LTO3/4 8968 slots 3500 slots DD530 Archives Vies SL8500 PSI Open/MFR Bourges 1
Les limites de la solution actuelle de sauvegarde sur notre infrastructure OPEN Le déluge des données Bande passante Sept 2009 : 220To/sem vs Sept 2010 : 300To/sem Saturation VTL SUN dans leur fonction de Destaging sur K7 Sauvegarde des serveurs virtuels VMWare et HyperV Mise à disposition de 50 To en 2010 en protocole CIFS sur NAS Netapp Croissance à +35% annuelle Réplication 3ieme site Externalisation des K7 : limite du Vélo processing, mauvais RTO Réduction des coûts Course technologique lecteur LTO pour absorber la bande passante, saturation des robots
1er retour d’expérience sur Data Domain 2 robotiques 9710, 1200 cassettes, 12 lecteurs DLT700 4 catalogues TINA sur 4 serveurs UNIX Avril 2009 : demande cliente Groupama SA : conserver pendant 5 ans les sauvegardes pour des contraintes fiscales Projet en 1 mois Installation DataDomain DD530 4To utiles Regroupement des 4 catalogues sur un seul point de montage NFS – Restauration par copie de données Migration de 44To de données K7 sur 1To utile dé dupliqué L’ensemble des contrats robotiques résiliés 1 mois après le démarrage du projet le 30 Juin 2009 Division par 4 du coût de fonctionnement annuel de la conservation des données d’archive 6
Septembre 2009 Nos interrogations ? Comment réduire les coûts de fonctionnement de la sauvegarde en assurant la croissance ? Comment répliquer nos données sauvegardées ? Les acteurs sur le marché de la bande, combien seront-ils dans 3 ans ? EMC, IBM, HDS, SUN, FALCONSTORE, COPAN, HP, QUANTUM, NETAPP : Existe-t-il des solutions émergentes sur le marché ? Comment intégrer notre solution d’archivage ARCSYS, s’inscrit elle dans la cible ? Low Cost / Easy Management, VTL, Appliance & matériel de déduplication, Logiciel de déduplication à la source, déduplication des données primaires … Solutions de production ou veille technologie ?
Schéma directeur Sauvegarde En 2010 : Mener un Schéma Directeur Sauvegarde sur le monde Open Choix d’une solution logicielle de sauvegarde Choix d’une infrastructure matérielle évolutive sur 5 ans Donner une vision budgétaire à 5 ans Répondre aux besoins de reprise d’activité sur notre site de backup à Mordelles depuis notre Data Center de Bourges : RTO / RPO Revoir l’ensemble des polices de sauvegarde Assurer l’intégrité des données en cas de restauration : 100% des données « sauvegardées » sont 100% « restaurables »
Référencement des flux de sauvegarde en 2010 Windows UNIX Flux save CIFS VMWare HyperV VM Flux save Clients / Serveurs NBK IP NETWORK Unix / Intel LAN FREE BACKUP Média NBU Flux save LFB Media UNIX Master NBU Flux save LFB NDMP Volumes NAS NAS SAN sauvegarde NAS 8% 24To 32% 97To DESTAGING 39% 120To 21% 62To VTL SUN SL8500
Choix de la solution Data Domain pour flux VMWare et HyperV Approche par Quick Win en s’intégrant dans une trajectoire à 5 ans Etude de cas sur : Sauvegarde des serveurs virtuels Windows Sur 5 semaines 9,5 To de données à sauvegarder sont sauvegardées soit sur 2,2 To de disques dé dupliqués, soit sur 57To de données K7 Taux moyen de déduplication 25 Gamme DD670
Concentration des sauvegardes et couplage des flux Rationalisation et concentration des sauvegardes Obtenir le meilleur ratio de déduplication Garantir les performances pour absorber la bande passante Couplage des flux Mode VTL : bibliothèque de bandes virtuelles Mode CIFS / NFS : interface fichiers 2 baies en miroir réparties sur les 2 sites Activation du mode VTL et CIFS Réplication croisées intra site Réplication 3ème site 20To utiles sur 55To possibles de base, croissance au résultat 6 attachements réseaux sur 3 slots, 2 attachements FC sur 1 slot en mode fabric Sous réserve de contractualisation financière Gamme DD670 Flux 10Gb Production Flux 1Gb Non Production Flux FC 8gbs VTL Réplication intra Bourges
2011 : Intégration sans révolution Classification des données par flux Classes de services sur la sauvegarde : policies, réplication, restauration Données dé dupliquées sur disques / Données K7 Architecture cible 3 sites Conservation des robotiques sans évolution => fin de maintenance Virtualisation VSM / VTL Intégration Disques Low Cost : ouverture de la dé duplication à la source sur solution de sauvegarde Rester attentif aux évolution des baies de stockage et la fonctionnalité de déduplication sur données primaires Réplication des données sauvegardées Les plateformes Data Domain ont pour objectif sur 1 an : Assurer les sauvegardes des environnements virtuels comme cible de stockage dé dupliqué Assurer les sauvegardes NDMP en mode VTL dé dupliquée Devenir la plate forme VTL du système d’information pour les serveurs clients Sécuriser le stockage : mode cluster / failover en cas de chute d’un noeud
Trajectoire à 5 ans GSI restera à l’écoute des évolutions de la sauvegarde : nous conservons une approche Quick Win par flux Low cost et Easy Management Emergence des baies low cost font chuter le coût du stockage disque Dégressivité annuelle du coût du Go disque Evolution solution de sauvegarde Coupler avec la solution disque Fonctionnalité OST en remplacement de CIFS/NFS Déduplication à la source des données primaires Allègement des flux réseaux Postes de travail virtuels Tapeless : jusqu’où ? Limite de la déduplication Open Cible des VSM5 Mainframe