4 ans de stockage mutualisé et réparti Dimitri Rapacchi assistant ingénieur à l’UGA Je suis un des représentant du comité technique du projet que je vais présenter aujourd’hui, le projet SUMMER. SUMMER est une infrastructure de stockage mutualisé et réparti et il s’appelle SUMMER pour…… Dimitri RAPACCHI et al.
Plan Présentation générale Organisation Architecture et technologie Modèle économique Outils Bilan Le plan pour cette présentation. Je ferai dans un premier temps une présentation générale du projet, dans quel contexte il se situe et quels sont ses enjeux. Je parlerai ensuite de l’organisation du projet, avec ses différents acteurs. De son architecture et de ses technologies Le modèle économique qui a été mis en place, afin d’avoir un équilibre entre les recettes et les dépenses. Les outils utilisés pour mener à bien le projet Et je finirai cette présentation par un bilan de l’ensemble de projet.
Contexte du site académique grenoblois Contexte politique : Communauté Universitaire Grenoble Alpes Etablissements d’enseignement supérieur Université Grenoble Alpes (Fusion de 3 Universités depuis Janvier 2016) Grenoble INP Université de Savoie Mont Blanc Institut d’Etudes Politiques de Grenoble Ecole Nationale Supérieure d’Architecture de Grenoble Instituts de recherche CNRS INSERM INRIA Contexte opérationnel : UMS GRICAD Pilotage informatique scientifique Contexte IDEX Tout d’abord quel est le contexte du site académique grenoblois. La communauté Université Grenoble Alpes fédère les établissements d’enseignements supérieur et les organismes de recherche de l’académie de Grenoble. GRICAD, en charge du pilotage informatique et scientifique. Elle est soutenu par la ComUE et englobe des projets de mutualisation et rationalisation de l’infrastructure des centres de données. Si vous êtes plus intéressé par ce qu’est GRICAD, ils font une présentation demain à 15h. La ComUE est porteuse du projet sélectionné aux Initiatives d’Exclelence (L’lDEX). Ce qui a permis d’avoir un financement 650 millions d’euros sur 8 ans. Cet investissement permet d’avoir une structure d’hébergement de projets exigeants, dont le projet SUMMER
Objectifs du projet Apporter une solution innovante, hautement disponible et sécurisée aux besoins de stockage Participer à la démarche globale de développement durable Mutualiser les centres de données et les ressources humaines Maîtriser les coûts Quels sont les objectifs du projet SUMMER ? solution innovante aux besoins de stockage, tout en participant à une démarche de développement durable. garantie en sécurité, en haute disponibilité, et en souplesse Ce projet répond à une dispersion des moyens (ressources humaines, énergétiques,) Avant cette mutualisation, on comptait 44 salles informatique sur le domaine universitaire, ce qui générait ne serais reste qu’en cout énergétiques de 700.000 euros par an pour les établissements. L’objectif de est qu’il ne reste plus que 4 centre de donné d’ici 2020, site grenoblois. Cette mutualisation va du fait de consolider, donc de converger vers moins de centre de données et de rationaliser les investissements humains et budgétaire afin maitriser les coûts. L’idée est vraiment de mutualiser les efforts. Environnement privé = souveraineté des données
Genèse du projet L’UJF participante de « European Code of Conduct for Data Centers » (2011) Recensement des besoins par une enquête interne (2011) Appel d’offre et étude des candidatures (2012) Choix de l’intégrateur et constructeur (2013) Bull/ATOS NetApp Mise en production (fin 2013) En 2011, l’UJF (avant la fusion) s’est engagé dans une démarche globale de développement durable. Elle était la première université française à obtenir le statut de « participant » au «Code de conduite européen pour les centres de données» de GreenIT. Reformulaire avant la fusion En cette année 2011 une enquête a été réalisé pour recenser les besoins de stockage des labo et des composante. Cette enquête a montré une demande de plus en plus forte de volumétrie et de performance. Ce qui a amené à l’université à proposer et à apporter une solution aux besoins de stockage, en participant à l’éco-système du site grenoblois. Un appel d’offre a été lancé en 2012 afin que l’université aient plusieurs proposition pour la mise en place d’un tel projet. ATOS, à l’époque Bull avec la solution technique NetApp ont apporter la candidature la plus à même de réaliser ce projet, c’est eux qui répondaient le mieux à nos besoins. Et ensuite, fin 2013, a eu lieu la mise en production de la plateforme
Comité Technique Stockage (CTS) Missions Exploitation de la plateforme Gestion des évolutions de l’infrastructure Accompagnement des ayants droit Définition de l’offre de service Promotion du projet Membres 10 informaticiens représentatifs des sites grenoblois (20% ETP) 1 expert NetApp de la société de service ATOS (60% ETP) Pour mener à bien ce projet, un CTS, comté technique stockage a été créé Les missions sont, exploitation…, gestion…., accompagner les AY, pour toutes demandes de création, d’extension de volumétrie, mise en place du service et assurer un suivi. Ce CTS est organisé un peu comme un centre de service. Il définit l’offre de service et s’occupe de la partie promotionnelle du projet. 10 informaticiens issu de la communauté scientifique et pédagogique du site académique grenoblois. Issu d’une grande diversité de composante, de laboratoire de recherches, et de services comme la DGDSI. (qui est la direction…) Une lettre de mission reprenant les activités du CTS est fourni à chacun de ces membres et nous permet de contribuer à ce projet à hauteur de 20% de notre temps de travail. Le CTS est accompagné par un expert Netapp de chez ATOS qui travaille 3 jours par semaine sur le projet. Le CTS se réunit une journée par semaines.
Organisation Fonctionnelle Ayant droit : Informaticien de laboratoire Equipe de recherche Composante, UMS, UMR, Extérieurs Comité exécutif : GRICAD Support à l’installation Administration Rapports d’utilisation Suivi des niveaux de service Définition de la politique Définition de la stratégie du catalogue de services Support Requêtes/Demandes Devis Facturation Comité Technique Stockage DGDSI Suivi Planification Catalogue de services Projets Exploitation Quel est le schéma de l’organisation fonctionnelle du projet : Ayant-droit : issue de domaines grandement divers, qui communiquent avec le CTS principalement par mail, via l’outils de ticketing de l’UGA qui est GLPI (OPEN SOURCE). GRICAD, communique avec le CTS principalement pour valider la politique et les stratégies qui ont été proposées par le CTS. Comme par exemple le catalogue de service. Cellule financière de la DGDSI de l’UGA. Cette cellule établit les devis, les conventions nécessaires et gère les transactions financières avec les ayants-droits. La DGDSI a hautement contribué au succès et à l’expansion du projet, notamment grâce à 2 personnes… Comme vu le CTS est accompagné par la société de service ATOS. D’une part il y a la partie exploitation, essentiellement assuré par notre expert NetApp. Très assidue sur le projet D’autre part il y a la parti HA Center, qui apporte une supervision en continu afin d’assurer, comme son nom l’indique la haute disponibilité du service. Cellule Financière Bull/ATOS Suivi : HA Center Bull/ATOS Exploitation UGA Maintien en condition opérationnelle Surveillance Gestion des problèmes Qualification Conseil d’administration Gestion des alertes Supervision Provisioning
Architecture Technique Technologie Infrastructure NetApp (3 clusters) Système d’exploitation Data Ontap 9.2 SATA et SSD (RAID DP et RAID TEC) Connectivité réseau 10 Gbps entre les clusters et le backbone UGA 40 Gbps entre les deux clusters de production SUMMER // se repose essentiellement sur une infrastructure NetApp avec actuellement la version 9.2 de sa technologie Data Ontap. L’infrastructure est composé de 3 clusters de stockage hébergé dans 3 centres de données réparti sur le site académique grenoblois. Nous avons deux clusters de production et un cluster de sauvegarde. Nos disques sont en SATA et SSD, en RAID DP et RAID TEC Pour ce qui est de la partie réseau, l’ensemble de l’infrastructure est relié en 10G sur le backbone de l’UGA. A court terme elle sera relié en 2 fois 40G sur le backbone. Et les deux clusters de prods sont reliés entre eux directement en 40G.
Briques Fonctionnelles Stockage (snapshots, déduplication, compression, thin provisioning) Sauvegarde Réplication Sauvegarde Réplication Mode Blocs (SAN) iSCSI Mode Fichiers (NAS) CIFS/NFS Quel sont les briques fonctionnelles ? Nous faisons donc du stockage. La grande efficacité de ce stockage est apporté par les 4 fonctionnalité suivantes , les snapshots…. Qu’est-ce que les snapshots ? Les snapshot ceux sont des copies instantanées // qui servent de sauvegarde et qui sont stockées localement dans le volume lui-même. Et ils permettent de faire de la restauration de manière très rapide. Et les snapshot n’occupe que très peu de place car ils sont stockés avec un système de lien, d’indexation. Copie que des modifications La déduplication permet de rationaliser plusieurs blocs redondants, pour n’en conserver qu’un seul identique, avec les pointeurs associés Et du thin provisionning, il permet d’allouer dynamiquement du stockage. Si un AY a acheté 10 To mais n’en n’utilise que 7, 7 To lui seront alloué à l’instant T. Nous proposons de la sauvegarde et ou de réplication des volumétrie stockées. Nous faisons du mode bloc avec protocole iSCSI. Du mode fichier avec…. (NFS 3 et 4) On peut pluger du samba et l’AD Et nous garantissons la haute disponibilité des données Toutes ses fonctionnalités apportés par les technos de NetApp sont très importante. Elles apportent à la plateforme de l’agilité (souplesse), de la souveraineté (maitrise des données) et de la convergence Haute Disponibilité
Architecture Technique Répartition des 3 centres de données SUMMER DC2 SUMMER DC1 La répartition des 3 centres de données sur le campus universitaire de Grenoble Comme on peut le voir les 3 centre de données sont réparti de manière distant dans 3 batiments différents sur le site universitaire grenoblois SUMMER DC3
Deux grands axes L’axe performance L’axe sécurité et disponibilité SATA : 2000 IOps assurés par ayant droit SATA + SSD : 10000 IOps assurés par ayant droit SSD : IOps dans la limite du contrôleur L’axe sécurité et disponibilité Snapshots Sauvegarde (dimensionné à 120 % du volume source) Réplication (asynchrone à 1 heure) Contrôleurs en paire HA L’architecture nous a permis d’avoir 2 grands axes sur lesquelles nous nous sommes basé pour proposer une offre de service Axe performance : Avec du stockage dit « capacitif » sur des disques SATA, limité à 2000 Iops par entité Stockage plus « performant » (HYBRIDE)avec l’utilisation des disques SATA et SSD, où les Iops sont assuré à la limite du contrôleur. Stockage dit « hautement performant » sur des disques SSD Axe sécurité et disponibilité : Les snapshot sont intégré pour tous types de volumétrie. Et ensuite nous donnons la possibilité d’avoir du stockage sauvegardé, du stockage répliqué, Et nos controleur sont en paire HA, ce qui assure de la haute disponibilité des données Pour pouvoir avoir une retentiion de 30 jours PRA
Offre de service Performance Prix Sécurité Haute Perf (SSD) Hybride (SATA + cache SSD) Capacitif (SATA) Cuivre Bronze Argent Or Platine Sécurité Ces deux grands axes nous ont amené a proposer un catalogue de service qui est le suivant. Ces classes de services et les tarifs sont proposé par le comité technique et sont ensuite validé par le conseil d’administration de l’UGA. Pour toutes ces classes, la volumétrie achetées doit être au minimum de 5 To. CUIVRE : Offre simplifié, seulement pour du capacitif La classe Bronze et la classe Argent sont les 2 classes qui ont le plus de succès. 56% des AY ont choisi la classe bronze et 50 % des AY la classe Argent Pourquoi 106? AY droit peut acheter plusieurs volumétries de classe différente Enlever les 3 lignes du bas Parler de la retention Location au To : Prix en fonction du niveau de Performance et Sécurité Cuivre Petite volumétrie non répliquée Bronze Non répliquée et non sauvegardée Argent Sauvegardée Or Répliquée (PRA) Platine Sauvegardée et répliquée
Architecture Technique Classe Bronze Classe Argent Classe Or Classe Platine 4 contrôleur FAS 8040 en paire HA par DC de prod ; Le paire HA permet d’avoir de la redondance et de la haute disponibilité Les contrôleurs ont peut les appeler des nœuds 3. L’infrastructure permet de faire de la Sauvegarde des données des DC de prod vers le DC3 qui est le DC de sauvegarde grâce à la technologie snapvault 4. Elle permet aussi la réplication asynchrone à une heure entre les deux DC de prod avec la technologie SnapMirror 5. Voici maintenant une légende pour comprendre ce que je vais vous présenter ensuite. Cette légende va maintenant me permettre de vous expliquer les différentes classes de services que nous proposons en fonction du type volumétrie souhaitées. Nous avons donc la classe Bronze 6. Bronze Comme on peut le voir les volumes sont réparti sur les différentes baie de disques. Volume sont vu comme des objets logiques, qui ne dépendent pas des contrôleurs donc les données sont répartis sur l’ensemble cluster Cette classe est proposé pour de la volumétrie simple. Comme nous le voyons nous avons notre AY, avec ses LIFS attribué et sa SVM qui sont sur le DC2. Et sa volumétrie est réparti sur le cluster. 7. Argent Classe qui propose de la volumétrie simple, plus la sauvegarde de cette volumétrie sur le DC3 via la technologie snapvault. Comme on le voit ici, une SVMs et des lif sur le DC3 sont attribué à l’AY. L’AY n’est pas obligé de sauvegardé tout ses volumes. En réalité, ici l’AY a acheté a acheté de la volumétrie bronze pour un volume, et de la volumétrie argent pour 2 volumes Nous avons actuellement 22% de nos AY qui ont acheté 2 ou + types de volumétrie. Pour revenir sur la technologie snapvault. Sur les volumes sources, on applique une politique de snapshot (qui est décidé par l’AY) et ceux sont ces snapshot qui seront copié vers la SVM de sauvegarde. 8. Or Snapmirror fait un snapshot de la totalité de la volumétrie et envoie ce snapshot sur la SVM répliqué (vraiment comme un miroir) Mécanisme de NETAPP 9. Platine Et une dernière vue pour montrer que nos AY cohabitent ensemble sur cette infrastructure. Inversé SVM et LIF Transférer juste la différence du snapshit Parler qu’on transfere pas la globalité du snapshot mais le delta des modifications Ayant Droit Backbone de l’UGA Machine Virtuelle de Stockage (SVM) p : production dr : réplication s : sauvegarde Sauvegarde snapvault Réplication snapmirror dr Interface réseau logique (LIF) Volumétrie achetée
Ouverture et évolutivité Evolution des solutions technologiques FullFlash : SolidFire SAN bas coût : E-Series Possibilité d’intégration de solution d’autres constructeurs Intégration d’autres projets Traitement intensif Virtualisation OpenStack Big Data Evolution et mise à jour dynamique de l’infrastructure Scale up Scale out Le projet SUMMER est un projet qui a grandement évolué depuis ses débuts en 2013. Au départ c’était un projet uniquement pour du stockage capacitif, depuis il a connu une réel progression en fonction des besoins, par la grande modularité de son infrastructure. PAS DIRE QUE C’EST DÉJÀ INTEGRE EN COURS D’INTEGRATION Nous avons intégrer le Fullflash (stocker les données sur des disques SSD) On a aussi imbriquer d’autres solutions de stockage SAN à un plus faible cout, des E-series. Et l’infrastructure permet d’intégrer d’autres solutions de stockage d’autres constructeurs. Tout ceci pour montrer que le projet SUMMER n’est pas du tout figé, l’infrastructure permet d’intégrer d’autres projets, comme…. L’évolution et la mise à jour de l’infrastructure peut se faire dynamiquement et à chaud du fait que les contrôleurs sont paire HA. Scale UP -> mettre à jour les controleur pour augmenter les potentialités, à chaud car PAIRE HA Scale Out -> ajouter des controleurs et des baies de disques (à chaud)
Coût de la volumétrie Facturation selon 4 critères Volumétrie acquise Durée de location Classe de service Coût d’infrastructure Equipements réseau Centres de données Accompagnement du prestataire Participation du CTS en ETP Le prix de la volumétrie se fait selon 4 critères : Volumétrie acquise La durée de location de cette volumétrie (minimum 1 an) La classe de service qui a été choisi Et le cout d’infrastructure, qui comprend …… Ce cout d’infrastructure varie en fonction de l’appartenance de l’entité de l’AY. Hebergement centre de donnés SUMMER est destiné à l’ensemble de la communauté académique de Grenoble mais il est peut être destiné à un périmètre plus large en fonction des demandes et des moyens. Et des conventions sont faites pour permettre aux AY hors ComUE de participer au projet.
Tarifs Comparatif : 1 espace de stockage de 12 To sauvegardé Classe Stockage capacitif Stockage performant Bronze, stockage simple 97 euros To/an 250 euros To/an Argent, stockage sauvegardé 175 euros To/an 328 euros To/an Or, stockage répliqué 194 euros To/an 406 euros To/an Platine, stockage répliqué et sauvegardé 272 euros To/an 453 euros To/an Quels sont les tarifs ? OVH propose de la volumétrie sauvegardé, pour les professionnelle à un cout de 7800 euros Pas la même garantie de bande passante Ajouter classe cuivre Offre de service cnrs Répondre à logique > équilibrer Attractif pour les ayant droits, rester compétitif Comparatif : 1 espace de stockage de 12 To sauvegardé Ayant droit sous tutelle UGA Ayant droit membre de la COMUE UGA Ayant droit extérieur à la COMUE UGA Externalisation Coût estimé 2100 €/an 4800 €/an 7500 €/an 7800 €/an (OVH)
Modèle économique Projet porté financièrement par l’UGA Frais d’investissement Marché Risques Premières briques de l’infrastructure financées par : Université Joseph Fourier (avant la fusion) EquipEX RESIF (réseau national en sismologie et géodésie) Briques ultérieures financées par : La location de volumétrie Quel est le modèle économique du projet Tout d’abord, le projet est porté par l’UGA, notamment grâce au contexte IDEX. C’est l’UGA qui a les frais d’investissement, qui contractualise le marché, et aussi c’est l’UGA qui prend des risques A la mise en place du projet, les premières briques de l’infrastructure ont été financé par l’UJF et par l’équipex RESIF qui est …. Cette investissement initiale à permis de lancer le projet. Et les briques ultérieures ont été financées ensuite par les recettes réalisées grâce à la location de la volumétrie.
Modèle économique Projection simplifiée du modèle économique Jouvence Investissement Initial 600 500 400 300 200 100 2014 2015 2016 2017 2018 2019 2020 Recettes Dépenses d’amortissements Jouvence Investissement initial La mutualisation a permis d’avoir une vraie maitrise des coûts Schéma volontairement simplifié Ce schéma va me permettre de vous expliquer le modèle eco de la manière la plus simple possible. Les dépenses d’amortissement (petites briques bleus) qui sont provisionné par la trésorerie de l’UGA chaque année sur 6 ans Les recettes (location de volumétrie) équilibrent les dépenses d’amortissement. Et ces dépenses d’amortissement permettront en 2020 de financer la jouvence de l’infrastructure Il faut que SUMMER se retrouve à l’équilibre, ce n’est pas aussi cher que la concurrence car on ne fait pas de bénéfice. Les recettes équilibrent les dépenses d’amortissement Les dépenses d’amortissement permettent de financer la jouvence de l’infrastructure
Pluridisciplinarité des données et criticité des services Hétérogénéité des données Simulation Recherche Pédagogie Administration Hébergement de services et données hautement critiques Données médicales Publications et brevets Données de type sismologique et astrophysique Serveur de fichiers Datastore virtualisation Le projet SUMMER héberge des données grandement hétérogène On a des données de simulations, issues par exemple de calcul de données sismologiques. On a des données issues de la recherche, avec des expériences qui génèrent beaucoup de données On héberge les HOMES des étudiants et de l’ensemble du personnel de l’UGA Le projet héberge aussi des données hautement critiques On héberge des données issues du domaine médicale, qui sont des données particulièrement sensible et confidentielles. A titre juridique, ces données bien entendu anonémisées Des publications et brevets, etc…. ……. A tire d’exmple mais on est vraiment vaste sur ce qu’on heberge (audiovisuel, bibliothéque)
Outils pour le CTS Gestion et configuration OnCommand System Manager Supervision et remontée d’alertes OnCommand Unified Manager Outils délégables WorkFlow Automation SSH Grafana (Indicateurs) Quel sont les différents outils mis à disposition afin de mener à bien ce projet Oncommand system manager Outil de gestion et configuration au niveau des noeud et des cluster Cet outil est natif à l’OS NetApp, l’OS Netapp s’appelle Wafl) Cet outil sert à simplifier les tâches d’administration Gestion des SVM, des LIFS, des volumes, des relations snapmirror et snapvault et aussi la gestion des politiques d’accès aux volumétrie OnCommand Unified Manager (outils gratuit fourni par le constructeur NetApp) Outil de supervision du provisionnement (OCUM) et supervision de la performance (OPM) et de remontées d’alertes. Le CTS dispose aussi d’outils que nous pouvons déléguer aux AY avec des permissions spécifiques WFA > Outils d’industrialisation, il permet d’automatiser des taches de routine (outils gratuit mis à disposition par le constructeur) Accès à la configuration de leur volumétrie par SSH Et Grafana (outils gratuit et Open Source) pour de la supervision sur les métrics lié au stockage Je vais maintenant revenir sur chacun de ses outils, avec des copies screenshot
OnCommand System Manager Gestion et configuration Ici nous avons une vu sur la SVM de la DSI de l’UGA Dans les onglets à gauche On voit les différents protocoles (cifs…) Les différentes politiques mis en place, export policies (politiques d’accès à la volumétrie par adressage IP), politiques de snapshot ou encore les politiques de qualité de service, pour limiter ou non les AY à 2000 Iops Et en haut, nous avons différents onglets, volume, lun, quota etc…
OnCommand Unified Manager Supervision L’outils OCUM, pour la supervision Ici nous avons un aperçu sur la capacité et les performances des clusters et des SVM Et en dessous un aperçu sur les alertes A savoir que l’outils OCUM est imbriqué avec l’outils OPM OnCommand Performance Manager (qui sert lui de collecteur de performance) 32 erreurs en rouge, erreur de quota qui remonte comme des incidents
OnCommand Unified Manager Rapports d’exploitation Espace utilisé/disponible Espace réservé disponible pour les snapshots Nombre/pourcentage d’utilisation des inodes Gain d’espace grâce à la déduplication et à la compression Alertes d’exploitation Occupation d’un volume Nombre d’inodes Espace de snapshot plein Quota NFS/CIFS atteint Cet outil OCUM permet aussi d’extraire des données afin d’envoyer des rapports par mail chaque semaine aux AY. Sur ces rapports on y trouve les données suivantes …. Espace disponible Espace disponible pour les snapshots Le nombre d’inodes et le gain d’espace grâce….. OCUM envoie aussi des alertes, C’est le CTS qui écrit les règles pour les remontées d’alertes, ces règles permettent aussi bien d’alerter le CTS que les AY. Ces alertes d’exploitation sont envoyé par mail aux AY et au CTS
WorkFlow Automation Industrialisation et automatisation L’outils d’industrialisation et d’automatision WFA. Ici nous avons la vue d’un AY, avec des permissions spécifiques sur leur SVM Comme on peut le voir avec différentes BOX, qui sont des workflow. Ils peuvent créer/modifier des exports policy, changer la politique de leur snapshot, mapper/démapper des LUN iSCSI, etc…. Les membres du CTS ont a leur disposition une trentaine de workflow pour faciliter la gestion du stockage
Administration via SSH Gestion des volumes, qtrees, quotas et snapshot Gestion des LUN Configuration des protocoles : NFS, CIFS et iSCSI Configuration des services : DNS, LDAP et NIS Depuis une connexion SSH, les AY ont accès à la gestion des volumes….. Et peuvent configurer les protocoles Accès ssh à la configuration svm
GRAFANA Latence L’outils Grafana, // qui est un outil très apprécié des AY. Il donne une réel vision sur les différentes métrics de stockage. Quelques vu de l’outils, indicateurs temps réél, fiable, historisé, Le cts fourni des outils simple mais efficace
GRAFANA Bande passante Ici nous avons une vue sur la bande passante. Comme on peut le voir, ces métrics sont historisées. On voit bien que c’est limuité à 2000 IOps
GRAFANA IOps Et ici une vue sur les IOps Limité à 200 IOps
Quelques chiffres 3 clusters de données Volumétrie utile de 1,5 Po (2,5 Po brut) 10 nœuds 912 disques (RAID DP et TEC) 270.000 IOps 36 ayants droit 60000+ utilisateurs Quelques chiffres à noter sur ce projet SUMMER. 3 DC Volumétrie utile actuel de 1,5 Po mais notre volumétrie brute est de 2,5 Po en comptant Disque de parité, disque de spare et le formatage D’ici Janvier 2018 nous aurons une évolution de la volumétrie utile allant à 2,2 Po Inverser la manière de raconter le BRUT 270000 Iops délivré par infrastructure Nous avons eu une évolution de 5 à 10 nœuds en 4 ans 912 disques 36 AY actullement qui représentent 50 000 usagers en comptant notamment les étudiants de l’UGA.
Evolution Ayant Droit Volumétrie (To) Le projet SUMMER est un projet qui a fait ses preuves et qui évolue d’année en année. AY : 5 à 36 en 4ans V: 500 à 2500 en 4 ans (évolution de 5 à 10 neods en 4 ans)
Bilan Réussite de la mutualisation Satisfaction et augmentation constante des ayants droit Stockage capacitif et performant : offre diversifiée Respect des exigences du cahier des charges Réussite de la mutualisation Comme en témoigne l’augmentation progressive de la volumétrie et de l’adhésion du nombre des ayants droit, SUMMER est un projet qui connait un réel succès. Enquête / sondage Initialement ce projet avait été conçu pour du stockage exclusivement capacitif, et il offre désormais l’opportunité d’acceuillir des projets de grand envergure grâce à la modularité et la souplesse de l’architecture. Sur ces 4 années les exigences du cahier des charges ont été respecté, la continuité de service a été complètement assuré, notamment grâce à la robustesse et à la résilience de cette infrastructure. SUMMER est un projet qui est un exemple de la réussite de la mutualisation, de la mise en commun des moyens et des compétences du site académique grenoblois.
Prospectives Evolution et ouverture à des technologies innovantes en fonction des besoins Brique d’archivage Chiffrement des données Stockage objet QoS intelligente Pérennité Ouverture de SUMMER au niveau du « territoire » De notre côté le CTS a pour ambition à court terme d’étoffer l’offre de service avec l’intégration d’une brique d’archivage, du chiffrement des données hébergées (d’ici Janvier 2018) et d’intégrer du stockage objet. applications particulière, big data, hpc Des besoins qui émerge et on va le tester en Janvier Et avec à court terme, avec la mise à jour de DataOnTap, il y aura la QoS intelligente qui permet de faire du fair sharing. On garantira aux AY un minimum de 2000 Iops mais avec la possibilité d’en utilisé plus // en fonction de la disponibilité des controleurs, en fonction du nombre d’utilisateurs à l’instant T. Le but initiale et constant est d’assurer la pérénité et l’accessibilité des données sur un grand nombre d’année. L’avenir de SUMMER se construit avec les utilisateurs et en fonction de leur besoin. SUMMER a l’ambition, pourrait très bien de devenir à moyen terme, le projet de stockage des données de l’ensemble du territoire grenoblois Le territoire comprenant le rectorat, le CHU, les collectivités territoriale et la ComUE
Membres du CTS Jean-Noël BOUVIER (ISTerre) Anthony DEFIZE (GRICAD) Fabien DRAGO-RAJON (DGDSI UGA) Gaëtan ENDERLE (DGDSI UGA) Manuel ESTEVEZ (ATOS) Didier MATHIAN (SIMSU) Pascal MEYRAND (LPSC/IN2P3) Rodolphe PINON (ISTerre) Dimitri RAPACCHI (UFR IM²AG) Frédéric ROUSSEL (IPAG) Guenael SANCHEZ (DGDSI UGA)
Questions ? https://summer.univ-grenoble-alpes.fr POURQUOI la prestation d’un expert NetApp ? SUMMER il est géré par le CTS, mais les personnes en travaille qu’à 20% On a une personne qui apporte une vraie expertise de la solution Garantie de bon fonctionnement, On peut exiger de la réactivité ATOS nous conseil grâce à l’expertise car ils ont déjà vu ça ailleurs Mise en place pour faire des économies 44 salles informatiques > 40 salle ajourd’hui Le temps que tout se mette en, place, en 2020, 4 salles Pourquoi avoir choisi Netapp Netapp leader mondiaux du stockage, reconnu avec C’est eux qui correspondait Sécurité des données Mécanisme d’authentification, LDAP, accès via IP autorisé (export policy), ACL (réseau son cloisoner par des VLAN) Basculer dans l’Aci on pourra gérérer beaucoup plus finement les accès réseau Iscsi gérer par les target, les initiateurs du protocol Il faut avoir des certifications et des labels pour stocker les données médicales Accès au sauvegarde Notre ay droit minimum 1To L’ay maximum 250 To Pérénité > Dans 5 ans on est sur Aujourd’hui on ne fait pas de l’archivage, le CTS n’accède pas aux données des AY. On ne sait pas comment aura évoluer la technologie dans 10 ans Disque SATA de 4 TO > 20h de reconstruction SATA > rapport qualité/prix C’est ce qu’on a pris à l’époque Après on sait qu’aujourd’hui le sasnl est plus récent et marche bien. ?? Sécurité assuré par les export policy, les ACL, cloisonnement par VLAN, authentification forte par LDAP TEC (triple parité, 3 disques de parité) La nature des disques, taille des disques, 2, 4 et 8 To limitation des disques accepté par la plateforme . SATA > 10 To . SSD > 4 To Répondre à logique > équilibrer Attractif pour les ayant droits, rester compétitif La mutualisation permet de maitriser les couts Grafana… Ecriture/lecture > l’activité *******A savoir que Grafana est un outil en 3 parti, il y a Harvest qui est le collecteur de données, Graphite qui stocke les données, et Grafana qui affiche les données.******** Perte de beaucoup d’espace (BRUT) La technologie Netapp qui explique cela, par contre derrirèe on a 99,99% de haute disponiblité, grand sécurité grâce au RAID DP, optimiser la performance, compromis entre performance et sécurité La gestion des disques par l’OS NetApp (Wafl) qui consomme beaucoup de place Spare pour la reconstruction de disque en cas de panne SASNL Le fait que la volumétrie soit dans un réseau privé, assure la souveraineté des données. Pas n’importe qui qui peut rentrer dans le réseau. Maitrise des données. Ce qui permet de rentre la plateforme agile c’est les fonctionnalité : snapshot, compressio, dédup Pas les mêmes fontionnalité, tout est délégué, sécurité, haute disponibilité POURQUOI PAS EMC ?????? 2 type de baie avec bonne fonctionnalité EMC et Netapp (2 leader mondial) Intégrateur dans un écosystème ATOS ont un centre d’expertise à Grenoble, la proximité y a joué BULL fait parti de l’éco système grenoblois, expert en stockage Animation en local avec le CTS et un portage politique qui fait la force du projet Séurité assurer par la politique réseau mis en place par le groupe réseau de la DGDI Snapvault snapmirror > payant (licence) Ouverture des protocoles payant (licence) Opération sur l’infra > Scale UP -> upgrader les controleur pour augmenter les potentialités, à chaud car PAIRE HA Scale Out -> ajouter, augmenter les baies de disques (à chaud) Mis à jour (NDU non disruptif update ; à chaud) de l’OS, on est passé de la version 8 à la version 9,2 (7 mise à jours en quatre ans) La mise à jour de l’OS met à jour les firmwares des disques, des cartes Raid DP, mets à jour les algorytmes de fonctionnement de l’algorythme Onglet de performance, met à jour les appliciations Déménager le DC3 physiquement, sans perte de prod car le déménagement la nuit, dans une plage où aucune sauvegarde n’étaient prévue On a ¾ To de données de sauvegarde par jour Opération concernant les AY > Déplacement de la volumétrie dans un même cluster, d’un agrégat à un autre Déplacement d’un AY vers l’autre ckuster de prod > durée de la coupure c’est la durée de la bascule du réseau Déplacement d’un volume d’une SVM à une autre SVM LE CTS demande à mettre en place des POKES (des essais de test) Et le CTS fait des enquêtes de satisfactions Panne/incident > changement de disques, de batterie Coupure électrique planifié lié à une problèmatique du DC (DC3) Pertes de clim Coupure électrique accidentelle > pris par le relai des onduleurs Malgrè tout ça > 100% de disponibilité, aucune coupure de service Eco responsable, le CTS est un groupe ouvert, les gens qui veulent s’investir et rentrer dans le CTS, le peuvent Grafana > monitorer leur volumétrie Compaction -> déduplication amélioré Utilisateur est maitre de données Temps passé sur le porjet Les temps d’arrêt de service quand il y a des mises à jours Coùt énergétiques, électricité, clim, quand tu pars en vacances et la baie plante L’efficacité de stockage c’est l’argument de choix pour Netapp Souplesse > projet dure 1 an pour 10 TO, possibilité d’utiliser SUMMER https://summer.univ-grenoble-alpes.fr