Praia,Septembre 2011 Session 7: Le stockage des données, la maintenance et la sécurité La experience: INE-cv United Nations Regional Seminar on Census Data Archiving for Africa Addis Ababa, September 2011 Présenté par: João Baptista Lopes de Pina Directeur du Système dInformatique et de la diffusion
Session 7: Data storage, maintenance and security PLAN DE LA PRESENTATION Projet DataCenter(objectif) Architecture Virtualisation Stockage et Maintenance de données Continuité des activités ( tolérance au pannes et réplication) Securité et accès au donnés (Ine-LabStat) Vmware Vsphere Client Ressources Septembre 2011 United Nations Regional Seminar on Census Data Archiving for Africa Addis Ababa, September 2011
Projet DataCenter (objectif) Consolidation du système informatique de l'INS face à l'obsolescence des infrastructures anciennes qui ne garantit pas la sécurité des données, en particulier la consolidation dans les domaines suivants: Migration des serveurs physique existants vers à lenvironnement « cloud »; Volume de données et de la croissance du stockage; Amélioration de la sécurité, de la haute disponibilité et de la tolérance aux pannes: Consolidation de sauvegarde de données et assurer la continuité des activités: Mettre en œuvre une infrastructure plus robuste pour la démocratisation de l'accès à l'information permettant aux chercheurs de manipuler et d'obtenir des résultats à la mesure. Septembre 2011
Architecture Septembre 2011
Virtualisation La virtualisation est une technique qui permet de partager et dutiliser les ressources à partir d'un seul système informatique composé plusieurs autres machines virtuelles. Chaque machine virtuelle fournit un système informatique complet très semblable à une machine physique. Ainsi, chaque machine virtuelle peut avoir son propre système d'exploitation, applications et services réseau. Qu'est-ce qu'il permet? Gestion est plus centralisée et les ressources sont gérées de façon distribuée et partagée (serveur), avec la facilité d'affectation des ressources de la CPU et de la mémoire; Migration des serveurs existants; Création de nouvelles machines virtuelles; Réduction des coûts de matériel et de maintenance, résultant en une faible consommation d'énergie; Récupération rapide en cas de catastrophe, et Administration simplifiée et centralisée; Praia,Septembre 2011
Stockage et Maintenance des données La gestion de disque dur est basée sur le système RAID6 (standard) de parité pour maintenir l'intégrité des données en cas de pannes dau moins 2 disques. Pou ce la il faut mettre en place un SAN (Storage Area Network) avec des grands avantages: Partage de toutes les capacités de stockage pour tous les serveurs existants et futurs; Essentiel pour la mise en œuvre de la Haute Disponibilité (Stockage partagé et replication des donnés) Flexibilité pour augmenter la capacité; Praia,Septembre 2011
Continuité des activités ( Tolérance au pannes et réplication) Mise en place du Cluster - un système comprenant deux serveurs (appelés noeuds) dans lequel ils travaillent ensemble, en assurant la disponibilité des services et des ressources sur une base continue en utilisant la redondance implicite au système. La Haute disponibilité est réalisée dans deux cas: Redondance local en cas de panne d'un serveur; Redondance à distance en cas de perte de l'emplacement principal; LAssurance de la continuité des activités est soutenus par le stockage centralisé des données et sa copie sur un site distant. Praia,Septembre 2011
Sécurité physique - la porte d'accès du DataCenter est interdite sauf aux personnes autorisées. Dans l'avenir il est prévu d'installer le test biométrique et la vidéo surveillance. La sécurité logique – elle est assurée par le gestionnaire du système. Chaque individu a un nom d'utilisateur et un mot de passe et un « homefolder" pour stocker des données. INE –LabStat Afin de promouvoir la démocratisation de l'accès à l'information, l'INS a créé un laboratoire pour l'analyse des données statistiques, permettant aux chercheurs de manipuler et d'obtenir des résultats à la mesure, mais pourtant sans avoir un accès physique aux micro- données, rendant impossible la copie a partir du poste de travail. INE-Labstat dispose dun serveur hébergé dans le DataCenter et les terminaux sans d'autres ressources locales telles que OS, CPU et mémoire et les périphériques d'écriture (USB, CD / DVD etc.), d'une part exclu la vulnérabilité aux virus et d'autre part élimine la possibilité daccès direct aux données (WyseS class thin clients) Sécurité e accès au données(INE-LabStat) Praia,Septembre 2011
HARDWARE 2 Site – INE site e DR site (disaster recovery) installé dans Standard Rack Cabinet 42U 2x4 SAN Storage - IBM System Storage DS3400 Dual Controller 2x10 HDD - IBM 1000GB 3.5in SL HS 15K 6Gbps SAS HDD 2 serveur de haute disponibilité – IBM x3650 M3, Xeon 4C E Express IBM System Storage SAN24B-4 w. fiberchanner 1 Console gestion de serveur - IBM x3650 M3, Xeon 4C E Robot de Backup - 2 drives - TS3200 Tape Library Model L4U Driveless SOFTWARE Logiciel de gestion VMware vSphere 4 Enterprise Logiciel Sauvegarde - SYMC BACKUP EXEC 2010 SERVER WIN PER SERVER Logiciel Antivirus – Microsoft FireFront Logiciel de traitement des données au INE-LabStat – SPSS v.19 Ressources Praia,Septembre 2011
Logiciel de Gestion – VMWare Vsphere Client Praia,Septembre 2011
Obrigado!!! Plan Technologique - BDEO Praia,Septembre 2011