Stockage et sauvegarde Ateliers techniques - Automne 2007 - Stockage et sauvegarde Jérôme MARTINIERE Chef de Produits Lionel CARVALHO Technicien réseau
Bases sur les solutions de stockage DAS (Direct-Attached-Storage) Interface de connexion traditionnelle (SATA, ATA, SCSI, USB, FireWire) + Facile d’utilisation, rapport prix/performances - Accès via un autre appareil (Le serveur/PC doit être en marche) SAN (Storage-Area-Network) Méthode de stockage utilisant la norme Fiber Channel + Performances, possibilité d’avoir une grande distance entre le stockage et le serveur, nécessite peu de ressources système - Prix, réseau distinct nécessaire
Bases sur les solutions de stockage NAS (Network-Attached-Storage) Serveur de fichiers (NFS, SMB, CIFS) + Utilise le réseau déjà en place, compatible avec tous les OS - Consomme beaucoup de ressources système (CPU) iSCSI (Internet SCSI) Format intermédiaire, utilise le réseau Ethernet/IP avec une méthode d’accès par bloc similaire aux SAN + Possibilité d’avoir une grande distance entre le stockage et le serveur, performances proches du SAN pour un prix moindre - Nécessite un pilote sur le PC/Serveur (disponibilité selon les OS?), prix supérieur au NAS
Bases sur les solutions de stockage Article NAS iSCSI SAN Niveau d’accès Fichier Bloc Type de réseau Ethernet Fibre-Channel Client / utilisateur Client ou serveur Serveur de fichier Accès aux données Via le NAS Accès direct Administration Simple, locale ou distante Bei SANs greifen die Server über Fibre Channel auf Storage Devices im Blockverfahren zu. Ein NAS nutzen die Endanwender direkt per Ethernet, der Zugriff erfolgt auf Dateiebene. Eine 'Mischform' ist iSCSI - hier basiert der Dateizugriff auf Blockebene via Ethernet.
Stockage « block level » ILM Stockage « block level » PME/Enterprise Haute disponibilité Serveurs de stockage TPE/PME Backup Sauvegarde Multi-niveau Connexion réseau TPE / Home Partage RAID Média divers TPE/ Home Stockage SAN DAS NAS NSA Un article de Wikipédia, l'encyclopédie libre. Aller à : Navigation, Rechercher Information Lifecycle Management est un terme anglais faisant référence à la gestion du cycle de vie de l'information (ILM) celui-ci se définissant comme l'ensemble des stratégies mise en place pour administrer les systèmes de stockage des périphériques d'ordinateur. La problématique se situe dans la recherche du meilleur compromis entre la qualité du support de stockage et la valeur de l'information qui lui est inscrite.[1] Principe Avec l'évolution des technologie (loi de Moore), la pérennité des informations est menacé. Il faut donc conserver les informations sensibles sur des supports de stockage externes ainsi que leurs supports de lecture. Par exemple, pour conserver des disquette ZIP, il faut aussi conserver le lecteur adéquat. Évolutions De plus, les différents acteurs doivent aussi avoir accès à l'information (les clients, les fournisseurs, les partenaires ou le public). Il faut donc qu'elle soit disponible immédiatement. [2] Les ressources vont s'accroître avec le temps. Il faut donc prendre en compte également le facteur d'encombrement.
RAID (Redundant Array of Independent Disks) « Striping » des données, lecture simultanée des données sur les différents disques, pas de parité + Performances Pas de sécurisation La perte d’un seul disque entraine la perte de toutes les données RAID 1 Mirroring, les données sont stockées en double + Restauration rapide, données sécurisées - Rapport prix / espace, la moitié de l’espace disque n’étant pas utilisable Qu’est-ce qu’un RAID ? Le RAID (Redundant Array of Inexpensive/Independent Disks) a été inventé en 1987 à, une fois n’est pas coutume, l’université californienne de Berkeley, dans le but de pouvoir utiliser des disques de faible capacité de telle façon qu’ils seraient vus comme un seul disque. Depuis, le RAID a évolué et répond à trois objectifs : Augmenter la capacité Améliorer les performances Mais surtout apporter la tolérance de panne Le système RAID a été décliné en plusieurs méthodes ou niveaux, qui définissent chacun un degré de fiabilité et de performance. Pour simplifier, il existe 7 niveaux (de 0 à 6) de RAID standardisés : Le RAID 0 (ou striping) : c’est celui qui a été inventé au départ, il permet d’utiliser plusieurs disques comme un seul. Il ne propose donc aucune tolérance de panne. Le RAID 1 (ou mirroring) : les données sont écrites simultanément sur 2 disques (ou sur une matrice de 2, 4, 6... disques, les disques étant associés par paire). On a donc une tolérance de panne qui prend la moitié de la capacité totale de stockage. Le RAID 2 : il nécessite des disques pour les données et des disques pour les codes de correction d’erreur (ECC). Il est de moins en moins utilisé. Le RAID 3 : il nécessite au minimum une matrice de 3 disques : il utilise un disque pour stocker les bits de parités qui servent à controler les erreurs. La tolérance de panne est de 1 disque. Le RAID 4 : Le principe est le même que le RAID 3, si ce n’est au niveau de la structure des données : le RAID 4 utilise une segmentation des données par blocs alors que le RAID 3 segmente par octets. La tolérance de panne est de 1 disque. Le RAID 5 : C’est le plus utilisé des niveaux de RAID. Les données sont divisées en paquets de la taille d’un cluster. Plutôt que d’utiliser un disque pour les données de parités, chaque disque en contient une partie. Il n’y a donc pas de goulet d’étranglement au niveau du disque de parité. Comme pour le RAID 3 et 4, la capacité est le nombre de disques (au moins égal à 3) - 1 . La tolérance de panne est de 1 disque. Le RAID 6 : C’est une évolution du RAID 5 avec une tolérance de panne encore accrue qui porte cette dernière à 2 disques mais on perd en capacité de stockage. Le RAID 7 : Il est étudié pour offrir les meilleures performances. Pour cela, il met en jeu une carte microprocesseur fonctionnant sous un noyau temps-réel qui contrôle et calcule la parité. C’est un RAID propriétaire développé par Storage Computer Corporation très onéreux... Les combinaisons de RAID simples : Comme nous venons de le voir, les RAID simples offrent chacun leurs avantages et leurs inconvénients, ce qui permet de trouver le RAID le mieux adapté à ses besoins. Il existe aussi des combinaisons de niveaux de RAID qui offrent encore d’autres solutions spécifiques, en tirant avantages de plusieurs solutions RAID à la fois. Le RAID qui est le plus utilisé en combinaison est le RAID 0 (performances inégalées) avec du RAID 1,3 ou 5 (pour la tolérance de panne). Suivant le sens de la combinaison, le résultat n’est pas le même : quand on parle de RAID 01, le RAID 0 est appliqué en premier et le RAID 1 en deuxième. Quand on parle de RAID 10 c’est l’inverse ;-) Exemple avec une matrice de 6 disques : RAID 01 : on divise les disques en 2 grappes de 3 disques, chaque grappe étant configurée en RAID 0, puis on fait un RAID 1 entre les 2 grappes. RAID 10 : on divise les disques en 3 grappes de 2, chaque grappe étant configurée en RAID 1, puis on fait un RAID 0 sur les 3 grappes. La différence me direz-vous ? Elle est de taille ! En RAID 01 si un disque tombe en panne, c’est tout une grappe qui est perdue et on se retrouve avec un simple RAID 0. Et si jamais un disque de cette grappe tombe en panne ??? En RAID 10, si un disque tombe en panne, une paire de disques en RAID 1 fonctionnera en mode dégradé... sans oublier le temps de reconstruction qui est plus élevé pour le RAID 01 que pour le RAID 10. En effet, il faut reconstruire les données de 3 disques pour le RAID 01, alors que pour le RAID 10 il n’y a qu’un disque à reconstruire.
RAID (Redundant Array of Independent Disks) Data-Striping avec parité, avec au moins 3 disques + Performance et sécurité, l’espace d’un disque seulement est requis pour stocker la parité (1 disque sur X) - Nécessite un contrôleur performant, temps de reconstruction assez long -RAID 0: wenn Speed zählt und Daten anderweitig gesichert -RAID 1: wenn Sicherheit sehr wichtig und Kosten für Plattenplatz nicht so wichtig -RAID 5: als Zwischenlösung bzgl. Sicherheit und Kosten für NSA am sinnvollsten
Le mythe du RAID Le RAID rend la sauvegarde inutile Le RAID permet de contrer toutes les pertes de données
ZyXEL NSA-2400 4 slots disques SATA (jusqu’à 3 TB) JBOD, RAID : 0, 1, 1+0, 5, 5 + hotspare Gigabit Ethernet Support Active Directory Partage Sauvegarde Archivage Capacité : de 10 à 50 utilisateurs HDs nicht limitiert (750GB aktuell grösste Disk). Kein Hotswap. Einführungsangebot bis 15.04
ZyXEL NSA-2400 JBOD* RAID 0* RAID 1 RAID 5 1. With over 1 terabytes capacity and 4 hard drives installed, the NSA-2400 provides advanced RAID level fault tolerance and countless scenarios for RAID configuration including JBOD RAID 0, RAID 1, RAID 5. ---- When JBOD is configured, the storage volume is a single HDD with no RAID support When RAID 0 is configured, the four drives are striped into a large drive. Although you get the 1 TB capacity, all data is lost if one hard drive fail. Sorry I know this is a little bit technical, but it is important to customers However, when RAID 1 is configured, only 500GB capacity is usable. The Pros is that you may work on normally if one of the two hard drive fail. When RAID 5 is configured, 750GB capacity is usable. The Pros is that you may work on normally if one of the 4 hard drives fail. 2. The easily removable hard drive rack allow quick swapping of hard drives should a drive fail. This feature further provides the pay as you grow benefit which means you gain the flexibility to expand the storage capacity with your business growth.
Partage de fichiers LAN NSA-2400 is architected as a central storage server. You can share information between clients with different operating system including windows, unix, Mac OS. 1. By supporting active directory service, it can secure access privilege to your data with no additional user account required. 2. A network share can is created for each server or client and then exported onto the network. 3. Or you may map a network share as a drive letter for a Windows client, or accessed through mount points for a UNIX/Linux client or on a Mac OS client, Such simplified storage infrastructure can reduce your improve your operational efficiencies and reduce your total cost of ownership. Remote data access is available. Wherever you are over the world, NSA-2000 can be accessed 3. through either web browser or FTP client software. This offers you the opportunity to administrate or even access data remotely. Active Directory Application Server USB Disk NSA-2400
Sauvegarde et archivage Copie de sécurité, en cas de perte des données (sabotage, vol, virus, panne, incendie/inondation, crash de l‘OS) La version sauvegardée est la plus récente Permet de sauvegarder les données importantes Archivage Sauvegarde une certaine version à une date précise Gestion des différentes versions Méthodes de sauvegarde les plus courantes [modifier] La méthode la plus simple est la sauvegarde complète ou totale (appelée aussi "full backup") ; elle consiste à copier toutes les données à sauvegarder que celles-ci soient récentes, anciennes, modifiées ou non. Cette méthode est aussi la plus fiable mais elle est longue et très coûteuse en terme d'espace disque, ce qui empêche de l'utiliser en pratique pour toutes les sauvegardes à effectuer. Afin de gagner en rapidité et en temps de sauvegarde, il existe des méthodes qui procèdent à la sauvegarde des seules données modifiées et/ou ajoutées entre deux sauvegardes totales. On en recense deux : La sauvegarde différentielle La sauvegarde incrémentale La restauration d'un disque avec l'une de ces méthodes s'avère plus longue et plus fastidieuse puisqu'en plus de la restauration de la sauvegarde différentielle ou des sauvegardes incrémentales, on doit également restaurer la dernière sauvegarde complète. Les fichiers supprimés entretemps seront également restaurés. Afin de comprendre la différence entre les deux méthodes, nous prendrons l'exemple d'un plan de sauvegarde selon le cycle suivant : Une sauvegarde complète au jour J (dimanche soir par exemple) Une sauvegarde des fichiers modifiés ou nouveaux du jour J+1 au jour J+6 (du lundi soir au samedi soir inclus) Une sauvegarde complète au jour J+7 (dimanche soir suivant) Mécanisme [modifier] Pour pouvoir différencier ces différentes méthodes de sauvegarde/archivage (complète, incrémentale, différentielle), le mécanisme mis en place est l'utilisation d'un marqueur d'archivage. Chaque fichier possède ce marqueur d'archivage, qui est positionné à "vrai" lorsque l'on crée ou modifie un fichier. On peut comprendre cette position comme "Je viens d'être modifié ou créé : je suis prêt à être archivé donc je positionne mon marqueur à vrai". Ce marqueur est appelé aussi attribut d'archivage (ou bit d'archivage). Sauvegarde complète [modifier] Lors d'une sauvegarde complète, on va remettre à "0" l'attribut du fichier pour mémoriser le fait que le fichier a été enregistré. Lorsque l'on travaille avec la date, on mémorise la date de la dernière sauvegarde de façon à pouvoir différencier les fichiers qui ont été sauvegardés des autres (date de dernière modification). Détail technique [modifier] Lors d'une sauvegarde complète, tous les fichiers sont sauvegardés, indépendamment de la position du marqueur (vrai ou faux). Une fois le fichier archivé, celui-ci se voit attribuer la position de son marqueur (ou son bit) à "faux" (ou à "0"). Sauvegarde différentielle [modifier] La sauvegarde différentielle effectue une copie des fichiers créés ou modifiés depuis la dernière sauvegarde complète, quelles que soient les sauvegardes intermédiaires. En d'autres termes, la sauvegarde complète du jour J sert de référence pour identifier les fichiers créés, modifiés ou ajoutés et ainsi ne sauvegarder que ces derniers du jour J+1 au jour J+6. La restauration faite à partir de ce type de sauvegarde nécessite la recopie sur disque de la dernière sauvegarde complète et de la sauvegarde différentielle la plus récente. Avec notre exemple, si la restauration se porte sur un disque complet qui a été sauvegardé le jour J+2, on doit alors recopier sur disque la sauvegarde complète du jour J et la sauvegarde différentielle du jour J+2 afin d'avoir la dernière version des données. Cependant lorsqu'il s'agit de la restauration d'un fichier ou d'un répertoire qui a été sauvegardé le jour J+2 seule la dernière sauvegarde, ici la différentielle, est utile. Lors d'une sauvegarde différentielle, tous les fichiers dont le marqueur est à "vrai" sont sauvegardés. Une fois le fichier archivé, celui-ci garde la position de son marqueur tel qu'il l'avait avant la sauvegarde. Sauvegarde incrémentale [modifier] Cette méthode consiste à sauvegarder les fichiers créés ou modifiés depuis la dernière sauvegarde quel que soit son type (complète, différentielle ou incrémentale). Exemple : une sauvegarde complète est réalisée le jour J. Le jour J+1, la sauvegarde incrémentale est réalisée par référence au jour J. Le jour J+2, la sauvegarde incrémentale est réalisée par référence au jour J+1. Et ainsi de suite. Si la restauration se porte sur un disque complet qui a été sauvegardé le jour J+4, on doit alors recopier sur disque la sauvegarde du jour J et les sauvegardes incrémentales des jours J+1, J+2, J+3 et J+4 afin d'obtenir la dernière version de la totalité des données. Cependant lorsqu'il s'agit de la restauration d'un fichier ou d'un répertoire qui a été sauvegardé le jour J+3, seule la dernière sauvegarde, ici l'incrémentale, est utile. Lors d'une sauvegarde incrémentale, tous les fichiers dont le marqueur est à "vrai" sont sauvegardés. Une fois le fichier archivé, celui-ci se voit attribué la position de son marqueur à "faux".
Type de sauvegarde : différentielle Ihre Notizen: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Type de sauvegarde : incrémentale Ihre Notizen: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Génie-Backup Fourni avec le NSA-2400, logiciel de sauvegarde pour Windows Licences fournies (NSA-2400) : Nombre illimité de licences client Une licence pour serveur Exchange/SQL
Sauvegarde polyvalente Sauvegarde des postes client Sauvegarde du serveur Sauvegarde locale du NAS Sauvegarde instantanée LAN Serveur SQL/Exchange Disque USB NSA-2400
Sauvegarde instantanée Réalisation « d’instantané » des fichiers internes Archivage de différentes versions des mêmes données Une partie de l’espace de stockage est dédiée à cette fonction, et autant de versions différentes que possible sont enregistrées Récupération de la version souhaitée Sep 15, 2007 09:00:30 AM Sep 15, 2007 10:00:30 PM
Fonction clé : Snapshot Avantages du Snapshot Réduit les temps de sauvegardes Résout les problèmes de droit d’accès aux fichiers Restauration facile et rapide Rend les sauvegardes fréquentes possibles Economise l’espace
Sauvegarde à plusieurs niveaux LAN JBOD RAID 0 RAID 1 RAID 5 Disque USB Serveur Exchange Server SQL NSA-2400 Niveau 4 2,3
« More Than a Storage Device » Enterprise 500+ users Large Mid (200-500 users) SMB (50-200 users) NSA-2400 Sauvegarde SB (<50 users) Partage SOHO/Home NSA-220