Nouveaux Systèmes de stockage de données (SAN/NAS) Par : GOEBEL Georges georges@goebel.tv
Plan Mise en contexte Storage Area Networks Network Attached Storage Architecture Fibre Channel Network Attached Storage Exemple d’un serveur NAS EMC2 Celerra Conclusion Démonstration Questions - Réponses
Mise en contexte De nos jours la quantité des données augmente Comment garantir l’accès aux données 24h/24h et 7j/7j ? Grand centre de stockage Solution propriétaire « Open System » Architecture i386, SCSI, TCP/IP, … Avant plusieurs années pas de solution dans l’immédiat
Storage Area Network Caractéristiques : Avantages : Augmenter la capacité de stockage des serveurs particuliers Accès multiples et directs aux mêmes données Séparation de lieu (serveur et sauvegarde) Intégration des solutions back up (tape libraries) Avantages : Haute disponibilité des données Redondance des données
Storage Area Network Composé de : Serveur Storage Array (SA) Serveurs Groupes de disques (Storage Array) Fibre Channel Switch/Hub, SCSI, iSCSI, … Serveur Rendre les données accessibles à l’extérieur File System, Base de données, Vidéo, … Storage Array (SA) Groupe de disques magnétiques en RAID (Redundant Array of Inexpensive Disks)
Storage Array (SA) Chaque groupe est un RAID de disques !
Storage Array : RAID RAID 0 : Striping RAID 1 : Mirroring RAID 5 : 2 disques physiques-> visible 1 disque virtuel avec la capacité des 2 disques Aucune protection contre un crash RAID 1 : Mirroring La même information se trouve sur 2 disques différents Bonne protection contre un crash d’un disque RAID 5 : 3 disques données + 1 disque avec parité Striping des 3 disques données -> réduit le nombre des disques pour la même sécurité Autre : RAID S (parité distribué), RAID 7 (5 + 1)
SAN : Connectivité Connexion entre Serveur et SA Parallèle (S/390 Mainframe) ESCON (Mainframe) SCSI (Open System) Fibre Channel (Open System) Avantage du « Open System » Indépendance d’un fournisseur / marque Plus de choix
SCSI vs Fibre Channel Caractéristiques Trouver un compromis SCSI : Distance maximale : 19 – 25 m Débit maximal : 20-40 MB / seconde Protocole : SCSI (Small Computer System Interface) Fibre Channel : Distance maximale : 300 – 500 m (10km – 60km) Débit maximal : 100 MB / seconde Protocole : SCSI encapsulé (frame based protocol) Possibilité d’utiliser d’autres services à travers le même fil (Vidéo, SCSI, réseau) Trouver un compromis Prix Solution FC = 1.5 * Prix Solution SCSI Mais : Fibre Channel est le futur
SAN : Fibre Channel topologie Différentes connexions entre Serveur et SA possibles Point à Point Bande passante et accès exclusif garantie (QoS garanti) Comparable à SCSI
SAN : Fibre Channel topology Fibre Channel Arbitrated Loop (FC-AL) Daisy Chain 127 nœuds au maximum Bande passante complète mais accès partagé Désavantage : Single Point of Failure !
SAN : Fibre Channel topology Fibre Channel Hub Comme Daisy Chain mais sans « Single Point of Failure »
SAN : Fibre Channel topology Fibre Channel Switched Fabric (FC-SW) Administration en un point central No Single Point of failure Chaque nœud gère une connexion point à point
Notion « HA Cluster »
SAN : High Availability
SAN : High Availability avec distance topologie Connexion entre les « Fabric Switch » connexion « long wave » -> 10 km ( nouvelle technologie 60 km ) Seulement possible entre switch, les nœuds ne le supportent pas connexion « long wave »
SAN : Produits Sun IBM EMC2 HP Autres StoreEdge Series FAStT200 storage server, FAStT400 storage server, … EMC2 EMC CLARiiON Midrange Storage Systems, … HP Disk System 2100…2405, HP Surestore series, … Autres Hitachi, Broadcom,…
Network Attached Storage
Network Attached Storage NAS HEAD : Groupement de machine(s) (cluster) offrant les données persistantes (SAN) à l’extérieur à travers le protocole TCP/IP Caractéristiques : Haute disponibilité (High Availability) Groupes redondantes de disques (redundant storage array) Serveurs redondants (redundant server) Redémarrage automatique et disponible endéans quelques minutes Haute performance (High Performance) Système d’exploitation optimisé I/O pour serveurs de fichiers Connexion multiple entre Serveurs et SA (distribution de charge) Cache sur SA
Network Attached Storage Caractéristiques (suite): Servir le plus grand nombre de requêtes en réseau simultanément « Content on demand » « Video on demand » Supporter des « File system » multiples CIFS (Common Internet File System) NFS (Network File System) Diminution des efforts d’administration Gestion centralisée (bien sûr redondante) Extensibilité (Scalability) Utilisation des composants standards (PC, FC, …)
Différence SAN et NAS SAN NAS Connexion FC ou SCSI Serveurs connectés avec FC peuvent accéder à SAN Protocole : Encapsulated SCSI Peu de overhead 100 MB/sec Next generation -> 200 MB/sec Bloque I/O 10 km FS géré par serveurs Configuration par serveurs NAS Connexion réseau Ethernet, FDDI, ATM Toute machine dans le réseau peut accéder à NAS Protocole : TCP/IP, CIFS, HTTP Overhead mais GB Ethernet 1 GB Ethernet -> 80 MB/sec Fichier I/O Mondial FS géré par NAS Head Configuration par Head Unit
NAS Head Machine qui est connectée : NIC -> réseau TCP/IP HBA -> SAN (Fibre Channel) Administration du NAS à partir d’un interface web
NAS Head 3 composants : Hardware utilisé Serveurs de fichiers redondants Stations de contrôle redondantes Groupes de disques (storage array) Hardware utilisé Serveurs de fichiers et stations de contrôle I386, FCA redondant, alimentations redondant, … DART (Data Access in Real Time) Linux I/O optimisé
NAS Head Stations de contrôle (CS) Installation, mise à jour des logiciels Calcul de la performance des serveurs de fichiers « Phone Home » « Dial In » Communication avec les serveurs de fichiers via RPC sur un réseau privé.
NAS Head Serveurs de fichiers (FS) Transfert des données entre Client et le SAN Téléchargement des logiciels de la station de contrôle lors du démarrage Configuration à l’aide de la Management Software de la station de contrôle Redémarrage automatique lors d’une erreur Connexion Fibre Channel avec SAN Dynamic Multipathing Serveurs de fichiers « Hot Spare »
NAS : Exemple EMC2 Celerra Nécessité d’un disque physique sur le SA Divisé en 6 Volumes : Vol 00 : OS pour la station de contrôle active Vol 01 : OS pour la station de contrôle passive Vol 02 : Boot partition pour les FS et CS Vol 03 : Système BD sauvegardant la configuration du NAS Vol 04 : Journaled FS. Protocole de toutes les opérations sur le File System (fast recovery). Changement niveau « block » ! Vol 05 : Données de log
EMC2 : Control Disk
Conclusion SAN Bon système de sauvegarde pour les Open System Favoriser Fibre Channel Accès au block (applications comme ORAC, OCFS, GFS, …) Beaucoup de produits de différents producteurs Bon rapport Prix/Disponibilité Devient intéressant pour les PME Mais : distance maximale 10km entre SA et Serveur Configuration par serveur
Conclusion NAS Extensibilité (Scalability) Facilite l’administration Facile d’ajouter des FS ou SA supplémentaires Facilite l’administration Support de multiple FS Distance entre Client et NAS-HEADs : mondial Mais : Une solution NAS/SAN avec FC est très chère « THE NETWORK IS THE COMPUTER » ® Sun Microsystem 1982
Matériel
Bibliographie Storage Area Networks / Network Attached Storage : « Hohe Datenverfügbarkeit durch Speichernetzwerke » ISDN : 3-8273-1871-8 Implementing the IBM TotalStorage NAS 300G http://www.ibm.com/redbooks
Démonstration du Red Hat GFS Mise en place d’un SAN RedHat GFS -> logical volume manager « Mount » d’une clé USB comme « block device » à travers le réseau sur les nœuds du cluster Création d’un GFS sur la clé USB « Mount » du FS sur deux machines différentes en même temps. Visualiser un accès multiple à un fichier
Schéma : Shared disk (block device)
Questions - Réponses ???