La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Redundant Array of Inexpensive Disks Pourquoi le RAID ? Les principes de base Les modèles RAID Comparaison des modèles Conclusion.

Présentations similaires


Présentation au sujet: "Redundant Array of Inexpensive Disks Pourquoi le RAID ? Les principes de base Les modèles RAID Comparaison des modèles Conclusion."— Transcription de la présentation:

1 Redundant Array of Inexpensive Disks Pourquoi le RAID ? Les principes de base Les modèles RAID Comparaison des modèles Conclusion

2 © BBY – 19/10/02 2 Pourquoi le RAID ? Proposé en 1987 par luniversité de Berkeley 3 axes damélioration de lexistant... Coût Performances Disponibilité des données … difficiles à concilier en même temps

3 Principes de base

4 © BBY – 19/10/02 4 Amélioration des performances Utilisation de plusieurs disques pour paralléliser les accès (data striping) Les informations sont réparties automatiquement sur le groupe de disques Le système dexploitation ou le SGBD voient un seul disque logique

5 © BBY – 19/10/02 5 Performances : le data stripping Disques physiques bloc 1 bloc 2 bloc 3 bloc 4 bloc 1bloc 2 bloc 3 bloc 4 Disque logique Stripe : ensemble de blocs de même niveau bloc : bloc de données destiné à être stocké sur un disque physique 2 possibilités selon le profil de lapplication : Optimisation du taux de transfert (unité E/S applicative = bloc) pour application transactionnelle -> plusieurs dE/S de petite taille Optimisation du taux dE/S (unité E/S = stripe) pour application multimédia -> 1 E/S de grosse taille

6 © BBY – 19/10/02 6 Inconvénient du data stripping Exemple : un ensemble de 10 disques dun MTTF de heures (environ 23 ans) aura un MTTF global de / 10 = heures (soit un peu plus de 2 ans). Lutilisation de multiples disques, si elle améliore les performances, augmente donc le risque dindisponibilité. Le MTTF (Mean Time To Failure) décroît en fonction du nombre de composants : AvecM=MTTF dun composant n = nombre de composants Léquation ci-dessus ce simplifie en si tous les composants ont le même MTTF, cas dun disk array formé de disques identiques.

7 © BBY – 19/10/02 7 Disponibilité : redondance des données par duplication Principe du miroir Les données sont dupliquées intégralement sur un 2ème disque Avec un décalage pour éviter une panne simultanée Disques physiques Disque logique bloc 1 bloc 2 bloc 3 bloc 4 bloc 1 bloc 2 bloc 3 bloc 4 bloc 1 bloc 2 bloc 3 bloc 4 Disque miroir

8 © BBY – 19/10/02 8 Disponibilité : redondance des données par contrôle de parité Disques physiques bloc 1 bloc 2 bloc 3 bloc 4 bloc 1 bloc 2bloc 3 bloc 4 Disque logique bloc P bloc_P = bloc_1 XOR bloc_2 XOR bloc_3 Les propriétés du ou exclusif font que cette relation est équivalente à : Bloc_1 = bloc_P XOR bloc_2 XOR bloc_3 et ainsi de suite. On est donc capable de reconstituer linformation de nimporte quel disque à partir de celle des autres.

9 © BBY – 19/10/02 9 Contrôle de parité : reconstitution bloc_1 = XOR bloc_2 = XOR bloc_3 = = bloc_P = Si le disque 2 tombe, on reconstruit linformation perdue à laide des 2 autres disques et du disque de parité : bloc_1 = XOR bloc_3 = XOR bloc_P = = bloc_2 =

10 © BBY – 19/10/02 10 Inconvénients du contrôle de parité On ne peut perdre quun seul disque Dans le cas de la mise à jour il faut modifier la parité : Exemple : bloc_1 est modifié en bloc_1. Il faut : Lire lancienne valeur de bloc_1 Lire lancienne parité Calculer la nouvelle parité = bloc_1 XOR bloc_1 XOR bloc_P Écrire la nouvelle parité Écrire la nouvelle valeur de bloc 1 On doit faire 4 accès disques !

11 Modèles RAID

12 © BBY – 19/10/02 12 Les modèles de base sans parité Disques physiques bloc 1 bloc 2 bloc 3 bloc 4 bloc 1bloc 2 bloc 3 bloc 4 Disque logique RAID 0 (data stripping) Disques physiques Disque logique bloc 1 bloc 2 bloc 3 bloc 4 bloc 1 bloc 2 bloc 3 bloc 4 bloc 1 bloc 2 bloc 3 bloc 4 RAID 1 (miroir)

13 © BBY – 19/10/02 13 Les modèles de base à parité fixe Un disque est dédié à la parité. Unité dentrée / sortie = 1 stripe (RAID 3) ou 1 bloc (RAID 4) Dans le cas du RAID 4, il devient un véritable goulet détranglement en écriture. Cet inconvénient nexiste pas en RAID 3 puisquon modifie de toute façon lensemble des blocs. RAID 3 et 4 Disques physiques bloc 1 bloc 2 bloc 3 bloc 4 bloc 1 bloc 2 bloc 3 bloc 4 Disque logique bloc P Parité fixe

14 © BBY – 19/10/02 14 Les modèles de base à parité tournante Disques physiques bloc D Disque logique bloc Pbloc D bloc P bloc D Parité tournante RAID 5 Pour faire disparaître linconvénient majeur du RAID 4 en écriture, la parité est écrite alternativement sur lensemble des disques. Conçu au départ pour les applications transactionnelles en lecture, donne de bons résultats aussi dans le cas de grosses E/S. Remplace donc souvent le RAID 3.

15 © BBY – 19/10/02 15 Combinaison : RAID 0+1 Performances du RAID 0 alliées à la sécurité du RAID 1 Disques physiques Disque logique Disques miroirs RAID 0 RAID 1

16 © BBY – 19/10/02 16 Évolution : RAID 6 Utilisation de codages Reed-Solomon ou Hamming, nécessitant plusieurs disques de contrôle + de sécurité, mais encore plus de difficultés en mise à jour Disques physiques Chunk D Chunk P Chunk Q Chunk D Disque logique Chunk PChunk D Chunk Q Chunk D Chunk QChunk P Chunk D Chunk P Chunk D

17 Comparaison des modèles Performances

18 © BBY – 19/10/02 18 Comparaison pour petites E/S Performances comparées au RAID 0. « group size » = nombre de disques dans le système de parité. RAID : High-Performance, Reliable Secondary Storage Peter M. Chen, Edward K. Lee, Garth A. Gibson, Randy H. Katz, David A. Patterson article de ACM Computing Surveys, octobre 1993

19 © BBY – 19/10/02 19 Comparaison pour grandes E/S Performances comparées au RAID 0. « group size » = nombre de disques dans le système de parité. RAID : High-Performance, Reliable Secondary Storage Peter M. Chen, Edward K. Lee, Garth A. Gibson, Randy H. Katz, David A. Patterson article de ACM Computing Surveys, octobre 1993

20 © BBY – 19/10/02 20 Amélioration des modèles : le cache Ajout de cache, utile surtout en écriture Solution ayant ses limites Solutions de stockage, Jacques Péping, Eyrolles, 1998

21 © BBY – 19/10/02 21 Autres améliorations Parité flottante En cas de mise à jour, la parité nest pas réécrite au même endroit, mais + loin sur la piste, pour éviter le délai rotationnel du disque Parity logging Stockage en mémoire des mises à jour de parité. Écriture séquentielle dès quun volume suffisant est atteint Disques « intelligents » Fonctions de calcul de parité, réordonnancement des requêtes pour optimisation

22 Comparaison des modèles Disponibilité

23 © BBY – 19/10/02 23 Exemple : disponibilité du RAID 5 Reprenons notre exemple du début, 10 disques avec MTTF de heures (23 ans) et MTTR de 2 heures. Organisons les en 2 groupes de 5 : ( ) 2 /(10 x 9 x 2) = ans, soit une probabilité de 0,04 % sur 10 ans. Où N = nombre total de disques G = nombre de disques dans un groupe de parité MTTR = Mean Time To Repair (temps de réparation dun disque) On montre que : RAID : High-Performance, Reliable Secondary Storage Peter M. Chen, Edward K. Lee, Garth A. Gibson, Randy H. Katz, David A. Patterson article de ACM Computing Surveys, octobre 1993

24 © BBY – 19/10/02 24 Fonctionnement en mode dégradé RAID 0 : perte des données Pas de mode dégradé ! RAID 1 : légère baisse de performances en lecture car plus de choix du disque le + rapide RAID à parité : dépend du disque perdu Si disque de parité : idem en lecture, + rapide en écriture ! Si disque de données : obligation de lire tous les autres disques !

25 © BBY – 19/10/02 25 Reconstitution du disque défectueux HOT SWAP : remplacement à chaud du disque défectueux HOT SPARE : disque de secours en ligne dans la baie de disques Reconstruction : coûteuse dans tous les cas

26 © BBY – 19/10/02 26 Les coûts liés à la disponibilité ModeSurcoût RAID 00 RAID 1100% RAID 3 à 51 / Nb disques

27 Conclusion

28 © BBY – 19/10/02 28 Domaines d application

29 © BBY – 19/10/02 29 Le RAID aujourdhui Technique de base disponible dans la plupart des systèmes de disques et systèmes dexploitation (Unix, Windows 2000/NT) RAID matériel ou logiciel Le marché sest orienté vers le RAID 0, 1 et 5 (et combinaisons : 0+1)

30 © BBY – 19/10/02 30 Diverses configurations matérielles RAID interne Baie externe Cluster Storage Area Network

31 © BBY – 19/10/02 31 ATA Pour stations de travail RAID 0/1 mirroring/striping Jusquà 4 disques ATA/100 or ATA/66 SCSI Hot-swap, hot-spare Supporte RAID 0, 1, 10, 5, 50 Jusquà 15 disques Cartes internes pour PC

32 © BBY – 19/10/ unités Ultra160 SCSI RAID 2 contrôleurs RAID 0, 1, 3, 4, 5, 10 and disques de 146 Go (1,7 To) Baies externes


Télécharger ppt "Redundant Array of Inexpensive Disks Pourquoi le RAID ? Les principes de base Les modèles RAID Comparaison des modèles Conclusion."

Présentations similaires


Annonces Google