La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Adrien LEBRE Systèmes distribués: des réseaux aux grilles IFSIC-M2R Novembre 2007 1/12 Gestion des données persistantes (complément) IFSIC Master - SDR.

Présentations similaires


Présentation au sujet: "Adrien LEBRE Systèmes distribués: des réseaux aux grilles IFSIC-M2R Novembre 2007 1/12 Gestion des données persistantes (complément) IFSIC Master - SDR."— Transcription de la présentation:

1 Adrien LEBRE Systèmes distribués: des réseaux aux grilles IFSIC-M2R Novembre /12 Gestion des données persistantes (complément) IFSIC Master - SDR - Nov/Déc 2007 Adrien Lebre - IRISA - projet PARIS

2 Adrien LEBRE Systèmes distribués: des réseaux aux grilles IFSIC-M2R Novembre /12 Sommaire Les systèmes de fichiers Les systèmes de fichiers distribués E/S parallèles, les bibliothèques daccès Complément sur les DFS: de Sprite à xFS

3 Adrien LEBRE Systèmes distribués: des réseaux aux grilles IFSIC-M2R Novembre /12 Systèmes de fichiers distribués Etude de cas : de Sprite à xFS Projets SPUR (1985/1993) et NoW (1993/1998) - Université Berkeley Sprite : Système dexploitation distribué Basé sur deux idées : Un système «network-aware» (rendre transparent le réseau) Exploiter les espaces mémoires de plus en plus grand (32Mo à lépoque) Sprite FS : Espace de nommage unique (transparence de situation). Partitionné de manière transparente en domaine. Chaque nœud composé dun espace de stockage peut contenir un ou plusieurs domaines (chaque nœud peut être client et/ou serveur) Une table de correspondance (table des « préfixes ») entre les domaines et leur situation physique est maintenue dynamiquement sur chacun des nœuds. Lors de laccès à un fichier, si aucune entrée ne correspond au sein de la table des « préfixes », un requête de type « inondation » est transmise. La problématique des fichiers spécifiques au machine (/etc/hostname) est résolu en « privatisant » certaines ressources au sein de la table des «préfixes».

4 Adrien LEBRE Systèmes distribués: des réseaux aux grilles IFSIC-M2R Novembre /12 Systèmes de fichiers distribués Etude de cas : de Sprite à xFS Sprite FS (suite) : Sémantique de type UNIX Cache distribué (coté client, lecture + écriture retardée) et maintenu en cohérence par un serveur « stateful » (invalidation des caches afin de forcer déventuelles écritures). Utilisation de la mémoire vive et secondaire de lensemble des nœuds Serveur à « état » (tolérance au pannes) Passage à léchelle (protocole par inondation, maintien de la table des «préfixes») Log-Structured File System, LFS (Sprite FS, Version 2, 1990) Placement physique des données journalisé : « Les performances sont obligatoirement dépendantes du matériel minimiser les déplacements » Idée fondamentale : une unité de stockage est vue comme un « buffer » circulaire Gain de performance en écriture

5 Adrien LEBRE Systèmes distribués: des réseaux aux grilles IFSIC-M2R Novembre /12 Systèmes de fichiers distribués Etude de cas : de Sprite à xFS Dun FS traditionnel vers LFS (a) Traditionnel (b) Minimisant la fragmentation (c) Fusion des méta et des données Concept de « super méta-bloc » de taille inférieur au cache. (d) Structure complètement journalisé Le « super méta-bloc » est écrit de façon périodique sur le disque. Principale difficulté : Réorganisation des données lorsque le pointeur décriture atteint la fin du disque. Segmentation du disque, à chaque nouveau segment, le précèdent est défragmenté.

6 Adrien LEBRE Systèmes distribués: des réseaux aux grilles IFSIC-M2R Novembre /12 Système de fichiers distribués Etude de cas : de Sprite à xFS LFS, bilan : Sprite FS amélioration des performances en lecture (cache sur chacun des noeuds) Journalisation amélioration des performances en écriture Distribution et maintien du méta-bloc complexe et coûteuse Chaque fichier est stocké sur un unique disque saturation/goulet détranglement Zebra File System (extension de LFS, 1992) Apport : répartition des données en RAID 4, Granularité des blocs (« chunk size») : si trop importante «hot spot » (cas des fichiers), si trop faible surcoût latence réseau/disque (multiple accès). Mise en place dun tampon au sein de chaque client (appelé «log»), A chaque fois que le tampon est plein, il est réparti sur les serveurs de données. Comment gérer les accès concurrents ?

7 Adrien LEBRE Systèmes distribués: des réseaux aux grilles IFSIC-M2R Novembre /12 Système de fichiers distribués Etude de cas : de Sprite à xFS Zebra : utilisation de service centralisé pour maintenir en cohérence les données

8 Adrien LEBRE Systèmes distribués: des réseaux aux grilles IFSIC-M2R Novembre /12 Système de fichiers distribués Etude de cas : de Sprite à xFS Architecture du système Zebra Les clients : Lors dune lecture, le client interroge le gestionnaire de fichiers qui lui indique le/les serveur(s) de stockage auquel(s) il est nécessaire d'accéder. Les écritures sont réalisées dans le «log» en sappuyant sur le modèle LFS. Seules les méta-informations sont transmises au gestionnaire de fichiers et de stripes afin quils évitent daccéder aux serveurs de stockages (les « deltas »). Le gestionnaire de fichiers : Localisation des données sur les différents serveurs de stockages (à chaque fichier créé correspond un méta-fichier stocké sur le gestionnaire). Ces informations fournissent la correspondance vers les différents serveurs de stockages. Maintien de la cohérence entre les caches des clients en sappuyant sur le modèle proposée par Sprite FS. Les serveurs de stockages : Gestion du stockage par blocs de taille fixe (stockage, récupération, identification, suppression) Le gestionnaire de stripes : Organisation des segments sur les différents serveurs de stockages, défragmentation des disques afin dobtenir des segments libres (LFS). A chaque stripe correspond un fichier stocké au sein du gestionnaire qui indique les fragments de données encore valides au sein du stripe. Ces informations sont maintenues grâces aux «deltas».

9 Adrien LEBRE Systèmes distribués: des réseaux aux grilles IFSIC-M2R Novembre /12 Système de fichiers distribués Etude de cas : de Sprite à xFS Zebra, bilan : Les données sont fractionnées équilibrage des « hot spots », tolérance Les méta-informations, Il y en a beaucoup !! Problèmes liés au point de centralisation des deux gestionnaires, La perte du gestionnaire de fichiers est critique ! Lorsquun serveur de stockages subit une défaillance, mode dégradé (RAID 4) Un nouveau concept dans les systèmes de fichiers distribués : Adaptation partiel de la structure du système de fichiers (possibilité dajouter des serveurs de stockages dynamiquement) xFS, « serverless file system» 1993, un nouveau projet: NoW (Network of Workstation, Univ. Berkeley), un nouveau système xFS : Version 1 : hiérarchisation des serveurs de méta-données Version 2 : «lensemble des services doit être accessible et opérationnel depuis chaque client»

10 Adrien LEBRE Systèmes distribués: des réseaux aux grilles IFSIC-M2R Novembre /12 Système de fichiers distribués Etude de cas : de Sprite à xFS xFS, architecture : Accès aux caches distants en priorité (cache coopératif). Distribution des gestionnaires sur plusieurs nœuds. Chaque nœud peut agir comme un client, un gestionnaire de stockage, de fichiers et de nettoyage. Distribution du gestionnaire de fichiers et de stripes : Un gestionnaire gère un sous groupe didentifiants (un ensemble dinodes). La table des préfixes dynamique du modèle Sprite FS devient statique. Lorsquun client souhaite accéder à une ressource, il regarde dans sa table afin de déterminer le gestionnaire en charge. Modèle du «premier écrivain» pour la création (possibilité de mettre en œuvre un méthode dite de ré-attribution permettant de re-équilibrer la table des préfixes). Même approche pour les stripes, chacune des unités maintient les segments quelle a écrits et réorganise les informations sur les blocs «valides» le cas échéant. Adaptation complète de la structure : Ajout et suppression de serveurs de stockages (répartis en sous groupe) Approche similaire à du RAID 1+4 («parallélisation» de lécriture de plusieurs stripes) En cas de défaillance, le sous-groupe atteint bascule dans un mode dit «obsolète» (seules les lectures sont autorisées). Le gestionnaire de stripe va peu à peu transférer les données vers les sous-groupes qualifiés dactuels. Lors de la remise en état du sous-groupe « obsolète », il nest plus utile de recalculer les données via le XOR.

11 Adrien LEBRE Systèmes distribués: des réseaux aux grilles IFSIC-M2R Novembre /12 Système de fichiers distribués Etude de cas : de Sprite à xFS xFS, bilan : Suppression des « SPOFS » (services totalement distribués). Tolérant aux pannes et hautement disponible Dynamicité dans la structure du système de fichiers La sécurité nest jamais été abordée ! Il est « facile » de corrompre une structure (les logs) et «crasher» de manière irrévocable le système de fichiers encapsulation du système xFS dans une boite noire (via NFS par exemple). Performance ? Une version sous Solaris (1997) Le projet NoW sest terminé en 1998.

12 Adrien LEBRE Systèmes distribués: des réseaux aux grilles IFSIC-M2R Novembre /12 De Sprite à XFS « The sprite network operating system » par J. Ousterhout, A. Cherenson, F. Douglis, M. Nelson at B. Welch. Paru dans IEEE Computer en 1998 « Beating the I/O bottleneck: A case oor log-structured file systems » par J. Ousterhout et F. Douglis. Paru dans un rapport de recherche de luniversité de Berkeley en « The Zebra Striped Network File System » par J. Hartman et J. Ousterhout. Paru dans High Performance Mass Storage and Parallel I/O: Technologies and Applications en « Serverless network file systems » par T. E. Anderson, M. D. Dahlin, J. M. Neefe, D. A. Patterson, D. S. Roseli et R. Y. Wang. Paru dans un rapport de recherche de luniversité de Berkeley en Systèmes de fichiers distribués Références (rappel)


Télécharger ppt "Adrien LEBRE Systèmes distribués: des réseaux aux grilles IFSIC-M2R Novembre 2007 1/12 Gestion des données persistantes (complément) IFSIC Master - SDR."

Présentations similaires


Annonces Google