GDS – 17/02/061 Gestion de la volatilité dans un système de stockage P2P F. Picconi, P. Sens Regal (LIP6 / INRIA) ACI Masses de Données.

Slides:



Advertisements
Présentations similaires
Module Systèmes d’exploitation
Advertisements

La Couche Réseau.
Gabriel Antoniu IRISA / INRIA Rennes
A NETWORK-AWARE DISTRIBUTED STORAGE CACHE FOR DATA INTENSIVE ENVIRONMENTS Brian L. TIERNEY, Jason LEE, Brian CROWLEY, Mason HOLDING Computing Sciences.
UV Libre Calculatrice Scientifique
DUDIN Aymeric MARINO Andrès
Nicolas Galliot M2SIR David Raspilaire
Applications et Techniques
26/03/2017 Fonctionnement d ’un cluster sous AIX grâce à HACMP : High Availability Cluster Multi-Processing Raphaël Bosc, IR5.
Projet SeVeCom (Secure Vehicular Communications)
Stockage dans DIET Groupe de travail du 16 décembre 2002.
Vue d'ensemble Implémentation de la sécurité IPSec
Jean-François Deverge, Sébastien Monnet
simulateur de réseau de machines UML connectées par WiFi mode ad-hoc
Configuration de Windows Server 2008 Active Directory
Karel Heurtefeux1, Fabrice Valois2
Stockage de blocs dans un système distribué pair- à-pair.
SSL (Secure Sockets Layer) (couche de sockets sécurisée)
Module 1 : Préparation de l'administration d'un serveur
Amélioration de la sécurité des données à l'aide de SQL Server 2005
ADR Active and Dynamic Routing. Plan Introduction au routage Les réseaux actifs Les agents Mise à jour des matrices de routage Architecture du routage.
Noyau persistant en réseaux pair-à-pair Comment relier la taille à la durée de vie V. Gramoli, A-M. Kermarrec, A. Mostéfaoui, M. Raynal, B. Sericola.
Guérin Julien Mézerette Marius GTR FI 2A
Indexation 1. Concepts de base 2. Arbre B 3. Indexes secondaires.
Un nouveau monde d’échange sur Internet ????
Les fichiers indexés (Les B-arbres)
Module 2 : Préparation de l'analyse des performances du serveur
Module 7 : Accès aux ressources disque
1 Protection des arbres multicast avec une forêt duale Mohand Yazid SAIDI Bernard COUSIN Miklós MOLNÁR 15 Février 2006.
Eléments pour GridExplorer (GdX). Evalutation de grand système Modélisation Simulation Emulation Exécution (In-situ) Quelle méthodologie pour l'évalutation/test.
Architecture des systèmes pair-à-pair de gestion de données Gabriel Antoniu Projet PARIS IRISA/INRIA.
CEDCOM architecture haute performance pour des applications “big data” Tanguy Raynaud Projet CEDAR.
La réplication dans les réseaux mobiles ad hoc
Université des Sciences et Technologies Houari Boumediene
Réseaux Mesh (Maillés) sans fil « WMNS »
JDBC L'API JDBC est utilisée pour utilisée pour intéragir avec une base de données.
1 F o r m a t i o n A R S FTP anonyme, Archie 2 F o r m a t i o n A R S FTP ANONYMOUS m Premier service d'accès à des documents publics. m Repose très.
Modèles et protocoles de cohérence des données en environnement volatil Grid Data Service IRISA (Rennes), LIP (Lyon) et LIP6 (Paris) Loïc Cudennec Superviseurs.
1/13 Sécurité dans Pastis Fabio Picconi LIP6 13 février 2004 ACI MD Grid Data Services (GDS)
Etude de la volatilité dans un système de stockage P2P Fabio Picconi – LIP6.
Jean-Michel BUSCA et Pierre SENS
GDS : Grid Data Service Gabriel Antoniu IRISA / INRIA Rennes Réunion de lancement du projet GDS de l’ACI Masses de Données 22 septembre 2003.
1 Détection et tolérance aux fautes dans JuxMem Sébastien Monnet IRISA / PARIS Lyon, 05/12/2003.
Yonel GRUSSON.
P2pWeb Une boite à outils pour construire un réseau coopératif d’hébergement de site Web –Réseau coopératif réseau physique de nœuds sur l ’Internet réseau.
Présence et communication peer-to-peer Diplômant : Yves Bresson Professeur responsable : Yves Dennebouy EIVD Septembre - Décembre 2003.
Outil d’observation d’un réseau pair-à-pair Fabio Picconi – LIP6.
AFPA CRETEIL 14-1 Windows NT Environnement des utilisateurs Chapitre 14.
1 Premières études sur la gestion de la volatilité dans Pastis Fabio Picconi Réunion GDS – 19/11/2004.
Réunion calcul simulations GIEC/IPCC - Prodiguer Lundi 23 Mars PRODIGUER un noeud français de distribution des données GIEC/IPCC Sébastien Denvil.
Utilisation de Modelnet dans le cluster de SRC Fabio Picconi – LIP6.
ACI Masses de Données Bilan GDS Regal (LIP6 / INRIA)
COMPARAISON ENTRE GNUTELLA ET FREENET
Un service de partage de données pour DIET : GDS basé sur JuxMem Mathieu Jan Projet PARIS Lyon, 5 décembre 2003.
GDS : Grid Data Service Etat de l’avancement Gabriel Antoniu Réunion GDS, Lyon, 17 février 2006 IRISA, Rennes ACI Masses de Données.
Structures de données avancées : Variantes des B arbres
SONDe: Service à densité auto-organisante tolérant la charge Vincent Gramoli (INRIA) Erwan Le Merrer (INRIA) Anne-Marie Kermarrec (INRIA) Didier Neveux.
COMPARAISON DES SYSTEMES DE GESTION DE FICHIERS LINUX / WINDOWS NT
Persistance de noyau dans les systèmes dynamiques à grande échelle
1 UMLV  FICHIERS Mémoire de masse découpée en blocs Fichier :liste chaînée de blocs, ou arbre de blocs (répertoires - fichiers)‏ Bloc d’éléments Bloc.
Structures de données avancées : Arbres B+ avec expansion partielle D. E ZEGOUR Institut National d ’Informatique.
Projet GDS de l’ACI MD Projet PARIS IRISA, Rennes.
Module 3 : Gestion des fichiers de base de données
Gestion des documents internes avec SQL Server 2005 Date de publication : janvier 2006.
Localisation collaborative dans les réseaux de capteurs
1Boulogne Informatic Club PRESENTATION DE WINDOWS 10.
1 G ÉNÉRALITÉS Notions et caractéristiques générales.
Chapitre 8 Protection du trafic réseau à l'aide de la sécurité IPSec et de certificats Module S43.
Chapitre8 Configuration de l'adressage TCP/IP et de la résolution de noms Module S41.
PetaSky: Expérimentations avec HadoopDB et Hive 1 Amin Mesmoudi.
Transcription de la présentation:

GDS – 17/02/061 Gestion de la volatilité dans un système de stockage P2P F. Picconi, P. Sens Regal (LIP6 / INRIA) ACI Masses de Données

GDS – 17/02/062 Problème de la volatilité « Churn » = taux élevé d’ajout de nœuds et de défaillances Le churn : une des causes des dénis de services dans P2P (issue de sources non forcément malicieuses). Nombreuses études sur la résistances aux churns des overlay (cf. Bambou, MSPastry …). => Relative bonne résistance (quelques minutes) de couche basses (KBR) Quid des applications : –Stockage des données Objectif : Etudier le churn dans Past et Pastis

GDS – 17/02/063 [Rhea 04] Handling churn in DHT, Usenix Annual Technical Conf. 2004

GDS – 17/02/064 Architecture Pastis Internet Distribution des blocs de données racine du bloc réplication Anneau de machines Past Système de fichiers Pastis

GDS – 17/02/065 Placement des répliques (PAST) 04F2 3A B BB2 AC78 C52A E25A 73AB 8971 put( 8959, block ) 0-root 2-root 1-root Facteur de réplication k = 3 Clef = 8959

GDS – 17/02/066 Pastis (2) Deux types de blocs : –CHB (Content Hash Block): blocs de données Non modifiable Auto-certifiant :cle de stockage = Hash(contenu) Lecture : 1 copie suffit –UCB (User Certificate Block) : blocs de méta-données (inodes) Modifiable : clé = H(Clé Publique) Donnée signée Accès : Obtenir un quorum

GDS – 17/02/067 Test de la volatilité dans Pastis console devgdx002 netgdx router Modelnet gdx [1-5] gdx [9-13] … Pastry/Past/Pastis contrôleur noeuds DHT gdx

GDS – 17/02/068 Test de la volatilité dans Pastis console devgdx002 netgdx router Modelnet contrôleur noeuds DHT gdx gdx [1-5] gdx [9-13] … Pastry/Past/Pastis

GDS – 17/02/069 Moniteur de contrôle Communique directement avec les noeuds de calcul sans passer par l’émulateur Modelnet Injection de la volatilité (join / leave) –Tue et crée des nœuds de la DHT Observation de l’état global –Ensemble des blocs stockés –Répartition des blocs, nombre de copies –Etat des leafset (voisinage dans l’anneau Past)

GDS – 17/02/0610 Injection de volatilité Le contrôleur utilise un processus de poisson A chaque événement il tue un noeud de la DHT et en crée un nouveau On utilise le temps médian de session comme paramètre pour la volatilité t med = N.ln 2 / λ (N = nb. noeuds, λ = param. Poisson)

GDS – 17/02/0611 Expérimentations –1 client Pastis utilisant une DHT de 100 nœuds –liens client-stub de 1 mbps –Andrew Benchmark exécuté sur le client Pastis –répertoire contenant 27 fichiers (total 316 Ko) –20 edge nodes et 2 émulateurs Modelnet –10 noeuds DHT par machine physique

GDS – 17/02/0612 Expérimentations Nombre de répliques trouvés par le client Pastis lors de l’exécution du Andrew Benchmark en fonction du temps. MST = 60 min Facteur de réplication = 11 Intervalle de maintenance = 1 minIntervalle de maintenance = 5 min

GDS – 17/02/0613 Expérimentations MST = 30 min. Un intervalle de maintenance de 5 minutes ne permet pas au protocole de régénération de blocs de réagir suffisamment vite, et l’exécution du AB est bloquée lorsque le client trouve moins de 8 répliques. Intervalle de maintenance = 1 minIntervalle de maintenance = 5 min

GDS – 17/02/0614 Retour sur expériences Mauvaise résistance aux « churns » lorsque les nœuds sont chargés Goulot d’étranglement : –le transfert de données : essentiellement des CHB (et non pas la mise à de la structure de l’overlay –Possibilité d’amélioration (limitée) en donnant une priorité plus forte au CHB (cf Présentation GDS du 4 novembre) – Soumission ICPADS 2006 => Nécessité d’un système d’incitation pour « forcer » les nœuds à rester –HotP2P 2006

GDS – 17/02/0615 Incitation dans Pastis Objectif : améliorer la stabilité de Pastis 2 mécanismes : (1) Modification du protocole de join (2) Associé une métrique de « réputation » pour chaque nœud qui correspond à la stabilité du nœud Réputation élevée => accès plus rapide, plus grande capacité de stockage

GDS – 17/02/0616 Protocole de Join Join en 2 phases : –Phase 1 : Le nœud doit prouver sa stabilité pendant Tphase1 Pas présent dans l’anneau mais relié par un proxy Accès à la DHT limité (plus lent : un saut de plus), pas de stockage de données –Phase 2 : Récupération des réplicats de ses voisins Le nœud doit prouver le stockage de ses réplicats A la fin de la phase 2 : le nom obtient une réputation minimum Le noeud est inséré dans l’anneau –La réputation du nœud évolue au cours du temps

GDS – 17/02/0617 Join du nœud A (2) Phase 1 : Connexion au nœud B d’id le plus proche dans DHT – Récupération de son LeafSet A envoie périodiquement des heartbeat à m nœuds du LeafSet de B Après une période Tphase 1 sans défaillance, A entre en phase 2 Phase 2 : Transfert des blocs depuis les m noeuds Liste des blocs transférés maintenue dans les voisins Les voisins vérifient périodiquement que A possède bien les blocs en envoyant des « challenges » : Envoi d’un nombre aléatoire et d’une clé de bloc Fin de la phase 2 lorsque A a récupéré tous les blocs des m nœuds Récupération d’un certificat de chacun des m nœuds Les certificats sont inclus (et vérifiés) dans la demande de Join final

GDS – 17/02/0618 Evolution de la réputation Augmentation lorsque le nœud reste connecté –Incrémentation tous les Tup Diminution lors des déconnexions –Décrémentation tous les Tdown(d,n) d : durée de déconnexion n : nombre de voisins en ligne –Réputation = 0 => exclusion de l’anneau Pb : un nœud peut tricher sur sa réputation –Certification : tous les Tup, un nœud demande à ses m voisins un certificat incluant sa nouvelle réputation –Certificat vérifiable avec clé publique des voisins –Audit aléatoire des certificats –Triche => blacklist

GDS – 17/02/0619 Réplication et réputation Associé à chaque donnée (bloc) un niveau de stabilité Répliqué le bloc jusqu’à ce que la somme de réputation des nœuds de stockage = niveau de stabilité Stabilté(B) = 14 Racine B Stockage = Avantages : Réplication dynamique en fonction de la stabilité des nœuds Peu de modifications dans Past Inconvénient : Pics sur les nœuds de réputation forte (=> associer la réputation à la capacité de stockage)

GDS – 17/02/0620 Bénéfice d’une réputation élevée Capacité de stockage : –Quotas –Proportionnelle à la capacité offerte par les nœuds Meilleures QoS : donner une priorité plus importante aux messages issus de nœuds réputés –Difficile à mettre en œuvre (possibilité de tricherie)

GDS – 17/02/0621 Conclusions Evaluation du coût du nouveau protocole de join dans Pastis –Surcoût du monitoring, de la génération/transfert des certificats Implémentation de la réplication basé sur réplication Difficulté d’évaluer l’efficacité de l’incitation (nécessité d’avoir de nombreux utilisateurs « réels »)

GDS – 17/02/0622 Questions ?

GDS – 17/02/0623 Autre approche Placer les réplicats sur les nœuds les plus stables du leafset  Plus de contiguïté des réplicats dans l’anneau  Mise en place de pointeur (modification plus en profondeur de Past)