A NETWORK-AWARE DISTRIBUTED STORAGE CACHE FOR DATA INTENSIVE ENVIRONMENTS Brian L. TIERNEY, Jason LEE, Brian CROWLEY, Mason HOLDING Computing Sciences.

Slides:



Advertisements
Présentations similaires
Stockage et sauvegarde
Advertisements

Le stockage DAS,NAS,SAN.
Introduction aux environnements répartis
Accélération du Rendu Volumique basée sur la Quantification des Voxels
Recherche de motifs par méthodes exploratoires: Comparaisons de performances et statistiques sur le score.
Excel 2007 et les services Excel. Pourquoi Excel ? Outil privilégié danalyse des données issues des bases multidimensionnelles Ergonomie connue des outils.
Le serveur NAS Network Attached Storage, (NAS) désigne un périphérique de stockage relié à un réseau dont la principale fonction est le stockage de données.
Le Grid Computing Par Frédéric ARLHAC & Jérôme MATTERA.
DUDIN Aymeric MARINO Andrès
CLUSTERING Grappe d'ordinateurs.
Nicolas Galliot M2SIR David Raspilaire
ISP/ASP ISP ASP Conclusion DESS Réseaux 2000/2001
Applications et Techniques
Exposé Système Netware 5 11 /10/ 2001 Aurélie Démolis
Stockage dans DIET Groupe de travail du 16 décembre 2002.
Les jeux persistants massivement Multijoueurs : problèmes techniques Vincent Roudaut MASTER M2 ESTC/CAM
Module 10 : Gestion et analyse de l'accès réseau
Informatique parallèle hautes performances
Les réseaux locaux sans fil : normes, domaines d'utilisation et enjeux
simulateur de réseau de machines UML connectées par WiFi mode ad-hoc
Réseaux Longue Distance – Réseaux Haut Débit
Système de stockage réseaux NAS - SAN
Etude des Technologies du Web services
SECURITE DU SYSTEME D’INFORMATION (SSI)
Module 1 : Préparation de l'administration d'un serveur
JAVASERVER FACES Un framework Java pour le développement Web.
Amélioration de la sécurité des données à l'aide de SQL Server 2005
ADR Active and Dynamic Routing. Plan Introduction au routage Les réseaux actifs Les agents Mise à jour des matrices de routage Architecture du routage.
1 Sécurité Informatique : Proxy Présenter par : Mounir GRARI.
Noyau persistant en réseaux pair-à-pair Comment relier la taille à la durée de vie V. Gramoli, A-M. Kermarrec, A. Mostéfaoui, M. Raynal, B. Sericola.
L'équilibrage de charge Utilisation, principe et solutions
Cloud Computing et mesures de performances
Développement d’application web
Scénarios Architecture Drupal V 1.0. Scénario 1 : La base de données est également installée sur celui-ci. Le client ici fait office dinjecteur. Drupal.
Gestion de Fichiers Tri Interne Efficace et Tri Externe.
Universté de la Manouba
1 Algotel /05/04 Modélisation analytique des algorithmes dordonnancement GPS & WFQ BOCKSTAL Charles, GARCIA J.M. et BRUN Olivier.
Mise en oeuvre des MMCs L'utilisation des MMCs en reconnaissance des formes s'effectue en trois étapes : définition de la topologie de la chaîne de Markov,
Détection du meilleur format de compression pour une matrice creuse dans un environnement parallèle hétérogène Olfa HAMDI-LARBI.
1 Workshop : modelling relationships between agriculture and environment - Brussels - 15/02/2001 Séminaire LISC Vendredi 29 Juin 2001 Transmission de linformation.
Réseau de stockage étendu
Développement dapplication avec base de données Semaine 10 : WCF avec Entité Framework Automne 2013.
Ipchains TP 1 TP 2 TP 3 Installer un serveur web sur votre poste,
Vue d'ensemble Configuration d'adresses IP
IntroductionContexteAnalyseConclusionApproche Présentation d’article 04/02/04 DEA DISIC Grid Computing Monitoring Data Archive In Grid Environments GANAME.
- La commutation de niveau 5- - La commutation de niveau 5 - Option RIO 2003 – FP04 Fabien DAGOMMER Fernando LUIS.
Module 8 : Surveillance des performances de SQL Server
Agrégation de Liens A Guyancourt le
INF3500 : Conception et implémentation de systèmes numériques Pierre Langlois Performance de circuits.
Enterprise Java Beans 3.0 Cours INF Bases de Données Hiver 2005, groupe 10 Stefan MARTINESCU.
Crawlers Parallèles Présentation faite par: Mélanie AMPRIMO
Étude d’un protocole de partage de travail entre systèmes Pair à Pair
Adapting to changing resource performance in grid query processing Anastasios Gounaris Jim Smith Norman W. Paton Paul Watson Rizos Sakellariou University.
GF-11: Tri Interne Efficace et Tri Externe
Etat d’avancement Développement et intégration Bilal EL ALI Caen, Mars 2001.
Approche Cross layer Dr Mekkakia Maaza Zoulikha Cours M2 SIR
LE DATA WAREHOUSE.
Les différents modèles d’architecture technique
L'unité centrale est composé en générale de :
Optimisation pour la Conception de Systèmes Embarqués
SNMP Simple Network Management Protocol
21/02/2003DEA DISIC 1 Grid Computing Programming the grid: Distributed Software Components, P2P and Grid Web Services for Scientific Applications Tarak.
Simulation de traces réelles d’E/S disque de PC. Jalil Boukhobza, Claude Timsit Perpignan le 06/10/2006.
SKY.
Kawthar Karkouda, Nouria Harbi, Jérôme Darmont, Gérald Gavin,
31/05/2007Projet Master 11 Présentation ludique de la recherche opérationnelle à la fête de la science Année universitaire 2006/2007 Sylvain FIX Julien.
MP2P PROTOCOLE & SYSTÈME DE STOCKAGE REDONDANT COACHING 3 – 21/05/2015 Julien DUBIEL – Mathieu CORRE – Francis VISOIU MISTRIH.
MP2P PROTOCOLE & SYSTÈME DE STOCKAGE REDONDANT COACHING 2 – 30/04/2015 Julien DUBIEL – Mathieu CORRE – Francis VISOIU MISTRIH.
PROJET DE SESSION DANS LE CADRE DU COURS: SCG Réalisation d’applications en SIG PRÉSENTÉ PAR: Marie-Andrée Levesque 18 AVRIL 2006.
TD N°5: Une GPAO pour l’usine Odyssée. Lancement du logiciel Logiciel « Usine Odyssée 7 » disponible dans … Entrer votre nom et un nom d’entreprise de.
Transcription de la présentation:

A NETWORK-AWARE DISTRIBUTED STORAGE CACHE FOR DATA INTENSIVE ENVIRONMENTS Brian L. TIERNEY, Jason LEE, Brian CROWLEY, Mason HOLDING Computing Sciences Directorate – Lawrence Berkley National Laboratory University of California, Berkley, CA, Proceedings of IEEE High Performance Distributed Computing conference ( HPDC-8 ), August 1999HPDC-8 Tahiry RAZAFINDRALAMBO – DEA DISIC

PLAN 1- Introduction 2- Problématique 3- Cache de stockage distribué 4- Optimisation, adaptation « network-aware » 5- Résultats 6- Conclusion

Tahiry RAZAFINDRALAMBO – DEA DISIC Introduction Ce dont on dispose: Ce que lon voudrait: - Une nouvelle générations dapplications scientifiques - De plus en plus de données à traiter - Un réseau de plus en plus performant - Pouvoir stocker ces données pour en avoir un accès plus facile et plus rapides - Distribuer ces données pour permettre un accès facile a tous les scientifique du monde - Pour ce faire, utiliser le réseau au meilleur de ça capacité

Tahiry RAZAFINDRALAMBO – DEA DISIC Problématique Construire une architecture au dessus du réseau pour le stockage de donnée, un cache implémenté sur le réseau Optimiser cette architecture en fonction des performances du réseau et de son état

Tahiry RAZAFINDRALAMBO – DEA DISIC Cache de stockage distribué Le modèle de manipulation de donnée utilisé:

Tahiry RAZAFINDRALAMBO – DEA DISIC Cache de stockage distribué: «DPSS» Distributed Parallel Storage System Larchitecture DPSS (basé sur le modèle précédent):

Tahiry RAZAFINDRALAMBO – DEA DISIC DPSS: exemple…

Tahiry RAZAFINDRALAMBO – DEA DISIC DPSS: description - Collection de serveur de disque (en parallèle et sur un réseau haut débit) - Une interface application supportant des sémantique I/O - DPSS autorise une reconfiguration dynamique: lajout et/ou le retrait de disque à la volée - Un serveur DPSS est une station UNIX, avec 6 disques SCSI, et une interface réseau haut débit capable de fournir de 60 à 120 Mbits/sec

Tahiry RAZAFINDRALAMBO – DEA DISIC Optimisation, adaptation « network-aware» Monitoring system: JAMM (java agents monitoring and managment) - Collecter les informations du réseau - Publier ces informations dans une base LDAP - Lancer JAMM sur tous les clients et les serveurs

Tahiry RAZAFINDRALAMBO – DEA DISIC Optimisation, adaptation « network-aware» (2) Optimisation du buffer TCP: - DPSS utilise TCP - La congestion dans un réseau utilisant TCP est dû à la taille de la fenêtre TCP - La fenêtre TCP (émission) dépend du buffer TCP (en réception) - La taille du buffer est fonction du produit délai bande passante (sur le réseau)

Tahiry RAZAFINDRALAMBO – DEA DISIC Optimisation, adaptation « network-aware» (3) Optimisation du buffer TCP: - Il est difficile de déterminer les paramètres de TCP qui soit optimal pour chacune des connexions (client - serveur) - La librairie cliente DPSS, mesure le produit délai bande passante vers tous les serveurs DPSS, et calcul la taille optimal du buffer TCP.

Tahiry RAZAFINDRALAMBO – DEA DISIC Optimisation, adaptation « network-aware» (4) Load balancing: - Le DPSS peut effectuer un load balancing si les données sont répliquées sur plusieurs serveurs - Le DPSS effectue la répartition des requêtes de données clientes suivant lalgorithme de flots de coût minimum

Le DPSS utilise dans sa version précédente ma méthode « greedy master» Tahiry RAZAFINDRALAMBO – DEA DISIC Optimisation, adaptation « network-aware» (5) Load balancing: Le DPSS maître choisi le serveur avec la plus grande bande passante vers le client pour 75% des cas pour le reste il choisit les serveurs de manière aléatoire.

Tahiry RAZAFINDRALAMBO – DEA DISIC Optimisation, adaptation « network-aware» (6) Load balancing: Lalgorithme de flots à coût minimum consiste à attribué un coût basé sur la latence réseau par bloc de données et par lien. Lalgorithme est lancé à chaque fois quun client envoie une requête (lalgo prend environ 1ms) et choisi le serveur avec la plus petite latence donc le plus petit coût pour maximiser le rendement

Tahiry RAZAFINDRALAMBO – DEA DISIC Résultats (1) TCP buffer tuning

Tahiry RAZAFINDRALAMBO – DEA DISIC Résultats (2) Load Balancing

Tahiry RAZAFINDRALAMBO – DEA DISIC Résultats (3) Load Balancing: comparaison entre les 2 algo pour le load balancing sur 3 clients.

Tahiry RAZAFINDRALAMBO – DEA DISIC Résultats (4) Load Balancing:comparaison entre les 2 algo pour le load balancing sur 1 et 3 clients.

Tahiry RAZAFINDRALAMBO – DEA DISIC Conclusions (1) - le load balancing (avec lalgorithme de flots a coût minimum) et la réplication de données augmente les performances du système - Le fait que le système prenne en compte létat du réseau augmente aussi les performance du système - La réplication permet une meilleure tolérance aux fautes

Tahiry RAZAFINDRALAMBO – DEA DISIC Conclusions (2) - dommage quaucun test nest était fait pour définir le coût de la réplication - Il ny a pas de système de sécurité mis en place dans DPSS - Aucune comparaison na été faite au niveau performance avec les autres systèmes de stockage distribué…

Tahiry RAZAFINDRALAMBO – DEA DISIC Conclusions (3) - Larticle ne donne pas assez de détails sur le DPSS lui même (dommage par rapport au titre…) - dautres articles montrent des exemples dutilisation de DPSS avec dautre optimisation Le projet DPSS nest plus dactualité…

Tahiry RAZAFINDRALAMBO – DEA DISIC Merci… Des questions?