Stockage dans DIET Groupe de travail du 16 décembre 2002.

Slides:



Advertisements
Présentations similaires
Information publique: oser la mutualisation
Advertisements

Rick Claus Conseiller professionnel en TI Microsoft Canada Rodney Buike Conseillère professionnelle en TI Microsoft Canada
Module Systèmes d’exploitation
Revue rapide de tous les aspects du service. Tryble en trois points Tryble permet de "cloner" des contenus présents dans un PC … dans un service Internet.
Gabriel Antoniu IRISA / INRIA Rennes
Applications de GdX Coordinateur thématique : Christophe Cérin
A NETWORK-AWARE DISTRIBUTED STORAGE CACHE FOR DATA INTENSIVE ENVIRONMENTS Brian L. TIERNEY, Jason LEE, Brian CROWLEY, Mason HOLDING Computing Sciences.
Apec - Services Web - Novembre 2006
Introduction aux réseaux informatiques
1 Internet Act II Gilles Kahn Président Directeur Général, INRIA.
Le serveur NAS Network Attached Storage, (NAS) désigne un périphérique de stockage relié à un réseau dont la principale fonction est le stockage de données.
Les techniques Le marché Simon PomaratMickaël Curty.
Les jeux persistants massivement Multijoueurs : problèmes techniques Vincent Roudaut MASTER M2 ESTC/CAM
Vue d'ensemble Vue d'ensemble de la sécurité dans Windows Server 2003
Intégration du système de production LHCb sur la DataGRID V. Garonne, CPPM, Marseille Réunion DataGRID France, 13 fv fév
B. Del-FabbroCFSE05LIFC p.1 Data Tree Manager : Un service de gestion des données persistantes pour le calcul ASP sur la grille Bruno DEL-FABBRO LIFC Besançon,
Jean-François Deverge, Sébastien Monnet
Système de stockage réseaux NAS - SAN
FrontCall - 4C Les Centres de Contacts Virtuels
Retour sur l'allocation d'espace Exemple sur une table facture (sans les tables associées) N° fact, N° Client, N° Cde, date Cde, date fact, date réglement,
Etude des Technologies du Web services
Gestion des données persistantes (complément)
Sommaire Objectif de Peakup Principes de fonctionnement
Configuration de Windows Server 2008 Active Directory
ASP.NET Par: Hugo St-Louis. C ARACTÉRISTIQUES A SP. NET Évolution, successeur plus flexible quASP (Active Server Pages). Pages web dynamiques permettant.
Le Stockage Distribué Robin Favre Fabien Touvat
Performance Grands Clients
WINDOWS Les Versions Serveurs
Les nouveautés Windows Server 2012
Support des services et des serveurs
Module 8 : Maintenance des logiciels à l'aide des services SUS
Module 3 : Création d'un domaine Windows 2000
Architecture des systèmes pair-à-pair de gestion de données Gabriel Antoniu Projet PARIS IRISA/INRIA.
Réseau de stockage étendu
LEGO – Rennes, 18 Septembre 2006 Un outil de monitoring pour le déploiement dynamique de JuxMem Loïc Cudennec IRISA / INRIA, PARIS project-team Stage de.
Faculté des sciences économique et gestion de Nabeul
Solutions d'infrastructure, systèmes et réseaux
GDS – Paris, 13 Octobre 2006 Un outil de monitoring pour le déploiement dynamique de JuxMem Loïc Cudennec IRISA / INRIA, PARIS project-team Stage de M2RI.
Partage de mémoire à très grande échelle sur des réseaux pair-à-pair
1 Architecture orientée service SOA Architecture orientée service SOA (Service Oriented Architecture)
CEDCOM architecture haute performance pour des applications “big data” Tanguy Raynaud Projet CEDAR.
Stratégie d’entreprise - Alstom Transport – Marco Férrogalini
La réplication dans les réseaux mobiles ad hoc
Plan Définitions et exemples Composants de cluster
Performance Grands Clients
“Software defined Storage”
Le contenu est basé aux transparents du 7 ème édition de «Software Engineering» de Ian Sommerville«Software Engineering» de Ian Sommerville B.Shishedjiev.
D. E ZEGOUR Institut National d ’Informatique
Offre DataCenter & Virtualisation Laurent Bonnet, Architecte Systèmes Alain Le Hegarat, Responsable Marketing 24 Novembre 2009.
GDS : Grid Data Service Gabriel Antoniu IRISA / INRIA Rennes Réunion de lancement du projet GDS de l’ACI Masses de Données 22 septembre 2003.
Structure de stockage et relations
Big Data.
Module 3 : Création d'un domaine Windows 2000
1 Premières études sur la gestion de la volatilité dans Pastis Fabio Picconi Réunion GDS – 19/11/2004.
Réunion calcul simulations GIEC/IPCC - Prodiguer Lundi 23 Mars PRODIGUER un noeud français de distribution des données GIEC/IPCC Sébastien Denvil.
Projet intégration d’Unicamp sur réseau entreprise.
Un service de partage de données pour DIET : GDS basé sur JuxMem Mathieu Jan Projet PARIS Lyon, 5 décembre 2003.
1 Un protocole de cohérence des données tolérant aux fautes Jean-Francois Deverge Encadrants : Gabriel Antoniu, Luc Bougé Réunion GDS IRISA – Projet PARIS.
Projet GDS de l’ACI MD Projet PARIS IRISA, Rennes.
Lellouche Aaron ITIC Paris
Vendre l’offre StorageWorks GV13 Identifier les opportunités.
Localisation collaborative dans les réseaux de capteurs
1 G ÉNÉRALITÉS Notions et caractéristiques générales.
Cloud et Petites entreprises. Stockage de données.
1 Master Data Management au SANDRE. GPA 17/10/ Une philosophie de diffusion des référentiels 3 grands blocs dans les systèmes d’information environnementaux:
Chapitre 10 Maintenance d'Active Directory
1 Master Data Management au SANDRE. ADD 27/11/ Une philosophie de diffusion des référentiels 3 grands blocs dans les systèmes d’information environnementaux:
Présentation générale. Introduction Enregistreur vidéo numérique 4 canaux d’un excellent rapport qualité-prix Solution idéale pour les clients cherchant.
L’architecture du service Dirac Implementation au centre de calcul.
1 Interne Orange Accédez à votre système d'information depuis votre terminal mobile Nomalys.
Transcription de la présentation:

Stockage dans DIET Groupe de travail du 16 décembre 2002

Objectif Présenter quelques idées d'intégration du stockage dans DIET Soulever les problèmes qui vont se poser

Stockage dans DIET !? Pourquoi Faire ? Stocker/Archiver : – Datawarehouse virtuel : tolérence aux pannes, backup croisé – Accounting/Gestion des quotas Accélérer les traitements sur de grandes masses de données – Données accédées plusieurs fois (Read Multiple) – Données produites et réutilisées dans DIET (mailleur -> solveur)

OceanStore (Berkeley) Motivation : « outsourcing » du stockage Mise en commun de serveurs Accessible de n'importe où Fortement tolérant aux pannes (big one !) Sans coût de maintenance : automatique Réseau de serveurs : orienté entreprise & institution Serveurs + abonnement Permanence des connections (de haut débit)

OceanStore : Nommage et Localisation Fichier GUID SHA-1 Serveur NodeId GUID RootId Pointeurs répliqués Routage : Tapestry Dynamique Tolérant aux pannes

OceanStore : Les différents objets Active Data : Replica Tous les réplicas se signalent aux GUID Archive Data Fragmentées et dispersés Modifications des fichiers Conserve toute les versions (GUID spécifique) Le GUID référence la dernière version

Structure d'un fichier MAJ : Copy on Write Metadata Redo Logs Checkpoint Reference (GUID)..... Blocks Unit of Archival Storage Unit of Coding Fragments NOTE: Each Block needs a GUID Metadata Redo Logs Checkpoint Reference (Later Version)

OceanStore : Tolérance aux pannes Tapestry Données Fragmentation + redondance + dispersion Réparation automatique Disparition, noeuds malicieux Vérification de toutes les données à intervalle régulier

OceanStore sait faire aussi Introspection Surveillance de toutes les opérations Optimisation automatique (migration de données, génération de réplicas les plus demandés,...) Supporte le travail collaboratif Bayou system (cohérence) Généraux Byzantin

Y a qu'à prendre OceanStore ! Lourd, trop ambitieux – Travail collaboratif ? Découplé de DIET – Réseau parallèle : Tapestry – Aucune maitrise sur le placement – Schedulling ?!

Bonnes idées d'OceanStore Fragmentation + redondance – Tolérance aux pannes – Reconstruction rapide : accès parallèles – Recouvrement reconstruction/calcul (streaming) Réplicats de travail – Gestion LRU

Intégration dans DIET Placement des fragments – Minimiser les temps de communications pour la reconstruction Global, pour l'ensemble de la grille (IDMAPS) Selon le type de calcul qui seront effectués sur les données Placement des réplicats – À la demande – Persistance automatique Intégrer dans FAST le temps de construction du fichier

Ordonnancement et Placement Papier de K. Ranganathan and I. Foster – Simulation (ChicSim) de la combinaison de différentes stratégies de scheduling et de placement des réplicats – Jeux de simulation : exploitation de données HEP Utilisateurs uniformément distribués Tailles des fichiers uniformément distribuées (500Mo - 2Go) Chaque job traite un fichier de taille D : durée 300D (?) Fichier plus ou moins populaire : loi géométrique

Stratégies d'ordonnancement – JobRandom – JobLeastLoaded – JobDataPresent – JobLocal Stratégies de placement des réplicats – DataDoNothing – DataRandom – DataLeastLoaded Résultat : – Meilleurs stratégies : (DataRandom ou DataLeastLoaded) et JobDataPresent Bref, ca sert à rien de co-ordonnancer (?!)

Faut il tout faire ? IBP Internet Backplane Protocole Service de stockage temporaire : – Noeuds dépots – Service primitif : vision réseau Evolution : surcouche : – L-Bone : gestion des ressources (interopérable NWS) – ExNode : ~i-node Unix, gestion de la réplication (fragmentation ?), description XML Chargement parallèle

Travail à faire Validation IBP – Déployer IBP – Intégrer la fragmentation + redondance (Exnode) – Premières mesures de perf Intégration dans DIET – L-Bone -> NWS -> FAST – Scheduling – Meta-Data (répertoire globale au niveau de DIET)