CEDCOM architecture haute performance pour des applications “big data” Tanguy Raynaud Projet CEDAR.

Slides:



Advertisements
Présentations similaires
Active Directory Windows 2003 Server
Advertisements

Stockage et sauvegarde
ACTIVE DIRECTORY. Qu'est-ce un service d'annuaire ?: Un service d'annuaire peut être comparé à un agenda téléphonique, celui- ci contient au départ des.
Module 5 : Implémentation de l'impression
Comment Protéger les bases SQL avec System Center Data Protection Manager 2007.
Montée en charge avec SQL Server 2005: bonnes pratiques & performances
Le serveur NAS Network Attached Storage, (NAS) désigne un périphérique de stockage relié à un réseau dont la principale fonction est le stockage de données.
Serveur NAS storex.
Applications et Techniques
26/03/2017 Fonctionnement d ’un cluster sous AIX grâce à HACMP : High Availability Cluster Multi-Processing Raphaël Bosc, IR5.
Exposé Système Netware 5 11 /10/ 2001 Aurélie Démolis
Stockage dans DIET Groupe de travail du 16 décembre 2002.
Le File Transfer Protocol
Configuration de Windows Server 2008 Active Directory
Système de stockage réseaux NAS - SAN
Active Directory Windows 2003 Server
Module 1 : Préparation de l'administration d'un serveur
Gestion des Périphériques
Module 16 : Implémentation de serveurs Windows 2000
Serveurs Partagés Oracle
…. Service 1Service 2Service NService 3 …… North Central USA South Central USA Irlande Pays-Bas Hong Kong Singapour Contrat de service entreprise,
Ecole Supérieure Privée de ingénierie et de technologie année universitaire :2013/2014 Cross-Plateform Cours JavaScript.
Configuration de Windows Server 2008 Active Directory
Cloud Computing et mesures de performances
ASP.NET Par: Hugo St-Louis. C ARACTÉRISTIQUES A SP. NET Évolution, successeur plus flexible quASP (Active Server Pages). Pages web dynamiques permettant.
Un nouveau monde d’échange sur Internet ????
Module 4 : Création et gestion de comptes d'utilisateur
Création et gestion de comptes d'utilisateur
Les fichiers indexés (Les B-arbres)
Framework Play 2.0 Démonstration du proof of concept
Concurrent Versatile Versions
802.1x Audric PODMILSAK 13 janvier 2009.
Création de bases de données
Module 3 : Création d'un domaine Windows 2000
Module 7 : Accès aux ressources disque
Par Bernard Maudhuit. On peut tout sauvegarder et on doit tout sauvegarder sur des éléments physiques externes à lordinateur CD SVCD DVD et double couche.
Le moteur SQL Server 2008 R2 par l'exemple (DAT304)
Module 1 : Installation de Microsoft Windows XP Professionnel
OPTIMISATION DE BASE DE DONNEES ORACLE
Support des services et des serveurs Serveur DHCP.
De A à Z Fabrice Meillon & Stanislas Quastana, CISSP
Active Directory Windows 2003 Server
Partage de mémoire à très grande échelle sur des réseaux pair-à-pair
Outil de gestion des cartes grises
Nouvelles technologies de système de fichiers dans Microsoft Windows 2000 Salim Shaker Ingénieur de support technique Support technique serveur Microsoft.
Module 8 : Surveillance des performances de SQL Server
Réseaux Mesh (Maillés) sans fil « WMNS »
PLAN ● L'instance ● Optimisations – Gestion de l'espace – La gestion des quotas – Les requêtes gourmandes – Les goulots d'étranglement ● Administration.
Les Composants de l’architecture Oracle
Architecture Logicielle Les blocs d’applications
Plan Définitions et exemples Composants de cluster
Page 1 Restauration des données simplifiée MODE BLOC DEDUPLICATION SAN Sauvegarde Haute Performance pour les environnements les plus exigeants.
GESTION DES UTILISATEURS ET DES GROUPES
Mise en place d’un Intranet
Gérer l'instance Oracle
D. E ZEGOUR Institut National d ’Informatique
Architecture d’une application WEB Statique:
Module 3 : Création d'un domaine Windows 2000
1 Premières études sur la gestion de la volatilité dans Pastis Fabio Picconi Réunion GDS – 19/11/2004.
PHP 6° PARTIE : LES SESSIONS 1.Introduction 2.Identificateur de session 3.Variables de session 4.Client / Serveur 5.Principe 6.Ouverture de session 7.Enregistrement.
Gestion Parc Informatique Client UNIX Rémy Chaumard – BTSIRIS2 – projet GPI client UNIX – revue n1.
COMPARAISON ENTRE GNUTELLA ET FREENET
Citrix ® Presentation Server 4.0 : Administration Module 5 : Gestion des paramètres de serveur et de batterie de serveurs.
Outil de Supervision Réseau
Module 2 : Planification de l'installation de SQL Server
Étude de systèmes de fichiers distribués Théorie et pratique Cyril Séguin Directeurs de thèse Gaël Le Mahec Alain Cournier Benjamin Depardon c.
INTRODUCTION EMC Avamar : Sauvegarde et restauration rapides et efficaces grâce à une solution logicielle et matérielle complète. Intégrant une technologie.
Gestion des documents internes avec SQL Server 2005 Date de publication : janvier 2006.
Vendre l’offre StorageWorks GV13 Identifier les opportunités.
Chapitre 10 Maintenance d'Active Directory
Transcription de la présentation:

CEDCOM architecture haute performance pour des applications “big data” Tanguy Raynaud Projet CEDAR

Sommaire Motivation L’architecture Cedcom Les protocoles de communication Conclusion et travail à venir Démonstration

Motivation Le temps d’accès aux données est particulièrment long si la donnée n’est pas présente dans le cache

CedCom : Vue d’ensemble CedCom est une architecture hybride entre COMA (Cache-Only memory architecture) et Hadoop Distributed File System (HDFS) COMA est une architecture qui transforme la mémoire vive locale en un cache dynamique nommé Attraction Memory. Hadoop Distributed File System (HDFS) à été conçu pour stocker de façon fiables des quantité de données extrêmes importantes. CedCom n’utilise pas de home node pour fonctionner

CedCom : Vue d’ensemble Objectif de Cedcom : une architecture Big Data performante et résistante aux fautes: Réduction du temps d’accès aux données du CPU Réduction du nombre de ‘Miss’ lors des recherches dans le cache Mise en place un système de réplication optimisé Mise en place un système de migration permettant de transférer des données entre les noeuds au besoin

Cedcom : L’architecture Figure: The architecture of CedCom

Cedcom : le Directory Node Figure: The architecture of a Directory Node

Cedcom : le Directory Node Le directory node est un serveur de métadonnées. Il permet aux nœuds d’obtenir des informations sur les données, les réplications et les nœuds. Le directory node contient un index sur les blocks de données, sur les nœuds, et un contrôleur. Node directory Associe Adresse IP / nœud Block directory Associe les fichiers avec les blocks de données Associe les blocks de données et les nœuds de stockage

Cedcom : le Directory Node Replication Directory Sauvegarde l’emplacement des réplications Ordonne de nouvelles réplications Ordonne une restauration des blocks perdus Le directory node enregistre les compute nodes Il assiste les compute nodes lors des migrations

Cedcom : les Compute Nodes Figure: The architecture of a Compute Node

Cedcom : les Compute Nodes Les composants des Compute Nodes: Attraction Memory Stocke les données dans un Cache Associatif Utilise des clés de Hachage pour trouver ou ajouter des données Transit Area Contient les données en attente de migration Utilise le principe d’un cache LRU B33 Set = 33%4 = 1 Add a block B22 Set = 22%4 = 2 Find a block

Cedcom : les Compute Nodes Local Storage Espace de stockage sur le disque dur, utilisé uniquement en cas de débordement de la mémoire vive Replication Storage Stockage des réplications sur le disque dur Local Directory Un index local utilisé pour accélérer la recherche des blocks Node Controller Supervise les opérations effectuées par les nœuds.

Communication establishment protocol Heartbeat protocol Compute Node Directory Node 1. Conn_Open() 2. Req_Register () 3. Res_Confirmation() Stop/Save_node() Compute Node Directory Node 1. Conn_Open() 3. Confirm_Reg_HBeat() 4. Init_CPort() Stop/Save_node() 2. Req_Reg_HBeat() 5. Send_HBeat() Les protocoles de communication

Block Creation Protocol Client 1. Request meta-data 4. Transfer data 2. Response With meta-data 4. Transfer data Directory Node Compute Node Compute Node 3. Create_blck() Les protocoles de communication

1.Req_blocation() 2.Read_Directory() 3.Res_blocation() 4.Conn_Open()5.Session_Start() 6.Read_AMDir() Session 7.Transfer()8.Session_Close() 9.Connection_Close() 10.Write_Update() 11.delete_blck() Directory node Compute Node 2 Compute Node 1 Block Migration Protocol Les protocoles de communication

Block 9 Block 6 Block 5 Attraction Memory Node 2 Block 7 Block 1 Block 4 Block 3 Block 2 Directory Node 1. Req_rep() 2. Res_rep() 3. Conn_req() 4. session_start() Block 1 Block 2 Block 3 Attraction Memory Node 1 Block 4 6. session_close() 7. connection_close() 5. Transfer_blck) Transfer_blckI() Les protocoles de communication

Conclusion CedCom combine les points forts de HDFS et COMA Les points forts de cette architecture: Optimisation du temps d’accès aux données, Un accès au cache efficace, Dispose d’un système de migration efficace, L’architecture est résistante aux pannes Les interactions avec le disque dur sont considérablement réduites La priorité de Cedcom est de maximiser les performances Cedcom peut être déployé indépendamment du système d’exploitation La configuration utilisateur est simplifiée.

Conclusion Optimisation du système de gestion de fichier de Cedcom Définition de cas d’utilisation, et mise en place d’expérimentation à grande échelle Fiabilité et efficacité avec des jeux de données importants Mesure de l’efficacité de la migration de données Comparaison des performances de Cedcom avec les architecture existantes dans des scénarios similaires

Démonstration