Adapting to changing resource performance in grid query processing Anastasios Gounaris Jim Smith Norman W. Paton Paul Watson Rizos Sakellariou University.

Slides:



Advertisements
Présentations similaires
Placement de Motifs Architecture Application Contraintes: - Charge
Advertisements

GROUPES D'INNOVATION.
Gestion de portefeuille
Gestion de portefeuille
Séminaire sur les Politiques pharmaceutiques à lattention des Experts francophones, Genève, juin 2011 | Séminaire sur les Politiques pharmaceutiques.
MODIFICATION DES CODES DETERMINES PAR DES TABLE - PROCEDURES 6 septembre 2007 (Joël Martellet, WMO, World Weather Watch, Data Processing and Forecasting.
Using Semantic Caching to Manage Location Dependent Data in Mobile Computing (2000) Qun Ren, Margaret H. Dunham Southern Methodist University Dallas, Texas.
A NETWORK-AWARE DISTRIBUTED STORAGE CACHE FOR DATA INTENSIVE ENVIRONMENTS Brian L. TIERNEY, Jason LEE, Brian CROWLEY, Mason HOLDING Computing Sciences.
Accélération du Rendu Volumique basée sur la Quantification des Voxels
Recherche de motifs par méthodes exploratoires: Comparaisons de performances et statistiques sur le score.
Test de Systèmes Intégrés Digitaux et Mixtes
Introduction Pour concrétiser l’enseignement assisté par ordinateur
RISCD Vue densemble des principaux changements Alain GAUGRIS Division de statistique des Nations unies Atelier régional pour les pays africains.
DIFFUSION DES DONNEES SOCIO-DEMOGRAPHIQUES AU BURUNDI
Nicolas Galliot M2SIR David Raspilaire
Découverte automatique de mappings fondée sur les requêtes dans un environnement P2P Présenté Par: Lyes LIMAM Encadré Par: Mohand-Said Hacid.
Module 6 : Gestion et analyse du système DNS
A abstraction b assembleur c nombre binaire d bit e cache f UC g puce h compilateur i famille dordinateurs j contrôle k chemin de données l défaut m dé
Exercice Notre programme s'exécute en 10 secondes sur A, qui dispose d'une horloge à 100Mhz. Nous tentons d'aider un concepteur à construire une machine.
Dr DEVILLE Emmanuelle J D V 12/07/2006
1 Efficient Data and Program Integration Using Binding Patterns Ioana Manolescu, Luc Bouganim, Francoise Fabret, Eric Simon INRIA.
INTRODUCTION.
CALCUL PARALLELE PRODUIT : MATRICE – VECTEUR 10 pages Exposé par :
Sélection automatique d’index et de vues matérialisées
Système de stockage réseaux NAS - SAN
Pourquoi et comment développer la relation client ?
Module 1 : Préparation de l'administration d'un serveur
Support d'adaptation dynamique pour le modèle de composants PauWare
ADR Active and Dynamic Routing. Plan Introduction au routage Les réseaux actifs Les agents Mise à jour des matrices de routage Architecture du routage.
Réalisée par :Samira RAHALI
1 Bases de Données Distribuées Chapitre 22, Sections 22.6–22.14.
Le Travail Collaboratif ...
Exemple de séquence n°2 en 1ère Sciences de l’ingénieur
Stratégies et politiques financières I Présentation du chapitre 4 de Quest for Value «The EVA Financial Management System» Yaya Bamba Rami eL Mais Julian.
Universté de la Manouba
Module 2 : Préparation de l'analyse des performances du serveur
Module 5 : Publication de ressources dans Active Directory
PROGRAMMATION INFORMATIQUE DINGÉNIERIE II PRO-1024.
Détection du meilleur format de compression pour une matrice creuse dans un environnement parallèle hétérogène Olfa HAMDI-LARBI.
La performance de M&A n’est-elle que marketing ?
L’APPLICATION DE P2P DANS UN RESEAUADHOC
IntroductionContexteAnalyseConclusionApproche Présentation d’article 04/02/04 DEA DISIC Grid Computing Monitoring Data Archive In Grid Environments GANAME.
GDS – Paris, 13 Octobre 2006 Un outil de monitoring pour le déploiement dynamique de JuxMem Loïc Cudennec IRISA / INRIA, PARIS project-team Stage de M2RI.
1 Architecture orientée service SOA Architecture orientée service SOA (Service Oriented Architecture)
Monitoring the Dynamic Web to respond to Continuous Queries Le titre en français : Surveillance de l'enchaînement dynamique pour répondre aux questions.
Module 8 : Surveillance des performances de SQL Server
JDBC L'API JDBC est utilisée pour utilisée pour intéragir avec une base de données.
Optimisation de requêtes
1 Registration Physique Séminaire du Master Davide Bazzi Université de Fribourg
Séance 8 30 novembre 2005 N. Yamaguchi
Test et Testabilité des Circuits Intégrés Digitaux
Master 1 ère année Sécurité des Systèmes Informatique 1 Gestion de modules  Un module est un morceau de code qui peut être chargé à la volée dans le noyau.
Structure de Base d’un ordinateur Matière : Informatique
1 G. Gardarin Optimisation de Requêtes  1. Introduction  2. Arbres relationnels  3. Restructuration algébrique  4. Modèle de coût  5. Choix du meilleur.
Windows 2003 Server Modification du mode de domaine
Infrastructure haute disponibilité pour services informatiques JI2014
Gouvernance et démarche de qualité Crée par : Encadré par :
INF3500 : Conception et implémentation de systèmes numériques Pierre Langlois Performance de circuits.
Structures de données avancées : LH (Hachage linéaire) D. E ZEGOUR Institut National d ’Informatique.
Introduction aux solutions Microsoft pour le HPC.
Cours MIAGE « Architectures Orientées Services »Henry Boccon-GibodCours MIAGE « Architectures Orientées Services »Henry Boccon-Gibod 1 Architectures Orientées.
Notifications et Communication réseau D. BELLEBIA – 18/12/2007NSY208 CNAM.
Initiation au web dynamique Licence Professionnelle.
PaCO++ André Ribes Réunion Hydrogrid Rennes 15/09/03.
Étude de systèmes de fichiers distribués Théorie et pratique Cyril Séguin Directeurs de thèse Gaël Le Mahec Alain Cournier Benjamin Depardon c.
University of Ottawa - Bio 4118 – Applied Biostatistics © Antoine Morin and Scott Findlay 13/08/2015 6:59 PM Bootstrap et permutations.
Gestion des documents internes avec SQL Server 2005 Date de publication : janvier 2006.
Raison d'être de la structure de fichiers : Les premiers travaux : Début des années 1960 : En 1963 : Près de 10 ans plus tard... (à peu près 1973) : Durant.
Chapitre 12 Surveillance des ressources et des performances Module S41.
CONTRÔLE QUALITÉ DES RÉACTIFS Tidiane DIALLO, PharmD, PhD Maître Assistant en Toxicologie, FAPH/LNS Pr Benoît Yaranga KOUMARÉ Maître de Conférences en.
Transcription de la présentation:

Adapting to changing resource performance in grid query processing Anastasios Gounaris Jim Smith Norman W. Paton Paul Watson Rizos Sakellariou University of Newcastle Alvaro A.A. Fernandes upon Tyne University of Manchester Publié le septembre 2005 présenté par : Michel EL RAHI

Plan Introduction Définitions Problème Approche Evaluation Conclusion & critiques 2

Introduction Le traitement de requête de grille est particulièrement approprié où il y a un besoin d'intégrer et analyser l'information de différentes sources pendant des périodes spécifiques. les ressources de grille, aussi bien qu'être hétérogènes, peuvent également montrer le comportement imprévisible et volatil. Indisponibilité des statistiques précises sur le temps de compilation et les conditions d'exécution d'évolution. 3 DefinitionsProblèmeApprocheEvaluationConclusion et critiquesIntroduction

Definitions OGSA-DQP (Grid Query Evaluator Service): 1.Un processeur de requête distribué exposé aux utilisateurs. 2.Maintient la compilation et l’évaluation des requêtes. 3.Soutient l'accès aux services multiples de grille. Grid Data Service Factory (GDSF): 1.Représente les ressources de données. 2. Expose les capacités et les metadonnées. DefinitionsProblèmeApprocheEvaluationConclusion et critiques 4 Introduction

Definitions Grid Data Service (GDS): 1.Créer par GDSF. 2.Utiliser pour l’accès aux ressources de données. GDQS (Grid Distributed Query Service): 1.Accepte des requêtes d'utilisateur. Il lance la compilation et l'optimisation des requêtes pour rapporter des plans d'exécution. GQES (Grid Query Evaluator Service): 1.Un moteur d'évaluation qui est capable de courir un sous plan d'un plan distribué de requête produit par un GDQS. 2.L'exécution distribuée de requête est donc effectuée par un ensemble de GQES qui communiquent en échangeant des tuples. 5 DefinitionsProblèmeApprocheEvaluationConclusion et critiquesIntroduction

Definitions Exécution d’une requête: 6 DefinitionsProblèmeApprocheEvaluationConclusion et critiquesIntroduction

Problème Grille. Ralentissement dans une machine ! Diminution de la performance du système entier.!!! Solution aborder par le système… 7 DefinitionsProblèmeApprocheEvaluationConclusion et critiquesIntroduction

Approche Une architecture pour le traitement adaptatif de requête qui est caractérisé par les dispositifs suivants: non centralisé, orienté service, et ses composants communiquent d’une manière asynchrone. L'AGQES (Adaptive Grid Query Evaluator Service) est configuré de la façon suivante: Le MonitoringEventDetector est en activité dans chaque emplacement évaluant un fragment de requête. Il doit également y avoir un Diagnoser activé et un répondeur. Supposant un sous plan P est divisé à travers n machines, et que P i, i = 1... n, est le fragment sous plan envoyé à l’i eme AGQES. C(P i ) = coût par tuple pour chaque sous plan. 8 DefinitionsProblèmeApprocheEvaluationConclusion et critiquesIntroduction

AGQES (Adaptive Grid Query Evaluator Service) MonitoringEventDetector Diagnoser Responder (répondeur) Query Engine MonitoringEventDetector Diagnoser Responder (répondeur) Query Engine Submit plan fragment subscribe raw monitoring events Adpt execution Send notificationsubscribe Send notification AGQES 9 DefinitionsProblèmeApprocheEvaluationConclusion et critiquesIntroduction

AGQES (Adaptive Grid Query Evaluator Service) Surveillance (monitoring): oLe moteur de requête produit des notifications des deux types suivants: 1.M1, qui contient des informations sur le coût de traitement d'un tuple. 2.M2, qui contient des informations sur le coût de communication d'un buffer sortant des tuples. oCes notifications de bas niveau sont envoyés au MonitoringEventDetector, qui: 1.Groupe les notifications de deux types M1 et M2. 2.Calcule la moyenne du coût de fonctionnement. 3.Produit une notification à envoyer à Diagnoser si la valeur moyenne change par rapport à un seuil. 10 DefinitionsProblèmeApprocheEvaluationConclusion et critiquesIntroduction

AGQES (Adaptive Grid Query Evaluator Service) Surveillance (monitoring):  Un exemple des paramètres pris en défaut: 1.La fréquence de surveillance pour le moteur de requête est un notification pour chaque 10 tuples produits (pour M1) et un notification pour chaque buffer envoyé (pour M2). 2.Le seuil pour produire des notifications pour le Diagnosers est placé à 20%. 11 DefinitionsProblèmeApprocheEvaluationConclusion et critiquesIntroduction

AGQES (Adaptive Grid Query Evaluator Service) Évaluation: oL'évaluation est effectuée par le Diagnoser. Il recueille l'information produite par MonitoringEventDetectors pour établir s'il y a un déséquilibre de charge de travail. oLe Diagnoser se rend compte de la politique de distribution courante de tuple, qui est représentée comme vecteur W = (w 1, w 2... w n ), où le w i représente la proportion de tuples qui est envoyée à p i. oW'= (w' 1, w' w' n ) = vecteur équilibré calculé par le diagnoser. oLe coût par tuple c(p i ) pour un sous plan peut être calculé de deux manières: 1.A1, qui tient compte seulement des notifications du type M1. 2.A2, qui tient compte en plus des notifications du type M2. 12 DefinitionsProblèmeApprocheEvaluationConclusion et critiquesIntroduction

AGQES (Adaptive Grid Query Evaluator Service) Réponse: oLe répondeur reçoit des notifications au sujet de déséquilibre du Diagnoser sous forme de vecteurs augmentés proposés W' de distribution de charge de travail. oLa distribution de données peut changer de deux manières: 1.R1, où les tuples dans les recovery logs sont redistribués selon la nouvelle politique de distribution de données. Nous appelons cette redistribution rétrospective. 2.R2, où les tuples dans les buffers et les recovery logs ne sont pas affectés. Nous appelons cette redistribution prospective. 13 DefinitionsProblèmeApprocheEvaluationConclusion et critiquesIntroduction

Évaluation Q1: select EntropyAnalyser(p.sequence) from protein sequences p; Q2: select i.ORF2 from protein sequences p, protein interactions i where i.ORF1=p.ORF ; Trois machines RedHat Linux 9 connectées par un réseau de 100 mb/s sont utilisées pour l’évaluation. 14 DefinitionsProblèmeApprocheEvaluationConclusion et critiquesIntroduction

Évaluation 1.Augmentation de 45% quand l'adaptation est permise par opposition à 253% quand elle n’est pas permise. 2.Une augmentation de 57% quand l'adaptation est permise. 3.Dans le cas du déséquilibre et de l’adaptation, le système fait courir 1,31 fois plus lent au lieu de 1,71. Query- Response No ad / no imb Ad / no imb No ad / imb Ad / imb Q1 – R Q1 – R Q2 – R le coût d’appel d’un WS dans une machine est 10 fois plus que dans l'autre 15 DefinitionsProblèmeApprocheEvaluationConclusion et critiquesIntroduction

Évaluation (a) Performance de Q1 pour l’adaptation prospective R2; (b) Performance de Q1 pour différentes politiques de l’adaptation. 16 DefinitionsProblèmeApprocheEvaluationConclusion et critiquesIntroduction

Évaluation (a) Performance de Q2 pour l’adaptation rétrospective; (b) Performance de Q1 pour l’adaptation prospective et pour une donnée de taille double. 17 DefinitionsProblèmeApprocheEvaluationConclusion et critiquesIntroduction

Évaluation Performance de Q1 pour l’adaptation rétrospective. 18 DefinitionsProblèmeApprocheEvaluationConclusion et critiquesIntroduction

Conclusion et critiques Conclusion 1.Cette proposition est une bonne solution sur le problème de charge de travail dynamique. 2.Particulièrement l’implémentation pour cette proposition est sur les environnements comme la grille. Critiques 1.Manque de la structuration. 2.Utilise seulement trois machines semblables pour l'évaluation.!!!!!! 3.Plusieurs idées sont répétées plusieurs fois. 4.Pas de comparaison avec les anciennes approches sur ce sujet. 19 DefinitionsProblèmeApprocheEvaluationConclusion et critiquesIntroduction

Merci pour votre attention !