Quelle(s) application(s) pour GDS ? Eddy Caron LIP ENS Lyon Join work with A. Vernois and J.-Y. L’Excellent LIP, Lyon V. Garonne CPPM/IN2P3, Marseille.

Slides:



Advertisements
Présentations similaires
Primary French Presentation 2 Saying How You Are.
Advertisements

Comment Protéger les bases SQL avec System Center Data Protection Manager 2007.
Status report SOLEIL April 2008
WP9 – Earth Observation Applications – n° 1 Rapport du WP9 ESA, KNMI, IPSL Présenté by L. Peltier, IPSL.
LCG DATAGRID - France 8 Juillet 2002 LCG : LHC Grid computing - qui, quoi, quand, comment ? Quoi ? But : préparer l'infrastructure informatique des 4 expériences.
Intégration du système de production LHCb sur la DataGRID V. Garonne, CPPM, Marseille Réunion DataGRID France, 13 fv fév
SKHS Curriculum 2008 Essential skills: Skimming, scanning and reading detail.
Échantillonnage de l'eau et des facteurs connexes pour mesurer les caractéristiques physiques, chimiques et microbiologiques de l'eau de surface et des.
Laboratoire de Bioinformatique des Génomes et des Réseaux Université Libre de Bruxelles, Belgique Introduction Statistics.
ATLAS Data Challenges. Les Data Challenges (DC) en français Challenges des Données ont pour but de Valider: –le modèle dorganisation et dutilisation des.
1 Grille de calcul et physique des particules Vincent Garonne CPPM, Marseille Novembre 2003 Contenu de la présentation Etat de lart : Grille de calcul.
Information Theory and Radar Waveform Design Mark R. bell September 1993 Sofia FENNI.
© Copyright Showeet.com S OCIAL M EDIA T HINKING.
Notes for teachers: Olympics 2012 Project – parts of body Instructions for using these slides & attaching soundfiles if desired are in the notes pages.
Laboratoire des outils informatiques pour la conception et la production en mécanique (LICP) ÉCOLE POLYTECHNIQUE FÉDÉRALE DE LAUSANNE 1 Petri nets for.
EGEE is a project funded by the European Union under contract IST Noeud de Grille au CPPM.
QUI et QUE (QU’). Un pronom relatif allows us to __________ deux phrases ensemble quand il y a de la _________________________________ in ______________SENTENCES.
Algorithmes pour le web “A Unified Approach to Personalization Based on Probabilistic Latent Semantic Models of Web Usage and Content”
Le Comparatif et le Superlatif
Calcul CMS: bilan CCRC08 C. Charlot / LLR LCGFR, 3 mars 2008.
Calcul CMS: bilan 2008 C. Charlot / LLR LCG-DIR mars 2009.
2-mars-2009Eric Lançon1 Nouvelles d’ATLAS Reunion LCG 2 mars 2009 Lyon.
CMS ATLAS LHCb CERN Tier 0 Centre at CERN National Centres Lab a Russia Lab c Uni n Lab b Manno Canada Uni y Uni x Tier3 physics department  Ge  Germany.
Research interests Viviane Gascon Vietnam Nurse scheduling Viviane Gascon and Éric Gagné.
Gestion de données : Besoins de la VO Biomed Sorina Pop Laboratoire Creatis Université de Lyon, CREATIS; CNRS UMR5220; Inserm U1044; INSA-Lyon; Université.
Objectif: Comment employer un exposant?. Objective: How to use an exponent?
THE ADJECTIVES: BEAU, NOUVEAU AND VIEUX 1.
BENCHMARK JOBS Marie-Laure Rivier – January 2015.
Cultural Comparison 1 minute for directions (in English and French, spoken consecutively): You will make an oral presentation to your class on a specific.
Tier1 at the CC-IN2P3 March Current state at the CC-IN2P3 storage, computation, network...
Déploiement LCG-2 Etat actuel au CC-IN2P3 Fabio Hernandez Centre de Calcul de l’IN2P3 Lyon, 22 juillet 2004.
Greetings, formal and informal
WALT: how to talk about your timetable
ECASA.org.uk Ecosystem approach for a sustainable aquaculture STREP (FP6, Priority 8)
Pile-Face 1. Parlez en français! (Full sentences) 2. One person should not dominate the conversation 3. Speak the entire time The goal: Practice! Get better.
Lucia - LAPP Phi* meeting - 3 novembre Correcting back to the electrons after FSR So far C Z defined w.r.t. electrons before FSR Z status = 3 and.
Your team’s name. Préselection file You have just downloaded the preselection file: it’s the first step for you to win the challenge! In this file, you.
Synthèse de structure d'entreprise SAP Best Practices.
Groupe ALICE /Détecteur V0 (1)
Le 4-7 novembre. Qui est présent? Quelle heure est-il? La feuille pour étudier L’examen La Jéopardie!
GREDOR - GREDOR - Gestion des Réseaux Electriques de Distribution Ouverts aux Renouvelables How to plan grid investments smartly? Moulin de Beez, Namur.
Tache 1 Construction d’un simulateur. Objectifs Disposer d’un simulateur d’une population présentant un déséquilibre de liaison historique, afin d’évaluer.
CROSSMARC The Cross-lingual Multi Agent Retail Comparison Edinburgh, March 2001.
« © CEA [2006]. Tous droits réservés. Toute reproduction totale ou partielle sur quelque support que ce soit ou utilisation du contenu de ce document est.
Gestion des déplacements professionnels SAP Best Practices.
University of Ottawa - Bio 4118 – Applied Biostatistics © Antoine Morin and Scott Findlay 24/07/2015 2:29 PM Bootstrap et permutations.
Problématique « utilisation » Fonctionnalités Performance Consommation Fiabilité Prix du produit Sept ,000.
Benjamin Soulier Technical Expert Cambridge Technology Partners Les nouveautés de Windows Azure.
Aim To recap depuis + to say how long you have been doing something. J’ apprends le français depuis quatre ans. What does this sentence mean? Think of.
Unité 6 Leçon B. Forming yes/no questions  To form a yes/no question in French in the simplest way, add a question mark at the end of the sentence, and.
OAI-PMH & LOM OAI Repository interoperability using LOM metadata format Interopérabilité des bases de ressources utilisant OAI-PMH et LOM Steve Giraud.
10 février 2016 Informatique et Réseaux – Domaine de responsabilités.
Clique Percolation Method (CPM)
Negative sentences Questions
RozoFS KPI’s edition /04/2014. © Fizians Ce document ne peut être reproduit ou communiqué sans autorisation écrite. 2 RozoFS high level architecture.
O WHY IS IT IMPORTANT TO PLAN AHEAD FOR THE FUTURE?
Merci de remplir le formulaire et de le renvoyer à avant le 16 mai 2016 Please complete and send to
Projet LCG: Vue d’Ensemble Fabio Hernandez Responsable Technique LCG-France Centre de Calcul de l’IN2P3 Rencontre IN2P3/STIC Grenoble, 25.
UNITÉ II: LEÇON 6 PARTIE B: LES MOIS ET LA DATE. LES MOIS DE L’ANNÉE janvier January.
Grilles de recherche Veronique Donzeau-Gouge. 2 objectifs Renforcer la présence du CNRS dans ce domaine en liaison avec : L’Institut ST2I L’INRIA, Les.
Resource allocation: what can we learn from HPC? 20 janvier 2011 Vincent Breton Crédit: Catherine Le Louarn.
20-mars-2008Eric Lançon1 Activités ATLAS sur le nuage Français Emprunts a K. Bernardet, C. Biscarat, S. Jezequel, G. Rahal.
Page : 1 ObjectWeb 04/10/2004 Direction Générale du Système d ’Information Ce document est la propriété intellectuelle de DASSAULT AVIATION. Il ne peut.
WINS Windows Internet Name Service. What is WINS?  It does name resolution (?!) DNS resolves IP numbers and FQDN ARP resolves IP numbers and MAC addresses.
Making PowerPoint Slides Avoiding the Pitfalls of Bad Slides.
An Introduction To Two – Port Networks The University of Tennessee Electrical and Computer Engineering Knoxville, TN wlg.
IP Multicast Text available on
Quantum Computer A New Era of Future Computing Ahmed WAFDI ??????
Essai
M’SILA University Information Communication Sciences and technology
Transcription de la présentation:

Quelle(s) application(s) pour GDS ? Eddy Caron LIP ENS Lyon Join work with A. Vernois and J.-Y. L’Excellent LIP, Lyon V. Garonne CPPM/IN2P3, Marseille

Intro Gestion des données dans 3 applications susceptibles d’utiliser les résultats de GDS  Bioinformatique: GriPPS  Solveurs creux: TLSE  Physique des particules: LHCb

Bioinformatique GriPPS The Grid Protein Pattern Scanning

Application bioinformatique: Contexte des banques de données de référence  fichiers texte « à plat »  de qq Mos � plusieurs Gos  mise � jour : de quotidienne à mensuelle  nombre et volume augmentent rapidement Requêtes  en très grand nombre  indépendantes  impliquant 1 ou 2 banques  temps d'exécution linéaire

Analyse des logs A partir des logs de :  des requêtes plus fréquentes que d'autres  blast sur sp.fas : 77% des requêtes  globalement, l'utilisation reste la même On peut utiliser l'analyse des requêtes précédentes comme point de départ.

Quelques chiffres Source: Traces du serveur de l’IBCP Number of databanks m23 Number of algorithms p8 Number of couple algorithm databanks80 Number of requests88730 Size of smallest databanks1 MB Size of largest databanks12 GB

Solveurs Creux : Grid TLSE

Grid TLSE: expert site for sparse linear solvers Tests for Large Systems of Equations Coordinated by ENSEEIHT-IRIT, Toulouse Funded by ACI GRID Goal  Provide a friendly test environment for expert and non-expert users of sparse direct linear algebra software  Easy access to software and tools, a wide range of computer architectures, matrix collections  On a user’s specific problem, compare execution time / accuracy / memory usage /  of various sparse solvers  public domain  as well as commercial,  sequential  as well as parallel  Find best parameter values / reordering heuristics on a given problem

Request Examples Memory required to factor a matrix Error analysis as a function of the threshold pivoting value Minimum time on a given computer to factor a given unsymmetric matrix Which ordering heuristic is the best for solving a given problem

Why using a grid ? Sparse linear algebra software makes use of sophisticated algorithms for (pre/post)-processing the matrix Multiple parameters interfere for the efficient execution of sparse linear solvers  Ordering  Amount of memory  Architecture of the target computer  Available libraries  Determining the best combination of parameter values is multi-parametric problem  Combinatorial nature of these parameters The installation of any sparse solver library on a new architecture can be a nightmare ! Testing different architectures Always using the latest version of each library

Is it realistic ? Time to send the data can be more important than the computation itself ! But  Large number of independent requests  Time to answer is not critical  Data persistency between elementary requests easy to express Clear need for the users !  Managing software and hardware testing from a PSE

Architecture ClientExpert Expert Site Grid TLSE Websolve Weaver DIET Database Matrix Collections History Log Files Scenarios Services StaticDynamic Connection Synthetic Results Expertise Request Solver Runs Partial Results Requests Results Consult/Modify Stats Client Provided Matrix Consult Modify Writes scenarios, deploy new software Sends experiment requests

Data management in GRID TLSE Access to large collections of sparse matrices (URLs of files outside the DIET architecture)  Matrix files can be large (sometimes a few GBytes in worst cases).  Each server manages a cache mechanism.  Use DIET plug-in schedulers (or load function) to help choosing the platform, example: if matrix file is not in cache (on disk) then server_adequacy= «bad» (the request will first download the file) else server_adequacy = «good» (the file is already available) endif  Requires at least the matrix name to be passed to the SeDs before choosing.

Data management in GRID TLSE Management of temporary data could be done using persistency/replication mechanisms within DIET Example: the user asks for the impact of reordering on his matrix for different solvers and platforms  Some services (MUMPS, UMFPACK, …) first compute permutations files.  Permutation files are then applied to different solvers on different platforms to perform the actual computation.  Results of elementary requests are presented to the user through the web interface.  Permutation files must be cleaned when the user’s (meta) request has completed.

Physique des particules

Expérience LHCb Installée auprès du futur collisionneur proton-proton le Large Hadron Collider a Genève (CERN) avec trois autres expériences  Démarrage prévue en 2007 Étude précise de la violation de CP dans les systèmes de mésons beaux produits lors de collisions proton-proton 40x106 collisions par secondes Taux de données: 200 Ko/200Hz Chaque collision ou évènement est indépendant :  La taille d’un évènement varie selon la physique observée: LHCb (physique rare), 3 Mo

Caractéristiques Gros volumes de données à:  Analyser  Générer par simulation de Monte-Carlo  Stockage de l’ordre de 1.3 péta octets par an  Partager 500 utilisateurs répartis sur 20 sites dans le monde

LHCb: Types d’applications Production de données:  Produire un montant donné en une période fixée Analyse de données:  Extraire la physique des données  Appliquer un algorithme sur un ensemble de données

DIRAC: Caractéristiques des applications Production de données Traitement des données Analyse de données Application Multiparamétriques Pas de dépendances de données Production de données CPU Bound Gros grain Dépendances de données Production de résultats I/O Bound Petit grain Planifié Pour une expérience Puissance de calcul/période «High Troughput Computing» (HTC) Chaotique/aléatoire Pour un utilisateur Temps de réponses/Job « High Performance Computing »(HPC)

LHCb: Data Challenge 2004 Produire et analyser des données en vue de préparer la mise en service du LHC (2007) Avoir 10 % des données du système final:  50 To de données/trois mois~ jobs  20 sites ~2000 Worker Nodes  Grande hétérogénéité des ressources Analyser ces données  Appliquant au préalable une sélection des fichiers intéressant par l’intermédiaire d’un service de méta-data

*approximatif car en cours de redéfinition, au moins un facteur 2… Ordre de grandeur* Par simulation:  700 To par an,  ~ fichiers  Taille des fichiers: ~1 Go  Sécable par événement de 3 Mo Par acquisition du détecteur:  Équivalent Analyse:  De 1 à 100 fichiers  Fichiers pouvant être lus partiellement  Traités par événement  Dépendances aux données peuvent être indéterminées au départ de la tâche

Outils usuelles de gestion des données Mass storage, storage classique Primitives de transferts: BBFTP, grid-ftp, etc. File catalog: correspondance logical file name, physical file name Meta-data catalog: permets de sélectionner les data sets intéressant Pas encore d’outils standards:  Replica Manager  (local/global) File transfer service  Pending file transfer service  …

Références gag/LCG_GAG_Docs/HEPCAL-prime.doc gag/LCG_GAG_Docs/HEPCAL-prime.doc

Question et Conclusion Conclusion : Il reste une question Question : Quelle(s) application(s) cible(s) pour GDS ?