EGEE is a project funded by the European Union under contract IST-2003-508833 Gestion des données David Bouvet CCIN2P3 Présentation faite à partir des.

Slides:



Advertisements
Présentations similaires
Module Systèmes d’exploitation
Advertisements

SRB (Storage Resource Broker)
1 Georgeta Bădău CRÉATION ET GESTION DUN BLOG AVEC LA PLATE-FORME LEWEBPEDAGOGIQUE.COM Séance no.4.
VOTable et lobservatoire virtuel solaire Marco Soldati Haute École Spécialisée de la Suisse de nord-ouest.
FORMATION OUTILS « FONCTIONS »
Le web classeur Guide à l'usage des élèves. un support de classement et de conservation de vos informations en matière dorientation un outil permettant.
Autorisations Utilisation eCATT
ESIEE Paris © Denis BUREAU I N Initiation à la programmation avec le langage Java.
User management pour les entreprises et les organisations Auteur / section: Gestion des accès.
Gestion de la communication par établissement sur le site ville
Initiation au système d’information et aux bases de données
Page 1 Introduction à ATEasy 3.0 Page 2 Quest ce quATEasy 3.0? n Ensemble de développement très simple demploi n Conçu pour développer des bancs de test.
Formation Centra - GDE.
1 Comment utiliser votre Extranet Se connecter 2.My Site 3.Documentation 3.1 Documents dintégration 3.2 Documents types 4.Vos informations privées.
Rédacteur 1. Sommaire Connexion Interface SPIP Menu SPIP Rédiger un article Interface de création dun article Fonctionnalités de base Statut de larticle.
Publispostage Menu Outils / Lettres et publipostage
Configuration de Windows Server 2008 Active Directory
UTILISATION DE LOGMEIN Prise de contrôle à distance
Indexation 1. Concepts de base 2. Arbre B 3. Indexes secondaires.
e-Marque Traitement des fichiers
Gestion denquêtes et suivi dindicateurs statistiques 1er degré © DOS3 – Pôle Analyse & Développement Octobre 2011 – v.0.1 Tutorial portail directeur décole.
Mon passeport pour l’orientation et la formation
Développer en C avec Eclipse Introduction Création d'un projet Ajout de fichiers Compilation Exécution Utiliser le débogueur Département dinformatique.
1 Grille de calcul et physique des particules Vincent Garonne CPPM, Marseille Novembre 2003 Contenu de la présentation Etat de lart : Grille de calcul.
Programmation concurrente
Module 5 : Publication de ressources dans Active Directory
Passeport Orientation
Tout savoir sur la synchronisation des mails, contacts et calendrier sur Windows Phone Lire cette présentation en mode plein écran.
Utilisation avancée de linux
‘‘Open Data base Connectivity‘‘
Module : Technologies des serveurs réseaux : FTP Dynamic Host Configuration Protocol Présenter par : Mounir GRARI.
Plateforme de Calcul pour les Sciences du Vivant Soumission de jobs sur grille.
Plateforme de Calcul pour les Sciences du Vivant Gestion de données sur EGEE.
Création et présentation d’un tableau avec Word 2007
Gérer la sécurité des mots de passe et les ressources
Gestion des fichiers et dossiers
KIWAPP IS A B2B FULL-STACK APP-MANAGEMENT TOOL KIWAPP EN QUELQUES ETAPES Octobre 2014.
PHP 5° PARTIE : LES COOKIES
Windows 7 et son explorateur
1 F o r m a t i o n A R S FTP anonyme, Archie 2 F o r m a t i o n A R S FTP ANONYMOUS m Premier service d'accès à des documents publics. m Repose très.
EGEE is a project funded by the European Union under contract IST Noeud de Grille au CPPM.
Utilisation avancée de linux Réseau Démarrage et arrêt.
Gestion des données sur la grille C. Charlot / LLR CNRS & IN2P3 For the European DataGrid Project Team
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks TP Data Management René Météry CS Tutorial.
HTML Création et mise en page de formulaire
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Data management David Bouvet IN2P3-CC Clermont.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Sécurité sur le GRID Ahmed Beriache (CGG)
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Sécurité sur le GRID Ahmed Beriache (CGG)
LE COURRIER ELECTRONIQUE
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Soumission de jobs David Bouvet IN2P3-CC.
Formation.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Quelques commandes de la grille David Bouvet.
Contribution. Accueil Vous êtes actuellement connecté à votre espace de contribution de la médiathèque de l'Université Paris Descartes. Dans cette espace.
StratusLab is co-funded by the European Community’s Seventh Framework Programme (Capacities) Grant Agreement INFSO-RI Session I : Installation et.
EGEE is a project funded by the European Union under contract IST Job Soumission Eric Fede CPPM Grid Tutorial, Novembre
EGEE is a project funded by the European Union under contract IST Job Soumission N.Lajili Seminaire Grille-21 Novembre
Catalogues de fichiers de données. David Bouvet2 Problématique Possibilité de répliquer les fichiers sur divers SE  nécessité d’un catalogue de fichiers.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Data Management René Météry CS Tutorial EGEE.
Edit Knoops CPPM 20/01/2009 Enabling Grids for E-sciencE Gestion des données Gestion des jobs Edith Knoops.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Soumission de jobs C. Loomis / M. Jouvin.
EGEE is a project funded by the European Union under contract INFSO-RI Copyright (c) Members of the EGEE Collaboration Infrastructure Overview.
INFSO-RI Enabling Grids for E-sciencE Gestion des Données David Bouvet CCIN2P /10/10.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Monitoring dans EGEE Frederic Schaer ( Judit.
INFSO-RI Enabling Grids for E-sciencE Data management Daniel Jouvenot IN2P3-LAL ORSAY - 02/02/2007.
INFSO-RI Enabling Grids for E-sciencE La gestion des données Daniel Jouvenot LAL-IN2P3-CNRS 18/06/2008.
C. Loomis (LAL-Orsay) Tutorial EGEE Utilisateur (LAL) 2 février 2007
Fonctionnement de la grille
David Bouvet, David Weissenbach Observatoire de Meudon, 01-02/02/2011
David Bouvet IN2P3-CC Annecy - 27/09/2007
Auteurs : David Bouvet, David Weissenbach
Transcription de la présentation:

EGEE is a project funded by the European Union under contract IST Gestion des données David Bouvet CCIN2P3 Présentation faite à partir des slides de Jeff Templon Introduction à EGEE, 22-23/03/2005 Clermont-Ferrand

Introduction à EGEE, 22-23/03/2005 – Clermont-Ferrand - 2 Table des matières Problématique Introduction aux outils de Data Management Divers scenarios de gestion des données sur grille RLS

Introduction à EGEE, 22-23/03/2005 – Clermont-Ferrand - 3 Problématique : Comment connecter Utilisateur Programmes Données ? Utilisateur connecté à une UI, ou connecté à sa machine de bureau Programmes sur sa machine sur lUI sur des machines de la grille… quelque part… Données Peut avoir besoin de fournir des données (grille ou non grille) aux programmes Programme peut générer des données, avoir besoin de les sauvegarder Comment récupère-t-on ces données ?

Introduction à EGEE, 22-23/03/2005 – Clermont-Ferrand - 4 Outils de gestion des données de grille Edg-replica-manager (RM) est le premier outil Replica Location Service (RLS) garde la trace de la localisation des diverses copies des fichiers grille Transert de données utilise surtout gsiftp Comme le bon vieux FTP, utilise lauthentification grille Pas de mot de passe ! Peut aussi utiliser des flots multiples pour un transfert plus rapide RM couvre linteraction entre gsiftp et le RLS pour faciliter linstanciation, lenregistrement et la réplication des données grille Resource Broker peut envoyer (un petit ensemble) de données aux/depuis les jobs peut utiliser le RLS pour trouver vos données et les envoyer à votre job, si vos données sont dans le RLS et que vous le spécifiez au RB

Introduction à EGEE, 22-23/03/2005 – Clermont-Ferrand - 5 Commandes de base du RM (I) Mettre des données sur la grille Mettre le fichier /home/myhome/toto (de lordinateur local) sur le storage element leSEchoisi01.in2p3.fr et lenregistrer avec le nom de fichier logique edgrm.test lcg-cr -d leSEchoisi.in2p3.fr -l lfn:edgrm.test \ --vo gilda file:/home/myhome/toto Storage Element Storage Element – machine accessible par la grille pour le stockage de données Logical File Name Logical File Name – nom de fichier symbolique avec lequel vous pouvez faire référence à un fichier grille sans préciser sa localisation actuelle La commande ci-dessus retourne le GUID : guid: b4c7-11d8-bb5e-eba42b5000d0 Les GUID sont permanents, les LFN non !

Introduction à EGEE, 22-23/03/2005 – Clermont-Ferrand - 6 Commandes de base du RM (II) Trouvez vos données : la méthode listReplicas (lr) lcg-lr --vo gilda lfn:edgrm.test # via LFN sfn://leSEchoisi.in2p3.fr/grid/gilda/tutorial/data/ge nerated/ /file7115df45-b4c7-11d8-bb5e- eba42b5000d0 lcg-lr --vo gilda \ # via GUID guid: b4c7-11d8-bb5e-eba42b5000d0 sfn://leSEchoisi.in2p3.fr/grid/gilda/tutorial/data/ge nerated/ /file7115df45-b4c7-11d8-bb5e- eba42b5000d0 replicas car quelquun (ou un programme) peut faire une copie sur un SE différent – les LFN et GUID font référence à toutes les copies

Introduction à EGEE, 22-23/03/2005 – Clermont-Ferrand - 7 Commandes de base du RM (III) Trouver linformation concernant le RLS ou le DMS (Data Management System) Comment connaît-on que leSEchoisi.in2p3.fr était un SE ? lcg-infosites –-vo atlas se *********************************************************** *** These are the related data for atlas: (in terms of SE) *********************************************************** *** Avail Space(Kb) Used Space(Kb) SEs clrlcgse01.in2p3.fr clrlcgse02.in2p3.fr Emplacements de toutes les ressources

Introduction à EGEE, 22-23/03/2005 – Clermont-Ferrand - 8 Fonctions standards de gestion des données grille Traiter les données générées par votre job Récupérer les données sur votre machine de bureau Mettre les données sur la grille Récupérer des données pour votre job Soumettre des données avec votre job Mettre vos données sur la grille (depuis lextérieur) Adresser vos données grille à votre job Déplacer des données sur la grille Comment trouver vos données si vous ne vous rappeler plus où vous les avez mises ?

Introduction à EGEE, 22-23/03/2005 – Clermont-Ferrand - 9 Grille Données sur votre machine de bureau Vous pouvez définir votre job pour récupérer les données Le job génère des données dans le répertoire de travail du WN A la fin du job, les données sont placées dans lespace de stockage temporaire du RB Vous les récupérez via edg-job-get-output Eléments clé : Vous devez connaître les noms des fichiers que vous souhaitez récupérer OutputSandbox = {higgs.root", graviton.HDF"}; OutputSandbox = {higgs.root", graviton.HDF"}; Méthode non destinée pour de gros fichiers (> centaine MB) espace de stockage temporaire limité sur le RB

Introduction à EGEE, 22-23/03/2005 – Clermont-Ferrand - 10 Programme grille données sur grille (I) Votre programme génère des données dans un fichier local Le programme doit connaître quel est le nom du fichier local Le programme utilise les commandes lcg-* pour : Mettre les données sur un SE de la grille Enregistrer les données comme un jeu de données grille Deux options utiles : Sur quel SE les données doivent-elles être sauvegardées (ou même dans quel répertoire de quel SE !) ? Par défaut: SE local Un nom de fichier logique. Par défaut: pas de LFN !

Introduction à EGEE, 22-23/03/2005 – Clermont-Ferrand - 11 Programme grille données sur grille (II) Rappels : Si vous voulez un SE spécifique, vous pouvez le trouver en utilisant la commande : lcg-infosites --vo Mettez un fichier dans le système de stockage de la grille (dans le RLS et sur un SE) en utilisant : lcg-cr --vo (cf. tranparent 5)

Introduction à EGEE, 22-23/03/2005 – Clermont-Ferrand - 12 Prog. grille données sur grille (III) Laissez faire le WMS Lattribut OutputData du JDL spécifie où les fichiers doivent aller Si aucun LFN nest précisé, WMS en choisit un Si aucun SE nest précisé, le SE le plus proche est choisi A la fin du job, les fichiers sont effacés du WN et enregistrés Un fichier contenant le résultat de cette opération est créé et ajouté à la sandbox : DSUpload_.out OutputData = { [ OutputFile = toto.out ; StorageElement = adc0021.cern.ch ; LogicalFileName = lfn:theBestTotoEver ; ], [ OutputFile = toto2.out ; StorageElement = adc0021.cern.ch ; LogicalFileName = lfn:theBestTotoEver2 ; ] };

Introduction à EGEE, 22-23/03/2005 – Clermont-Ferrand - 13 Soummission de données par le job Cest facile : utiliser le champ InputSandbox Attention : on ne peut pas utiliser ce champ pour de trop grand transfert (plusieurs megabytes) InputSandbox = {input-ntuple.root, job.sh};

Introduction à EGEE, 22-23/03/2005 – Clermont-Ferrand - 14 Mettre des données sur la grille depuis lextérieur Mettre des données sur la grille (rappel transparent 5) Mettre le fichier /home/myhome/toto (de lordinateur local) sur le storage element leSEchoisi01.in2p3.fr et enregistrer-le avec le nom de fichier logique edgrm.test lcg-cr -d leSEchoisi.in2p3.fr -l lfn:edgrm.test \ --vo gilda file:/home/myhome/toto Storage Element – machine accessible par la grille pour le stockage de données Logical File Name – nom de fichier symbolique avec lequel vous pouvez faire référence à un fichier grille sans préciser sa localisation actuelle La commande ci-dessus retourne le GUID : guid: b4c7-11d8-bb5e-eba42b5000d0 Les GUID sont permanents, les LFN non !

Introduction à EGEE, 22-23/03/2005 – Clermont-Ferrand - 15 Adresser vos données grille à votre job Il faut des données sur la grille == enregistrées dans le RLS Spécifiez les données grille au job (JDL) : InputData = lfn:myfile.dat InputData = lfn:myfile.dat (Le Resource Broker met des infos concernant la correspondance avec les données dans le fichier.BrokerInfo sur le noeud dexécution distant) Dans le script dexécution de votre job, utilisez la commande edg-brokerinfo & les commandes lcg-* pour avoir une copie locale au job

Introduction à EGEE, 22-23/03/2005 – Clermont-Ferrand - 16 Dupliquer les données Vous pouvez dupliquer vos données sur dautres SE à partir du LFN du fichier lcg-rep --vo gilda lfn:edgrm.test –d \ autreSEchoisi.in2p3.fr Si vous listez ces données avec la méthode listReplicas, vous trouvez une nouvelle liste : sfn://leSEchoisi.in2p3.fr/grid/gilda/tutorial/data /generated/ /file7115df45-b4c7-11d8-bb5e- eba42b5000d0 sfn://autreSEchoisi.in2p3.fr/grid/gilda/tutorial/d ata/generated/ /file3498dg93-h3b6-38s2- kf7d-ksr38h8379q7

Introduction à EGEE, 22-23/03/2005 – Clermont-Ferrand - 17 RLS : Replica Location Service Le RLS a deux composants Local Replica Catalog (LRC) maintient le catalogue des GUID:(fichiers physiques) Attention : les noms des fichiers physiques peuvent avoir besoin dun traitement supplémentaire (voir la documentation de la méthode edg-rm getTurl) Replica Metadata Catalog (RMC) maintient le catalogue des LFN:GUID peut aussi maintenir les méta-données sur les LFN lcg-* intéragit avec les deux

Introduction à EGEE, 22-23/03/2005 – Clermont-Ferrand - 18 Autres commandes edg-rm (cr, lr, rep…) anciennes commandes lcg-* Outils bas niveau pour copier les données distribuées et obtenir des infos globus-url-copy copie sécurisée sans enregistrement RLS edg-gridftp-ls et commandes associées Interaction avec les composants RLS edg-lrc (local replica catalog) edg-rmc (replica metadata catalog, search on metadata)