David Bouvet IN2P3-CC Annecy - 27/09/2007

Slides:



Advertisements
Présentations similaires
EGEE is a project funded by the European Union under contract IST Gestion des données David Bouvet CCIN2P3 Présentation faite à partir des.
Advertisements

Plateforme de Calcul pour les Sciences du Vivant Gestion de données sur EGEE.
Gestion des données sur la grille C. Charlot / LLR CNRS & IN2P3 For the European DataGrid Project Team
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks TP Data Management René Météry CS Tutorial.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Data management David Bouvet IN2P3-CC Clermont.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Quelques commandes de la grille David Bouvet.
Catalogues de fichiers de données. David Bouvet2 Problématique Possibilité de répliquer les fichiers sur divers SE  nécessité d’un catalogue de fichiers.
Edit Knoops CPPM 20/01/2009 Enabling Grids for E-sciencE Gestion des données Gestion des jobs Edith Knoops.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Soumission de jobs C. Loomis / M. Jouvin.
INFSO-RI Enabling Grids for E-sciencE Gestion des Données David Bouvet CCIN2P /10/10.
INFSO-RI Enabling Grids for E-sciencE Data management Daniel Jouvenot IN2P3-LAL ORSAY - 02/02/2007.
INFSO-RI Enabling Grids for E-sciencE La gestion des données Daniel Jouvenot LAL-IN2P3-CNRS 18/06/2008.
FAIRE SA BIBLIOGRAPHIE DE THESE AVEC ZOTERO Traitements de texte pris en compte: Word et LibreOffice.
GCstar Gestionnaire de collections personnelles Christian Jodar (Tian)
INFSO-RI Enabling Grids for E-sciencE Gestion des Données Présentation : G. Philippon (LAL CNRS) IPN Orsay, 7/8 Juillet 2009 Ecriture.
Quelques commandes de base I. Se déplacer dans l'arborescence Change directory (cd), print working directory (pwd) II. Lister des fichiers List (ls) III.
Guide de l'enseignant SolidWorks, leçon 1 Nom de l'établissement Nom de l'enseignant Date.
1/6 Commandes de base en mode console sous LINUX/UNIX ● Arborescence, fichiers et répertoires ● Alias ● Manpages ● Editeur de texte vi.
EGEE is a project funded by the European Union under contract IST Soumission de jobs Tutorial Grille (LCG/EGEE) E.Fede (CNRS/IN2P3/LAPP)
Créer une alerte de recherche dans EBSCOhost Tutoriel support.ebsco.com.
Utilisation du logiciel EduStat © Construire une épreuve.
Un site internet : pourquoi faire ?
21/10/2017 L’organisation et la gestion des fichiers sur le site collaboratif MartineCochet 2SitePleiadeGestionFichier.
Téléchargement de fichiers
Utiliser le dossier Mon EBSCOhost
Sécurité - ASA8.x - Import du Plug-in RDP pour utilisation dans WebVPN
Groupes Retrouvez vos repères Vos premiers pas dans les Groupes
GUIDE UTILISATEUR- MY HR
Les commandes du système de fichiers
Logiciel de gestion des adhérents
Cours 5 Mardi 13 septembre Période 1: Les bases de l’informatique et les composantes de l’ordinateur PARTIE 1 Période 2: L’utilisation de Power Point.
GENIUS – GANGA Alternative à la CLI
Changer les critères de nommage
WEBAFFILIGUE - ASSOCIATION
C. Loomis (LAL-Orsay) Tutorial EGEE Utilisateur (LAL) 2 février 2007
Soumission de jobs Tutorial Grille (LCG/EGEE)
GRIF : Grille pour la Recherche en
Créer une alerte de recherche dans EBSCOhost
Surveillance des services grille par NAGIOS
Windows 7 NTFS.
Fonctionnement de la grille
Consolidation des services FTS et LFC
Soumission de jobs de calcul
David Bouvet, David Weissenbach Observatoire de Meudon, 01-02/02/2011
Initiation à l'infrastructure
Soumission de jobs C. Loomis / M. Jouvin (LAL-Orsay)
Auteurs : David Bouvet, David Weissenbach
Utilisation effective de la Grille par ATLAS S. Jézéquel (LAPP)
Tutorial Utilisateurs EGEE
CREAM-CE et SGE.
Chapitre 7 Configuration de l'environnement du bureau
Exercices: Système d’Information
Atelier régulation de la production dans un contexte grille
Gilbert GROSDIDIER IN2P3-LAL-CNRS & CERN-LCG-GD LAL-Orsay - 09/10/2007
Tutorial Utilisateurs EGEE
1 Copyright © 2004, Oracle. Tous droits réservés. Extraire des données à l'aide de l'instruction SQL SELECT.
Guide de soumission de la PPR-SLD
CountrySTAT / FENIX Aperçu globale de l’Editeur DSD dans la nouvelle plateforme CountrySTAT FORMATION DES POINTS FOCAUX SUR LE SYSTEME CountrySTAT/FENIX.
STS Web Services libres Créer un service libre
Infrastructure Opérationnelle d’EGEE
STS Web Services libres Constituer les services libres
Infrastructure Opérationnelle d’EGEE2
Principes de programmation (suite)
Introduction au Système d’exploitation Ms-DOS
LUSTRE Integration to SRM
Tableau de bord d’un système de recommandation
Implémentation de FTP Rappel sur FTP Relation entre un site Web et FTP
DONNÉE DE BASE QM Manuel de formation. Agenda 2  Introduction  Objectif de la formation  Données de base QM: Caractéristique de contrôle Catalogue.
Listes d’adresse Une liste d’adresse est une collection de destinataires et d’autres objets. Il peut exister (et il existe généralement) plusieurs listes.
Les Commandes de base Linux. 1 L’aide sur les commandes Linux ◦ help : obtenir de l’aide pour une commande interne du shell. Elle permet aussi d'afficher.
Transcription de la présentation:

David Bouvet IN2P3-CC Annecy - 27/09/2007 Gestion des données David Bouvet IN2P3-CC Annecy - 27/09/2007

Plan Commandes de bases Gestion à travers un job Catalogue LFC copier, lister, répliquer, effacer les données lcg-infosites Gestion à travers un job Catalogue LFC

Outils de gestion des données de grille Replica-manager (RM) est le principal outil LCG File Catalog (LFC) garde la trace de la localisation des diverses copies des fichiers grille le transfert de données utilise surtout gsiftp comme le bon vieux FTP, et utilise l’authentification grille pas de mot de passe ! peut aussi utiliser des flots multiples pour un transfert plus rapide RM couvre l’interaction entre gsiftp et le LFC pour faciliter l’instanciation, l’enregistrement et la réplication des données grille Resource Broker peut envoyer (un petit ensemble) de données aux/depuis les jobs peut utiliser le LFC pour trouver vos données et les envoyer à votre job, si vos données sont dans le LFC et que vous le spécifiez au RB

Commandes de base du RM (I) : copier les données Mettre des données sur la grille : Mettre le fichier /home/myhome/toto (de l’ordinateur local) sur le Storage Element leSEchoisi01.in2p3.fr et l’enregistrer avec le nom de fichier logique macopie.test lcg-cr -d leSEchoisi.in2p3.fr –l \ lfn:/grid/vo.lapp.in2p3.fr/macopie.test \ ––vo vo.lapp.in2p3.fr file:/home/myhome/toto Storage Element – machine accessible par la grille pour le stockage de données Logical File Name – nom de fichier symbolique avec lequel vous pouvez faire référence à un fichier grille sans préciser sa localisation physique actuelle La commande ci-dessus retourne le “GUID” : guid:76373236-b4c7-11d8-bb5e-eba42b5000d0 Les GUID sont permanents, les LFN non !

Commandes de base du RM (I) : copier les données Copier des données grille en local : lcg-cp ––vo vo.lapp.in2p3.fr lfn:/grid/vo.lapp.in2p3.fr/macopie.test file:///home/myhome/macopielocale La commande lcg-cp peut être utilisée pour copier des données locales sur un SE. Il n’est pas recommandé de l’utiliser de cette manière car il n’y a pas d’enregistrement dans le catalogue LFC.

Commandes de base du RM (II) : lister les données Trouvez vos données : la méthode listReplicas (lr) lcg-lr ––vo vo.lapp.in2p3.fr lfn:/grid/vo.lapp.in2p3.fr/macopie.test # via LFN sfn://leSEchoisi.in2p3.fr/grid/vo.lapp.in2p3.fr/tutorial/data/generated/2004-11-10/file7115df45-b4c7-11d8-bb5e-eba42b5000d0 lcg-lr ––vo vo.lapp.in2p3.fr \ # via GUID guid:76373236-b4c7-11d8-bb5e-eba42b5000d0 “replicas” car quelqu’un (ou un programme) peut faire une copie sur un SE différent. Les LFN et GUID font référence à toutes les copies

Commandes de base du RM (III): dupliquer les données Vous pouvez dupliquer vos données sur d’autres SE à partir du LFN du fichier : lcg-rep ––vo vo.lapp.in2p3.fr lfn:/grid/vo.lapp.in2p3.fr/macopie.test –d autreSEchoisi.in2p3.fr Si vous listez ces données avec la méthode listReplicas, vous trouvez une nouvelle liste : sfn://leSEchoisi.in2p3.fr/grid/vo.lapp.in2p3.fr/tutorial/data/generated/2004-11-10/file7115df45-b4c7-11d8-bb5e-eba42b5000d0 sfn://autreSEchoisi.in2p3.fr/grid/vo.lapp.in2p3.fr/tutorial/data/generated/2004-11-10/file3498dg93-h3b6-38s2-kf7d-ksr38h8379q7

Commandes de base du RM (V) : effacer les données Pour effacer les données d’un SE à partir du LFN : lcg-del ––vo vo.lapp.in2p3.fr –s autreSE.in2p3.fr lfn:/grid/vo.lapp.in2p3.fr/macopie.test Il faut spécifier le hostname du SE car en cas de replicas, la commande ne sait pas quel fichier effacer. Pour effacer tous les replicas d’un fichier, il faut rajouter l’option –a Cette option est aussi nécessaire lorsqu’il n’y a pas de replica Le catalogue LFC est mis à jour

Commandes de base du RM (VI) : lcg-infosites Trouver l’information concernant le LFC ou le “DMS” (Data Management System) comment connaît-on que leSEchoisi.in2p3.fr était un SE ? lcg-infosites ––vo atlas se ************************************************************** These are the related data for atlas: (in terms of SE) ************************************************************** Avail Space(Kb) Used Space(Kb) SEs ---------------------------------------------------------- 725228544 5741568 clrlcgse01.in2p3.fr 190257628 38750756 clrlcgse02.in2p3.fr Beaucoup d’autres informations peuvent être affichées emplacements des composants du LFC emplacements de toutes les ressources

Plan : vous êtes ici Commandes de bases Gestion à travers un job Catalogue LFC

Les données à travers les jobs : données sur votre bureau Vous pouvez définir votre job pour récupérer les données le job génère des données dans le répertoire de travail du WN à la fin du job, les données sont placées dans l’espace de stockage temporaire du RB vous les récupérez via edg-job-get-output Eléments clés : vous devez connaître les noms des fichiers que vous souhaitez récupérer OutputSandbox = {“higgs.root", “graviton.HDF"}; méthode non destinée pour de gros fichiers (> centaine MB)  espace de stockage temporaire limité sur le RB

Les données à travers les jobs : données sur la grille Votre programme génère des données dans un fichier local au WN Le programme doit connaître quel est le nom du fichier local Le programme utilise les commandes lcg-* pour : mettre les données sur un SE de la grille enregistrer les données comme un jeu de données grille Deux options utiles : sur quel SE les données doivent-elles être sauvegardées (ou même dans quel répertoire de quel SE !) ?  par défaut : SE “local” un nom de fichier logique.  par défaut : pas de LFN !

L’attribut OutputData du JDL spécifie où les fichiers doivent aller Les données à travers les jobs : données sur la grille Laissez faire le WMS L’attribut OutputData du JDL spécifie où les fichiers doivent aller si aucun LFN n’est précisé, le WMS en choisit un si aucun SE n’est précisé, le SE le plus proche est choisi OutputData = { [ OutputFile = “toto.out” ; StorageElement = “adc0021.cern.ch” ; LogicalFileName = “lfn:/grid/gilda/theBestTotoEver” ; ], [ OutputFile = “toto2.out” ; StorageElement = “adc0021.cern.ch” ; LogicalFileName = “lfn:/grid/gilda/theBestTotoEver2” ; ] }; A la fin du job, les fichiers sont effacés du WN et enregistrés sur le SE Un fichier contenant le résultat de cette opération est créé et ajouté à l’Output Sandbox : DSUpload_<unique jobstring>.out

Soumission de données par le job C’est facile : utiliser le champ InputSandbox du JDL Attention : on ne peut pas utiliser ce champ pour de trop grand transfert (plusieurs megabytes) InputSandbox = {“input-ntuple.root“, “job.sh”}; InputSandbox ne peut pas contenir 2 fichiers ayant le même nom, même s’ils ont un chemin absolu différent : ils s’écraseraient l’un l’autre pendant le transfert.

Adresser vos données grille à votre job Il faut des données sur la grille == enregistrées dans le LFC Spécifiez les données grille au job (JDL) : InputData = “lfn:/grid/gilda/myfile.dat” Le Resource Broker met des infos concernant la correspondance avec les données dans le fichier .BrokerInfo sur le noeud d’exécution distant Dans le script d’exécution de votre job, utilisez la commande edg-brokerinfo & les commandes lcg-* pour avoir une copie locale du job

Plan : vous êtes ici Commandes de bases Gestion à travers un job Catalogue LFC

Commandes LFC Le catalogue LFC (LCG File Catalog) présente une arborescence et des commandes façon « système de fichiers » : il est possible de lister les références, de créer une nouvelle arborescence, de faire des liens symboliques… Par défaut, le catalogue utilisé est le catalogue central de la VO. lcg–infosites ––vo vo.lapp.in2p3.fr lfc retourne le nom du LFC central lcg–infosites ––vo vo.lapp.in2p3.fr lfcLocal retourne la liste des catalogues locaux de la VO

Commandes LFC Pour utiliser un catalogue : export LFC_HOST=<hostname du LFC choisi> Racine de l’arborescence d’un LFC : /grid/<nom de la VO> on peut stocker cette racine dans la variable $LFC_HOME Lister les références : lfc-ls /grid/vo.lapp.in2p3.fr/... lfc-ls $LFC_HOME/... Créer une nouveau répertoire : lfc-mkdir /grid/vo.lapp.in2p3.fr/.../<mon rep> Autres ex. de commandes : lfc-ln, lfc-rm, lfc-getacl, lfc-setacl...

Liens utiles Projet LCG Projet EGEE LCG user gLite User Guide http://lcg.web.cern.ch/LCG/ Projet EGEE http://www.eu-egee.org/ http://www.eu-egee.org/try-the-grid (tutorial en ligne) LCG user http://lcg.web.cern.ch/LCG/users/users.html gLite User Guide https://edms.cern.ch/file/722398//gLite-3-UserGuide.html LCG FAQ (pas à jour mais ça aide quand même) https://edms.cern.ch/file/495216/1/LCG-Faq.html Doc diverses sur la grille https://gus.fzk.de/pages/docu.php User Support http://www.ggus.org/ pour soumettre des incidents pour la VO, pour un site…

Merci