INFSO-RI-508833 Enabling Grids for E-sciencE www.eu-egee.org La gestion des données Daniel Jouvenot LAL-IN2P3-CNRS 18/06/2008.

Slides:



Advertisements
Présentations similaires
Didacticiel Mon EBSCOhost
Advertisements

Support.ebsco.com Guide dUtilisation Rapports et statistiques EBSCOadmin.
Chapitre I : Systèmes d’exploitation
Le web classeur Guide à l'usage des élèves. un support de classement et de conservation de vos informations en matière dorientation un outil permettant.
Systèmes d’exploitation
Systèmes d'exploitations GRARI Mounir ESTO Année 2011.
Mars 2013 Grégory Petit
Module 1 : Préparation de l'administration d'un serveur
Autodesk® Revit® Building 9
Recherche avancée multi-champs EBSCOhost
EGEE is a project funded by the European Union under contract IST Gestion des données David Bouvet CCIN2P3 Présentation faite à partir des.
Module 6 : Gestion du stockage des données
Module 4 : Création et gestion de comptes d'utilisateur
Création et gestion de comptes d'utilisateur
Mon passeport pour l’orientation et la formation
Concepts de base. Fichiers et Répertoires Pour le système, des fichiers répertoires (directory files) contiennent les informations permettant de retrouver.
Les guides de formation WS-FTP Comment télécharger un site web sur le serveur de lÉcole.
Module 7 : Accès aux ressources disque
Module 5 : Publication de ressources dans Active Directory
Développement dapplication avec base de données Semaine 10 : WCF avec Entité Framework Automne 2013.
Plateforme de Calcul pour les Sciences du Vivant Gestion de données sur EGEE.
Utilisez LE CLOUD AVEC DROPBOX
PHP 5° PARTIE : LES COOKIES
Objectifs A la fin de ce chapitre, vous pourrez : présenter l'utilisation d'opérations de chargement de données par chemin direct décrire l'utilisation.
CONSULTER permet toujours d’explorer le protocole sans y apporter de modification. Pour MODIFIER le protocole, il faut indiquer le motif de cette.
Gestion de données : Besoins de la VO Biomed Sorina Pop Laboratoire Creatis Université de Lyon, CREATIS; CNRS UMR5220; Inserm U1044; INSA-Lyon; Université.
 Formulaires HTML : traiter les entrées utilisateur
Gestion des données sur la grille C. Charlot / LLR CNRS & IN2P3 For the European DataGrid Project Team
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks TP Data Management René Météry CS Tutorial.
Les vues Une vue: c’est une relation virtuelle. Définie par:
Support.ebsco.com Didacticiel Mon EBSCOhost Didacticiel.
Module 2 3. Stocker ses fichiers dans son porte-documents KOSMOS.
SRIT Lannion Jan-02 Author.
■ Atteindre la base académique ■ Utiliser le site central pour trouver le site de l’établissement: ■ Accepter.
HTML Création et mise en page de formulaire
Guide Acheteur Le site d’achat dédié au monde public
Sample Image CGGVeritas University - Massy Monday 10 December 2007 EGEODE VO meeting of GEOCLUSTER user's on the EGEE grid.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Data management David Bouvet IN2P3-CC Clermont.
1 PHP 5 Notions fondamentales (niveau 1 cours #3) Formation continue – Cégep de Sainte-Foy François G Couillard.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Sécurité sur le GRID Ahmed Beriache (CGG)
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Sécurité sur le GRID Ahmed Beriache (CGG)
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Soumission de jobs David Bouvet IN2P3-CC.
Utiliser le dossier Mon EBSCOhost Tutoriel support.ebsco.com.
Enabling Grids for E-sciencE EGEE-III INFSO-RI Sécurité sur la Grille G. Philippon (LAL – CNRS ) Tutorial EGEE Utilisateur (DAKAR)
Formation.
1Boulogne Informatic Club PRESENTATION DE WINDOWS 10.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Quelques commandes de la grille David Bouvet.
INFSO-RI Enabling Grids for E-sciencE NA4 test Eric Fede on behalf of the team.
Installation du PGI – CEGID
1 Le dispositif d’évaluation Présentation de XiTi Mise à disposition d’un outil d’analyse statistique : XiTi  Accessible en ligne pour le chef d’EPLE.
INFSO-RI Enabling Grids for E-sciencE Support MPI avec Torque/PBS C. Loomis (LAL-Orsay) EGEE-FR Conférence Téléphonique 7 Juin 2005.
Catalogues de fichiers de données. David Bouvet2 Problématique Possibilité de répliquer les fichiers sur divers SE  nécessité d’un catalogue de fichiers.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Data Management René Météry CS Tutorial EGEE.
Sample Image Comment utiliser la grille ? 3ème rencontre EGEODE des utilisateurs de Geocluster et des Sciences de la Terre sur la grille EGEE à Villefranche-sur-Mer.
Edit Knoops CPPM 20/01/2009 Enabling Grids for E-sciencE Gestion des données Gestion des jobs Edith Knoops.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Soumission de jobs C. Loomis / M. Jouvin.
INFSO-RI Enabling Grids for E-sciencE Sécurité sur la Grille C. Loomis (LAL-Orsay) Tutorial EGEE Utilisateur (LAL) 8 octobre 2007.
EGEE is a project funded by the European Union under contract INFSO-RI Copyright (c) Members of the EGEE Collaboration Infrastructure Overview.
EGEE induction course, 22/03/2005 INFSO-RI Enabling Grids for E-sciencE Infrastructure Overview Pierre Girard French ROC deputy.
INFSO-RI Enabling Grids for E-sciencE Adaptation de GRIDSITE à WEBDAV Cédric Duprilot CNRS/IN2P3/LAL.
INFSO-RI Enabling Grids for E-sciencE Gestion des Données David Bouvet CCIN2P /10/10.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Monitoring dans EGEE Frederic Schaer ( Judit.
INFSO-RI Enabling Grids for E-sciencE Data management Daniel Jouvenot IN2P3-LAL ORSAY - 02/02/2007.
INFSO-RI Enabling Grids for E-sciencE Gestion des Données Présentation : G. Philippon (LAL CNRS) IPN Orsay, 7/8 Juillet 2009 Ecriture.
C. Loomis (LAL-Orsay) Tutorial EGEE Utilisateur (LAL) 2 février 2007
Fonctionnement de la grille
David Bouvet, David Weissenbach Observatoire de Meudon, 01-02/02/2011
David Bouvet IN2P3-CC Annecy - 27/09/2007
Auteurs : David Bouvet, David Weissenbach
Gilbert GROSDIDIER IN2P3-LAL-CNRS & CERN-LCG-GD LAL-Orsay - 09/10/2007
Transcription de la présentation:

INFSO-RI Enabling Grids for E-sciencE La gestion des données Daniel Jouvenot LAL-IN2P3-CNRS 18/06/2008

Enabling Grids for E-sciencE INFSO-RI La gestion des données dans la grille EGEE 2 Plan Les principaux systèmes La gestion des données à l’aide des commandes de base –Copier des données sur la grille –Retrouver les données –Dupliquer les données –Effacer les données –Trouver les informations La gestion des données pendant un job –Adresser les données en entrée de job –Récupérer les données sur votre bureau Le catalogue LFC

Enabling Grids for E-sciencE INFSO-RI La gestion des données dans la grille EGEE 3 Point suivant Les principaux systèmes Les commandes de base La gestion des données pendant un job Le catalogue LFC

Enabling Grids for E-sciencE INFSO-RI La gestion des données dans la grille EGEE 4 Les principaux systèmes Le système de gestion de l’espace des noms logiques : le LCG File Catalog (LFC) –Garde la trace de la localisation physique des diverses copies d’un fichier sur la grille  Fournit le GUID (Global Unique IDentifier) du fichier, et aussi le SURL (Storage URL) –Présente une arborescence et des commandes façon « système de fichiers » –C’est l’interface avec l’utilisateur Le système de gestion de l’espace des noms physiques : le Storage Resource Manager (SRM) –Utilise le GUID (ou le SURL) et nous fournit le TURL (Transport URL) –C’est l’interface avec les systèmes de stockage Le système de transfert de données –Utilise le TURL –Protocoles : rfio, gsiftp …

Enabling Grids for E-sciencE INFSO-RI La gestion des données dans la grille EGEE 5 Point suivant Les principaux systèmes Les commandes de base La gestion des données pendant un job Le catalogue LFC

Enabling Grids for E-sciencE INFSO-RI La gestion des données dans la grille EGEE 6 Copier des données sur la grille Copier le fichier /home/myhome/toto (ordinateur local) sur le Storage Element le SEchoisi.in2p3.fr et l’enregistrer avec le nom de fichier logique macopie.test –Storage Element (SE) – machine accessible par la grille pour le stockage de données –Logical File Name (LFN) – nom de fichier symbolique avec lequel vous pouvez faire référence à un fichier grille sans préciser sa localisation physique lcg-cr –d leSEchoisi.in2p3.fr \ -l lfn:/grid/gilda/myname/macopie.test \ --vo gilda file:/home/myhome/toto Remarque : les LFNs peuvent comporter des dossiers et sous-dossiers et l’utilisateur est libre de les organiser à sa guise La commande lcg-cr retourne le “GUID” : – guid: b4c7-11d8-bb5e-eba42b5000d0 –Les GUID sont permanents, les LFN non ! Il y a plein d’autres options disponibles: ‘lcg-cr –help’

Enabling Grids for E-sciencE INFSO-RI La gestion des données dans la grille EGEE 7 Retrouver vos données Localisez vos données en utilisant le LFN ou bien le GUID : –lcg-lr --vo gilda lfn:/grid/gilda/macopie.test –lcg-lr --vo gilda guid: b4c7-11d8-bb5e-eba42b5000d0 lcg-lr (listReplicas) : “replicas” car on peut avoir plusieurs copies sur des SE différents – les LFN et GUID font référence à toutes les copies Ces commandes retournent le SURL : –sfn://leSEchoisi.in2p3.fr/grid/gilda/tutorial/data/generated/ /file7115df45-b4c7-11d8-bb5e-eba42b5000d0 Pour obtenir une copie locale de vos données –lcg-cp --vo gilda \ guid: b4c7-11d8-bb5e-eba42b5000d0 \ file:`pwd`/newcopy

Enabling Grids for E-sciencE INFSO-RI La gestion des données dans la grille EGEE 8 Dupliquer les données Vous pouvez dupliquer vos données sur d’autres SE à partir du LFN (GUID ou SURL) du fichier – lcg-rep --vo gilda lfn:/grid/gilda/macopie.test \ –d autreSEchoisi.in2p3.fr Si vous listez ces données avec la méthode listReplicas, vous trouvez une nouvelle liste : – sfn://leSEchoisi.in2p3.fr/grid/gilda/tutorial/data/ge nerated/ /file7115df45-b4c7-11d8-bb5e- eba42b5000d0 – sfn://autreSEchoisi.in2p3.fr/grid/gilda/tutorial/data /generated/ /file3498dg93-h3b6-38s2-kf7d- ksr38h8379q7

Enabling Grids for E-sciencE INFSO-RI La gestion des données dans la grille EGEE 9 Effacer les données Pour effacer un replica sur un SE : – lcg-del --vo gilda –s lautreSE.cern.ch \ lfn:/grid/gilda/myname/macopie.test Il faut spécifier le SE car s’il y a plusieurs replicas, la commande ne sait pas quel fichier effacer. Pour effacer tous les replicas d’un même fichier, il faut rajouter l’option –a Le catalogue LFC est mis à jour automatiquement

Enabling Grids for E-sciencE INFSO-RI La gestion des données dans la grille EGEE 10 Trouver les informations Comment trouver les SEs disponibles localement ? – lcg-infosites –-vo atlas se Avail Space(Kb) Used Space(Kb) Type SEs n.a sa3-se.egee.cesga.es n.a n.a se201.grid.ucy.ac.cy n.a n.a n.a dublin.desy.de n.a n.a ctb04.gridctb.uoa.gr n.a lxb1921.cern.ch Beaucoup d’autres informations peuvent être affichées –Le nom des serveurs LFC : utiliser l’argument lfc (au lieu de se) –Toutes les ressources disponibles : argument all –Autres arguments possibles : ce, closeSE, rb –Attention : l’option ‘--vo’ est toujours vitale  Un SE peut être valide pour une VO et pas pour une autre

Enabling Grids for E-sciencE INFSO-RI La gestion des données dans la grille EGEE 11 Point suivant Les principaux systèmes Les commandes de base La gestion des données pendant un job Le catalogue LFC

Enabling Grids for E-sciencE INFSO-RI La gestion des données dans la grille EGEE 12 Adresser les données en Input Pour vos données « locales » : –C’est facile : utiliser le champ InputSandbox du JDL  InputSandbox = {“input-ntuple.root“, “job.sh”}; –Attention : on ne peut pas utiliser ce champ pour de trop gros transferts (qqes MB seulement) Pour vos données « grille » : –Spécifiez les données grille à l’aide du champ InputData : guid:f62344d9-ca25-458a-adf7-9d dcd  InputData = {“lfn:/grid/gilda/myfile.dat”, “guid:f62344d9-ca25-458a-adf7-9d dcd”};

Enabling Grids for E-sciencE INFSO-RI La gestion des données dans la grille EGEE 13 Récupérer les données sur le bureau Le job génère des données dans le répertoire de travail du WN, et vous souhaitez simplement les récupérer sur votre machine locale (UI) –A la fin du job, les fichiers nouveaux sont placés dans un espace de stockage temporaire (sur le WMS) –Vous les récupérerez via “ glite-wms-job-output ” Eléments clés : –vous devrez spécifier les noms des fichiers que vous souhaitez récupérer dans le JDL du job par la clause :  OutputSandbox = {“higgs.root", “graviton.HDF"}; –méthode fortement déconseillée pour de gros fichiers (> 100MB)  espace de stockage temporaire limité

Enabling Grids for E-sciencE INFSO-RI La gestion des données dans la grille EGEE 14 Un mot sur GFAL Jusqu’ici, les fichiers accédés par le job sont toujours locaux –En lecture comme en écriture –C’est un handicap quand on veut lire/écrire de gros fichiers  Il faut les transférer d’abord  Surtout s’ils sont plus gros que l’espace disque disponible sur le WN Pour accéder directement à des fichiers distants : GFAL –GFAL : pour ‘Grid File Access Library’  Cette librairie est une API C, à la norme POSIX  Elle permet, directement depuis le programme en C/C++, d’accéder aux fichiers disponibles sur un SE (même lointain) –Les appels possibles sont (liste non exhaustive) :  gfal_open, gfal_read, gfal_write, gfal_close, … –La syntaxe des noms de fichiers est la syntaxe SURL –Moyen économique, il évite des transferts inutiles ou volumineux –Documentation : ‘ man gfal ’, ‘ man gfal_open ’, …  Un exemple de code C est fourni par ‘man gfal’

Enabling Grids for E-sciencE INFSO-RI La gestion des données dans la grille EGEE 15 Point suivant Les principaux systèmes mis en jeu Les commandes de base La gestion des données pour un job donné Le catalogue LFC

Enabling Grids for E-sciencE INFSO-RI La gestion des données dans la grille EGEE 16 LCG File Catalog (LFC) Le catalogue LFC (LCG File Catalog) présente une arborescence et des commandes façon Posix : –il est possible de lister les références, de créer une nouvelle arborescence, de faire des liens symboliques… Par défaut, le catalogue utilisé est le catalogue central de la VO.  lcg-infosites –vo gilda –f lfc retourne le nom du LFC central  lcg-infosites –vo gilda –f lfcLocal retourne la liste des catalogues locaux de la VO Pour utiliser un catalogue local :  export LFC_HOST=

Enabling Grids for E-sciencE INFSO-RI La gestion des données dans la grille EGEE 17 Commandes LFC Elles permettent la gestion des LFNs Racine de l’arborescence d’un LFC :  /grid/ –on peut stocker cette racine dans la variable LFC_HOME  export LFC_HOME=/grid/gilda –Si on définit cette variable, l’option ‘ -l lfn:mylfn ’ est en fait interprétée comme ‘ -l lfn:$LFC_HOME/mylfn ’ Lister les références :  lfc-ls /grid/gilda/...  lfc-ls $LFC_HOME/... Créer une nouveau répertoire :  lfc-mkdir /grid/gilda/.../ Autres ex. de commandes :  lfc-ln, lfc-rm, lfc-rename, lfc-getacl, lfc-setacl  lfc-chmod, lfc-chown, lfc-setcomment, lfc- delcomment Aide en ligne : commande ‘ man lfc-xx ’ ou simplement ‘ lfc-xx ’

Enabling Grids for E-sciencE INFSO-RI La gestion des données dans la grille EGEE 18 Liens utiles Projet LCG – Projet EGEE (tutorial en ligne) – LCG user – LCG User Guide – LCG FAQ (pas à jour mais ça aide quand même) – User Support – pour soumettre un ‘bug report’ (incidents sur la VO, pour un site …)