Edith Knoops CNRS/CPPM

Slides:



Advertisements
Présentations similaires
Plateforme de Calcul pour les Sciences du Vivant Le Système dInformation de gLite.
Advertisements

EGEE is a project funded by the European Union under contract INFSO-RI Copyright (c) Members of the EGEE Collaboration Infrastructure Overview.
EGEE is a project funded by the European Union under contract IST SERVICE de GRILLE Système d’information Présentation faite à partir des exemples.
EGEE is a project funded by the European Union under contract IST SERVICE de GRILLE Système d’information Présentation faite à partir des exemples.
Colloque LCG France14-15 mars SURVEILLANCE ET GESTION D’INCIDENTS Cécile Barbier (LAPP)
Nombre de job slot par machine Server_priv/node. Node1 np=2 Règle de 1 core = 1 job slot = 2 Go. Sur un bi-processeur bi-core on annonce alors np=4 Pas.
CNRS GRID-FR CA Sophie Nicoud
INFSO-RI Enabling Grids for E-sciencE Statistiques d'usage d'un site de la grille LCG/EGEE Emmanuel Medernach, IN2P3 LPC.
Lundi 11 juillet 2016 Exploitation globale de la grille Hélène Cordier Operations LCG.
Making PowerPoint Slides Avoiding the Pitfalls of Bad Slides.
EGEE is a project funded by the European Union under contract IST SERVICE de GRILLE Système d’information Présentation faite à partir des exemples.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Opérations : vers un modèle décentralisé...
An Introduction To Two – Port Networks The University of Tennessee Electrical and Computer Engineering Knoxville, TN wlg.
IP Multicast Text available on
Template Provided By Genigraphics – Replace This Text With Your Title John Smith, MD 1 ; Jane Doe, PhD 2 ; Frederick Smith, MD, PhD 1,2 1.
Overview of SUN’s Unix Campus-Booster ID : **XXXXX Copyright © SUPINFO. All rights reserved Introduction to Solaris 10.
Quelques Infos sur LDAP
[Insérez le nom du programme]
David Bouvet, David Weissenbach Observatoire de Meudon, 01-02/02/2011
IGTMD réunion du 4 Mai 2007 CC IN2P3 Lyon
Initiation à l’infrastructure
L’accounting dans EGEE
The nation now known as The Democratic Republic of Congo was at one time the personal property of the King of Belgium.
GENIUS – GANGA Alternative à la CLI
Le portail des opérations: retour d'expérience
C. Loomis (LAL-Orsay) Tutorial EGEE Utilisateur (LAL) 2 février 2007
Soumission de jobs Tutorial Grille (LCG/EGEE)
Etat des services grid de production
12 mars 2004, Lyon Reunion CAF F.Chollet 1
Surveillance des services grille par NAGIOS
Intégration de BQS dans CREAM
Pierre Girard LCG-France Tier
Pierre Girard LCG-France Tier
Fonctionnement de la grille
Surveillance des services grille par NAGIOS
Soumission de jobs de calcul
Initiation à l'infrastructure
2ème coloque LCG-France
Soumission de jobs C. Loomis / M. Jouvin (LAL-Orsay)
Déploiement d’un LCG CE
Consolidation des services de grille de production
David Bouvet IN2P3-CC Annecy - 27/09/2007
David Bouvet LCG France T2 T3 – LPNHE
Jobs ATLAS sur la grille
Tutorial Utilisateurs EGEE
mardi 11 septembre 2018mardi 11 septembre 2018
CREAM-CE et SGE.
Exercices: Système d’Information
Atelier régulation de la production dans un contexte grille
SRT3 LDAP.
Tutorial Grille (LCG/EGEE)
Essai
High-Availability Linux Services And Newtork Administration Bourbita Mahdi 2016.
Infrastructure Opérationnelle d’EGEE
Introduction à la Grille
Révision – Phrases Importantes
Français Les animaux (2).
Introduction à GENIUS et GILDA
1-1 Introduction to ArcGIS Introductions Who are you? Any GIS background? What do you want to get out of the class?
Vulnerability Analysis by : Wail Belhouchet Dr Djouad Tarek 1.
Question formation In English, you can change a statement into a question by adding a helping verb (auxiliary): does he sing? do we sing? did they sing.
Active Directory Services
Infrastructure Opérationnelle d’EGEE2
Making PowerPoint Slides Avoiding the Pitfalls of Bad Slides.
POWERPOINT PRESENTATION FOR INTRODUCTION TO THE USE OF SPSS SOFTWARE FOR STATISTICAL ANALISYS BY AMINOU Faozyath UIL/PG2018/1866 JANUARY 2019.
Les formes et les couleurs
Protocoles d'administration réseau CDP, LLDP
Le Passé Composé (Perfect Tense)
INS Tunisia, Towards a fully SDMX compliant Information system
M’SILA University Information Communication Sciences and technology
Transcription de la présentation:

Edith Knoops CNRS/CPPM Tutorial Grille EGEE/IDG/LASER Montpellier 17/06/2008 www.eu-egee.org SERVICE de GRILLE Système d’information Présentation de Christine Leroy CEA/IRFU faite à partir des exemples du site NA3/EGEE: http://wiki.nesc.ac.uk/read/egee-na3-etf?EtfInduction et des slides de Pierre Girard (French ROC deputy CC-IN2P3 site administrator) Edith Knoops CNRS/CPPM EGEE is a project funded by the European Union under contract IST-2003-508833

Plan Le système d’information dans EGEE/LCG origine, architecture, protocole, format des données Les outils du système d’information Exploitation et Système d’information Conclusion

Introduction Quoi ? Pourquoi ? Comment ? Système chargé de collecter des informations sur l’état des ressources/services mis à disposition sur la Grille. Pourquoi ? Découvrir les ressources/services de la grille et leur nature Disposer des données pertinentes pour utiliser les ressources et les services offerts par des sites hétéroclites. Vérifier l’état de santé des ressources et services de la grille. Comment ? En monitorant localement l’état et la description des ressources/services, et en publiant les données “fraîchement” collectées sur le système d’information. En adoptant un modèle de données “commun à/connu de” tous les composants/acteurs de la grille qui ont besoin d’interagir avec les ressources/services de la grille. En offrant les outils qui permettent d’alimenter et d’interroger le système d’information.

Système d’Information de LCG/EGEE Principes Chaque site publie Une description des ressources/services qu’il fournit par VO L’état actuel de ses ressources (CPUs libres, Espace de stockage, etc.)‏ Chaque VO publie Ce qu’elle a installé sur chaque site (“Tags” des Software Managers)‏ Les acteurs interrogent le SI pour savoir comment utiliser les services/ressources de la grille VO1 VO1 Système d’information VO2 RB1 RC1 LFC2 VO3 LFC1 RB2 RC2 RC3 Interrogation RB1 RB2 Utilisation LFC2 RB1 LFC1 Site IN2P3-CC

Système d’Information de LCG/EGEE Origine et Architecture MDS: Monitoring and Discovery Service ► Provient de la boite à outils Globus ► Technologie utilisée pour le système d’information LCG/EGEE Comment?: 1st. Sur chaque site l’état des services (informations statiques et dynamiques) est rapporté à des serveurs 2nd. Un système centrale interroge ces serveurs et stocke ces informations dans une base de données 3rd. Ces informations seront accessibles à travers le protocole d’accès: LDAP 4th. Le système centrale fourni l’information dans un schema prédéfini: GlueSchema

Architecture globale : Origine du SI actuel Globus: architecture MDS-2 (Monitoring and Discovery System)‏ Gridftp Gatekeeper Grid Resource Information Service Storage Element Computing Element Information Provider IP IP IP Resource A Resource A IP IP Resource B Resource B IP IP GRIS GRIS IP GRIS GRIS 1 GRIS register with GIIS GIIS requests info from GRIS services 2 Cache contains info from Cache contains info from A and B A and B Client 2 uses GIIS for Client 2 uses GIIS for searching collective searching collective Client 1 searches GIIS the GRIS directly information information Grid Index Information Service Client 1 Client 1 Client 2 Client 2

Architecture globale : SI actuel GLITE : Aggrégations des systèmes d’information des sites BDII (Berkeley Database Information Index): même fonctionnalité que le GIIS, avec une implémentation différente (meilleure gestion de cache)‏ 2 niveaux d’aggrégation: resource_BDII-site_BDII et de site_BDII-top_BDII BDII-A BDII-B BDII-C CE Site BDII Site BDII CE Site BDII CE Local BDII: resource CE Local BDII: resource Each BDII collects information from a set of sites defined in its configuration file. Then different BDII can collect different information. In the slide we can see that the BDII A collects information from Site 1 and 2, the BIII-B from… SE Local BDII: resource SE Local BDII: resource CE Local BDII: resource SE Local BDII: resource CE Local BDII: resource SE Local BDII: resource RB Local BDII: resource Site 1 Site 2 Site 3

Mise en oeuvre Annuaire LDAP Directory Information Tree GRIS, GIIS et BDII sont des serveurs d’annuaire LDAP (openldap)‏ LDAP : Lightweight Directory Access Protocol Modèle de données Arborescence de nœuds Chaque nœud (entrée de l’annuaire) contient des attributs La structure d’un nœud est définie par une ou des classes au schéma prédéfini. Modèle de nommage Distinguished Name (DN): cn=Girard Pierre,ou=People,ou=cc,o=in2p3,c=fr L’information est importé/exporté depuis/vers les serveurs LDAP par des fichiers au format LDIF (LDAP Data Interchange Format) o=in2p3,c=fr (racine du DIT) ou=lal ou=cc ou=lapp ou=People cn=Girard Pierre cn: Girard Pierre phone: +33 9999999999 uid: girardpi mail: pierre.girard@in2p3.fr objectClass: top objectClass: person objectClass: organizationalPerson objectClass: inetOrgPerson

Glue Schema in EGEE/LCG: Design GLUE Schema (v1.3): Définition de schémas LDAP décrivant chaque composant des ressources/services de la grille https://forge.gridforum.org/sf/projects/glue-wg

Quelques Exemples du Glue Schema (I) 1. Some General Attributes: ¤ Base class (objectclass: GlueTop): No attributes ¤ Schema Version Number (objectclass: GlueSchemaVersion)‏ • GlueSchemaVersionMajor: Major Schema Version Number • GlueSchemaVersionMinor: Minor Schema Version Number 2. Attributes for the CE ¤ Base Class for the CE information(objectclass: GlueCETop) : No attributes ¤ CE (objectclass: GlueCE)‏ • GlueCEUniqueID: unique identifier for the CE • GlueCEName: human-readable name of the service ¤ CE Status (objectclass: GlueCEState)‏ • GlueCEStateRunningJobs: number of running jobs • GlueCEStateWaitingJobs: number of jobs not running • GlueCEStateTotalJobs: total number of jobs (running + waiting)‏ • GlueCEStateStatus: queue status: queueing (jobs accepted but not running), production (jobs accepted and run), closed (neither accepted nor run), draining (jobs not accepted but those already queued are running)‏ • GlueCEStateWorstResponseTime: worst possible time between the submission of the job and the start of its execution

Quelques Exemples du Glue Schema (II)‏ 3. Attributes for the SE ¤ Base Class (objectclass: GlueSETop) : No attributes ¤ Architecture (objectclass: GlueSLArchitecture)‏ • GlueSLArchitectureType: type of storage hardware (disk, tape, etc)‏ ¤ Storage Service Access Protocol (objectclass: GlueSEAccessProtocol)‏ • GlueSEAccessProtocolType: protocol type to access or transfer files • GlueSEAccessProtocolPort: port number for the protocol • GlueSEAccessProtocolVersion: protocol version • GlueSEAccessProtocolAccessTime: time to access a file using this protocol 4. Mixed Attributes ¤ Association between one CE and one or more SEs (objectclass: GlueCESEBindGroup)‏ • GlueCESEBindGroupCEUniqueID: unique ID for the CE • GlueCESEBindGroupSEUniqueID: unique ID for the SE

Utilisation du Système d’Information Par les Ressources/services Par les utilisateurs

Services Grille Matchmaking Le SI est interrogé par le RB/WMS pour choisir une queue de soumission en fonction du JDL (Job Description Language) fourni par l’utilisateur 1- soumet un job (JDL)‏ UI JDL VO3 TAG VO3_APP1.0.2 Requirements: TAG VO3_APP1.0.2 MaxCPUTime >= 20 Input “datafile1” RB2 2- Interroge 3- Soumet Top BDII TAG VO3_APP1.0.2 RB1 RC1 LFC2 LFC1 RB2 RC2 RC3

Utilisation du Système d’Information niveau utilisateur - ldapsearch -x \ Simple authentication -H ldap://grid017.ct.infn.it:2170 \ Uniform resource identifier -b ‘mds-vo-name=resource,o=grid’ \ Base DN for search ‘(objectclass=GlueSE)’ \ Filter GlueSEUniqueID \ Attributes to be returned (Make “man ldapsearch” to retrieve the whole set of options)‏ The ldapsearch Implementation in EGEE/LCG Some wrappers of ldapsearch exist in LCG middleware Read port of the BDII

Utilisation du Système d’Information Comment interroger les différents composants Each site can run a top BDII. It collects the information coming from the site-BDII % ldapsearch –x –h <hostname -p 2170 –b “o=grid” At each site, a site BDII collects the information given by the resource_BDII % ldapsearch –x –h <hostname> -p 2170 –b “mds-vo-name=<name>,o=grid” Resource BDII run on CEs and SEs at each site and report dynamic and static information –b “mds-vo-name=resource,o=grid” Abbreviations: BDII: Berkeley DataBase Information Index

Utilisation du Système d’Information niveau utilisateur - ldapsearch $ ldapsearch -LLL -x -h topbdii.grif.fr:2170 -b mds-vo-name=GRIF-LLR,mds-vo-name=GRIF,mds- vo-name=local,o=grid '(&(objectclass=GlueSA)(GlueSAType=permanent)(GlueSALocalID=cms))' GlueSAStateAvailableSpace GlueSAStateUsedSpace dn: GlueSALocalID=cms,GlueSEUniqueID=polgrid4.in2p3.fr,Mds-Vo-name=GRIF-LLR,Mds-Vo- name=GRIF,Mds-Vo-name=local,o=grid GlueSAStateAvailableSpace: 3810000000 GlueSAStateUsedSpace: 11989948171 Sortie sous format LDIF

Utilisation du Système d’Information niveau utilisateur - lcg-infosites > lcg-infosites --vo <your_vo> feature –-is <your_bdii> • It’s mandatory to include the vo and the feature • The –is option means the BDII you want to query. If not supplied, the BDII defined into the LCG_GFAL_INFOSYS will be interrogated Features and descriptions: Description of the script help It groups all the features just described all Name of the lfc for the user’s VO lfc SEs names together with the available and used space se Number of CPUs, running and waiting jobs and names of the CEs ce Names of the CEs where the user’s VO is allowed to run together with their corresponding closest SEs closeSE

lcg-infosites: Examples (I)‏ > lcg-infosites –-vo biomed se –-is topbdii.grif.fr Avail Space(Kb) Used Space(Kb) Type SEs ---------------------------------------------------------- 1928602364 2752109700 n.a scaise-2.scai.fraunhofer.de 288020000 1984948 n.a se2.egee.cesga.es 2030000000 1807434 n.a fornax-se.itwm.fhg.de 361520000 955266 n.a se02.marie.hellasgrid.gr 2550000000 579915 n.a egee-se.grid.niif.hu 1421026112 125944000 n.a g03n05.pdc.kth.se 858740000 229921 n.a SE.pakgrid.org.pk 614310000 4863261 n.a dgc-grid-34.brunel.ac.uk 51510000 698432 n.a cs-grid2.bgu.ac.il 323750000000 12132807 n.a gw-3.ccc.ucl.ac.uk 94110000 10555968 n.a se01.grid.auth.gr ………..

lcg-infosites: Examples (II)‏ > lcg-infosites –-vo biomed ce –-is topbdii.grif.fr lcg-infosites --vo biomed ce #CPU Free Total Jobs Running Waiting ComputingElement ---------------------------------------------------------- 22 12 0 0 0 pearl.amu.edu.pl:2119/jobmanager-lcgpbs-biomed 12 12 0 0 0 ce.egee.di.uminho.pt:2119/jobmanager-lcgpbs-biomed 76 5 0 0 0 lcg38.sinp.msu.ru:2119/jobmanager-lcgpbs-biomed 1608 728 0 0 0 grid10.lal.in2p3.fr:2119/jobmanager-pbs-biomed 1116 7 326 326 0 gridce.pi.infn.it:2119/jobmanager-lcglsf-grid4 552 319 224 224 0 svr021.gla.scotgrid.ac.uk:2119/jobmanager-lcgpbs-q3d 156 133 0 0 0 lcgce0.shef.ac.uk:2119/jobmanager-lcgpbs-biomed 830 491 210 1 209 ce06.pic.es:2119/jobmanager-lcgpbs-gshort 22 20 0 0 0 ce001.grid.uni-sofia.bg:2119/jobmanager-lcgpbs-biomed 26 26 3 2 1 scaicl0.scai.fraunhofer.de:2119/jobmanager-lcgpbs-biomed 356 335 0 0 0 egeece01.ifca.es:2119/jobmanager-lcgpbs-biomed 204 45 0 0 0 dgc-grid-44.brunel.ac.uk:2119/jobmanager-lcgpbs-biomed 34 28 1 1 0 ce1.egee.fr.cgg.com:2119/jobmanager-lcgpbs-biomed 118 105 0 0 0 ce01.marie.hellasgrid.gr:2119/jobmanager-pbs-biomed ……

Exploitation et Système d’information GOC DB Référenciel de tous les sites de LCG/EGEE l’URL LDAP du Site BDII de chaque site Le statut/type (Certified/Production) de chaque site La déclaration éventuelle de « Scheduled Downtime » … Utilisable pour générer automatiquement la configuration des Top BDIIs avec la liste des sites déclarés en « Production » http://grid-deployment.web.cern.ch/grid-deployment/gis/lcg2-bdii/dteam/lcg2-all-sites.conf GOC DB HTTP Config URL SiteBDII1 URL SiteBDII2 … BDII

Exploitation et Système d’information Monitoring SAM (Service Availibility Monitoring)‏ https://lcg-sam.cern.ch:8443/sam/sam.py système soumettant régulièrement des tests sur les sites Le résultat des tests est utilisable pour filtrer les Top BDIIs en supprimant les sites en échec. Vue d’ensemble: infrastructure Grille: http://gridmap.cern.ch/gm/

Exploitation et Système d’information l’Accounting

Conclusions Le SI LCG/EGEE fournit les informations nécessaires à l’utilisation des ressources/services de la grille Pour les utilisateurs Pour les services de grille ~200 sites sont ainsi publiés Il est organisé autour d’une architecture à 3 niveaux de serveurs LDAP Resource BDII  Site BDII  Top BDII Utilise un modèle de données défini par le GLUE Schema Attention aux temps de latence liés à l’accumulation de cache Criticité du SI Stabilité en progression : répartission des Top BDIIs par ROC (fédérations)‏