L’environnement de production WISDOM

Slides:



Advertisements
Présentations similaires
Module Systèmes d’exploitation
Advertisements

Les technologies décisionnelles et le portail
« Les Mercredis du développement » Introduction Office « 12 » Présenté par Bernard Fedotoff Microsoft Regional Director Agilcom.
19 septembre 2006 Tendances Logicielles IBM Rational Data Architect Un outil complet de modélisation et de conception pour SGBD Isabelle Claverie-Berge.
Excel 2007 et les services Excel. Pourquoi Excel ? Outil privilégié danalyse des données issues des bases multidimensionnelles Ergonomie connue des outils.
GEF 435 Principes des systèmes dexploitation Structure des systèmes dexploitation (Tanenbaum 1.7)
- Couche 7 - Couche application. Sommaire 1)Introduction 1)DNS 1)FTP et TFTP 1)HTTP 1)SNMP 1)SMTP 1)Telnet.
Le Grid Computing Par Frédéric ARLHAC & Jérôme MATTERA.
Grid France – CC In2p3 – 19/07/2001 Travaux du WP4
WP10 Vincent BRETON – DataGRID France – Statut du WP10.
LCG DATAGRID - France 8 Juillet 2002 LCG : LHC Grid computing - qui, quoi, quand, comment ? Quoi ? But : préparer l'infrastructure informatique des 4 expériences.
PhyloJava : une application de phylogénie sur la grille DATAGRID
Intégration du système de production LHCb sur la DataGRID V. Garonne, CPPM, Marseille Réunion DataGRID France, 13 fv fév
Framework Avancement au Plan Principales avancées pour les parties Ligand, Sites Actifs et Docking Processus dinstallation de.
Recherche de similarité de séquences à grande échelle S. Penel, P. Calvat, Y. Cardenas LBBE, CCIN2P3 Calculs BLAST intensifs sur la plateforme TIDRA -
XML-Family Web Services Description Language W.S.D.L.
Rassemblement organisé des données en un ou plusieurs fichiers physique Optimisé pour le stockage, la lecture et la modification. 2.
L3 Module Libre Année universitaire Initiation à la Bioinformatique Jean-Michel RICHER.
Sommaire Objectif de Peakup Principes de fonctionnement
Calcul distribué pour l'imagerie médicale
Plan du Cours Définition de la BI Objectif de la BI Fonctionnement d’une plateforme BI Technologies de la BI Composantes de la BI Les caractéristiques.
EGEE is a project funded by the European Union under contract IST Gestion des données David Bouvet CCIN2P3 Présentation faite à partir des.
Plateforme de Calcul pour les Sciences du Vivant Le Système dInformation de gLite.
Des outils pour le développement logiciel
ATLAS Data Challenges. Les Data Challenges (DC) en français Challenges des Données ont pour but de Valider: –le modèle dorganisation et dutilisation des.
1 Grille de calcul et physique des particules Vincent Garonne CPPM, Marseille Novembre 2003 Contenu de la présentation Etat de lart : Grille de calcul.
Présentation de l’outil INDICO
Qu’est ce qu’une grille ?
Integration des pipelines d’analyse
La production informatique sécurisée et simplifiée
1 Spécifications RIMES Workshop Octobre 2005
Le contenu est basé aux transparents du 7 ème édition de «Software Engineering» de Ian Sommerville«Software Engineering» de Ian Sommerville B.Shishedjiev.
EGEE is a project funded by the European Union under contract IST Noeud de Grille au CPPM.
1Auteur : Oleg LODYGENSKY XtremWeb-HEP Atelier Opérations France Grille Lyon – Villeurbanne 13 et 14 octobre.
Résumé CHEP 2010 Distributed processing and analysis Grid and cloud middleware Thèmes : 1.
Déploiement LCG-2 Etat actuel au CC-IN2P3 Fabio Hernandez Centre de Calcul de l’IN2P3 Lyon, 22 juillet 2004.
Réunion calcul simulations GIEC/IPCC - Prodiguer Lundi 23 Mars PRODIGUER un noeud français de distribution des données GIEC/IPCC Sébastien Denvil.
Microsoft Dynamics CRM Online : l’efficacité utilisateur au premier plan
Banques de données en bio-informatique
Transition EGEE SA1 FR vers Opérations France Grille
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks TP Data Management René Météry CS Tutorial.
Citrix ® Presentation Server 4.0 : Administration Module 9 : Déploiement d'applications.
1 Journee gdr COSMAL 27/01/2009 Exécution Distribuée et Agile de Compositions de Services Françoise Baude & Virginie Legrand
21/02/2003DEA DISIC 1 Grid Computing Programming the grid: Distributed Software Components, P2P and Grid Web Services for Scientific Applications Tarak.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Data management David Bouvet IN2P3-CC Clermont.
Gestion des documents internes avec SQL Server 2005 Date de publication : janvier 2006.
SOAP et les RPC XML SOAP WSDL RPC. Rappels sur le XML Langage avec des balises Très lisible Pour stocker des données Séparation entre contenu et présentation.
Yannick Patois _ Journée du Libre _ 1er Novembre n° 1 Datagrid Une grille de calcul sous Linux Yannick Patois.
EGEODE 08/11/2006 Équipe GRID1 EGEODE EGEODE. 08/11/2006 Équipe GRID2 Plan  La géophysique sur la Grille : EGEODE  Partenariat académique  Comment.
LA GRILLE REGIONALE AUVERGRID. Idée de départ IUT Moulins CIRI Clermont-Fd IUT Aurillac IUT Le Puy CIRI IUT Montluçon LPC IUT Vichy OPGC CEMAGREF.
INFSO-RI Enabling Grids for E-sciencE NA4 test Eric Fede on behalf of the team.
Mardi 31 mai 2016 JJS (Java Job Submission) Soumission de jobs sur grille Pascal Calvat Centre de calcul.
EGEE is a project funded by the European Union under contract IST Job Soumission N.Lajili Seminaire Grille-21 Novembre
Mercredi 1er juin 2016 La biologie au centre de calcul Pascal Calvat Centre de calcul.
Plateforme de Calcul pour les Sciences du Vivant V. Breton, LAL, Les grilles, une nouvelle approche des sciences de la vie.
BABAR Georges Vasseur CEA Saclay, DSM/IRFU/SPP Workshop sur l’analyse des données au centre de calcul de Lyon 17 avril 2008.
Mardi 30 mars 2010 Technologies employées par le portail des opérations Cyril L’Orphelin, Olivier Lequeux, Pierre Veyre IN2P3/CNRS Computing Centre, Lyon,
Plateforme de Calcul pour les Sciences du Vivant 1 Grille de calcul et validation des processus EM Geant4/GATE.
INFSO-RI Enabling Grids for E-sciencE Les services d’EGEE Fede Eric Inspirée de la présentation de Frédéric Hemmer JRA1 EGEE 1 st.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Soumission de jobs C. Loomis / M. Jouvin.
INFSO-RI Enabling Grids for E-sciencE Sécurité sur la Grille C. Loomis (LAL-Orsay) Tutorial EGEE Utilisateur (LAL) 8 octobre 2007.
EGEE is a project funded by the European Union under contract INFSO-RI Copyright (c) Members of the EGEE Collaboration Infrastructure Overview.
20-mars-2008Eric Lançon1 Activités ATLAS sur le nuage Français Emprunts a K. Bernardet, C. Biscarat, S. Jezequel, G. Rahal.
EGEE induction course, 22/03/2005 INFSO-RI Enabling Grids for E-sciencE Infrastructure Overview Pierre Girard French ROC deputy.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Monitoring dans EGEE Frederic Schaer ( Judit.
INFSO-RI Enabling Grids for E-sciencE Data management Daniel Jouvenot IN2P3-LAL ORSAY - 02/02/2007.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Session “Site Administrator” Pierre Girard.
C. Loomis (LAL-Orsay) Tutorial EGEE Utilisateur (LAL) 2 février 2007
Fonctionnement de la grille
Les besoins des applications
Transcription de la présentation:

L’environnement de production WISDOM

WISDOM (World-wide In Silico Docking On Malaria) est à l’origine une organisation qui a pour but de prouver la pertinence de l’utilisation de la grille dans la recherche de médicaments contre les maladies négligées 2005 2006 2007 2008 Wisdom-I Malaria Plasmepsin DataChallenge Grippe aviaire Neuraminidase Wisdom-II Malaria 4 targets DataChallenge Diabetes Alpha-amylase GRIDS EUROPEAN PROJECTS INSTITUTES EGEE, Auvergrid, TwGrid, EELA, EuChina, EuMedGrid SCAI, CNU Academica Sinica of Taiwan ITB, Unimo Univ,, LPC, CMBA CERN-Arda, Healthgrid, KISTI Embrace EGEE BioInfoGrid

L’initiative WISDOM LPC Clermont-Ferrand: Biomedical grid SCAI Fraunhofer: Knowledge extraction, Chemoinformatics KISTI Grid technology CEA, Acamba project: Biological targets, Chemogenomics Univ. Modena: Biological targets, Molecular Dynamics Chonnam Nat. Univ. In vitro tests HealthGrid: Biomedical grid, Dissemination ITB CNR: Bioinformatics, Molecular modelling Academica Sinica: Grid user interface Univ. Los Andes: Biological targets, Malaria biology Univ. Pretoria: Bioinformatics, Malaria biology

Les activités de WISDOM Activités de calcul montrer la pertinence de la grille pour la bioinformatique développer un environnement capable de monitorer les déploiements sur grille: l’Environnement de Production Wisdom Fournir la grille aux non-experts Activités biologiques Etablir un workflow de criblage virtuel sur grille Trouver de nouveaux médicaments pour lutter contre les maladies négligées

L’environnement de Production Wisdom Déployer un environnement de monitoring des jobs sur grille de calcul Produire de grandes quantités de données pendant les data challenges dans un temps minimal et en utilisant un minimum de moyens humains Gérer le fait que la grille est hétérogène et dynamique un workflow de grille: soumission de job automatique, gestion des statuts de jobs, récupération des erreurs utiliser les modes push et pull https://sourceforge.net/projects/wisdom-pe/

Wisdom Production environment SEs User Interface Job submission CE & WNs WMS Software WISDOM production system DMS Protein Statistics Job Job status / Resubmission Compounds SRM Statistics Results AMGA 2. Post-Processing WMS: Workload Management System CE: Computing Element SE: Storage Element DMS: Data Management System SRM: Storage Resource Management Inputs Outputs 3. Lab Validation

Push-WPE ->> Pull-WPE Changer le WPE pour améliorer: Flexibilité Efficacité CE & WNs Génération des jobs avec un ensemble de tâches Génération de jobs sans tâches PUSH Job PULL WISDOM production system WISDOM production system Retrouve les informations des tâches AMGA Retroube les tâches et leurs informations

Performances PUSH Malaria I Malaria II Avian Flu Diabetes 41 millions Nombre de dockings années CPU Temps réel CPUs utilisés Quantités de données produites Crunching Factor Efficacité de distribution Modèle Malaria I 41 millions 80 6 sem 1700 1TB 400 25% PUSH Malaria II 142 millions 2,5 mois Jusqu’à 5000 1,6 TB 2000 40% Avian Flu 4 millions 100 1,5 mois 800 GB 900 50 % (>80% DIANE) Diabetes 300, 000 40 2,5 jours 7000 6000 85 % PULL

Apporter la grille aux non-experts WISDOM ENVIRONMENT Complexe et inflexible Pour les gens familiers avec la grille Application de recherche de médicaments 2005-2008 UTILISE LES AVANTAGES DES RESSOURCES DE CALCUL ET DE STOCKAGE DE LA GRILLE Utilisateurs Non-experts Plusieurs outils bioinfos 2008-…

INTERFACE WEB SERVICES Implémentation Moteur de Workflow Portail Web WS Client INTERFACE WEB SERVICES SERVICES WISDOM MIDDLEWARE DE GRILLE RESSOURCES DE GRILLE

Wisdom Production environment FTP HTTP File IS Bio IS WISDOM Information System AMGA Local Data Repository Data Manager Local Data Repository Data Manager Database Service Data Management APIs Client Services Transfer Manager EGEE EGEE DIGITAL RIBBON SE CE SE SE CE CE SE Task Manager OSG Tasks Management APIs Job Manager Job Submitter Data Metadata Jobs

WISDOM data manager Services de haut-niveau pour gérer les données et les métadonnées reliées aux applications et aux tâches Services qui peuvent être utilisés pour déployer et synchroniser des données sur la grille (BD incluses) ensemble d’APIs permettant d’accéder et de requêter les données WISDOM information system Basé sur AMGA DEUX MONDES Infos sur les fichiers Infos Biologiques

WISDOM Information System Data Manager Upload Service File IS Bio IS WISDOM Information System Local Data Repository Biodata APIs Database Service Data Manager File APIs Transfer Manager FTP FTP HTTP HTTP Data Metadata EGEE SE CE DIGITAL RIBBON OTHER GRID

Système de soumission des jobs Retroube les informations du BDII concernant les CD (nombre de CPU, nombre de CPU libres,…) Définit le lancement en fonction des infos du CE Initialise the voms proxy Génère les JDL Soumet les jobss en utilisant la soumission multithreadée Jusqu’à ce que tous les jobs soient done (success): Récupère le statut des jobs en utilisant le checking multithreadé Resoumet les jobs si besoin est Réinitialise le voms proxy si besoin est Met à jour les informations sur AMGA

Interactions du task manager 1 2 Utilisateur - Crée un nouveau service/une nouvelle tâche, spécifie les tags requis Job Liste les softs installés sur les WN (tags) Requête les tâches Task manager Crée un nouveau répertoire de tâche / service Retourne un id de tâche Liste les services possibles en fonction des tags Retourne une tâche 1 2

Processus de soumission de tâches Tool WEB SERVICE Crée et gère les tâches Information System (AMGA) Task Manager Prend une tâche (info sur les programmes et les paramètres) 1 Prend les informations correspondantes 2 6 Stocke les données résultats Supprime la tâche Storage Element 5 Computing Element 3 Prend les packages de programmes correspondant et récupère les données correspondantes 4 Exécute la tâche

Exemple Nom du service : blast.tar.gz Création d’une tâche ~/blast/  répertoire du nom du service ~/blast/createTask  exécutable de création de tâche ~/blast/scripts.tar.gz  scripts d’utilisation d’AMGA ~/blast/blast.sh  shell du service Création d’une tâche ~/createTask –s BLAST –u <username> –c <contrainte> –a <paramètres> les paramètres sont séparés par : ~/createTask –s BLAST –u reichma–c gilda –a seq.fasta:db.fasta Basé sur un fichier shell