-- 1 --. -- 2 -- DOKEOS Vos traitements bioinformatiques avec GALAXY Sarah Maman – Maria Bernard 11 Février 2014

Slides:



Advertisements
Présentations similaires
Galaxy objectives are : First, making bioinfo Linux tools accessible to biogists. Then, it is possible to add Linux tools by developpers into Galaxy workbench.
Advertisements

Galaxy objectives are : First, making bioinfo Linux tools accessible to biogists. Then, it is possible to add Linux tools by developpers into Galaxy workbench.
Nombre de job slot par machine Server_priv/node. Node1 np=2 Règle de 1 core = 1 job slot = 2 Go. Sur un bi-processeur bi-core on annonce alors np=4 Pas.
GCstar Gestionnaire de collections personnelles Christian Jodar (Tian)
Outil Système Complet d'Assistance Réseau CRDP de l'académie de Lyon Documentation librement inspirée de la présentation.
Ghost (Création d'image Système)‏ C.R.I.P.T Informatique (BOYER Jérôme)‏
DOKEOS Vos traitements bioinformatiques avec GALAXY Maria Bernard – Sarah Maman – Ibouniyamine Nabihoudine 5 Février 2014
20/09/2016DRT du CRDP de l'Académie de Lyon1 EOLE - SCRIBE Votre nouvelle organisation du réseau informatique pédagogique ● DRT : Département Ressources.
Logiciel Assistant Gestion d’Événement Rémi Papillié (Chef d’équipe) Maxime Brodeur Xavier Pajani Gabriel Rolland David St-Jean.
LES FONCTIONS D'UN SYSTEME D'EXPLOITATION ● Le système d'exploitation contrôle entièrement les ressources matérielles locales. ● Il est responsable de.
Messagerie Open Source à la DGCP Implémentation réalisée par IBM et Pilot Systems Sylvain Viollon.
Créer un site Web avec Eva Spip Première approche B. Gugger – Mars 2006 – Département RTC.
Séminaire Novembre 2006 Serveur pédagogique : Scribe.
DOKEOS Vos traitements bioinformatiques avec GALAXY Maria Bernard – Laurent Cauquil - Sarah Maman – Ibouniyamine Nabihoudine 5 Février.
Cetiad - Sicep Mars Généralités ➢ Organisation de l'assistance dans l'académie de Dijon ➢ Architecture réseau des établissements ➢ Présentation.
VHFFS : Enlarge your hosting Sylvain Rochet Samuel Lesueur Cette présentation est sous contrat Paternité-Partage des Conditions Initiales à l'Identique.
1 Observer le paramétrage d’un réseau. 2 Dans notre réseau téléphonique habituel, les postes, reliés à un auto-commutateur... …peuvent dialoguer, car.
Février 2006X. Belanger / Guilde Introduction à. Février 2006X. Belanger / Guilde Qu'est ce que Samba ? ● Implémentation libre du protocole CIFS/SMB (client.
15/11/20161DRT du CRDP de l'académie de Lyon Eole – Scribe Votre nouvelle organisation du réseau informatique pédagogique DRT : Département Ressources.
1 Identifier les composants d’un réseau local. 2 Les composants d’un réseau Des ordinateurs, appelés stations... …munis d’une carte réseau leur permettant.
L’intérêt de sauvegarder certaines données stockées localement sur les postes clients est souvent trop sous-estimée par nos utilisateurs. Casse matérielle,
A partir du 1er mars 2016 : 2 offres
2017/10/1 2017/10/1 Galaxy objectives are : First, making bioinfo Linux tools accessible to biogists. Then, it is possible to add Linux tools by developpers.
2017/10/6 Galaxy objectives are : First, making bioinfo Linux tools accessible to biogists. Then, it is possible to add Linux tools by developpers into.
Master II BioInfo - Galaxy – Session Décembre 2016
Outils (MailIntegration et autres)
2017/10/23 Galaxy objectives are : First, making bioinfo Linux tools accessible to biogists. Then, it is possible to add Linux tools by developpers into.
Master II BioInfo - Galaxy – Session Sept 2017
Micro Informatique au Cellier
Mise en place d’un système de partage de fichiers
Outil Système Complet d'Assistance Réseau
Qu’est-ce un serveur de messagerie?
LimeSurvey : Logiciel Open Source pour réaliser des enquêtes
Formation « Administrateur ATRIUM »
Phishing : Techniques et sensibilisation
Pack business Entrepreneurs intégral max la solution tout en 1 !
de la productivité individuelle au travail collaboratif
Galaxy objectives are : First, making bioinfo Linux tools accessible to biogists. Then, it is possible to add Linux tools by developpers into Galaxy workbench.
Quels outils collaboratifs pour mon association ?
Quels outils collaboratifs pour mon association ?
Présentation Scribe NG Serveur pédagogique.
Séminaire EOLE Beaune Septembre 2007
Installation et Configuration Internet Information Server (IIS 5)
Centralisation de logs
Batterie TSE.
Pack business Entrepreneurs intégral la solution tout en 1 !
Module S41 Chapitre 9  Configuration de Microsoft Windows 7 pour fonctionner sur des réseaux Microsoft.
E-lyco C’est quoi ?.
CeMEB La plateforme MBB
Présentation OCS-Inventory au LAPP
Séminaire EOLE Beaune Septembre 2007
Programmation système
Pack business Entrepreneurs intégral max la solution tout en 1 !
Le site FORUM liste de diffusion DROPBOX GESTAPRC Travail collaboratif
CeMEB La plateforme MBB
Windows Server 2012 Objectifs
Plus de 4000 langages....
Mise en œuvre d’une solution de portail
Présentation MERCURE t6mercure
Outils et principes de base. Exemple d’application  Gestion de données d’enquête : Interface de saisie en ligne  insère directement les données dans.
Missions Locales Serveur Mutualisé
Un cloud de production et de stockage
Atos, Atos et le poisson, Atos Origin et le poisson, Atos Consulting ainsi que le poisson seul sont des marques déposées d'Atos Origin SA. © 2006 Atos.
Système d’exploitation: Principe IFT6800 – E 2008 Pierre Poulin.
Présentation des services IT
FRAMEWORKS : XMLBEANS / STRIPES
Notions d'architecture client-serveur. Présentation de l'architecture d'un système client/serveur Des machines clientes contactent un serveur qui leur.
Projet CRImage UNIVERSITE STENDHAL GRENOBLE
Implémentation de FTP Rappel sur FTP Relation entre un site Web et FTP
Transcription de la présentation:

DOKEOS Vos traitements bioinformatiques avec GALAXY Sarah Maman – Maria Bernard 11 Février

Equipe “Galaxy project” : Le Center for Comparative Genomics and Bioinformatics - Penn State, Des départements “Biology” et “Mathematics and Computer Science” de l’Université d’Emory. Galaxy Project Anton Nekrutenko Penn State Nate Coraor Penn State James Taylor Emory

Code gratuit et “open source” Une communauté nationnale et internationnale très active : Listes de diffusion (US, FR) Wiki Twitter "Galaxy tour de France" L’instance locale Sigenae de Galaxy : Maintenue par Sigenae. Intégration des outils et scripts “locaux”. → Présentation des particuliarités de l’instance Sigenae. Serveur public ( ): Gratuit Quota limité : pour se familier à l’outil sur des petits jeux de donneés. Données non protégées Une « Galaxy » parmi tant d’autres

Documentation collaborative (wiki) Formations (mise en commun agenda PF) Architecture Intégration d’outils (Tool Shed) Groupe de travail GALAXY IFB

Inutile de savoir : Lancer une ligne de commande Programmer en perl, python, shell … Lancer un script Inutile de s’inquiéter pour son disque dur: Jobs lancés sur un cluster de calculs. Pas d’archivage de fichiers sont votre PC. Inutile d’attendre la fin d’un traitement: Possible de lancer plusieurs jobs en parallèle Partir prendre un café, consulter ses mails,..fermer Internet ! Puis voir les résultats le lendemain matin. Galaxy « la bioinformatique pour tous »

Complémentaire au « cahier de laboratoire » → Retrouver les données, les outils, les références pour la publication …. Manipuler facilement et rapidement les informations de votre fichier. Utiliser des outils bioinformatiques. Construction de workflow résumant l'ensemble des fonctionnalités utilisées. Intégration de nos propres outils (outils très utiles et fréquemment utilisés) → Galaxy devient VOTRE BOITE A OUTILS. Contexte d’utilisation dans un laboratoire

Formulaire de demande de compte: ! Utiliser un mail académique Comment ouvrir un compte sur Genotoul ?

Accès à l’instance Sigenae de Galaxy : Puis renseigner vos login et mot de passe LDAP Genotoul Vos données sont protégées. Vos jobs sont envoyés sur le cluster Genotoul. Inutile de savoir programmer De nombreux outils bioinformatiques sont intégrés dans Galaxy.

Comment fonctionne Galaxy ? Galaxy est installée sur une machine virtuelle qui envoie les calculs à un cluster. Utilisateur de Galaxy Envoi de données Récupération des résultats Serveur Web Galaxy Gestionnaire de tâches Cluster de calculs Envoi les jobs Gère la file d'attente Exécute Cluster de calculs

Limites d’utilisation Les limites et règles d'utilisation sont celles du cluster Genotoul : Temps de calcul: pour l'instant pas limité. Stockage: 1 Tio Les données sont traités sur la partition /work de Galaxy. Fichiers temporaires de calcul Quota utilisateur 1To Partition purgée si les fichiers ne sont pas utilisés depuis plus de 120 jours. Pour les traitements : Sur la workq : 256 slots et 2048G de mémoire / utilisateur Sur unlimitq : 32 slots et 256G de mémoire / utilisateur

Analyse en quelques clics sans utiliser votre disque dur !

Analyse en quelques clics sans utiliser votre disque dur !

Analyse en quelques clics sans utiliser votre disque dur !

Analyse en quelques clics sans utiliser votre disque dur !

Analyse en quelques clics sans utiliser votre disque dur !

Analyse en quelques clics sans utiliser votre disque dur !

Analyse en quelques clics sans utiliser votre disque dur !

Exécution de mes jobs et Workflows partagés Analyse en cours Analyse en attente Analyse en erreur Analyse OK

Méthodes d’installation d’une instance Galaxy Instance publique de Galaxy : Sur le serveur public du Galaxy Project : De nombreuses autres instances publiques sont disponibles. Instance « personnalisée » de Galaxy peut-être disponible : Sur un serveur SlipStream : Solution plug-and-play éditée par Galaxy. Aucune installation ni administration nécessaire. En local (sur votre PC) Sur une machine virtuelle Sur le cloud

VirtualBox : logiciel de virtualisation de systèmes d'exploitation. Principales étapes d’installation de Galaxy sur votre vm 1.Préparer votre espace de travail 2.Télécharger les sources de Galaxy (et Mercurial pour gérer les mises à jour du code) 3.Lancer Galaxy 4.Paramétrer Galaxy : universe ini file Intérêts d’une vm 1.Faire fonctionner en simultané plusieurs systèmes d'exploitation 2.Possibilité de cloner une vm => Partage de machines Galaxy 3.vm sauvegardée donc restaurable. Instance Galaxy sur une vm (Ubuntu) ou en local ?

Comparaison des différentes instances En fonction du contexte d’utilisation et des ressources IT disponibles : Source :

Les principaux fichiers de Galaxy Un fichier de configuration de l’instance : universe.ini (paramétrages, configurations, caractéristiques du déploiement). Un fichier de configuration des outils : tool_conf.xml Un fichier pour configurer le lancement des jobs : job_conf.xml Un fichier pour configurer les types de données traitées : datatypes_conf Définir le répertoire de travail dans lequel Galaxy placera les fichiers (tmp, résultats, entrées) : job_working directory

Les étapes d’installation d’un nouvel outil D’où peut provenir un nouvel outil ? 1.Outil de base dans le code de Galaxy 2.Du Galaxy Tool Shed 3.Outil / script maison Etapes d’installation : 1.Développer ou récupérer un wrapper (1 fichier xml + script (s) ) 2.Préciser le chemin d’accès à ce wrapper dans le fichier de conf tool_conf.xml 3.Relancer Galaxy pour que ce nouvel outil soit visible depuis l’interface → Galaxy devient VOTRE BOITE A OUTILS.

Autres outils d’administration : interface Web Users Manage users – Liste des utilisateurs Manage groups – Associer un utilisateur à un groupe Manage roles – Associer un utilisateur à un rôle Data Manage data libraries – Définir les permissions afin de permettre à certains utilisateurs d’accéder à certaines données Server Reload a tool's configuration – Pour rechargé un outil qui a été commenté dans le tool_conf.xml (préférer le terminal) Profile memory usage – Estimer la mémoire utilisée par certaines fonctions de Galaxy Manage jobs – Lister les jobs trop longs (en vu d’un kill)

Bonnes pratiques pour organiser son espace de travail « Problème » : Tests faciles => Multiplication rapide du nombre de fichiers dans les historiques => Surcharge du /work & impact sur le quota. Solutions apportées : Gros avantages à utiliser l’outil d’upload « maison » " Upload local file from filesystem path" plutôt que l'outil "Upload File". Classer vos traitements en créant un nouvel historique par analyse. S’organiser en renommant et taguant vos datasets, historiques & workflows (pour les retrouver facilement et distinguer les tests) Supprimer définitivement (Purge Deleted ) et régulièrement les datasets, historiques et workflows inutiles.

Quelques réflexions pour sécuriser votre instance Deux méthodes pour gérer les utilisateurs Galaxy : Gestion des utilisateurs interne à Galaxy Autoriser un utilisateur à se créer lui-même un compte : allow_user_creation : True Gestion externe des utilisateurs Limiter l'accès uniquement aux utilisateurs ayant un compte INRA LDAP : require_login : True URL en https Proxy & Virtual host

Quelques réflexions autour de la sécurité – Version 2014 Avantages : Lancement des jobs sur le cluster eu nom de l’utilisateur logué sur Galaxy et non au nom de « galaxy » Suivi affiné des quotas, statistiques et des priorités. Inconvénients : Les jobs sont lancés par l’utilisateur connecté avec un sudo. Solutions apportées : Donc la machine et les répertoires de travail sont isolés du reste du cluster. Réservation d’un nœud et d’une queue spécifique sur le cluster.

Merci pour votre écoute