-- 1 --. -- 2 -- DOKEOS Vos traitements bioinformatiques avec GALAXY Maria Bernard – Sarah Maman – Ibouniyamine Nabihoudine 5 Février 2014

Slides:



Advertisements
Présentations similaires
Galaxy objectives are : First, making bioinfo Linux tools accessible to biogists. Then, it is possible to add Linux tools by developpers into Galaxy workbench.
Advertisements

Galaxy objectives are : First, making bioinfo Linux tools accessible to biogists. Then, it is possible to add Linux tools by developpers into Galaxy workbench.
Formation des Chefs d’établissement Vague 3 Janvier-Février 2011 – V.0 SAFCO-Mission TICE-IUFM Formation ENT Exploiter les statistiques.
GUIDE TECHNIQUE DE LA COMMUNAUTÉ DE PRATIQUES. STRUCTURE DE LA COMUNAUTÉ DE PRATIQUES La plateforme Communauté de Pratiques est structurée en deux parties.
ENT ENVOLE – Mes Dossiers Académie de la Réunion.
GCstar Gestionnaire de collections personnelles Christian Jodar (Tian)
DOKEOS Vos traitements bioinformatiques avec GALAXY Sarah Maman – Maria Bernard 11 Février 2014
22/10/2011 Inkscape Le dessin vectoriel à portée de tous INKSCAPE Aru2L 22 octobre 2011.
Institut canadien d’information sur la santé Aperçu du Juillet Nouveau Centre d’apprentissage de l’ICIS.
La base de données de jurisprudence francophone.  Juricaf est composé de deux parties : - Le menu de gauche avec les différentes fonctions - La partie.
Présentation de Scribe Votre nouvelle organisation du Réseau Informatique Pédagogique.
Made with OpenOffice.org 1 Travailler en réseau intranet à l'école Un réseau : pourquoi ? Architecture du réseau Partager un dossier Enregistrer en réseau.
DOKEOS Vos traitements bioinformatiques avec GALAXY Maria Bernard – Laurent Cauquil - Sarah Maman – Ibouniyamine Nabihoudine 5 Février.
Utilisation du process marché  l ’objectif est d ’avoir un seul document de référence permettant de maîtriser chaque étape de la commande publique  ce.
Guide de l'enseignant SolidWorks, leçon 1 Nom de l'établissement Nom de l'enseignant Date.
Initiation à QuickPlace, janvier Initiation à QuickPlace n Nature de l'outil n Fonctions de base (lecture, création) n Fonctions de gestionnaire.
Gestion par le super administrateur. Page d’accueil.
GOOGLE MAPS ANDROID API V2. INTRODUCTION TO THE GOOGLE MAPS ANDROID API V2.
Utiliser le nouveau site internet du lycée niort/
Réaliser un CD lecteur de salon (photos ou vidéos) pouvant être lu
FOLIOS Outil support des parcours éducatifs Présentation générale
Cahier des charges.
Les commandes externes
2017/10/6 Galaxy objectives are : First, making bioinfo Linux tools accessible to biogists. Then, it is possible to add Linux tools by developpers into.
Master II BioInfo - Galaxy – Session Décembre 2016
AMUE – SIFAC Gestion des services fait sur SIFAC WEB
Recherche Summon - HINARI (Module 3)
2017/10/23 Galaxy objectives are : First, making bioinfo Linux tools accessible to biogists. Then, it is possible to add Linux tools by developpers into.
ATS8500 Standalone Downloader.
Formation Utiliser l'outil ownCloud
Galaxy objectives are : First, making bioinfo Linux tools accessible to biogists. Then, it is possible to add Linux tools by developpers into Galaxy workbench.
Présentation du site
Séminaire Novembre 2006 Zephir : Déploiement et supervision des serveurs Eole.
Séminaire EOLE Dijon octobre 2010
Guide d’utilisation.
L’essentiel à retenir BUDI - Vision partenaires
Actions de communication pour La convention services climatiques
Réalisation d'agents de surveillance Zephir
Présentation J GUIRANDE.
Support – info Sauvegarde des données locales des postes clients
Le cloud… Pourquoi, comment et budget
PRESENTATION DU NOUVEAU SITE INTERNET
1ers pas des utilisateurs migrés
Vie et mort des comptes utilisateurs
Guide des différences entre les deux versions de l’interface web
PROGRAMMATION INFORMATIQUE D’INGÉNIERIE II
3- Nouvelles pages d’accueil
Environnement de gestion des machines Virtuelles
Package R Markdown: Un outil pour générer des pages html avec R Studio
Guide Utilisateur. Guide Utilisateur.
La facture électronique
Mise en œuvre du programme de spécialité économie approfondie
Integrated Business intelligence
Gilles BADUFLE À partir d’un PPT modifié du C.A.H.M.
Suivi Campagne Principe
MPS Marchés Publics Simplifiés « dites- le nous une fois »
La facture électronique
Communication Assistant V2.0
Présentation générale
Logiciel de présentation
Support de formation Administrateur Entretien individuel
Les différents modes de démarrage de Windows
Structure et Services « STS » Démarrage et Fil conducteur
ManageEngine ADManager Plus 6
03/05/2019 L’organisation et la gestion des fichiers sur le site collaboratif Martine Cochet 2SitePleiadeGestionFichiers.
Support de formation Administrateur Entretiens
Support de formation Administrateur Portail RH
Backup des Postes de Travail
STS Web Services libres Gérer les services libres
GUIDE DE PRISE EN MAIN FRONT OFFICE
Transcription de la présentation:

DOKEOS Vos traitements bioinformatiques avec GALAXY Maria Bernard – Sarah Maman – Ibouniyamine Nabihoudine 5 Février

Plateforme Vos données Historique Workflow Bioinfo Présentation de la plateforme Galaxy. Comment récupérer vos données ? Notions d’outils, d’historique et de workflow. Lancement de traitements bioinformatiques. Guide pour les utilisateurs Galaxy. Vous Galaxy pour vos traitements (bio)informatiques Vidéo disponible sur « sig-learning »

Equipe “Galaxy project” : Le Center for Comparative Genomics and Bioinformatics - Penn State, Des départements “Biology” et “Mathematics and Computer Science” de l’Université d’Emory. Galaxy Project Plateforme Vos données Historique Workflow Bioinfo Vous Anton Nekrutenko Penn State Nate Coraor Penn State James Taylor Emory

Documentation collaborative (wiki) Formations (mise en commun agenda PF) Architecture Intégration d’outils (Tool Shed) Groupe de travail GALAXY IFB Plateforme Vos données Historique Workflow Bioinfo Vous

Une communauté nationnale et internationnale très active : Listes de diffusion (US, FR) Wiki Twitter "Galaxy tour de France" L’instance locale Sigenae de Galaxy : Maintenue par Sigenae. Intégration des outils et scripts “locaux”. → Présentation des particuliarités de l’instance Sigenae. Serveur public ( ): Gratuit et “open source”. Quota limité : pour se familier à l’outil sur des petits jeux de donneés. Données non protégées Une « Galaxy » parmi tant d’autres Plateforme Vos données Historique Workflow Bioinfo Vous

Les biologistes peuvent : Vos données sont protégées (accès LDAP). Lancer des traitements sans Linux, ni programmation, ni qsub. Dupliquer et partager des analyses complètes. Lancer plusieurs traitements en parallèle. Partir, fermer ‘Internet’ …Puis voir ses résultats le lendemain matin. Et ceci de manière très intuitive ! Les bioinformaticiens peuvent : Faire ajouter des outils / WF. Partager des outils (Tool Shed). Partager des traitements. Galaxy « la bioinformatique pour tous » Plateforme Vos données Historique Workflow Bioinfo Vous → Galaxy devient VOTRE BOITE A OUTILS.

Comment fonctionne Galaxy ? Galaxy est installée sur une machine virtuelle qui envoie les calculs à un cluster. Utilisateur de Galaxy Envoi de données Récupération des résultats Serveur Web Galaxy Gestionnaire de tâches Cluster de calculs Envoi les jobs Gère la file d'attente Exécute

Formulaire de demande de compte: ! Utiliser un mail académique Comment ouvrir un compte sur Genotoul ?

Analyse en quelques clics sans utiliser votre disque dur !

Analyse en quelques clics sans utiliser votre disque dur !

Analyse en quelques clics sans utiliser votre disque dur !

Analyse en quelques clics sans utiliser votre disque dur !

Interface divisée en 4 parties : 1 - Liste des outils disponibles. 2 - Visualisation de l’outil utilisé, historique, dataset ou workflow. 3 - Historique ou workflow détaillé. 4 - Menu Interface simplifiée 2 Plateforme Vos données Historique Workflow Bioinfo Vous

Le vocabulaire spécifique à Galaxy TOOL : Outil bioinformatique ou de traitement de fichiers. DATASET : Fichier de données téléchargé dans Galaxy (fichier entrant) ou fichier généré par Galaxy (fichier résultat). HISTORY : Liste des datasets (entrants et résultants) générés par les tools. WORKFLOW : Schématisation des traitements. TOOL DATASET (S) HISTORY WORKFLOW génère Dont la liste forme Plateforme Vos données Historique Workflow Bioinfo Vous

Principaux onglets ANALYSE DATA : Page d’accueil de Galaxy. WORFLOW : Liste des workflows. SHARED DATA : Liste des datasets, historiques et workflows partagés. VISUALIZATION : Outil de visualisation de vos fichiers résultats. USER : Accès à vos historiques et datasets sauvegardés. Plateforme Vos données Historique Workflow Bioinfo Vous

Solution 1 (recommandée si vos fichiers sont dans Genotoul) : « Upload local file from filesystem path ». Solution 2 : « Upload file from your computer, with a copy on server ». L’espace disque utilisé n’est pas celui de votre PC. Vos traitements ne sont pas limités par la capacité de votre PC. 2 méthodes de téléchargement de vos données privées Plateforme Vos données Historique Workflow Bioinfo Vous

Données UCSC, Ensembl, NG6, BIOMART : Téléchargement de données publiques Plateforme Vos données Historique Workflow Bioinfo Vous

Exercice 1 : Connexion à Galaxy, exploration de l’interface, téléchargement de datasets Plateforme Vos données Historique Workflow Bioinfo Vous

Conserver toutes les étapes de vos analyses. Partager vos analyses. A chaque run d’un outil, un nouveau dataset est créé. Les données ne sont pas écrasées. Répéter, autant de fois que nécessaire, une analyse. Gestion de vos historiques Plateforme Vos données Historique Workflow Bioinfo Vous

Historiques sauvegardés, publiés et partagés Plateforme Vos données Historique Workflow Bioinfo Vous L’ensemble de vos historiques sont automatiquement sauvegardés. Vos historiques publiés sont accessibles à l’ensemble des utilisateurs loggés sur Galaxy (Shared Data / Published Histories). Les historiques partagés sont accessibles uniquement à un utilisateur spécifique (Hitory / Option / Histories Shared With Me). Pour partager ou publier un historique : User / Saved histories / Cliquer sur le nom de l’historique / Share ou Publish

Liste des historiques et exécution de mes jobs Plateforme Vos données Historique Workflow Bioinfo Vous Analyse en cours Analyse en attente Analyse en erreur Analyse OK

Depuis une page blanche, vous pouvez concevoir un workflow. Aide : les résultats produits sont typés, il n’est donc pas possible de brancher une dataset sur un mauvais tool ! Créer un workflow Plateforme Vos données Historique Workflow Bioinfo Vous

Depuis votre fenêtre « History », vous pouvez extraire un workflow. Exporter votre historique en workflow. Plateforme Vos données Historique Workflow Bioinfo Vous

Outils de traitement de fichiers Ces outils sont nombreux et constituent une bonne alternative à la ligne de commande. Les traitements sont automatiquement lancés sur Genotoul (qsub). Voici les principaux outils « non bioinfo » proposés : Join (des fichiers lourds), Substract and Group Text Manipulation Filter and sort Convert Formats Plateforme Vos données Historique Workflow Bioinfo Vous

Mapper un FASTQ sur une référence avec BWA. Outils bioinformatiques Visualiser la qualité des données avec FASTQC Report. Visualiser un génome avec UCSC. Plateforme Vos données Historique Workflow Bioinfo Vous

FAQ et formation en ligne Une FAQ et le lien vers « sig-learning » sont disponibles depuis la page d’accueil. Plateforme Vos données Historique Workflow Bioinfo Vous Vos supports sont disponibles depuis : “How to be a good user ?”: Maîtrise de son quota Organisation de son espace de travail Contact:

Comment gérer son compte ? Suppression des datasets, historiques et workflows inutiles. Suppression temporaire / Suppression permanente Plateforme Vos données Historique Workflow Bioinfo Vous

Comment citer Galaxy dans vos publications ? Pour vos publications, citer: Les outils utilisés (nom, version). Le workflow généré. Les références « Galaxy project ». Plateforme Vos données Historique Workflow Bioinfo Vous

En conclusion … GALAXY Simplicité d'utilisation (sans Linux) pour lancer des calculs sur le cluster. Gérer les résultats et traitements d’une ou plusieurs analyses. Partage de vos datasets, historiques et workflows (intra et inter Galaxy). Présentation schématique de vos traitements grâce aux workflows. Possibilité d’ajout de nouveaux outils selon vos besoins. (*Outil Sigenae avec ligne commande)

Exercice 2 : Utilisation d’outils de traitements (bio-)informatiques. Création et partage d’historiques et de workflows. Plateforme Vos données Historique Workflow Bioinfo Vous

Merci pour votre écoute

Trop de datasets dans votre workflow ? Si tout est coché, alors tout se passe comme si rien est coché. Si le dataset n'est pas coché, alors qu'au moins un autre est coché, alors le dataset non coché ne sera pas visible dans l'historique. Sauf si l'utilisateur choisi d'afficher les fichiers cachés, alors, dans cette config uniquement, il pourra le voir. Si un 2ieme (ou plus) dataset est coché, alors il sera visible dans l'historique après analyse.