Sujet 1 : Wrapper stats sur les jeux de données ARN non codants

Slides:



Advertisements
Présentations similaires
Developpement Process « Coding party !! » Tony Carnal Altran.
Advertisements

Le débogage Semaine 12 Version A15. Plan de leçon - Débogage  Commentaire javadoc  Définition  Fonctionnement  Point d’arrêt  Exécution  Contrôler.
Catalog fonctionne sur vos données Catalog est préconfiguré pour fonctionner directement avec les données – WinBooks Accounting – WinBooks Logistics –
GCstar Gestionnaire de collections personnelles Christian Jodar (Tian)
Welcome présente la solution IsiReport ADM rue Gabriel COLOMBES.
1 Chapitre 2 La numération binaire. 2 Chapitre 2 : La numération binaire Introduction 1 - Le système binaire 2 - La conversion des nombres entiers 2.1.
TP 7 : UNE PROPRIÉTÉ DES ONDES, LA DIFFRACTION BUSQUET Stéphane LENNE Karl-Eric TS Physique-Chimie.
DAS Multi-détecteur Expérience Principale Détecteur 1 Détecteur 2 Détecteur N Chassis1 : Gamer Chassis2 : Gamer MUST2Système X Description de configuration.
1 Le stage informatique de Masters APIM et PIE (2012/2013) Ivana Hrivnacova Vincent Lafage Basé sur le stage informatique du LAL et IPN par (2005/2006):
Portage d'une application sur GPU CreditCruncher.
Utilisation du logiciel EduStat © Construire une épreuve.
12 Apprendre à rédiger Voici l’énoncé d’un exercice et un guide (en orange) ; ce guide vous aide : pour rédiger la solution détaillée ; pour retrouver.
Banques – 25 mai 2016.
Le logo.
Utilisation du logiciel EduStat©
Révision – mathématiques 8
I- ANALYSE DU BESOIN / Plan
Exploitation de logiciels :
SanMarco – Outil MicroStrategy Manuel d’utilisation sur les fonctionnalités 27 juillet 2015.
Sujet 1 : Wrapper stats sur les jeux de données ARN non codants
Les chromosomes Dr K Sifi Faculté de médecine UC3
Visite guidée - session 3 Les postes de charge et les gammes
Gestion de version centralisée et décentralisée
Sous menu de l’application «micro» (‘IHM’)
Chapitre 1 Généralités sur les données
Loi Normale (Laplace-Gauss)
Javadoc et débogueur Semaine 03 Version A17.
Centralisation de logs
3ème Livre 1 Rappel.
Sujet 1 : Wrapper stats sur les jeux de données ARN non codants
Javadoc et débogueur Semaine 03 Version A16.
Ce document est un exemple de présentation
Comptage unique dans les tableaux croisés dynamiques
D3 – Produire, traiter, exploiter et diffuser des documents numériques
Séance n°2 Changer l'arrière-plan d'une diapo par une image
Construire un GANTT.
Guide n°1 Formation initiale
Thème 5 : Mesures. Cours 1 : L’heure (1).
Des outils pour le développement logiciel : Make
Modélisation avec UML 2.0 Partie II Diagramme de classes.
Plus de 4000 langages....
Comment réussir son diaporama
1 Copyright © 2004, Oracle. Tous droits réservés. Extraire des données à l'aide de l'instruction SQL SELECT.
Guide n°1 Formation initiale
Les réparations Par.
Les méthodes non paramétriques
Séminaire nouveau BTS ELECTROTECHNIQUE
TP 4 Correspondance gène/protéine.
Révision – mathématiques 8
Module bibliothèques numériques : le format PDF
SyncoTM 200 Fonctionnement et mise en service
Pour faire des sondages en cours de séance.
Reconstitution de paléoclimats grâce à la palynologie:
Transition vers l’assignation automatique des stages à la résidence
L’analyse de la valeur des projets informatiques
Expression du Génome Le transcriptome.
Tableaux Cours 06.
Tableaux croisés dynamiques sous Excel: des outils simples pour une analyse rapide de jeux de données en cytométrie Camille SANTA MARIA Ingénieur d’étude.
Projet Logimage ESP Dakar Janvier 2019 Alain Faye
Extractions personnalisées
Ecriture de pipelines pour la recherche de néo-épitopes tumoraux
Tableaux croisés dynamiques sous Excel et Tableau Software :
REPRESENTATION GRAPHIQUE D ’UNE FONCTION AFFINE
Création d’un outil d’aide à la composition de cours
Révision – mathématiques 8
Tableau de bord d’un système de recommandation
INTELLIGENCE ARTIFICIELLE
Module bibliothèques numériques : le format PDF
La programmation dynamique
Transcription de la présentation:

Sujet 1 : Wrapper stats sur les jeux de données ARN non codants 2018/5/30 2018/5/30 Sujet 1 : Wrapper stats sur les jeux de données ARN non codants Générer des statistiques de comptage sur des jeux de données de sRNAseq. Les sorties seront des graphiques et des tableaux. Exemples de statistiques - qualité des données à chaque position, avant et après nettoyage des adaptateurs, - distribution de la taille des reads nettoyées des adaptateurs, avec ou sans redondance, taille en abscisse et nombre en ordonnées, - autres indicateurs à chercher par vous -même. Le wrapper Galaxy devra générer un fichier html en output avec un ensemble de graphiques HighCharts (graphiques dynamiques) et des tableaux de données (json html, fichier tabulé à téléchargé ou option HighCharts). Vous serez évalués sur le bon fonctionnement du wrapper, la clarté du rapport rendu, la richesse informative du rapport statistique, l'intégration du wrapper dans l'instance de tests, le README lié à l'installation du wrapper sur une instance Galaxy, la documentation utilisateur ainsi que la partie commentaire de l'outil ... et, bien-entendu, du code. 1 1

2018/5/30 2018/5/30 Sujet 2 : Wrapper jVenn A partir de données nettoyées, alignées et assemblées en loci, générer un diagramme jVenn illustrant les annotations des loci obtenues. Les banques de données utilisées pour réaliser ces annotations seront miRBase, Silva et GtRNAdb, RFAM tRNA, RFAM snoRNA et RFAM snRNA. Le graphique jVenn représentera pour chaque famille le nombre de loci annotés uniquement dans cette famille et à l'intersection des familles, le nombre de loci qui partagent des annotations différentes. Le wrapper Galaxy devra générer un fichier html en output avec un diagramme jVenn ainsi que des tableaux de données position/annotation. Vous serez évalués sur la clarté du rapport rendu, le bon fonctionnement du wrapper, l'intégration du wrapper dans l'instance de tests, le README lié à l'installation du wrapper sur une instance Galaxy, et la documention utilisateur ainsi que la partie commentaire de l'outil ... et, bien-entendu, du code. 2 2

Sujet 3 : Pipeline sRNAseq 2018/5/30 2018/5/30 Sujet 3 : Pipeline sRNAseq Développer un pipeline qui réalise le comptage des reads (brut et RPKM) s'alignant sur le génome (suite de lignes de commande) puis intégration de ces lignes de commande dans un ou plusieurs wrappers Galaxy (à voir en fonction de l'ordre des calculs au sein du pipeline). Les étapes de traitement sont : 1 - alignement des séquences avec Bowtie2 (ne conserver que les lectures qui s'alignent à 1 seul locus), 2 - comptage brut en utilisant l'outil htseqcount sur plusieurs jeux de données (au moins deux), 3- calcul RPKM (à réaliser à l'aide des outils de manipulation de fichiers). Vous serez évalués sur la clarté du rapport rendu, le bon fonctionnement du wrapper, l'intégration du wrapper dans l'instance de tests, le README lié à l'installation du wrapper sur une instance Galaxy, et la documention utilisateur ainsi que la partie commentaire de l'outil ... et, bien-entendu, du code. 3 3

Sujet 4 : Exploration des outils MirDeep2 existants 2018/5/30 2018/5/30 Sujet 4 : Exploration des outils MirDeep2 existants Evaluer le déploiement des deux deux suites sRNAseq actuellement disponibles dans le ToolShed Galaxy US. Installation sur une instance de tests,et proposer et intégrer les modifications nécessaires à leur bonne installation et au bon fonctionnement de ces outils. Vous serez évalués sur la clarté du rapport rendu, le bon fonctionnement des outils dans l'instance de test, le bon fonctionnement du pipeline, le README lié à l'installation du wrapper sur une instance Galaxy, et la documention utilisateur ainsi que la partie commentaire de l'outil ... et, bien-entendu, du code. 4 4

Sujet 5 : Wrapper de génération d'hairpins 2018/5/30 2018/5/30 Sujet 5 : Wrapper de génération d'hairpins Générer des structures secondaires à partir de la lecture majoritaire identifiée à un locus suite à l'alignement. Intégrer les lignes de commande dans un wrapper Galaxy. 1 - En entrée : fichier listant, pour chaque locus, sa lecture majoritaire. 2 - Extraire 80 nucléotides à gauche et à droite. 3 – Nommer les lectures extraites afin de pouvoir les retrouver. 4 - Construire les structures secondaires associées sous forme de structures parenthèsées. Vous serez évalués sur le bon fonctionnement du wrapper, la richesse informative du rapport statistique, l'intégration du wrapper dans l'instance de tests, le README lié à l'installation du wrapper sur une instance Galaxy, et la documention utilisateur ainsi que la partie commentaire de l'outil ... et, bien-entendu, du code. 5 5

2018/5/30 2018/5/30 Sujet 6 : Wrapper listant les structures secondaires parentèsées qui se replient en tiges boucles. Générer des hairpins à partir d'alignement et intégrer ces lignes de commande dans un wrapper Galaxy. 1 - En entrée : structures secondaires sous forme parenthèsée. Ce fichier est par exemple le fichier de sortie du sujet 5 précédent et le fichier des lectures majoritaires ayant permis de les générer. 2 – Evaluer les structures secondaires parenthèsées pour ne conserver QUE celles qui se replient en tiges boucles et dont la lecture majoritaire couvre 75 % de l'un des brins de la tige. 3 – Intégrer ces lignes de commande dans un wrapper Galaxy. Vous serez évalués sur le bon fonctionnement du wrapper, la richesse informative du rapport statistique, l'intégration du wrapper dans l'instance de tests, le README lié à l'installation du wrapper sur une instance Galaxy, et la documention utilisateur ainsi que la partie commentaire de l'outil ... et, bien-entendu, du code. 6 6

2018/5/30 2018/5/30 Sujet 7 : Assemblage de lectures en contigs et identification de la lecture majoritaire Calculs en ligne de commande puis intégration de ces lignes dans un ou plusieurs wrappers Galaxy (à voir en fonction de l'ordre des calcul au sein du pipeline). Les étapes de traitement sont : A partir des résultats d'alignement disponibles dans un fichier bam, générer les loci résultant des séquences/lectures chevauchantes et identifier dans ces loci la lecture majoritaire. La sortie attendue donnera les caractéristiques de chaque locus (chromosome, positions de début et de fin, brin, positions de début et de fin de la lecture majoritaire sur ce locus , nombre d'occurrences de la lecture majoritaire). Vous serez évalués sur la clarté du rapport rendu, le bon fonctionnement du wrapper, l'intégration du wrapper dans l'instance de tests, le README lié à l'installation du wrapper sur une instance Galaxy, et la documention utilisateur ainsi que la partie commentaire de l'outil ... et, bien-entendu, du code. 7 7