Sujet 1 : Wrapper stats sur les jeux de données ARN non codants

Slides:



Advertisements
Présentations similaires
Le débogage Semaine 12 Version A15. Plan de leçon - Débogage  Commentaire javadoc  Définition  Fonctionnement  Point d’arrêt  Exécution  Contrôler.
Advertisements

Catalog fonctionne sur vos données Catalog est préconfiguré pour fonctionner directement avec les données – WinBooks Accounting – WinBooks Logistics –
GCstar Gestionnaire de collections personnelles Christian Jodar (Tian)
1 Chapitre 2 La numération binaire. 2 Chapitre 2 : La numération binaire Introduction 1 - Le système binaire 2 - La conversion des nombres entiers 2.1.
Sauvegardes ● Le « workspace » (``'espace de travail''), c'est à dire l'ensemble des variables, a été sauvegardé sur le disque. Cela permet de reprendre.
1 Le stage informatique de Masters APIM et PIE (2012/2013) Ivana Hrivnacova Vincent Lafage Basé sur le stage informatique du LAL et IPN par (2005/2006):
Portage d'une application sur GPU CreditCruncher.
Utilisation du logiciel EduStat © Construire une épreuve.
Banques – 25 mai 2016.
Le logo.
Utilisation du logiciel EduStat©
Révision – mathématiques 8
Exploitation de logiciels :
L’art de dialoguer avec un texte
Environnement du développement de BD ORACLE REPORTS 10g
Les chromosomes Dr K Sifi Faculté de médecine UC3
Visite guidée - session 3 Les postes de charge et les gammes
Gestion de version centralisée et décentralisée
Sous menu de l’application «micro» (‘IHM’)
Javadoc et débogueur Semaine 03 Version A17.
Status logiciel 29 avril 2010.
Le professeur analyse votre travail à travers
La Wallonie monte en ligne
Présentation du B2i école Références : B.O. n° 42 du 16 novembre 2006
Centralisation de logs
3ème Livre 1 Rappel.
Sujet 1 : Wrapper stats sur les jeux de données ARN non codants
Javadoc et débogueur Semaine 03 Version A16.
Sujet 1 : Wrapper stats sur les jeux de données ARN non codants
Ce document est un exemple de présentation
Le carnet de suivi des apprentissages
Comptage unique dans les tableaux croisés dynamiques
Service Statistique.
Construire un GANTT.
Présentation du B2i école Références : B.O. n° 42 du 16 novembre 2006
Thème 5 : Mesures. Cours 1 : L’heure (1).
Des outils pour le développement logiciel : Make
Modélisation avec UML 2.0 Partie II Diagramme de classes.
Calcul Scientifique Initiation à SCILB
1 Copyright © 2004, Oracle. Tous droits réservés. Extraire des données à l'aide de l'instruction SQL SELECT.
Guide n°1 Formation initiale
Les réparations Par.
Les méthodes non paramétriques
Séminaire nouveau BTS ELECTROTECHNIQUE
TP 4 Correspondance gène/protéine.
Module bibliothèques numériques : le format PDF
SyncoTM 200 Fonctionnement et mise en service
Pour faire des sondages en cours de séance.
Reconstitution de paléoclimats grâce à la palynologie:
Les Gratte-ciel.
Noms des membres de l’équipe: Numéro de l’équipe: Groupe:
Transition vers l’assignation automatique des stages à la résidence
BUFFER CIRCULAIRE Meryem EL BAKRI. PLAN Introduction Buffer circulaire Fonctionnement.
PRESENTATION ACCESS Editeur : Microsoft Environnement Windows (SE)
L’analyse de la valeur des projets informatiques
Expression du Génome Le transcriptome.
Tableaux Cours 06.
Tableaux croisés dynamiques sous Excel: des outils simples pour une analyse rapide de jeux de données en cytométrie Camille SANTA MARIA Ingénieur d’étude.
Projet Logimage ESP Dakar Janvier 2019 Alain Faye
Ecriture de pipelines pour la recherche de néo-épitopes tumoraux
Tableaux croisés dynamiques sous Excel et Tableau Software :
REPRESENTATION GRAPHIQUE D ’UNE FONCTION AFFINE
Révision – mathématiques 8
Tableau de bord d’un système de recommandation
INTELLIGENCE ARTIFICIELLE
Module bibliothèques numériques : le format PDF
Les données structurées et leur traitement
Support de formation Administrateur Compétences
Les Commandes de base Linux. 1 L’aide sur les commandes Linux ◦ help : obtenir de l’aide pour une commande interne du shell. Elle permet aussi d'afficher.
La programmation dynamique
Transcription de la présentation:

Sujet 1 : Wrapper stats sur les jeux de données ARN non codants 2017/11/13 2017/11/13 Sujet 1 : Wrapper stats sur les jeux de données ARN non codants Générer des statistiques de comptage sur des jeux de données de sRNAseq. Les sorties seront des graphiques et des tableaux. Exemples de statistiques - qualité des données à chaque position, avant et après nettoyage des adaptateurs, - distribution de la taille des reads nettoyées des adaptateurs, avec ou sans redondance, taille en abscisse et nombre en ordonnées, - autres indicateurs à chercher par vous -même. Le wrapper Galaxy devra générer un fichier html en output avec un ensemble de graphiques HighCharts (graphiques dynamiques) et des tableaux de données (json html, fichier tabulé à téléchargé ou option HighCharts). Vous serez évalués sur le bon fonctionnement du wrapper, la clarté du rapport rendu, la richesse informative du rapport statistique, l'intégration du wrapper dans l'instance de tests, le README lié à l'installation du wrapper sur une instance Galaxy, la documentation utilisateur ainsi que la partie commentaire de l'outil ... et, bien-entendu, du code. 1 1

2017/11/13 2017/11/13 Sujet 2 : Wrapper jVenn A partir de données nettoyées, alignées et assemblées en loci, générer un diagramme jVenn illustrant les annotations des loci obtenues. Les banques de données utilisées pour réaliser ces annotations seront miRBase, Silva et GtRNAdb, RFAM tRNA, RFAM snoRNA et RFAM snRNA. Le graphique jVenn représentera pour chaque famille le nombre de loci annotés uniquement dans cette famille et à l'intersection des familles, le nombre de loci qui partagent des annotations différentes. Le wrapper Galaxy devra générer un fichier html en output avec un diagramme jVenn ainsi que des tableaux de données position/annotation. Vous serez évalués sur la clarté du rapport rendu, le bon fonctionnement du wrapper, l'intégration du wrapper dans l'instance de tests, le README lié à l'installation du wrapper sur une instance Galaxy, et la documention utilisateur ainsi que la partie commentaire de l'outil ... et, bien-entendu, du code. 2 2

Sujet 3 : Pipeline sRNAseq 2017/11/13 2017/11/13 Sujet 3 : Pipeline sRNAseq Développer un pipeline qui réalise le comptage des reads (brut et RPKM) s'alignant sur le génome (suite de lignes de commande) puis intégration de ces lignes de commande dans un ou plusieurs wrappers Galaxy (à voir en fonction de l'ordre des calculs au sein du pipeline). Les étapes de traitement sont : 1 - alignement des séquences avec Bowtie2 (ne conserver que les lectures qui s'alignent à 1 seul locus), 2 - comptage brut en utilisant l'outil htseqcount sur plusieurs jeux de données (au moins deux), 3- calcul RPKM (à réaliser à l'aide des outils de manipulation de fichiers). Vous serez évalués sur la clarté du rapport rendu, le bon fonctionnement du wrapper, l'intégration du wrapper dans l'instance de tests, le README lié à l'installation du wrapper sur une instance Galaxy, et la documention utilisateur ainsi que la partie commentaire de l'outil ... et, bien-entendu, du code. 3 3

Sujet 4 : Exploration des outils MirDeep2 existants 2017/11/13 2017/11/13 Sujet 4 : Exploration des outils MirDeep2 existants Evaluer le déploiement des deux deux suites sRNAseq actuellement disponibles dans le ToolShed Galaxy US. Installation sur une instance de tests,et proposer et intégrer les modifications nécessaires à leur bonne installation et au bon fonctionnement de ces outils. Vous serez évalués sur la clarté du rapport rendu, le bon fonctionnement des outils dans l'instance de test, le bon fonctionnement du pipeline, le README lié à l'installation du wrapper sur une instance Galaxy, et la documention utilisateur ainsi que la partie commentaire de l'outil ... et, bien-entendu, du code. 4 4

Sujet 5 : Wrapper de génération d'hairpins 2017/11/13 2017/11/13 Sujet 5 : Wrapper de génération d'hairpins Générer des structures secondaires à partir de la lecture majoritaire identifiée à un locus suite à l'alignement. Intégrer les lignes de commande dans un wrapper Galaxy. 1 - En entrée : fichier listant, pour chaque locus, sa lecture majoritaire. 2 - Extraire 80 nucléotides à gauche et à droite. 3 – Nommer les lectures extraites afin de pouvoir les retrouver. 4 - Construire les structures secondaires associées sous forme de structures parenthèsées. Vous serez évalués sur le bon fonctionnement du wrapper, la richesse informative du rapport statistique, l'intégration du wrapper dans l'instance de tests, le README lié à l'installation du wrapper sur une instance Galaxy, et la documention utilisateur ainsi que la partie commentaire de l'outil ... et, bien-entendu, du code. 5 5

2017/11/13 2017/11/13 Sujet 6 : Wrapper listant les structures secondaires parenthésées qui se replient en tiges boucles. Ecrire un programme informatique permettant d'identifier les structures secondaires qui sont de bons candidats « pre-miRNA » à partir d'un fichier contenant la lecture majoritaire ayant permis de générer les deux structures secondaires possibles ainsi que les structures secondaires associées disponibles sous forme parenthésée. Intégrer ce programme dans un wrapper Galaxy. 1 – Evaluer les structures secondaires parenthésées pour ne conserver QUE celles qui se replient en tiges boucles et dont la lecture majoritaire couvre 75 % de l'un des brins de la tige. 2 – Intégrer ces lignes de commande dans un wrapper Galaxy. Vous serez évalués sur le bon fonctionnement du wrapper, la richesse informative du rapport statistique, l'intégration du wrapper dans l'instance de tests, le README lié à l'installation du wrapper sur une instance Galaxy, et la documention utilisateur ainsi que la partie commentaire de l'outil ... et, bien-entendu, du code. 6 6

2017/11/13 2017/11/13 Sujet 7 : Assemblage de lectures en contigs et identification de la lecture majoritaire Calculs en ligne de commande puis intégration de ces lignes dans un ou plusieurs wrappers Galaxy (à voir en fonction de l'ordre des calcul au sein du pipeline). Les étapes de traitement sont : A partir des résultats d'alignement disponibles dans un fichier bam, générer les loci résultant des séquences/lectures chevauchantes et identifier dans ces loci la lecture majoritaire. La sortie attendue donnera les caractéristiques de chaque locus (chromosome, positions de début et de fin, brin, positions de début et de fin de la lecture majoritaire sur ce locus , nombre d'occurrences de la lecture majoritaire). Vous serez évalués sur la clarté du rapport rendu, le bon fonctionnement du wrapper, l'intégration du wrapper dans l'instance de tests, le README lié à l'installation du wrapper sur une instance Galaxy, et la documention utilisateur ainsi que la partie commentaire de l'outil ... et, bien-entendu, du code. 7 7