Sujet 1 : Wrapper stats sur les jeux de données ARN non codants 2018/5/28 2018/5/28 Sujet 1 : Wrapper stats sur les jeux de données ARN non codants Générer des statistiques sur des jeux de données Mir. Les sorties seront des graphiques et des tableaux de données/stats. Exemples de statistiques : distribution de la taille des reads, qualité des données, graphique avec la taille en abscisse et le nombre de reads en ordonnées (condensé et non condensé) , autres indicateurs à chercher par vous -même. Le wrapper Galaxy devra générer un fichier html en output avec un ensemble de graphiques HighCharts (graphiques dynamiques) et des tableaux de données. Vous serez évalués sur le bon fonctionnement du wrapper, la richesse informative du rapport statistique, l'intégration du wrapper dans l'instance de tests, le README lié à l'installation du wrapper sur une instance Galaxy, et la documention utilisateur ainsi que la partie commentaire de l'outil ... et, bien-entendu, du code. 1 1
2018/5/28 2018/5/28 Sujet 2 : Wrapper jVenn A partir de données nettoyées, générer un diagramme jVenn entre les banques de données miRBase et Rfam. Sur les lectures uniques, compter le nombre de séquences annottées Rfam, mirBase. Représenter graphiquement ces résultats sous forme d'un diagramme jVenn. Le wrapper Galaxy devra générer un fichier html en output avec un ensemble de graphiques HighCharts (graphiques dynamiques) et des tableaux de données. Vous serez évalués sur le bon fonctionnement du wrapper, la richesse informative du rapport statistique, l'intégration du wrapper dans l'instance de tests, le README lié à l'installation du wrapper sur une instance Galaxy, et la documention utilisateur ainsi que la partie commentaire de l'outil ... et, bien-entendu, du code. 2 2
Sujet 3 : Pipeline sRNAseq 2018/5/28 2018/5/28 Sujet 3 : Pipeline sRNAseq Calculs en ligne de commande puis intégration des ces lignes dans un ou plusieurs wrappers Galaxy (à voir en fonction de l'ordre des calsul au sein du pipeline). Les étapes de traitement sont : alignement unique des séquences avec Bowtie2 (ne conserver que les lectures qui s'alignent à un seul locus), puis comptage htseqcount sur deux jeux de données, et pour finir calcul RPKM (récupérer le nombre de lectures sur la taille de l'échantillon à l'aide des outils de manipulation de fichiers). Vous serez évalués sur le bon fonctionnement du wrapper, la richesse informative du rapport statistique, l'intégration du wrapper dans l'instance de tests, le README lié à l'installation du wrapper sur une instance Galaxy, et la documention utilisateur ainsi que la partie commentaire de l'outil ... et, bien-entendu, du code. 3 3
Sujet 4 : Exploration des outils MirDeep2 existants 2018/5/28 2018/5/28 Sujet 4 : Exploration des outils MirDeep2 existants Etat de l'art des outils sRNAseq existants dans le ToolShed Galaxy. Installation sur une instance de tests, intégration de ces outils dans un pipeline sRNAseq. Vous serez évalués sur le bon fonctionnement du wrapper, la richesse informative du rapport statistique, l'intégration du wrapper dans l'instance de tests, le README lié à l'installation du wrapper sur une instance Galaxy, et la documention utilisateur ainsi que la partie commentaire de l'outil ... et, bien-entendu, du code. 4 4
Sujet 5 : Wrapper de génération d'hairpins 2018/5/28 2018/5/28 Sujet 5 : Wrapper de génération d'hairpins Générer des hairpins à partir d'alignement et intégrer ces lignes de commande dans un wrapper Galaxy. 1 - En entrée : fichier listant les lectures alignées. 2 - Extraire 80 nucléotides à gauche et à droite. 3 – Nommer les lectures extraites afin de pouvoir les retrouver. 4 - Construire les structures secondaires associées sous forme de structures parenthèsées. Vous serez évalués sur le bon fonctionnement du wrapper, la richesse informative du rapport statistique, l'intégration du wrapper dans l'instance de tests, le README lié à l'installation du wrapper sur une instance Galaxy, et la documention utilisateur ainsi que la partie commentaire de l'outil ... et, bien-entendu, du code. 5 5
2018/5/28 2018/5/28 Sujet 6 : Wrapper listant les structures secondaires parentèsées qui se replient en tiges boucles. Générer des hairpins à partir d'alignement et intégrer ces lignes de commande dans un wrapper Galaxy. 1 - En entrée : structures secondaires associées aux lecture alignées nettoyées sous forme de structures parenthèsées. Ce fichier est le fichier de sortie du sujet 5 précédent. 2 – Evaluer les structures secondaires parenthèsées qui se replient en tiges boucles. 3 – Intégrer ces lignes de commande dans un wrapper Galaxy. Vous serez évalués sur le bon fonctionnement du wrapper, la richesse informative du rapport statistique, l'intégration du wrapper dans l'instance de tests, le README lié à l'installation du wrapper sur une instance Galaxy, et la documention utilisateur ainsi que la partie commentaire de l'outil ... et, bien-entendu, du code. 6 6