Bin1002 – Automne 2015 Intégration biosciences/informatique Sylvie Hamel Département d’informatique et de recherche opérationnelle André-Aisenstadt: 3161 sylvie.hamel@umontreal.ca Guillaume Lettre Institut de Cardiologique de Montréal, Faculté de Médecine Guillaume.Lettre@mhi-humangenetics.org http://esilbac1.esi.umontreal.ca/~dbin1002/
Activité Jour Local théorie Mercredi: 10h30-12h30 Z-255 Horaire et locaux: Activité Jour Local théorie Mercredi: 10h30-12h30 Z-255 Travaux pratiques Vendredi: 11h30-13h30 M-625 BIN1002-Université de Montréal Plan de cours 2
Structure et prédiction de gènes Alignement local et global Objectifs: Le cours BIN1002 vise à introduire l’étudiant au domaine de la bioinformatique en y survolant plusieurs thèmes importants. Contenu: Structure et prédiction de gènes Alignement local et global Recherche de similarités Introduction au séquençage de deuxième génération Transcriptomique Médecine personnalisée BIN1002-Université de Montréal Plan de cours 3
Qu’est-ce que la bio-informatique? Champs multi-disciplinaire qui utilise des méthodes informatiques (mathématiques, statistiques, combinatoires…) pour résoudre un problème biologique: Formaliser des problèmes de biologie moléculaire; Développer des outils formels; Analyser les données; Prédire des résultats biologiques; Organiser les données. Discipline relativement nouvelle, qui évolue en fonction des nouveaux problèmes posés par la biologie moléculaire. Pas de consensus sur la définition de la bio-informatique. BIN1002-Université de Montréal Plan de cours 4
Quelques références: Un invité: D. Gusfield, Algorithms on Strings, Trees, and Sequences, Cambridge University Press, 1997. D.W. Mount, Bioinformatics: Sequence and Genome Analysis, Second Edition, Cold Spring Harbor Laboratory Press, 2004. R.D.M. Page et E.C. Holmes, Molecular Evolution, A Phylogenetic Approach, Blackell Publishers, 1998 M. Pop, S.L. Salzberg et M. Shumway, Genome Sequence Analysis: Algorithms and Issues, IEEE, 2002 Etc. Un invité: Sébastien Lemieux (IRCM) – transcriptomique – 28 octobre BIN1002-Université de Montréal Plan de cours 5
Démonstrateur: Robin Milosz Tâches: Travaux pratiques Correction des 2 devoirs Page web Aide à la préparation des fichiers « powerpoint » pour les présentations Disponibilités: sur rendez-vous (email: miloszro@iro.umontreal.ca) BIN1002- Université de Montréal Plan de cours 6
Disponibilité des professeurs: Sylvie Hamel et Guillaume Lettre: sur rendez-vous (via email) STUDIUM (GL) BIN1002- Université de Montréal Plan de cours 7
Plagiat: Pour vos travaux, vous pouvez utiliser tout ce qui est disponible et accessible publiquement en autant que les références utilisées soient proprement citées. Les cas de plagiat seront traités conformément aux règles en vigueur à l’Université de Montréal BIN1002- Université de Montréal Plan de cours 8
Pondération: 20 % 14 octobre Test récapitualtif: Évaluation: 2 devoirs: Pondération: 10 % chacun Discussions permises TP1: - remise de l’énoncé: 18 septembre - remise du devoir: 9 octobre TP2: - remise de l’énoncé: 16 octobre - remise du devoir: 6 novembre Intra: Pondération: 20 % 14 octobre Test récapitualtif: Pondération: 30 % 16 décembre Tout retard dans la remise des travaux entraînera une pénalité de 10% par jour (24 heures). BIN1002-Université de Montréal Plan de cours 9
Évaluation (suite): Présentation: Pondération: 30% Vous devez remettre un résumé de 2 pages + une page de bibliographie du sujet choisi le 16 octobre (10%) Vous devez remettre un plan de votre présentation (première version de votre présentation) (ppt, ps ou pdf) le 9 novembre (5%) La présentation de chaque sujet sera d’une durée de 20 minutes. L’exposé sera suivi d’une dizaine de minutes de questions. (15%) Format: Il est important de préparer un exposé qui couvrira l’aspect biologique, la définition des concepts, les problèmes les plus intéressants liés au sujet choisi et l’apport de la bioinformatique. Conseil: Il est primordial de commencer ce travail dès la semaine prochaine. BIN1002-Université de Montréal Plan de cours 10
Évaluation (suite): Présentation: Préparation: Lecture de la documentation conseillée (articles de revue, chapitres de livre, etc.) Recherche d’informations supplémentaires (web: google, NCBI, parrain) Faire la présentation avec PowerPoint ou Acroread Emprunter un portable à la DGTIC (si nécessaire) BIN1002-Université de Montréal Plan de cours 11
Évaluation (suite): Présentation: Sujets: Calcul moléculaire (SH) Dynamique moléculaire (SH) Génomique Comparative (SH) microARN et détection d’ARN non codants (SH) Phylogénomique (SH) Algorithmes d’identification d’isoformes à partir de données RNAseq (GL) Algorithmes d’alignment pour les courtes séquences de NGS (GL) Bio-informatique et le nuage (“cloud computing”) (GL) Outils de recherche et d’annotation du génome humain: UCSC Browser ou ENSEMBL (GL) Pubmed: votre meilleur ami! (GL) BIN1002-Université de Montréal Plan de cours 12
Calcul moléculaire Utiliser des molécules biologiques (habituellement ADN) pour réaliser des calculs et stocker de l’information 01001110111110 ACGTTGACGTAG BIN1002-Université de Montréal Plan de cours 13
Calcul moléculaire L’espace occupé par une billes représente environ 10 billions de molécules d’ADN Comme toutes ces molécules peuvent travailler en parallèle, on peut en théorie avoir 10 billions de calculs exécutés en même temps dans un très petit espace … BIN1002-Université de Montréal Plan de cours 14
Dynamique moléculaire Simulation d’une molécule dans le temps Pourquoi? - Déterminer la structure des biomolécules Autres méthodes: Crystallographie, Résonnance magnétique nucléaire, etc. http://www.gradschool.usciences.edu/faculty/pophristic-vojislava - Déterminer le mouvement interne des molécules - Structure + dynamique = fonction BIN1002-Université de Montréal Plan de cours 15
Génomique Comparative Définition (wiki): La génomique comparative est l'étude comparative de la structure et fonction des génomes de différentes espèces. Elle permet d'identifier et de comprendre les effets de la sélection sur l'organisation et l'évolution des génomes. Gènes conservés entre l’homme et la souris Nature 409, 860-921(15 February 2001) BIN1002-Université de Montréal Plan de cours 16
Génomique Comparative www.bioalgorithms.info Question: Peut-on expliquer le scénario d’évolution qui a permis ce changement d’ordre et d’orientation des gènes entre ces deux chromosomes? BIN1002-Université de Montréal Plan de cours 17
microARN et détection d’ARN non codant miARN: Historique: Existence rapportée pour la première fois en 1993 RC Lee, RL Feinbaum et V Ambros, « The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14 », Cell, vol. 75, 1993, p. 843-854 Courtes séquences d’ARN simple-brin propre aux cellules euchariotes (~ une vingtaine de nucléotides) Régulateurs post-transcriptionnels capables d’extinction de l’expression d’un gène ARN non condant: ARN issu de la transcription qui ne sera pas traduit en protéine par les ribosomes Exemples: miARN, ARN nucléaire, ARN interférents, etc. BIN1002-Université de Montréal Plan de cours 18
Phylogénie Phylogénie: Étude des relations de parenté entre être vivants Arbre universel du vivant – Haeckel 1866 BIN1002-Université de Montréal Plan de cours 19
Construction d’arbres Méthodes de distances: - Entrée: ensemble de distances (ex: distance d’édition) - Problème: Construire l’arbre de phylogénie en “accord” avec cet ensemble de distances Méthodes de parsimonie: - Arbres qui explique l’évolution des espèces par un nombre minimal de mutations. Méthodes de maximum de vraisemblance: Méthode probabiliste permettant de trouver la séquence de nœuds internes la plus probable BIN1002-Université de Montréal Plan de cours 20
« Genome browser » BIN1002-Université de Montréal Plan de cours 24
PubMed BIN1002-Université de Montréal Plan de cours 23
Bio-informatique et cloud computing BIN1002-Université de Montréal Plan de cours 23
Alignement de courtes séquences d’ADN BIN1002-Université de Montréal Plan de cours 23
Détection d’isoformes par analyse RNA-seq (transcriptomique) BIN1002-Université de Montréal Plan de cours 23