CHMI 4206 Bioinformatique appliquée Prof: Eric R. Gauthier, Ph.D. Département de chimie et biochimie Université Laurentienne Bioinformatique 1: Bases de données CHMI 4206F - Automne 2010
Stratégies de séquençage de génomes Méthode hiérarchique Méthode « shotgun » CHMI 4206F - Automne 2010 NATURE REVIEWS | GENETICS VOLUME 2 | AUGUST 2001 | 573
Séquence chromosome 1 Nucléotides 1-3060 (sur 247 million!) Annotation: Nombre et nature des gènes? Cadres de lecture ouverts (open reading frames): codent pour les protéines? Séquences de régulation (e.g. promoteurs) Séquences répétées? Fonction des séquences annotées? CHMI 4206F - Automne 2010
Séquençage des génomes CHMI 4206F - Automne 2010
Après le séquençage? Outils nécessaires: Bases de données de séquences. Programmes informatique d’accès et d’analyse de séquences: Accès aux gènes connus Découverte de nouveaux gènes Identification des cadre de lecture ouverts Comparaison de séquences: ressemblance entre gènes/protéines différentes = fonction commune? Phylogénétique Prédiction de la structure des protéines CHMI 4206F - Automne 2010
Bases de données publiques National Center for Biotechnology Information (NCBI): Associé aux National Institutes of Health et la National Library of Medicine (USA) Portail Principal: http://www.ncbi.nlm.nih.gov/ Génomique: http://www.ncbi.nlm.nih.gov/Genomes/ Ensembl: Collaboration entre le European Bioinformatics Institute (EMBL-EBI) et le Sanger Institute Portail principal: http://www.ebi.ac.uk/Databases/ Génomique: http://www.ensembl.org/index.html CHMI 4206F - Automne 2010
NCBI CHMI 4206F - Automne 2010
EMBL-EBI CHMI 4206F - Automne 2010
GMOD CHMI 4206F - Automne 2010
Bases de données publiques Generic Model Organism Database (GMOD): http://www.gmod.org/home UCSC Genome Browser: http://genome.ucsc.edu/ TIGR Comprehensive Microbial Resource: http://cmr.tigr.org/tigr-scripts/CMR/CmrHomePage.cgi CHMI 4206F - Automne 2010
NCBI Entrez-Gene Recherche simple de gènes de gènes connus; Sert de point de départ pour l’accès à une foule d’information sur un gène d’intérêt. CHMI 4206F - Automne 2010
Contenu de Entrez-Gene CHMI 4206F - Automne 2010 D54–D58 Nucleic Acids Research, 2005, Vol. 33, Database issue
NCBI Entrez-Gene Site map: http://www. ncbi. nlm. nih CHMI 4206F - Automne 2010
NCBI Entrez-Gene CHMI 4206F - Automne 2010
NCBI Entrez-Gene Résultat de la recherche Résumé de la séquence; Structure du gène; Bibliographie sommaire Informations d’interaction protéine-protéine Homologie de séquence Phénotypes (mutations, maladies héréditaires, etc) Gene Ontology: Fonction cellulaire Processus cellulaires influencés par cette protéine Composante cellulaire où on retrouve la protéine Voies de signalisation Séquences mRNA (RefSeq) Protéine CHMI 4206F - Automne 2010
Fiche de séquence CHMI 4206F - Automne 2010
Fiche de séquence CHMI 4206F - Automne 2010
Formats de séquences Genebank: Fasta: Importance: certains logiciels/algorithmes ne reconnaissent qu’un seul format de séquence; Logiciel de conversion: ReadSeq Biosequence Format Converter http://iubio.bio.indiana.edu/cgi-bin/readseq.cgi CHMI 4206F - Automne 2010
Accès aux séquences de chromosomes Portail: Entrez Genome http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Genome CHMI 4206F - Automne 2010
Mapviewer Chromosomes humains CHMI 4206F - Automne 2010
Chromosome 1 humain CHMI 4206F - Automne 2010
Légende O: orientation de la séquence sur le chromosome: ↓: brin positif ↑: brin négatif OMIM: Online Mendelian Inheritance in Man HGNC: HUGO Gene nomenclature Committee Sv: Sequence Viewer Pr: Protein Sequences Dl: Sequence Download Ev: Evidence Viewer Mm: Model Maker Hm: Homologene CCDS: Concensus CDS Download/view sequence Maps and Options CHMI 4206F - Automne 2010
Exercice pratique 1 Utilisation de Entrez-Gene Utilisez Entrez-Gene afin de trouver les informations suivantes sur la séquence U90223: Quel est le nom de la protéine correspondante? Quel est la longueur du polypeptide encodé par ce gène? Localisez le cadre de lecture ouvert de cette protéine dans l’ARNm. Quelle est la fonction de cette protéine? CHMI 4206F - Automne 2010
Exercice pratique 2 Syndrome de l’X fragile FMR1: Fragile X Mental Retardation 1 Trouvez les informations suivantes (génome humain): chromosome encodant FMR1 séquence du gène FMR1 séquence en acides aminés de FMR1 l’organization du gène (exons/introns) l’homologue de FMR1 chez le poulet CHMI 4206F - Automne 2010
TIGR - CMR Portail: http://cmr.tigr.org/tigr-scripts/CMR/CmrHomePage.cgi CHMI 4206F - Automne 2010
Exercice pratique 3 Génomes bactériens À partir du site CMR de TIGR, trouvez le génome de E. coli K12: Trouvez la liste de tous les gènes de E. coli K12; Trouvez la fiche signalétique du gène rpmC. Quel est le produit encodé par ce gène? Quelle est la longueur de la protéine encodée par ce gène? Trouvez la séquence en acides aminés et en nucléotides de rpmC. Sur le génome de E. coli K12, quels sont les gènes situés près de rpmC. Est-ce-que l’identité des gènes avoisinant rpmC est logique selon vous? Pourquoi? CHMI 4206F - Automne 2010
Exercice pratique 3 Génomes bactériens CHMI 4206F - Automne 2010
Exercice pratique 3 Génomes bactériens CHMI 4206F - Automne 2010
Exercice pratique 3 Génomes bactériens À partir du site CMR de TIGR, trouvez le génome de E. coli K12: Trouvez la liste de tous les gènes de E. coli K12; CHMI 4206F - Automne 2010
Exercice pratique 3 Génomes bactériens CHMI 4206F - Automne 2010
Exercice pratique 3 Génomes bactériens À partir du site CMR de TIGR, trouvez le génome de E. coli K12: Trouvez la liste de tous les gènes de E. coli K12; Trouvez la fiche signalétique du gène rpmC. Quel est le produit encodé par ce gène? Quelle est la longueur de la protéine encodée par ce gène? CHMI 4206F - Automne 2010
Exercice pratique 3 Génomes bactériens Trouvez la fiche signalétique du gène rpmC. Quel est le produit encodé par ce gène? Quelle est la longueur de la protéine encodée par ce gène? CHMI 4206F - Automne 2010
Trouvez la fiche signalétique du gène rpmC Trouvez la fiche signalétique du gène rpmC. Quel est le produit encodé par ce gène? Quelle est la longueur de la protéine encodée par ce gène? CHMI 4206F - Automne 2010
Exercice pratique 3 Génomes bactériens À partir du site CMR de TIGR, trouvez le génome de E. coli K12: Trouvez la liste de tous les gènes de E. coli K12; Trouvez la fiche signalétique du gène rpmC. Quel est le produit encodé par ce gène? Quelle est la longueur de la protéine encodée par ce gène? Trouvez la séquence en acides aminés et en nucléotides de rpmC. Sur le génome de E. coli K12, quels sont les gènes situés près de rpmC. Est-ce-que l’identité des gènes avoisinant rpmC est logique selon vous? Pourquoi? CHMI 4206F - Automne 2010
Devoir #1 CHMI 4206F - Automne 2010