Introduction à la bioinformatique « Génomique Nouvelle Génération » BIOLOGISTE INFORMATICIEN BIF7000 Etienne Lord Lord.etienne@courrier.uqam.ca
Avant-Propos La bioinformatique = L’organisation de séquences biologiques dans des bases de données facilement accessibles. http://www.ncbi.nlm.nih.gov/Genbank/genbankstats.html
Déroulement du cours Les sciences « omiques » La biologie en bref… Les technologies de séquençage Discussion sur le génome à 1000$
Les sciences « omiques » Les sciences « omics » requières des technologies à haut-débit ne recherchant pas la précision/qualité, mais plutôt le nombre de résultats Glossaire anglais disponible à : http://www.genomicglossaries.com/content/omes.asp
Le dogme de la biologie ADN ARNm Protéine Acide DéxoxyriboNucléique Acide RiboNucléique messager ADN ARNm Protéine (structure ou enzyme)
Définitions Séquence: On parle de séquence comme une suite de nucléotides (ADN/ARN) ou d’acide aminées (Protéines) complète ou non Génomique: Étude des génomes, donc de l’ADN structurale et fonctionnelle Transcriptomique: Étude des ARNm d’un tissu Protéomique: Étude des protéines d’un tissu Biome: Étude de l’ensemble des génomes ou des séquences dans un échantillon biologique (eau, sol, tissu)
BIOMES ET SÉQUENCES SITE http://www.sorcerer2expedition.org/version1/HTML/main.htm DATA http://www.ploscollections.org/article/browseIssue.action?issue=info%3Adoi%2F10.1371%2Fissue.pcol.v06.i02
Questions pour un biologiste? Unité fonctionnelle ARNm Préservation de l’information ADN On compare un tissu malade Protéine a un autre On compare un homme a un autre
Le problème Adénine Guanine Thymine Cystosine http://benfry.com/chr22/
Le séquençage (1975-2005) Théorie Normal Modifié
Le séquençage classique (1975-2005) Amplification de fragment d’ADN prédéfinis. On séquence un fragment à la fois. http://www.wellcome.ac.uk/Education-resources/Teaching-and-education/Animations/DNA/WTDV026689.htm
Le séquençage classique (1975-2005) 1975-~2000 2000-2005
Le séquençage nouvelle génération (2005-2008) les taux d’erreurs sont en moyenne 10 fois plus élevés que les méthodes de séquençage en capillaires le type d’erreur varie selon la plate-forme - la quantité extraordinaire de séquences offre la possibilité de générer de l’information de séquence à très grande profondeur, ce qui réduit de beaucoup les taux d’erreurs Nature Biotechnology 26, 1117 - 1124 (2008) 1 2 5 3 4
Discussion sur le génome Prix d’un génome proposé : 1000$ À lire pour le prochain cours: twitter/bif7000 -> Article2.pdf Nombre de nucléotides Temps / gigabases Prix $US / 1000 bases Capillary 1000 500 $0.10 454 450 2 $0.02 Illumina 75 0.5 $0.001 SOLiD 50 http://www.wellcome.ac.uk/News/2009/Features/WTX056032.htm