La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

2004, lodyssée des génomes Enjeux scientifiques, médicaux et éthiques Amos Bairoch; Institut Suisse de Bioinformatique (ISB) Groupe Swiss-Prot Genève –

Présentations similaires


Présentation au sujet: "2004, lodyssée des génomes Enjeux scientifiques, médicaux et éthiques Amos Bairoch; Institut Suisse de Bioinformatique (ISB) Groupe Swiss-Prot Genève –"— Transcription de la présentation:

1 2004, lodyssée des génomes Enjeux scientifiques, médicaux et éthiques Amos Bairoch; Institut Suisse de Bioinformatique (ISB) Groupe Swiss-Prot Genève – 3 Février 2004

2 Institut Suisse de Bioinformatique (ISB) Fondation à but non-lucratif créée le 30 mars 1998; Associé à de nombreux partenaires académiques (Universités, écoles polytechniques) et instituts de recherche (ISREC, Ludwig); Recherche, enseignement, développement et prestations de services en bioinformatique; Initialement situé à Genève et Lausanne. Depuis 2002 aussi à Bâle; Dix groupes, ~130 chercheurs en

3 Vue « chimique » et « alimentaire » des constituants du vivant Au niveau moléculaire: –Eau; –Sels minéraux et métaux; –Lipides; –Sucres: monosaccharides (exemple: glucose); oligosaccharides (exemple: cellulose); –Acides nucléiques (=ADN et ARN); –Protéines Les oligosaccharides, acides nucléiques et protéines sont des macromolécules

4 Les acides nucléiques Des chaînes composées de quatre types de nucléotides; Un nucléotide est formé dun sucre (ribose dans ARN et deoxyribose dans ADN), dun groupe phosphate et dune base; Les 4 types de bases sont: Adénine (A), Cytosine (C), Guanine (G) et Thymine (T); LADN forme souvent des double brins (double hélice) par complémentarité; Support de linformation génétique ACGTATGTATCGTGTATGACGTATATGTCATGATGTGA

5 Les protéines Des chaînes composées de 20 types dacides aminés qui ont des caractéristiques physico-chimique distinctes; Séquences de taille variable: de 10 à 10,000 a.a; 4,000 protéines différentes chez une bactérie; plus de 20,000 chez lêtre humain; Les protéines forment des structures tridimensionelles complexes; Des fonctions très variées: structure (collagène); transport (hémoglobine); hormone (insuline); enzyme (trypsine), etc. Met-Ser-Ala-Thr-Arg-Arg-Lys-Ala-Val-Phe-Pro-Ser-Thr-Ile-Tyr M S A T R R K A V F P S T I Y

6 Séquence dune protéine Structure dune protéine

7 Dogme central Le "dogme central", introduit par Francis Crick (co-découvreur de la structure de l'ADN) à la fin des années 50, veut que chez tous les êtres vivants, l'information ne soit transmise que dans un sens: de l'ADN, où repose l'information, à l'ARN, une structure transitoire permettant sa transmission à une machine de traduction, aux protéines, les constituants de base qui font fonctionner la cellule et l'organisme entier.

8 Code génétique universel Le code génétique est le système de correspondance permettant au message génétique (acides nucléiques) d'être traduit en protéine par une cellule. A chaque séquence de 3 bases consécutives (codon) portées par l'ARN messager, correspond un acide aminé donné et un seul. Il y a 64 combinaisons codon-acide aminé possibles pour 20 acides aminés seulement. Un même acide aminé peut donc être codé par plusieurs codons différents: on parle de "code dégénéré". Mais il existe des exceptions au code génétique «universel»; certains organismes utilisent des variantes de ce code!

9 Quelques definitions LADN est organisé en gènes; Lensemble des gènes forme le génome dun organisme; La discipline qui a comme champ daction létude des gènes est appelée génomique. La plupart des gènes codent pour des protéines; Lensemble des protéines exprimées par un organisme est appelé son protéome; La discipline qui a comme champ daction létude des protéines est appelée protéomique. La génomique et la protéomique font partie de la biologie moléculaire («wet lab»). On utilise linformatique pour étudier les séquences et les structures de lADN et des protéines; on parle alors de bioinformatique («dry lab»).

10 Les «iques» Génomique Transcriptomique Protéomique Métabolique Bioinformatique Mais aussi biomique, cellomique, crystallomique, diagnomique, epigénomique, glycomique, immunomique, interactomique, métabonomique, opéromique, pathogénomique, phénomique, physiomique, protéomatique, régulomique, gènomique structurelle et la toxicomique! Retrouvez tous ces héros dans ma prochaine aventure!

11 Quelques clefs pour comprendre le pourquoi et le comment de ces «iques» Aucune de ces techniques ne peut exister par elle-même, elles sont complémentaires; Chacune produit des résultats expérimentaux qui permettent dappréhender une partie spécifique des processus moléculaires du monde vivant; Aujourdhui lactivité majeure dans ces domaines scientifiques est la production massive de données. Il sagit dune industrialisation du travail de laboratoire; Qui dit «données» implique lutilisation de la bioinformatique pour stocker et analyser ces informations!

12 De nombreuses techniques expérimentales produisent une vaste quantité dinformation

13 Bioinformatique moléculaire: une définition Les applications de linformatique à la biologie moléculaire Et plus particulièrement létude de macromolécules telles que les protéines, les acides nucléiques et les oligosaccharides (sucres)

14 La bioinformatique: banques de données et logiciels De nombreuses banques de données: plus de 1,000. De taille et dimportance très variable; Des outils logiciels pour analyser ces données. Beaucoup de programmes pour analyser les séquences dADN et de protéines et les structures 3D; Une différence essentielle par rapport à un domaine tel que la chimie: la très grande majorité des resources sont gratuites et disponibles sur le web; Problème: la pérennité du financement de ces resources. Structure 3D de la protéase du virus HIV-1 avec un inhibiteur

15 La chance dêtre bioinformaticien en 2004 Nous avons le privilège dêtre les généralistes du monde «biomoléculaire»; Un groupe de recherche connaît généralement parfaitement lensemble des données concernant un groupe de gènes et de protéines; Nous avons une connaissance très superficielle de lensemble des gènes et génomes et ceci à une époque où chaque jour apporte son lot de découvertes; Des avancées technologiques ont permis de multiplier la vitesse de séquençage des génomes par un facteur 1,000; Nous sommes la première génération qui a la possibilité de comprendre les mécanismes du vivant et lhistoire de la vie.

16 Donc…. Cette discipline aide à comprendre la signification de certaines des données obtenues à laide des iques; La bioinformatique est un composant clef dans le processus de découverte des mécanismes du vivant.

17 Bref historique des données biomoléculaires 1953: Découverte de la double hélice dADN (Franklin, Crick, Watson) 1954: 1ère séquence dune protéine (insuline; Sanger) 1958: 1ère structure dune protéine par rayons X (myoglobine; Kendrew) 1972: Premier séquençage dADN 1977: Techniques de séquençage rapide de lADN (Gilbert et Sanger!) 1986: PCR (la photocopieuse du biologiste!) 1992: Séquence du chromosome III de la levure (3x10 5 pb) 1995: Séquence du génome de la bactérie Haemophilus influenzae (2x10 6 pb) 1999: Séquence du génome dun organisme multicellulaire (Caenorhabditis elegans) (10 8 pb) 2000: Séquence du génome humain (3x10 9 pb) 2001: Démarrage des projets de génomique structurelle 2002: Une quantité significative de données de micro-array (micro- tableaux) devient disponible Jan 2004: 140 génomes microbiens et 20 génomes eukaryotes

18 Plus de 50% de linformation biomoléculaire disponible aujourdhui a été obtenue ces trois dernières années

19 Viroïde 300 Petit phage (virus infectant une bactérie) 2,000 Virus du SIDA 10,000 Virus de lherpes150,000 Mycoplasma genitalium (bactérie parasite)600,000 Bactérie 1 à 13 millions Levuredu boulanger 13 millions Drosophile (mouche) 180 millions Poisson fugu 360 millions Homme 3.2 milliards Pin 68 milliards Salamandre 81 milliards Amibe 670 milliards La taille des génomes (en nombre de bases)

20 Deux observations découlent de la taille des génomes 1) La limite minimale pour un organisme vivant autonome sétablit à environ un million de bases. Il ne sagit pas dune limite «théorique», mais dune constatation découlant de la quantité dADN nécessaire au codage des protéines essentielles à la vie (réplication, traduction, métabolisme, structure, etc.); 2) A partir dune certaine taille il ny a plus de corrélation entre la taille dun génome et la complexité de lorganisme.

21 Mimivirus: le plus grand virus connu actuellement: ~800,000 bases

22 Organisme qui vit en symbiose avec une archée du type Ignicoccus; Trouvée dans des cheminées hydrothermales au nord de lIslande; Se reproduit à une température de 90 degrés; Génome de 490,885 bases; 95% du génome code pour des gènes Une petite archée: Nanoarchaeum equitans

23 CCCCTGACGACCGATTCAAAAACCACTTTCCTCTTTTACGGCGCCCTAGCGCTATGGCGGTGAAGACTGCTTGACATTAACATGCCTGTTGAGGCTAGAGAATCCATGCGAAGGCGGTTCGGAAACTGCTTCGAAGGCGTGGGGTGGTGCGGG GGGTGGGATTTGAACCCACGCAGGCCTACGCCATCGGGTCCTAAGCCCGACCCCTTTGGCCAGGCTCGGGCACCCCCGCACCGTGTAGTCTTTAGGTTTAGCTTTCAGGGTTAAAACGGTTTAACACTCATGAGTATCACTGGGCTGGCTGTG ACTGGGCTCTGCATTCCCGAGGCCATGCTGCCCGTGAGGAATAACGGGTCTGAGGAGCCGTTGACAGGTTGCCATTTGGCCTTGCCCCCAAAAGTGATGCTGTGGATCACGACCTCCTCGGAGGAGGGGAGCCTCAGCATACACTTTATAATG AAGGCTTTAAGGGTTTAGCCGGATAATGTTGTTGGGGCGTGCAGCGGCAAGTGCTGCAGCTCATGGGTATGGTATGCGGCTTTGCCTGGTGATGCGGTTTGGCCCCCGTTGTCTGCGACGTCTGCGGTGTTAGGAGGGCTGTGGTGCTGCAGC GCCACACGGGAAGGCGGCTCTGCAGGGAGTGCTTTAGGGAGGATATAGTGGGGAGGGTCAGGAGGGAGGTTGAGAGGTGGGGGATGATAGGCCCTGGGGAGACGGTCCTCCTAGGCCTGAGCGGCGGTAAGGACAGCTATGTCCTGCTGGACG CCCTCTCCGAGATAGTCGGGCCCTCGAGGCTGGTGGCGGTGTCTATAGTGGAGGGCATACCGGGGTACAACAGGGAGGGAGATATCGAGAAGATCAGGAGGGTGGCCGCGGCTAGGGGCGTCGACGTGATAGTGACGAGCATAAGGGAGTACG TGGGGGCCAGCCTCTATGAGATATACTCCAGGGCCCGAGGGAGGGGGGCGGGCCACGCCGCCTGCACCTACTGCGGCATAAGCAGGAGGAGGATACTTGCCCTCTACGCCCGCCTCTACGGCGCCCACAAGGTCGCTACGGCCCACAACCTCG ACGACGAGGCGCAGACAGCTATAGTGAACTTCCTCAGGGGGGACTGGGTTGGCATGCTGAAAACACACCCCCTCTACAGGAGCGGGGGCGAGGACCTGGTTCCAAGGATAAAGCCTCTTAGGAAAGTCTACGAGTGGGAGACGGCCAGCTACG TGGTACTCCACCGCTACCCCATCCAGGAGGCTGAATGCCCCTTCATAAACATGAACCCAACCCTCAGGGCGAGGGTGAGGACGGCCCTGAGGGTGCTAGAGGAGAGGAGCCCGGGCACCCTGCTCAGGATGATGGAGAGGCTCGACGAGGAGC TGAGGCCGCTGGCCCAGGCCATGAAGCCCTCCTCCCTAGGCAGGTGCGAGAGATGCGGGGAGCCGACCAGCCCGAAGAGGAGGCTCTGCAAGCTCTGCGAGCTCCTGGAGGAGGCCGGGTTCCAGGAGCCCATCTACGCGATCGCAGGGAGAG GCAAGAGATTAAGGCTTCAGAGCCCCACCGCTAGCCCTGGGTGAACGCGCTATGGCAAAGCCAAAGGTTAGCCTGCCGGAGGATGTGGAGCCCCCCAAGGCTATAGTCAAGAAGCCTAGGCTAGTGAAGCTAGGCCCCGTAGACCCGGGGGTC AGGAGGGGAAGGGGGTTCAGCCTAGGCGAGCTCGCGGAGGCTGGGCTAGACGCTAAAAAGGCGAGGAAGCTTGGCCTGCACGTGGACACGAGGAGGAGGACGGTCCACCCGTGGAACGTGGAGGCCCTCAAGAAGTATATAGAGAGGCTTAGA GAGGCGGGCGTAGAGGTCTAGACCCCGGGGCTATATACTACCACTTCGCCCTCCCCATTATACTATCCACATCCACCCTGGCCCTCCCCACCTCCAGGACCTCAATATCCCCCTCAGCCCTGGTGTACACGCTCAAAGACGGCTCCCTGTAGG AGGCCCTGGTCACCACCCCCACGTGAATCACCCCTCCCGCGTGTACGGCGGCTATAAGCCCCCTCTCCCAGCCCTCCCGGAGGACGCGGAGCCCGGAGCCTACTCCGACCCTACCGCCCCTCCTCGCCACAACCACTATGTCCCCGTCAACAC TCTCACCATAGAGGGCGGCTGGGTGTAGGGCCTTGAGGGCCTCGTGGGCCAGAGGCTCCCCCCGGAATATCGGCGCGCCAACTATCTCGGCCTCGCCGGGCCTGACCCTCCTCTCCCTCCCTCCCGAGGTCCTAAGGGCTATCAGCCTCTCCC TATGAAGAGCCCTCTCCCCCCGGCTCTTGCCCGCCTCTCCAGCCAGCCTCTCCACAGACAGAGTGTCAAGCCCCCACACCCTCTCGAGCAGCCTGGCCCGTCGGCTGGCTATGCCCACCGCGACTACAAGCCTTGCTCTAGAGGCTATGGCGA GGGCTGCCTTAGACTCGAGCCCCTCCCACAGTGATATCCAGCCATCTGTATCCACTACCACCTGGCTGGCCAGTGAGGCCAATCTAGATGCGCAGGCGAGGTAGCGGGACTCCGACCCCCGGGGGGTGAAGCCGCCGACGAAACACGGCTCGA CACTCGAGAACGAGTCGTCTAGGCCCGGGACGGCCACGCCCTGTGGAGACGCCAGCGCCATAAACCCCGGGGCGAAGACCTCGTTCTGGCCTATATCCGCCGACAGCAGTCTATACCCACCACCGCCCCTGTTAACTATCCAAGCCGCTAGTG TGCTCTTACCGGAGTCGCTCGGCCCCACAATAGCCACCCTGCCCCGCTGAGAGGCCTCCCTGGCTATGGAGTCGAACCTGTTGTAAGCCTCCTCCACGCCCCCTGTGGAGACTACACCGGACACAATAGCCCTCCCCTCAACCCTGGCGAGCA CCGACCTGCCTGCAGGGACCACTAGAGTAGAGCCCTCCCCCAGCCTTCCACCCAAAACCTCTGCAGCACCCTCTACAACCTCTATCCTCCCCGGGCCGCGGACTAGCGCCGAGCCCCATGCAATCTCCACAGGCAAAGCTTTAAACCCCCAGT GGTAAGATATGTGAACCGGGCCGCGGTAGTATAGCCTGGACTAGTATGCGGGCCTGTCAAGGGCCCCGCCTCCGCCCCACCCTCATTCTACTACACGCTTATCAGGATAAACAGCCGGGCAAACGTTTTTAACCCCGCCGAAATTCATACTCT TCCCGGGGCGGAGGCGGGCCTGCGGAGAGCCCGTGACCCGGGTTCAAATCCCGGCCGCGGCGCCAATAATCCTCGCGGCCCGCCTTCAAGACTCACTAAACCCCGGTTGAGCACCCGCAGCATCGATGCTAAGGCTCGAGCCATGCATAGTGC CCGCGGGGGGTGGGGGGATTTGGCGAGGCCTGTTGAGGCGGTAAAGAGGCTGCTGGAGAGGTGGCTGGAGGGTAGGAGGAGGGGTTATGTCCTTACGCTTGTAGCTCTTAGAAGGCTTGAGGAGAGGGGGGAGGAGGCTACTGTAGAGAGGGT TAGGGAGGAGGGCCTGAGGATTCTGGAGAGGACGGAGGGGAGGATAGACTGGGGTGTTACTAGGGATGAGTACACTGTCAACATGGTCTCCAGCGTTCTTCGCGAGCTGGCCGAGAGCGGCCTTGTCGAGATGGTGGACGGCGGGAGGAGTAT CGTCAGGTACAGGATAGCGAGGGATGCTGAGGAGGAGTTCCTCTCCAGCTTCGGCCACCTCCTGCAGCTTGTGAGGATGCCGAAGTAGCGTTAAAGCCCTAGGTGCCAGAGGCCGCCGGAGGCTAAGAGGCCGATGAAGGCCTTGAGAGGCTC TGCCGCCAAGCTATCCCTATCCCTGCTGCTCTTTTGGGCTAGCTACTCGATCTACTACACTATAACGAGGCGTGCTGTAGAGGAGGGCCTAGGAGAGGGATCCTACCTCCTGGGCGTCTTGATGTCGGGGGCTGAGGAGGCGCCGCTCGCGGC GTCAATAGTCCTTGGCTACCTGGCGGACAGGCTAGGCTACCGCTTACCCCTGGCCCTGGGCCTGTTTGAGGCTGGGCTGGTCGCTGCAATGGCCTTCACCCCCCTAGAGACCTACCCCATACTGGCTGGGGCTGCGTCGCTAGTCTACGCCCT CTCATACTCCGCCCTAATGGGCCTCGTCCTGGGTGAGAGCGGGGGGAGCGGCTTCAGGTACAGTGTTATAGCAGCCTTCGGCAGCCTTGGCTGGGCTCTCGGCGGGTTGGCGGGGGGAGCGGCTTACTCCCGCCTGGGGTCACTGGGGCTCCT AGTGGCCGCAGCCCTCATGGCCGCCTCATACCTAGTCGCCCTCTCAGCCTCGCCCCCCCGCGGCGGCGCGGCGCCCAGTGTGGGGGAGACGATAACCGCTCTGAAGGGGGTTCTGCCCCTATTTGCAAGCCTCTCAACCAGCTGGGCGGCCTT GGGCTTCTTCTTCGGGGCTGCCAGCATAAGGCTTAGCGAGGCGCTCGAGAGCCCTATCGCCTACGGGCTAGTGCTGACCACCGTCCCCGCACTCCTAGGCTTCCTGGCGAGGCCTGCGGCGGGCAGGCTGGTCGACAAGGCCGGGGCTGTGGC AGTGCTTGCGTTGTCCAACGCGGCATACTCCCTTCTCGCCCTAGTTTTCGGCCTGCCCACCAGTCCGGCCCTGCTGGCCCTTGCATGGAGCCTGCCCCTATACCCCTTTAGGGATGCCGCCGCGGCCATCGCAGTTAGCAGCAGGCTTGAGAG GAGGCTGCAGGCGACGGCCGCGGGGCTGCTCTCAGCGAGCGAGAGCGTCGGCGGCGCTGCAACCCTTGCCCTGGCACTGCTCCTGGATGGGGGGTTTAGGGAGATGATGACGGCTTCAATAGCCCTTATGCTCCTCTCCACCCTACTCCTGGC CGCAGACCACTCTACGGCTCCACGCCGAGAGCCCTGTCCCCGGCGTCGCCAAGGCCCGGCACTATGAAGTAGTTCTCGTCCAGCTCGGGGTCTAGGGCTAGCGTGTATATGGGGGTGTCGCCGTAGAGGGATGATATGTACTCGACGCCCTGC CTGGACGCTATTATAGAGCCTATAACGACCTTGCTGGCCCCCCTGTCTCTGGCCAGCCTCACGGCCTCCGCCACAGTCTTGCCCGTGGCCAGCATCGGGTCTAGAACGACGGCGGGGCCGTCGAACATGCGGGGTAGCCTGGAGTAGTAGACC TCTATCTTGAGCCTGCCCGGCTCCTCGACCCTCCTGGCTGCTACGAGGGCTATCCTCGCCTCCGGCATCATCGAGGCGAAACCCTCTACCATGGGGAGGCTAGCCCCGAGTATCCCTACGAGGTAGACGGGCCCCGCTGGCGCCAGCTCCTTG GCCTTAGCCCCCAGGGGGGTCTCCACCTCCTCCTCCACCCACCCGAGCTCGCCCGCAATGTACACCGCCAGTATGGAGCCCGCTATCCTGACGTACCTCCTAAACTCCGGGAACCCGGTTGTCCGGTCCCTGAGAACCTTGAGGACGTAGCGC GCTAGGGGTGTTTCGCCCCCAATAACCCTAACTGCCGCCACCATGGGAACCTCTAGGTAGTGGTTGAGGCTCCGGAGCTTAAGAGGGTTAAACTCCAGGATGGCCACCTGGGTGCCGCCGGGGATTGGACAGTAGGGTTCTAGAGTCCGCGTT GAGAGCCCTATCCCGCTACCCCCTCTGCGACCGCTGCCTCGGCAGGCTCTTCGCTAGGCTTGGGAGAGGCTGGAGCAATAGGGAGCGGGGAGAGGCTGTCAAGAGGGTTCTGGTGATGGAGCTTCACAGGAGGGTCCTCGAGGGGGATGAGGC GGCGTTGAAAACCCTGGTCTCTGCAGCTCCGAACATAGGGGAGGTGGCAAGGGATGTCGTGGAGCACCTCTCCCCAGGTTCCTACAGGGAGGGCGGCCCATGCGCTGTCTGCGGCGGGCGGCTGGAGAGTGTTATAGCCTCAGCGGTGGAGGA GGGGTACAGGCTGCTAAGGGCTTACGATATCGAGAGGTTCGTAGTCGGGGTCCGGCTAGAGAGAGGTGTTGCCATGGCTGAGGAGGAGGTAAAGCTGGCCGCCGGCGCCGGGTACGGCGAGTCCATTAAGGCTGAGATCAGGAGGGAGGTGGG CAAGCTCCTGGTGAGCCGGGGTGGAGTGACCGTGGACTTCGACAGCCCTGAAGCGACCCTAATGGTGGAGTTCCCCGGGGGCGGGGTTGACATACAGGTCAACAGCCTGCTCTACAAGGCTAGGTACTGGAAGCTTGCCAGGAACATAAGCCA GGCATACTGGCCCACGCCAGAGGGGCCGAGGTACTTCAGCGTGGAGCAGGCTCTATGGCCGGTTCTAAAGCTCACTGGGGGGGAGAGGCTGGTTGTACACGCTGCTGGCAGGGAGGATGTAGACGCCAGGATGCTGGGCAGCGGGAGGCCCAT GATAGTCGAGGTCAAGTCGCCTAGGCGCAGGAGGATCCCGCTTGAGGAGCTGGAGGCGGCCGCCAACGCCGGCGGGAAGGGGCTGGTTAGGTTCAGGTTCGAGACGGCTGCCAAGCGTGCCGAGGTCGCGCTTTACAAGGAGGAGACTGCGAG GGTTAGGAAGGTGTACCGCGCCCTGGTAGCGGTGGAGGGTGGTGTTAGTGAGGTGGATGTTGAAGGGTTGAGGAGGGCTCTCGAGGGCGCGGTTATAATGCAGAGGACGCCCTCCAGGGTCCTCCATAGGAGGCCGGATATACTGAGGAGGCG GAGGCTCTACAGCCTAGACTGCAGCCCCCTGGAGGGGGCGCCTCTGATGGAGTGCATATTGGAGGCGGAAGGGGGTCTCTACATCAAGGAGCTGGTCAGCGGTGATGGCGGGAGAACCAGGCCAAGCTTCGCTGAGGTCCTCGGCAGGGAGGC TGTGTGTATAGAGCTCGACGTGGTGTGGGTGGAGCATGAAGCTCCAGCCGCACCCGGCTAAAGCTAAATTAAGCTGGGCTGAGCAAAATACCGGGGGGAGCGTAGGTTGGTCAAGGCACCTAGAGGCTATAGGAACAGGACTAGGAGGCTGTT GAGGAAGCCTGTGAGGGAGAAGGGCAGCATACCCAGGCTCAGCACCTACCTTAGGGAGTACAGGGTGGGCGATAAGGTGGCTATAATCATAAACCCCTCCTTCCCAGACTGGGGCATGCCCCACAGGAGGTTCCACGGGCTGACGGGAACCGT GGTGGGGAAGAGGGGCGAGGCCTACGAGGTAGAGGTCTATCTGGGTAGGAAGAGGAAGACCCTCTTCGTCCCCCCCGTGCACCTCAAACCCCTCAGCACAGCCGCCGAGAGGCGGGGCAGCTAGAGCTGTCCCCACGGTTCCACGCTGGAGTA GGGGGTGCTAGTGTTGGAGAGGAGGATCCTAGAGTATAAGGCGGTGCCCTACCAGGTAGCCAAGAAGTATATGTACGAGAGGGTTAGGGAGGGCGACATAATATCGATACAGGAGTCGACTTGGGAGTACTTCAGGAAGGTAGTGTTCTGGGA CGACCCGGAGGCTGCCTCCGAGCTTGTTGAGGAGATTGTGAAGGAGGGTGTCAGCCGTGAGGCGCGGCGAACATCGCGAGCATATGCCCCAAGACCGAGGGCGAGCTCAGGAGCATTCTCGAGATGGACAGGAGCATAACCTCCGTACACGAG ATGGCTAGCAAACTGTACCCCATAGTTTCCAAATACTGCAAGGACTAGACCCCGCCCCCCTTCAGCCCGGGGATTAACAGTTTAATCTCCGCGTCCCAACCATATTTATGTTGATAGCGGCTGTACGGAGAGTGTTGAGAAGTGTCTAGACAG CCCCGCCCCCGCGACAGGAAGCCCCCCCACCAGGGGAGGCCGCAGCCCCACATCGCCGCCCTTGAGGTGGAGGCTATAGTTCTGGACTACATACCCGAGGGCTACCCGAGAGACCCCCACAGGGAGCACCGCAGTAAGCCCGTCGTTCAGGGT CTCGGGGTTAGGAGGCTGCACCTAGTCGACGGTGTCCCCCTCCATGAGGTCGATATACTGGAGCGGGTCACCCTGGCTAGGGAGGTTGTGTATAGCGTCCCCATAGTGGCCCGGCTCCCCGGGGGGGTCGAGAGGAGGGTGAAAAGTGTTACC GTCGCGGTAACATGCCTCCCCGGCCAGGCGCGGGAGGGCGGGGTCAGGGAGATATACTGCTACCCCCTCTCCTACGCCGACCAGGCGACCCTGGAGGCGCTGCAGCAGCTCCTGGGTGAGGGGGACGAGAGGCACAGGTATATACTTGTGGAC TCCCCCGACAAGCTCTCCGAGGTGGCCAGAGGTCACGGCCTCTCGGGGAAGATAGTGAGCACGCCCAGAGACCCTATATCCTACCAGGACCTCACCGACGTCGCCAGGGCTACGCTGCCGGACGCTGTGAGGAAGCTGGTCAGGGAGAGGGAG GACTTCTTCGTGGAGTTCTTCAACGTGGCCGAGCCGATAAACATAAGGATACACGCGCTGGAGGCCCTAAAGGGTGTGGGTAAGAAGATGGCTAGGCACCTCCTCCTCGAGAGGGAGAGGCGTAGGTTCACGAGTTTCGAGGAGGTGAAGAAG ATTCTGAAGATAGACCCCGCAGAGGCCCTGGCCGAGAAGATAATGGAGGAGATAGAGTGTAGGGACACTGTGAAATACTACTTCTTCGTCGAGCCCTGCGACCCCTCCAAGCCCTACCTAGGCTACACGGAGAGGATGTGGAAGGCCTATGCC Le génome humain est 380,000 fois plus long que la séquence qui est représentée sur cette dia

24 Alphabet Mot Phrase Chapitre Livre Les 4 bases: A, C, G, T Codon (3 bases codant pour un acide aminé) Gène Chromosome Génome Parallèle entre létude des textes et létude des génomes

25 Grammaire et style Le génome de chaque espèce a une grammaire/style spécifique qui dépend de: –La taille du génome; –Le nombre et la topologie des chromosomes; –La composition en bases; –Le pourcentage et la structure des régions non codantes; –La structure des gènes (intron/exons, éléments de régulation, etc.) Comme pour les textes, il est possible de reconnaître un style, dobserver les similitudes entre les «auteurs» (espèces) et même de détecter les plagiats!!

26 Quelques titres évocateurs

27 La diversité biologique On estime de 3 à 30 millions le nombre despèces sur terre; limprécision est inhérente aux méthodes destimation ainsi quau flou quant à la définition de ce quest une espèce 1,8 millions ont été répertoriées Au total, 50 millions despèces auraient vécu sur terre En 2004: 300 génomes (sans compter les virus), plus de espèces sont représentées dans les banques de séquence.

28 Nombre approximatif despèces

29 Contribution relative des différentes formes de vie à la biodiversité totale

30 NEWT

31 Calendrier de la vie sur terre

32 Arbre généalogique dErnst Haeckel (1874)

33 La phylogénie basée sur la comparaison des génomes classe les êtres vivants en trois règnes ou lignées généalogiques: eucaryotes, eubactéries et (archées) archébactéries Savoir dou lon vient permet de mieux comprendre les processus du monde vivant

34 HBA Homme VLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHF-DLSHGSAQVKGHG HBA Chauve-sris VLSSADKTNIKAAWDKVGGNAGEYGAEALERMFLSFPTTKTYFPHF-DLSHGSAQVKGHG HBA Boeuf VLSAADKGNVKAAWGKVGGHAAEYGAEALERMFLSFPTTKTYFPHF-DLSHGSAQVKGHG HBA Cochon VLSAADKANVKAAWGKVGGQAGAHGAEALERMFLGFPTTKTYFPHF-NLSHGSDQVKAHG HBA Alligator VLSMEDKSNVKAIWGKASGHLEEYGAEALERMFCAYPQTKIYFPHF-DMSHNSAQIRAHG HBA Poule VLSAADKNNVKGIFTKIAGHAEEYGAETLERMFTTYPPTKTYFPHF-DLSHGSAQIKGHG HBA Carpe SLSDKDKAAVKGLWAKISPKADDIGAEALGRMLTVYPQTKTYFAHWADLSPGSGPVKKHG *: *: ::. *.. **::* *:: :* :* **.*: ::*.* : :* HBA Homme KKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPAEFTP HBA Chauve-sris KKVGDALTNAVGHLDDLPGALSALSDLHAYKLRVDPVNFKLLSHCLLVTLANHLPSDFTP HBA Boeuf AKVAAALTKAVEHLDDLPGALSELSDLHAHKLRVDPVNFKLLSHSLLVTLASHLPSDFTP HBA Cochon QKVADALTKAVGHLDDLPGALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHHPDDFNP HBA Alligator KKVFSALHEAVNHIDDLPGALCRLSELHAHSLRVDPVNFKFLAHCVLVVFAIHHPSALSP HBA Poule KKVVAALIEAANHIDDIAGTLSKLSDLHAHKLRVDPVNFKLLGQCFLVVVAIHHPAALTP HBA Carpe KVIMGAVGDAVSKIDDLVGGLAALSELHAFKLRVDPANFKILAHNVIVVIGMLYPGDFPP : *:.* ::**:. *. **:***..*****.**::*.:. *... HBA Homme AVHASLDKFLASVSTVLTSKYR HBA Chauve-sris AVHASLDKFLASVSTVLTSKYR HBA Boeuf AVHASLDKFLANVSTVLTSKYR HBA Cochon SVHASLDKFLANVSTVLTSKYR HBA Alligator EIHASLDKFLCAVSAVLTSKYR HBA Poule EVHASLDKFLCAVGTVLTAKYR HBA Carpe EVHMSVDKFFQNLALALSEKYR : : ***: :..*: *** Comment on reconstruit lévolution à partir dinformations moléculaires

35 HBA_HUMAN -MVLSPADKTNVKAAWGKVGA---HAGEYGAEALERMFLSFPTTKTYFPHFDLSH----- HBAZ_HUMAN -MSLTKTERTIIVSMWAKIST---QADTIGTETLERLFLSHPQTKTYFPHFDLHP----- HBB_HUMAN MVHLTPEEKSAVTALWGKV-----NVDEVGGEALGRLLVVYPWTQRFFESFGDLSTPDAV HBD_HUMAN MVHLTPEEKTAVNALWGKV-----NVDAVGGEALGRLLVVYPWTQRFFESFGDLSSPDAV HBE_HUMAN MVHFTAEEKAAVTSLWSKM-----NVEEAGGEALGRLLVVYPWTQRFFDSFGNLSSPSAI HBG_HUMAN MGHFTEEDKATITSLWGKV-----NVEDAGGETLGRLLVVYPWTQRFFDSFGNLSSASAI MYG_HUMAN -MGLSDGEWQLVLNVWGKVEA---DIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEM GLB_BUSCA --GLDGAQKTALKESWKVLGADGPTMMKNGSLLFGLLFKTYPDTKKHFKHFDDATFA-AM : : : * : * : ::.* * * * HBA_HUMAN -GSAQVKGHGKKVADALTNAVAHVD--DMPNALSALSDLHAHKLRVDPVNFKLLSHCLLV HBAZ_HUMAN -GSAQLRAHGSKVVAAVGDAVKSID--DIGGALSKLSELHAYILRVDPVNFKLLSHCLLV HBB_HUMAN MGNPKVKAHGKKVLGAFSDGLAHLD--NLKGTFATLSELHCDKLHVDPENFRLLGNVLVC HBD_HUMAN MGNPKVKAHGKKVLGAFSDGLAHLD--NLKGTFSQLSELHCDKLHVDPENFRLLGNVLVC HBE_HUMAN LGNPKVKAHGKKVLTSFGDAIKNMD--NLKPAFAKLSELHCDKLHVDPENFKLLGNVMVI HBG_HUMAN MGNPKVKAHGKKVLTSLGDAIKHLD--DLKGTFAQLSELHCDKLHVDPENFKLLGNVLVT MYG_HUMAN KASEDLKKHGATVLTALGGILKKKG--HHEAEIKPLAQSHATKHKIPVKYLEFISECIIQ GLB_BUSCA DTTGVGKAHGVAVFSGLGSMICSIDDDDCVBGLAKKLSRNHLARGVSAADFKLLEAVFKZ. : ** *... :.. :. : : :.:: : HBA_HUMAN TLAAHLPAEFTPAVHASLDKFLASVSTVLTSKYR HBAZ_HUMAN TLAARFPADFTAEAHAAWDKFLSVVSSVLTEKYR HBB_HUMAN VLAHHFGKEFTPPVQAAYQKVVAGVANALAHKYH HBD_HUMAN VLARNFGKEFTPQMQAAYQKVVAGVANALAHKYH HBE_HUMAN ILATHFGKEFTPEVQAAWQKLVSAVAIALAHKYH HBG_HUMAN VLAIHFGKEFTPEVQASWQKMVTAVASALSSRYH MYG_HUMAN VLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG GLB_BUSCA FLDEATQRKATDAQKDADGALLTMLIKAHV *. : : :.

36 Un problème pour la reconstruction de lhistorique de la vie sur terre: les transferts horizontaux Il sagit du transfert de gènes entre espèces. Phénomène courant chez les micro-organismes (bactéries, archées), moins chez les eucaryotes Nous sommes donc tous des organismes transgéniques. La peur des OGM est à la fois fondée (risques de transferts) et infondée (la nature est déjà «habituée» à gérer ce mécanisme).

37 LUCA: Last Universal Common Ancestor LUCA devait posséder plus ou moins lensemble des caractéristiques présentes dans les trois règnes. Il sagissait donc dun organisme complexe sur le plan moléculaire avec un génome à ADN. Compromis entre «Last common ancestor» et «Last universal ancestor»

38 A la recherche des gènes…. On pourrait penser que lorsque lon obtient la séquence dun génome, il est facile de détecter les gènes et de traduire ces gènes en protéines; Cest partiellement vrai chez les bactéries et archées dont la grammaire génomique est caractérisée par: –Une très grande densité des gènes (70% à 95% du génome code pour des gènes); –Des structures de gènes simples: pas dintrons, régions régulatrices petites et peu complexes.

39 Un exemple illustrant la densité dun génome bactérien: la carte dune partie du génome de Bacillus subtilis Chez les bactéries: 1 million de paires de bases 1000 gènes

40 Mais, chez les eucaryotes…. Une grammaire complexe: –Il y a beaucoup de régions non-codantes; –Les gènes sont morcelés (exons/introns); –Leurs régions régulatrices peuvent être dune extrême complexité; –Plusieurs gènes peuvent partager une même région du génome; Même après avoir détecté un gène, il nest pas évident de pouvoir prédire son ou ses transcrits: –Epissage alternatif; –Edition de lARN messager

41 La solution: séquençage dEST et de cDNA complets Un exemple du résultat de lanalyse dune région du génome humain

42 Du génome au protéome Modifications post- traductionelles des protéines (PTMs) Augmentation 5-10 X Epissage alternatif des mARN Augmentation 2-5 X ~ transcrits humains ~ gènes humains ~ 1'000'000 protéines humaines Augmentation de la complexité

43 Les protéines (1/2) Le nombre de permutations possibles pour une protéine de 100 acides aminés est de , beaucoup plus que le nombre datomes dans lunivers; Dans chaque espèce, il y a des protéines «universelles» et dautres qui sont propres à une ou à un groupe despèces; Ce sont les nanomachines de la vie; aucun phénomène biologique ne peut avoir lieu sans laide dune ou plusieurs protéines;

44 Les protéines (2/2) Elles permettent daller aux limites de ce qui est possible au niveau moléculaire. Exemples: –Capture de lénergie solaire (photosynthèse); –Enzymes: permettent de faciliter des réactions qui sinon ne seraient pas possibles dans le cadre de notre biosphère sans apport énergétique important. Exemple: la fixation de lazote moléculaire; La technologie actuelle narrive pas encore à la cheville de ce que la nature a réussi à façonner en 3 milliards dannées dévolution.

45 La banque de données Swiss-Prot crèée en 1986 Une étroite collaboration entre lInstitut Suisse de Bioinformatique (ISB) et lInstitut Européen de Bioinformatique (EBI)

46 Genetic studies 3D Structures & Drug design Laboratory experiments GENOMIC DATA Scientific publications

47 Elles proviennent de plus de espèces Plus de protéines sont décrites dans Swiss-Prot et TrEMBL

48 Disponible sur ExPASy, Le premier serveur web dans le domaine des sciences de la vie. ExPASy a été développé depuis 1993 à genève 350 millions de connections sur ExPASy et ses sites miroirs en Australie, Bolivie, Canada, Chine, Corée, Etats-Unis et Taiwan

49 Le groupe Swiss-Prot travaille en collaboration avec Ensemble ils produisent UniProt, The Universal Protein Resource

50 Le séquençage du génome humain: lorsque les relations publiques et la politique prennent le pas sur la science

51 Chronologie dun projet Octobre 1990: début officiel du projet de séquençage du «génome humain»; : cartographie du génome; : mise en place du séquençage par un consortium public de laboratoires (USA, UK, France, Allemagne, Japon); Mai 2000: publication de la séquence du chromosome 21; 26 Juin 2000: annonce officielle du premier jet «working draft» du génome humain (90% complet, trous); 15 Février 2001: publication dans Nature et Science de la séquence provenant des projets publiques et de Céléra; 14 Avril 2003: annonce de la fin du projet de séquençage (99% complet; 400 trous); 2004: On na toujours pas une version complète de tous les chromosomes.

52 Le génome humain: une remise en question Beaucoup moins de gènes (25 à 30,000) que ce qui était prévu (100000); Nous sommes très proches de tous les autres mammifères (80% à 90% didentité avec la souris au niveau des protéines; près de 100% avec le chimpanzé); Comme dans la plupart des espèces complexes nous sommes obligés davoir une grande redondance au niveau de nos processus moléculaires (familles multigéniques, épissage alternatif, etc.).

53 Un grand désert… Seulement 1.5 à 5% de notre génome semble contenir des régions codantes (gènes); Plus de 50% semble être constitué de régions répétées dorigine diverse (virales, transposons). Cest ce que lon appelle lADN poubelle (junk DNA) ou ADN égoïste (selfish DNA); La «composition» de lADN poubelle est généralement spécifique à une espèce. Certaines espèces nen ont presque pas (exemple: poisson fugu) tout en conservant le même répertoire de gènes; Il ne semble donc pas y avoir davantages ou de désavantages à être colonisé dune façon aussi massive; Il est paradoxal de penser que chaque fois quune de nos cellules se réplique, plus de 50% du travail de duplication de lADN est probablement inutile!

54 Nous sommes tous atteints de maladies génétiques Actuellement sur 18,000 gènes humains «connus», 1,600 sont associés à des maladies génétiques Il sagit dans la plupart des cas de maladies «simples» (par opposition avec des maladies multifactorielles); Il est possible que plus de la moitié de nos gènes puissent être les «vecteurs» de maladies génétiques et ceci malgré la grande redondance de notre génome; Nous sommes sûrement tous porteurs de «défauts» plus ou moins graves.

55 Le concept de maladie génétique est relatif Lanémie falciforme Maladie causée par la mutation dun acide aminé de la chaine béta de lhémoglobine. Cette mutation cause un changement dans la forme de la protéine et indirectement celle du globule rouge (forme de faucille) Les individus porteurs de deux copies modifiées du gène (homozygotes) sont malades et meurent généralement dans leur jeune âge, les individus porteurs dune seule copie modifiée (hétérozygotes) sont porteurs, mais sains.

56 Fréquence de la mutation de lanémie falciforme La présence de cette mutation est protectrice contre le paludisme, car elle empèche le parasite (Plasmodium) de pénétrer dans les globules rouges

57 Les pathogènes ont contribués et continuent à contribuer à notre évolution Chacun dentre nous est le produit dune lignée ininterrompue de succès. Tous nos ancêtres ont survécu en tout cas jusquau moment où ils ont pu transmettre leurs gènes; Notre système immunitaire est le résultat de millions dannées dévolution; Chaque pathogène contribue à notre selection.

58 La vie, ennemie de la perfection Aucun phénomène biologique ne peut être parfait sous risque de faire courir à lorganisme le danger de disparaître; Lexemple de la réplication de lADN: sil y a des erreurs, il y a des risques graves pour lindividu. Mais si la copie est parfaite, il y a peu de possibilités dévoluer et donc de pouvoir survivre à un changement du paysage évolutionnaire; Corollaire: plus lindividu est sujet à des changements environmentaux, plus il aura tendance à avoir un système de réplication permettant des erreurs. Lexemple extrême sont les virus: SARS, SIDA, etc.

59 Génome et médecine Il est évident que beaucoup de choses seront petit à petit possibles. Par exemple: –Diagnostique précoce et guérison des cancers; –Thérapie génique pour corriger les «défauts» associés aux maladies génétiques; –Individualisation de la pharmacopée: déterminer le médicament adéquat et la dose optimale qui correspond au métabolisme personnel du malade; –Réparation des lésions de certains tissus. Examples: réparation du muscle cardiaque, guérison de la paraplégie/tétraplégie; –Développement dantibiotiques et dantiviraux très ciblés.

60 Le revers de la médaille La médecine post-génomique sera chère: –Qui va décider des priorités (labos pharmaceutiques ou organismes publiques comme lOMS); –Comment va-t-on payer pour cette médecine de «luxe»; –Lutilisation accrue de tests de dépistage de maladies génétiques risque de poser un problème grave au système des assurances.

61 Données génomiques et bioterrorisme Depuis deux ans la question se pose de savoir sil faut permettre laccès libre aux informations sur les séquences dorganismes pathogènes

62

63 Quelques conclusions Nous en sommes seulement à létape préliminaire de lexploration des génomes; Une quantité gigantesque dinformation va saccumuler dans les prochaines années; Transformer linformation en connaissance va être le challenge essentiel que devront relever les chercheurs des sciences de la vie; Communiquer au grand publique les enjeus de cette fantastique aventure est aussi primordial. Il faut pouvoir apaiser les craintes des uns et les attentes démesurées des autres.

64 Group leaders: Amos Bairoch, Rolf Apweiler Annotators/curators: Andrea Auchincloss, Kristian Axelsen, Kirsty Bates, Margaret Biswas, Marie-Claude Blatter Garin, Brigitte Boeckmann, Silvia Braconi Quintaje, Paul Browne, Eveyl Camon, Danielle Coral, Elisabeth Coudert, Tania de Oliveira Lima, Kirill Degtyarenko, Sylvie Dethiollaz, Anne Estreicher, Livia Famiglietti, Nathalie Farriol- Mathis, Stephanie Federico, Serenella Ferro, Gill Fraser, John Garavelli, Raffaella Gatto, Vivienne Gerritsen, Arnaud Gos, Nadine Gruaz-Gumowski, Ursula Hinz, Chantal Hulo, Nicolas Hulo, Janet James, Florence Jungo, Vivien Junker, Youla Karavidopoulou, Maria Krestyaninova, Kati Laiho, Minna Lehvaslaiho, Michele Magrane, Karine Michoud, Virginie Mittard, Madelaine Moinat, Nicola Mulder, Claire O'Donovan, Sandra Orchard, Sandrine Pilbout, Sylvain Poux, Manuela Prüss, Sorogini Reynaud, Catherine Rivoire, Bernd Röchert, Michel Schneider, Christian Sigrist, André Stutz, Shyamala Sundaram, Michael Tognoli, Elmar von Baum, Sandra van den Broek, Eleanor Whitfield Programmers and system administrators: Daniel Barrell, David Binns, Laurent Bollondi, Sergio Contrino, Michael Darsow, Edouard deCastro, Séverine Duvaud, Alexander Fedetov, Astrid Fleischmann, Wolfgang Fleischmann, Elisabeth Gasteiger, Alain Gateau, Andre Hackmann, Henning Hermjakob, Ivan Ivanyi, Eric Jain, Alexander Kanapin, Paul Kersey, Ernst Kretschmann, Corinne Lachaize, Maria-Jesus Martin, Xavier Martin, John O Rourke, Tom Oinn, Isabelle Phan, Astrid Rakow, Nicole Redaschi, Kai Runte, Florence Servant, Allyson Williams, Dan Wu Research staff: Pavel Dobrokhotov, Alexandre Gattiker, Margus Luk, Anne Morgat, Anne- Lise Veuthey Clerical and secretarial assistance: Veronique Mangold, Claudia Sapsezian, Margaret Shore-Nye, Laure Verbregue The Swiss-Prot staff at SIB and EBI

65


Télécharger ppt "2004, lodyssée des génomes Enjeux scientifiques, médicaux et éthiques Amos Bairoch; Institut Suisse de Bioinformatique (ISB) Groupe Swiss-Prot Genève –"

Présentations similaires


Annonces Google