La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Grand pa, grand ma, etc... momdad génome Qu'est ce que la vie ? Mêmes atomes, mêmes principes physico-chimiques histoire et fonctions.

Présentations similaires


Présentation au sujet: "Grand pa, grand ma, etc... momdad génome Qu'est ce que la vie ? Mêmes atomes, mêmes principes physico-chimiques histoire et fonctions."— Transcription de la présentation:

1 grand pa, grand ma, etc... momdad génome Qu'est ce que la vie ? Mêmes atomes, mêmes principes physico-chimiques histoire et fonctions

2 Qu'est ce qu'un génome ? Génome: (1920 Hans Winkler, Hamburg) ensemble des déterminants héréditaires (gènes) propres à une espèce donnée. 1944: l'ADN est le support de l'hérédité 1953: les propriétés de la molécule d'ADN expliquent la dualité de son rôle: - instructions fonctionnelles pour l'organisme: séquence des nucléotides - reproduction (formation du semblable): appariement des nucléotides Génome: ensemble de l'information héréditaire d'un organisme. Cette information est présente en totalité dans chacune des cellules de l'organisme. Lorsqu'une cellule se divise l'information est copiée et transmise aux deux cellules filles. Génome: contient les instructions nécessaires au développement, au fonctionnement, au maintien de l'intégrité et à la reproduction des cellules et de l'organisme.

3 La dualité fonctionnelle de l'ADN est intrinsèque à sa structure L'information génétique (le message) est fournie par la succession des nucléotides le long des brins d'ADN Double hélice Fourche de réplication Deux double hélices filles adeninecytosineguaninethymine NH 2 O sucre N N C NH 2 N N N N A O sucre N NH 2 G N N NH O O sucre CH 3 NH N T C CC C O OH H HH CH 2 P O - O O O Base HH désoxyribonucléotides La reproduction des organismes est assurée par l'appariement des nucléotides. Les deux molécules filles sont identiques à la molécule mère et donc identiques entre elles Complémentarité des nucléotides Séquence des nucléotides Génomique Combinaisons possibles = 4 n n = 50 > nbre particules de l'univers

4 Le "dogme central" de la biologie moléculaire 1953 ARN Protéine Réplication Transcription Traduction ADN language à 4 lettres: nucléotides language à 20 lettres: acides aminés LE CODE GENETIQUE (1966) TTTphe FTCTser STATtyr YTGTcys C TTCphe FTCCser STACtyr YTGCcys C TTAleu LTCAser STAAochreTGAopale TTGleu LTCGser STAGamberTGGtrp W CTTleu LCCTpro PCAThis HCGTarg R CTCleu LCCCpro PCAChis HCGCarg R CTAleu LCCApro PCAAgln QCGA arg R CTGleu LCCGpro PCAGgln QCGG arg R ATTile IACTthr TAATasn NAGT ser S ATCile IACCthr TAACasn NAGC ser S ATAile IACAthr TAAAlys KAGA arg R ATGmet MACGthr TAAGlys KAGG arg R GTTval VGCTala AGATasp DGGTgly G GTCval VGCCala AGACasp DGGCgly G GTAval VGCAala AGAAglu EGGAgly G GTGval VGCGala AGAGglu EGGG gly G Gène Fonction "intermédiaire"

5 Fonction 1 Fonction 2 x x mutation ADN Déterminisme génétique (version élémentaire)

6 Taille des génomes et séquençage: bases de la génomique

7 Homo sapiens Drosophila melanogaster Caenorhabditis elegans Saccharomyces cerevisiae Escherichia coli Taille du génome (nucléotides) Nbre de gènes (protein-coding) Vitis vinifera Arabidopsis thaliana Amoeba dubia~ ? Psilotum nudum~ ? Fritillaria assyriaca~ ? Necturus lewisi~ ?

8 kilobases = kbmégabases = Mbgigabases = Gb Echelle de taille des molécules dADN et des génomes paires de bases distance = 1 paire de bases virus bactéries champignons levures plantes animaux mammifères homme Les génomes sont (trop) grands archaea å en général, les génomes sont trop grands pour le nombre de protéines qu'ils codent å les génomes despèces proches peuvent différer considérablement en taille å la complexité des génomes n'est pas en relation directe avec la complexité des organismes et le nombre de gènes Le paradoxe de la valeur C C = complexité du génome = nombre total de nucléotides du génome haploïde (taille du génome) amibes

9 ADN purifié Fragmentation 1 Copies incomplètes partant d'un point fixe Sens de la copie --> Fragment d'ADN à séquencer (matrice) 2 Sens de la migration électrophorétique 3 Détection du signal de fluorescence à la sortie du séquenceur Séquence reconstituée 4 séquençage Le séquençage des génomes paires de bases virus bactéries champignons levures plantes animaux archaea amibes

10 5 assemblage contig contig 1contig 2contig Nombre de séquences (c = NL/G) Nombre de contigs (G/L) 3X: exploratoire 6X: ébauche 12X: qualité "finale" Type de séquenceCaractéristiquesUtilisation Exploratoire Très nombreux contigs, petite tailleVariations polymorphiques, biodiversité Ebauche (draft)Nombreux contigs, taille variablePremières analyses globales FinalePeu de contigs, grandsAnalyse génomique fonctionnelle Le séquençage des génomes (suite)

11 6 Finition (supercontigs) Ossature de supercontigs (scaffolds) 8 Annotation: ensemble de procédures informatiques qui: 1- prédisent (± efficacement) les limites des gènes, des éléments de contrôle et de tout autre élément du génome 2- suggèrent les fonctions des gènes à partir des comparaisons avec ce qui est déjà connu 7 Finition (remplissage des trous et zones de basse qualité vérification des assemblages, examen des séquences répétées, … ) Séquence finie, complète et de haute qualité Le séquençage des génomes (fin)

12

13 Les premiers génomes séquencés 1995 Haemophilus influenzae 1.8 Mb Mycoplasma genitalium 0.6 Mb 2004 Homo sapiens 2ème ébauche (99,9 % de l' euchromatine) 2008 Deux individus Projet "1000 genomes" Consortium international 1000 individus à travers le monde 1998 Caenorhabditis elegans 98 Mb (Premier organisme multicellulaire) 2000 Arabidopsis thaliana 115 Mb (Première plante) Drosophila melanogaster 160 Mb (ébauche) Homo sapiens MB Annonce internationale 1ère ébauche 90 % ( trous) 1996 Mycoplasma pneumoniae 0.8 Mb Synechocystis sp. 3.6 Mb Methanococcus jannaschii 1.7 Mb (Première Archae) Saccharomyces cerevisiae 12.3 Mb (Premier Eucaryote) Bactéries

14 812 génomes complets et publiés 1766 génomes bactériens (en cours) 936 génomes eucaryotes (en cours) 90 génomes d'archaea (en cours) 130 métagénomes L'accélération des "projets génomes" Banques de données publiques Février 2008: nucléotides fichiers "génomes entiers" bactéries eucaryotes archaea

15 Pourquoi séquencer les génomes ? Biotechnologies fermentations et bioconversions (acetate, acetone, butanol, éthanol, hydrogène ….) additifs alimentaires (alginate, succinate, glutamate … ) production d'enzymes (cellulase, biocatalyse ….) et protéines Environnement: cycles naturels (carbone, azote, conversion de la biomasse …) traitements (pesticides, fongicides, algicides, …) énergie, pétrole, détergents traitements des eaux, détoxification des sols Alimentation: produits laitiers, fromages, suppléments diététiques, fermentations alimentaires … Agronomie: animaux, plantes, et leurs pathogènes, résistance … Santé humaine: pathogènes, cancer, vaccins, infections nosocomiales, insectes vecteurs … Connaissance: éducation, évolution, origine de la vie, arbre de la vie, compréhension des mécanismes fondamentaux de la vie, biodiversité … Biologie et écologie marine: pêche, aquaculture, algues, plancton …. Pharmacie: vitamines, antibiotiques, acides aminés, acide lactique ….

16 Saccharomyces cerevisiae (1996) Schizosaccharomyces pombe (2002) Ascomycota La génomique comparative (Eucaryotes) Plasmodium falciparum (2002) Plasmodium yoeli yoeli (2002) Cryptosporidium hominis (2004) Cryptosporidium parvum (2004) Theileria annulata (2005) Theileria parva (2005) Toxoplasma gondi Apicomplexa Paramecium tetraurelia (2006) Tetrahymena thermophila (2006) Ciliophora Leishmania major (2005) Trypanosoma brucei (2005) Trypanosoma cruzi (2005) Euglenozoa Entamoeba histolytica (2005) Dictyostelium discoideum (2005) Conosa Cyanidioschyzon merolae (2004) Galdieria sulphuraria (2005) Rhodophyta Ostreococcus tauri (2006) Chlorophyta Thalassiosira pseudonana (2004) Stramenopiles Strongylocentrus purpuratus Echinodermata Arabidospis thaliana Oryza sativa Populus nigra Vitis vinifera ViridiplantaeMammalia Homo sapiens Pan troglodytes Mus musculus Rattus norvegicus Gallus gallus Tetraodon negrovirids Fugu rubripes Drosophila melanogaster (2000) Arthropoda Caenorhabditis elegans (1998) Caenorhabditis briggsae (2003) Oscheius tipulae (2006) Meloidogyne incognita Nematoda

17 Ernst Haeckel, 1866

18 Baldauf (2003) Science 300:

19 Qu'apprenons nous dans les génomes ? Catalogue complet des gènes et autres éléments Présence de nombreux gènes et autres éléments de fonctions inconnues Processus dynamiques de modification (altération et évolution) du génome

20 ADN ARN Protéine Transcription Traduction Réplication Transcription réverse Epissage Edition 1953 ARN Protéine Réplication Transcription Traduction ADN Le "dogme central" de la biologie moléculaire (1ère révision) Gène Fonction Information génétique Catalyse

21 = 5-méthyl uracile ARN C CC C O OH H HH CH 2 P O - O O O base HH C CC C O OH HH CH 2 P O - O O O base HH ribonucléotides désoxyribonucléotides Gène ADN adeninecytosineguaninethymine NH 2 O sucre N N C NH 2 N N N N A O sucre N NH 2 G N N NH O O sucre CH 3 NH N T sucre NH 2 N N N N A O sucre N NH 2 G N N NH NH 2 O sucre N N C O O NH N U adeninecytosineguanineuracile ADN ARN

22 Gène ADN ARN précurseur transcrit du gène Intron 2Intron 3 Intron 1 Exon 1Exon 2Exon 3Exon 4 Epissage des ARN protéine dégradation + Introns excisés Phase codante Jonctions des exons régulation 5' UTR 3' UTR ARN épissé

23 Exon shuffling ~ 19 % des exons des génomes eucaryotes proviennent de ce processus exon Exon 1Exon 2Intron nouvel exon Nouvel épissage ou perte de l'intron Evènements évolutifs dépendant des ARN ~ 4 % des nouveaux exons du génome humain proviennent de ce processus Insertion d'un élément mobile élement mobile Exon 1Exon 2Intron Formation de nouveaux sites d'épissage ou perte des introns Nouvel exon Formation de rétrogènes 1 % des gènes humains, plus de nombreux pseudogènes, sont issus de ce processus ADNc rétrogene fusion de gène ou ARN gène ancestral

24 Exonisation d'éléments mobiles Gène humain RPE ' UTR 5' UTR Alu J exon 3 Partie de séquence Alu J devenant un exon codant intron Ribulose-5-phosphate-3-épimerase Saguinus LemurEulemurTarsiusSaimiriMacacaColobus Hylobates PongoPan Homo Réversion Alu J insertion / fixation Alu J exonisation Strepsirrhini Tarsioidea Platyrrhini Cercopithecoidea Hominoidea ca. 10 MYr Mutations au site 3' d'épissage

25 Les gènes se dupliquent et se perdent Gène ancestral Le génome n'est qu'un cliché instantané de processus continuels de duplications et de perte de gènes au cours des générations successives Susumu Ohno, 1970 Copies de gènes paralogues nouvelles fonctions spécialisation fonctionnelle redondance mutations Ex.: Le génome de la paramécie ( gènes) révèle les traces de trois évènements successifs de duplication (ancêtre ~ gènes) Duplication totale du génome Perte de gènes Ex.: génotypage de trios parents-enfant normaux révèle délétions nouvelles (> 5kb) à chaque génération (total kb) Duplication de segments du génome Ex.: le génome humain montre plusieurs centaines de segments dupliqués (> 5kb) totalisant ~ 150 Mb (5 % du génome). Source d'instabilités génomiques.

26 Les éléments des génomes levure homme Gènes (codant des protéines) ~ Introns 280 > Pseudogènes 10 > Éléments mobiles~ 50 > Nombre de familles de protéines~ ~ Redondance (gènes paralogues) 1,4 x 2,3 x Exons codants Introns, UTR, pseudogènes Eléments mobiles Autres régions régulations évolution fonctions

27 Buts et outils de la génomique fonctionnelle Buts: connaître les fonctions de tous les gènes comprendre leurs interactions prédire les phénotypes à partir du génotype

28 Puces à ADN et quantification des ARN

29 Principes pour l'interprétation des résultats 2- les gènes qui participent à une même fonction doivent avoir des expressions corrélées Gènes dont l'expression est corrélée 1- l'expression des gènes dans différentes conditions est révélatrice de leur fonction Condition 1 Condition 2 Zone des variations non significatives

30 Gène Fonction ARN Nombreux gènes Complexe fonctionnel Nombreux ARN RNA proteins La grande sous-unité du ribosome ARN Protéines Les interactions fonctionnelles

31 Identifier les interactions des protéines 1- purification biochimique des complexes Marquage de chaque gène par une étiquette moléculaire facilitant la purification de la protéine dans des conditions non dénaturantes Analyse des complexes purifiés par spectrographie de masse 2- identification des interactions binaires par artifice génétique (double hybride) X Y OFF Y X ON AB I J K Mutant 1 de J Mutant 2 de J

32 Saccharomyces cerevisiae gènes (protéines) Collections de délétions avec marquage moléculaire (barcoding). Recherche de phénotypes et d'interactions. Collections de fusions de gènes pour produire les protéines fluorescentes. Localisation intracellulaire. Collections de gènes surexprimés (augmentation de la quantité de protéine). Recherche de phénotypes et d'interactions. 1- Collections complètes de mutants Identifier les interactions fonctionnelles des gènes 2- Phénotypes synthétiques Mutant A Mutant BMutant A+B Mutants --->

33 fonctions inconnues fonctions identifiées Nombre de gènes temps Integration des résultats des différentes approches : vers la connaissance complète du fonctionnement d'une cellule ARN Génomique comparative Interactions des produits des gènes Localisation intracellulaire Génétique Prédire le phénotype Replacer les mécanismes dans l'évolution

34 Et maintenant ?

35 ADN ARN Protéine Transcription Traduction Réplication Transcription réverse Epissage Edition 1953 ARN Protéine Réplication Transcription Traduction ADN Le "dogme central" de la biologie moléculaire (actuel) 2008 ADN ARN Protéine S Transcription multiple Traduction Réplication Transcription reverse Epissage Edition Régulation Evolution Formation de gènes Epigénèse

36 Gène Fonction ARNLe génome fonctionnel Le génome séquencé Séquencer le transcriptome Les fonctions étudiées

37 Qu'est qu'un gène ? Gerstein et al., 2007 Genome Res. 17: ENCODE Project Consortium 2004 Science 306: ADN Transcrits primaires Transcrits épissés Produits fonctionnels Gènes Protéines ARN nc

38 Les nouvelles techniques de séquençage Méthodelongueur desnombre detotal parcoût relatif lectureslecturestour (run)par nucléotide Sanger~700 nuc Kb 1 Pyroséquençage~250 nuc Mb 0,1 Phase solide25-35 nuc Mb 0, Mb 0,01 Combinaison des technologies: vers le séquençage des individus et des populations entières

39 Quelques grands projets en cours ou annoncés 1000 genomes Consortium international But: cartographier le polymorphisme génétique de la population humaine (1000 individus) Origine de la multicellularitéNHGRI But: identifier les gènes et complexes impliqués dans l'apparition de la vie multicellulaire (animaux, champignons, protistes) Microbiome humainPlusieurs centres de séquençage américain But: identification exhaustive de la flore microbienne commensale de l'homme Encyclopédie génomique des bactéries et archaeaJGI But: étudier toutes les branches phylogénétiques de l'arbre de la vie (procaryote) Bar coding of life 130 organisations, 43 pays But: attribuer une signature moléculaire standard à chaque espèce identifiée ENCyclopedia Of DNA Elements (ENCODE) Universités américaines, NHGRI But: identifier tous les éléments fonctionnels du génome humain

40 génome Qu'est ce que la vie ? principes physico-chimiques + hérédité


Télécharger ppt "Grand pa, grand ma, etc... momdad génome Qu'est ce que la vie ? Mêmes atomes, mêmes principes physico-chimiques histoire et fonctions."

Présentations similaires


Annonces Google