La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

génome Qu'est ce que la vie ? histoire et fonctions

Présentations similaires


Présentation au sujet: "génome Qu'est ce que la vie ? histoire et fonctions"— Transcription de la présentation:

1 génome Qu'est ce que la vie ? histoire et fonctions
grand pa, grand ma, etc ... mom dad génome Mêmes atomes, mêmes principes physico-chimiques

2 Qu'est ce qu'un génome ? 1944: l'ADN est le support de l'hérédité
Génome: (1920 Hans Winkler, Hamburg) ensemble des déterminants héréditaires (gènes) propres à une espèce donnée. Génome: ensemble de l'information héréditaire d'un organisme. Cette information est présente en totalité dans chacune des cellules de l'organisme. Lorsqu'une cellule se divise l'information est copiée et transmise aux deux cellules filles. Génome: contient les instructions nécessaires au développement, au fonctionnement, au maintien de l'intégrité et à la reproduction des cellules et de l'organisme. 1944: l'ADN est le support de l'hérédité 1953: les propriétés de la molécule d'ADN expliquent la dualité de son rôle: instructions fonctionnelles pour l'organisme: séquence des nucléotides - reproduction (formation du semblable): appariement des nucléotides

3 n = 50 > nbre particules de l'univers
La dualité fonctionnelle de l'ADN est intrinsèque à sa structure C O OH H CH2 P O - Base 1’ 2’ 3’ 4’ 5’ désoxyribonucléotides adenine cytosine guanine thymine NH2 O sucre N C 1 2 3 4 5 6 A 7 8 9 G NH CH3 T Double hélice Fourche de réplication Deux double hélices filles Complémentarité des nucléotides Séquence des nucléotides La reproduction des organismes est assurée par l'appariement des nucléotides. Les deux molécules filles sont identiques à la molécule mère et donc identiques entre elles L'information génétique (le message) est fournie par la succession des nucléotides le long des brins d'ADN Génomique Combinaisons possibles = 4n n = 50 > nbre particules de l'univers

4 Le "dogme central" de la biologie moléculaire
1953 ARN Protéine Réplication Transcription Traduction ADN Gène Fonction "intermédiaire" language à 4 lettres: nucléotides language à 20 lettres: acides aminés LE CODE GENETIQUE (1966) TTT phe F TCT ser S TAT tyr Y TGT cys C TTC TCC TAC TGC TTA leu L TCA TAA ochre TGA opale TTG TCG TAG amber TGG trp W CTT CCT pro P CAT his H CGT arg R CTC CCC CAC CGC CTA CCA CAA gln Q CGA arg R CTG CCG CAG CGG arg R ATT ile I ACT thr T AAT asn N AGT ser S ATC ACC AAC AGC ser S ATA ACA AAA lys K AGA arg R ATG met M ACG AAG AGG arg R GTT val V GCT ala A GAT asp D GGT gly G GTC GCC GAC GGC GTA GCA GAA glu E GGA GTG GCG GAG GGG

5 Déterminisme génétique (version élémentaire)
x mutation Fonction 1 Fonction 2 ADN

6 Taille des génomes et séquençage: bases de la génomique

7 Fritillaria assyriaca ~ 100 000 000 000 ?
Taille du génome (nucléotides) Nbre de gènes (protein-coding) Amoeba dubia ~ ? Psilotum nudum ~ ? Fritillaria assyriaca ~ ? Necturus lewisi ~ ? Homo sapiens Drosophila melanogaster Caenorhabditis elegans Saccharomyces cerevisiae Escherichia coli Vitis vinifera Arabidopsis thaliana

8 Les génomes sont (trop) grands
Echelle de taille des molécules d’ADN et des génomes homme distance = 1 paire de bases mammifères animaux champignons levures plantes bactéries amibes virus archaea 1 10 102 103 104 105 106 107 108 109 1010 1011 1012 paires de bases kilobases = kb mégabases = Mb gigabases = Gb Le paradoxe de la valeur C C = complexité du génome = nombre total de nucléotides du génome haploïde (taille du génome) en général, les génomes sont trop grands pour le nombre de protéines qu'ils codent la complexité des génomes n'est pas en relation directe avec la complexité des organismes et le nombre de gènes les génomes d’espèces proches peuvent différer considérablement en taille

9 Le séquençage des génomes
animaux champignons levures plantes séquençage bactéries amibes virus archaea 1 10 102 103 104 105 106 107 108 109 1010 1011 1012 paires de bases ADN purifié Fragmentation 1 Copies incomplètes partant d'un point fixe Sens de la copie --> Fragment d'ADN à séquencer (matrice) 2 Sens de la migration électrophorétique 3 Détection du signal de fluorescence à la sortie du séquenceur Séquence reconstituée 4

10 Le séquençage des génomes (suite)
5 assemblage contig contig 1 contig 2 contig 3 0.2 0.4 0.6 0.8 2 4 6 8 10 12 Nombre de séquences (c = NL/G) Nombre de contigs (G/L) 3X: exploratoire 6X: ébauche 12X: qualité "finale" Type de séquence Caractéristiques Utilisation Exploratoire Très nombreux contigs, petite taille Variations polymorphiques, biodiversité Ebauche (draft) Nombreux contigs, taille variable Premières analyses globales Finale Peu de contigs, grands Analyse génomique fonctionnelle

11 Le séquençage des génomes (fin)
6 Finition (supercontigs) Ossature de supercontigs (scaffolds) 7 Finition (remplissage des trous et zones de basse qualité vérification des assemblages, examen des séquences répétées, … ) Séquence finie, complète et de haute qualité 8 Annotation: ensemble de procédures informatiques qui: 1- prédisent (± efficacement) les limites des gènes, des éléments de contrôle et de tout autre élément du génome 2- suggèrent les fonctions des gènes à partir des comparaisons avec ce qui est déjà connu

12

13 Les premiers génomes séquencés
1995 Haemophilus influenzae Mb Mycoplasma genitalium Mb 1996 Mycoplasma pneumoniae Mb Synechocystis sp Mb Methanococcus jannaschii Mb (Première Archae) Saccharomyces cerevisiae Mb (Premier Eucaryote) Bactéries 1998 Caenorhabditis elegans 98 Mb (Premier organisme multicellulaire) 2000 Arabidopsis thaliana 115 Mb (Première plante) Drosophila melanogaster 160 Mb (ébauche) Homo sapiens MB Annonce internationale 1ère ébauche 90 % ( trous) 2004 Homo sapiens 2ème ébauche (99,9 % de l' euchromatine) Deux individus Projet "1000 genomes" Consortium international 1000 individus à travers le monde

14 L'accélération des "projets génomes"
bactéries eucaryotes archaea 812 génomes complets et publiés 1766 génomes bactériens (en cours) 936 génomes eucaryotes (en cours) 90 génomes d'archaea (en cours) 130 métagénomes Banques de données publiques Février 2008: nucléotides fichiers "génomes entiers"

15 Pourquoi séquencer les génomes ?
Biotechnologies fermentations et bioconversions (acetate, acetone, butanol, éthanol, hydrogène ….) additifs alimentaires (alginate, succinate, glutamate … ) production d'enzymes (cellulase, biocatalyse ….) et protéines Environnement: cycles naturels (carbone, azote , conversion de la biomasse …) traitements (pesticides, fongicides, algicides, …) énergie, pétrole, détergents traitements des eaux, détoxification des sols Alimentation: produits laitiers, fromages, suppléments diététiques, fermentations alimentaires … Agronomie: animaux, plantes, et leurs pathogènes, résistance … Biologie et écologie marine: pêche, aquaculture, algues, plancton …. Pharmacie: vitamines, antibiotiques, acides aminés, acide lactique …. Santé humaine: pathogènes, cancer, vaccins, infections nosocomiales, insectes vecteurs … Connaissance: éducation, évolution, origine de la vie, arbre de la vie, compréhension des mécanismes fondamentaux de la vie, biodiversité …

16 La génomique comparative (Eucaryotes)
Plasmodium falciparum (2002) Plasmodium yoeli yoeli (2002) Cryptosporidium hominis (2004) Cryptosporidium parvum (2004) Theileria annulata (2005) Theileria parva (2005) Toxoplasma gondi Apicomplexa Paramecium tetraurelia (2006) Tetrahymena thermophila (2006) Ciliophora Leishmania major (2005) Trypanosoma brucei (2005) Trypanosoma cruzi (2005) Euglenozoa Entamoeba histolytica (2005) Dictyostelium discoideum (2005) Conosa Cyanidioschyzon merolae (2004) Galdieria sulphuraria (2005) Rhodophyta Ostreococcus tauri (2006) Chlorophyta Thalassiosira pseudonana (2004) Stramenopiles Strongylocentrus purpuratus Echinodermata Mammalia Homo sapiens Pan troglodytes Mus musculus Rattus norvegicus Gallus gallus Tetraodon negrovirids Fugu rubripes Arabidospis thaliana Oryza sativa Populus nigra Vitis vinifera Viridiplantae Tout ça nous a amene a regfrouper la plusparte des lignes euca connues dans à peu pres 6 supergroupes. Couleurs differents, gris signifie qu’on est pas sure de la monophylie, on vera comment qq chose semble etra maintenant resolue. Some more familiar comme les plantes, autres moins evidents. Je vais vous decrire ces groupes et sur la base de quels evidences morphologiques et moleculaires ont ete suggeré et comment certain de ce nouveau supergrupes apportent une perspective totalement nouvelle sur l’evolution des euka. Je me suis largement inspire par deux papiers fondamentals,Baldauf, d’ou ce figure vient, et Simpson/roger, plus j’ai ajouté les nouveautés depuis 2003. Caenorhabditis elegans (1998) Caenorhabditis briggsae (2003) Oscheius tipulae (2006) Meloidogyne incognita Nematoda Saccharomyces cerevisiae (1996) Schizosaccharomyces pombe (2002) Ascomycota Drosophila melanogaster (2000) Arthropoda

17 Ernst Haeckel, 1866

18 Tout ça nous a amene a regfrouper la plusparte des lignes euca connues dans à peu pres 6 supergroupes. Couleurs differents, gris signifie qu’on est pas sure de la monophylie, on vera comment qq chose semble etra maintenant resolue. Some more familiar comme les plantes, autres moins evidents. Je vais vous decrire ces groupes et sur la base de quels evidences morphologiques et moleculaires ont ete suggeré et comment certain de ce nouveau supergrupes apportent une perspective totalement nouvelle sur l’evolution des euka. Je me suis largement inspire par deux papiers fondamentals,Baldauf, d’ou ce figure vient, et Simpson/roger, plus j’ai ajouté les nouveautés depuis 2003. Baldauf (2003) Science 300:

19 Qu'apprenons nous dans les génomes ?
Catalogue complet des gènes et autres éléments Présence de nombreux gènes et autres éléments de fonctions inconnues Processus dynamiques de modification (altération et évolution) du génome

20 Le "dogme central" de la biologie moléculaire (1ère révision)
1953 ARN Protéine Réplication Transcription Traduction ADN ADN ARN Protéine Transcription Traduction Réplication Transcription réverse Epissage Edition Gène Information génétique Catalyse Fonction

21 ADN ARN Gène ADN ARN T C G A U C G A C O OH H CH2 base ribonucléotides
P O - base 1’ 2’ 3’ 4’ 5’ ribonucléotides désoxyribonucléotides ARN ADN = 5-méthyl uracile adenine cytosine guanine thymine NH2 O sucre N C 1 2 3 4 5 6 A 7 8 9 G NH CH3 T sucre NH2 N A 1 2 3 4 5 6 7 8 9 O G NH C U adenine cytosine guanine uracile ARN

22 + Epissage des ARN ADN Gène ARN précurseur transcrit du gène
Intron 2 Intron 3 Intron 1 Exon 1 Exon 2 Exon 3 Exon 4 + Introns excisés Phase codante Jonctions des exons régulation 5' UTR 3' UTR ARN épissé protéine dégradation

23 Evènements évolutifs dépendant des ARN
Formation de rétrogènes 1 % des gènes humains, plus de nombreux pseudogènes, sont issus de ce processus ADNc rétrogene fusion de gène ou ARN gène ancestral Exon shuffling ~ 19 % des exons des génomes eucaryotes proviennent de ce processus exon Exon 1 Exon 2 Intron nouvel exon Nouvel épissage ou perte de l'intron ~ 4 % des nouveaux exons du génome humain proviennent de ce processus Insertion d'un élément mobile élement mobile Exon 1 Exon 2 Intron Formation de nouveaux sites d'épissage ou perte des introns Nouvel exon

24 Exonisation d'éléments mobiles
Gène humain RPE2-1 Ribulose-5-phosphate-3-épimerase 1 2 3 4 5 6 3' UTR 5' UTR Alu J exon 3 Partie de séquence Alu J devenant un exon codant intron Saguinus Lemur Eulemur Tarsius Saimiri Macaca Colobus Hylobates Pongo Pan Homo Réversion Alu J insertion / fixation Alu J exonisation Strepsirrhini Tarsioidea Platyrrhini Cercopithecoidea Hominoidea ca. 10 MYr Mutations au site 3' d'épissage

25 Les gènes se dupliquent et se perdent
Susumu Ohno, 1970 Ex.: Le génome de la paramécie ( gènes) révèle les traces de trois évènements successifs de duplication (ancêtre ~ gènes) Duplication totale du génome Gène ancestral Duplication de segments du génome Ex.: le génome humain montre plusieurs centaines de segments dupliqués (> 5kb) totalisant ~ 150 Mb (5 % du génome). Source d'instabilités génomiques. mutations Copies de gènes paralogues nouvelles fonctions spécialisation fonctionnelle redondance Perte de gènes Ex.: génotypage de trios parents-enfant normaux révèle délétions nouvelles (> 5kb) à chaque génération (total kb) Le génome n'est qu'un cliché instantané de processus continuels de duplications et de perte de gènes au cours des générations successives

26 Les éléments des génomes
levure homme Gènes (codant des protéines) ~ Introns > Pseudogènes > Éléments mobiles ~ 50 > Nombre de familles de protéines ~ ~10 000 Redondance (gènes paralogues) 1,4 x ,3 x Exons codants Introns, UTR, pseudogènes Eléments mobiles Autres régions régulations évolution fonctions

27 Buts et outils de la génomique fonctionnelle
Buts: connaître les fonctions de tous les gènes comprendre leurs interactions prédire les phénotypes à partir du génotype

28 Puces à ADN et quantification des ARN

29 Principes pour l'interprétation des résultats
1- l'expression des gènes dans différentes conditions est révélatrice de leur fonction Condition 1 Condition 2 Zone des variations non significatives 2- les gènes qui participent à une même fonction doivent avoir des expressions corrélées Gènes dont l'expression est corrélée

30 Les interactions fonctionnelles
Nombreux gènes Complexe fonctionnel Nombreux ARN RNA proteins La grande sous-unité du ribosome ARN Protéines Gène Fonction ARN

31 Identifier les interactions des protéines
1- purification biochimique des complexes 2- identification des interactions binaires par artifice génétique (double hybride) X Y OFF ON A B I J K Mutant 1 de J Mutant 2 de J Marquage de chaque gène par une étiquette moléculaire facilitant la purification de la protéine dans des conditions non dénaturantes Analyse des complexes purifiés par spectrographie de masse Exemple d'unité fonctionnelle

32 Identifier les interactions fonctionnelles des gènes
1- Collections complètes de mutants 2- Phénotypes synthétiques Mutant A Mutant B Mutant A+B Mutants ---> Collections de délétions avec marquage moléculaire (barcoding). Recherche de phénotypes et d'interactions. Saccharomyces cerevisiae 5 770 gènes (protéines) Collections de gènes surexprimés (augmentation de la quantité de protéine). Recherche de phénotypes et d'interactions. Collections de fusions de gènes pour produire les protéines fluorescentes. Localisation intracellulaire.

33 Integration des résultats des différentes approches : vers la connaissance complète du fonctionnement d'une cellule fonctions inconnues fonctions identifiées Nombre de gènes temps Génomique comparative Interactions des produits des gènes ARN Génétique Prédire le phénotype Replacer les mécanismes dans l'évolution Localisation intracellulaire

34 Et maintenant ?

35 ARN Le "dogme central" de la biologie moléculaire (actuel) ADN
1953 ARN Protéine Réplication Transcription Traduction ADN ADN ARN Protéine Transcription Traduction Réplication Transcription réverse Epissage Edition 2008 ADN ARN ProtéineS Transcription multiple Traduction Réplication Transcription reverse Epissage Edition Régulation Evolution Formation de gènes Epigénèse

36 Séquencer le transcriptome
Le génome séquencé Gène Le génome fonctionnel ARN Fonction Les fonctions étudiées

37 Qu'est qu'un gène ? ADN Transcrits primaires Transcrits épissés
ENCODE Project Consortium 2004 Science 306: ADN Transcrits primaires Transcrits épissés Protéines Produits fonctionnels ARN nc Gènes Gerstein et al., 2007 Genome Res. 17:

38 Les nouvelles techniques de séquençage
Méthode longueur des nombre de total par coût relatif lectures lectures tour (run) par nucléotide Sanger ~700 nuc Kb Pyroséquençage ~250 nuc Mb ,1 Phase solide nuc Mb ,01 Mb ,01 Combinaison des technologies: vers le séquençage des individus et des populations entières

39 Quelques grands projets en cours ou annoncés
ENCyclopedia Of DNA Elements (ENCODE) Universités américaines, NHGRI But: identifier tous les éléments fonctionnels du génome humain 1000 genomes Consortium international But: cartographier le polymorphisme génétique de la population humaine (1000 individus) Origine de la multicellularité NHGRI But: identifier les gènes et complexes impliqués dans l'apparition de la vie multicellulaire (animaux, champignons, protistes) Microbiome humain Plusieurs centres de séquençage américain But: identification exhaustive de la flore microbienne commensale de l'homme Encyclopédie génomique des bactéries et archaea JGI But: étudier toutes les branches phylogénétiques de l'arbre de la vie (procaryote) Bar coding of life organisations, 43 pays But: attribuer une signature moléculaire standard à chaque espèce identifiée

40 Qu'est ce que la vie ? principes physico-chimiques + hérédité génome


Télécharger ppt "génome Qu'est ce que la vie ? histoire et fonctions"

Présentations similaires


Annonces Google