ADN / ARN Structure.

Slides:



Advertisements
Présentations similaires
La synthèse des protéines
Advertisements

Stabilité et Variabilité des génomes et Evolution
Du gène à la protéine A. Les molécules
Biologie Moléculaire des Hépatites Virales
Transcription de l’ADN
Biosynthèse des macromolécules
Acide désoxyribonucléique : ADN
ADN.
Synthèse des protéinés
LA SYNTHÈSE DES PROTÉINES
Évolution et diversité du vivant
Correction du TP sur la transcription.
4.2 – Structure des acides nucléiques
La Régulation génétique chez les Procaryotes
La synthèse des protéines
LES BASES MOLÉCULAIRES DE L’HÉRÉDITÉ DU GÈNE À LA PROTÉINE
Présenté par: Dr TAIBI Faiza
LA TRANSCRIPTION DE L’ADN CHEZ LES PROCARYOTES
Le code génétique Biologie 122.
Synthèse des protéines
Le code génétique.
Groupe Béna Parallélisme entre la structure de l’information dans le code génétique et dans l’arithmétique Alain Bruyère Alain Bruyère.
Synthèse de protéines (et d’ARN)
Le ribosome.
La transcription.
Rappels de 1èreS Rappelez la définition du génotype et celle du phénotype. Génotype : ensemble des gènes d’un individu existant sous leur forme allélique.
Expression du Génome Le transcriptome.
LA SYNTHÈSE DES PROTÉINES
La synthèse des protéines
La Transcription de l’ADN a l’ARN
ADN à ARN La synthèse des protéines étape 1
4. Les acides nucléiques.
L’arbre du vivant.
L'information génétique
Cours des Acides Nucléiques
LA SYNTHÈSE DES PROTÉINES
Les acides nucléiques.
LA REGULATION DE L’EXPRESSION DES GENES
Chapitre 7.3 Réplication de l’ADN
La structure et la reproduction de l’ ADN
Génétique moléculaire
CHMI 2227F Biochimie I Expression des gènes
Université Hassan II AIN CHOCK Faculté de Médecine et de Pharmacie Casablanca - Cours de Biologie - Pr. Tahiri Jouti N. Année Universitaire
La synthèse des protéines
L’ARN.
Ordre des chapitres : 1 – 3 – 2 – 4 1.
Les Séquences et leurs Propriétés. Nucléotides  ADN  A, T, G, C  ARN  A, U, G, C.
Plan du cours : première partie
CHMI 2227F Biochimie I Expression des gènes
Quand la génétique s'en mêle.
Par: Laura Chiasson et Stephanie Alcock
De l’ADN aux protéines Introduction.
Le code génétique I- Définition: ensemble de codons qui signifient un acide aminé ou une information génétique. II- Nombre de codons: 43 = 64 codons -61.
Révision chapitre 8 Page
4.6 – La synthèse des protéines
ARNm à Protéine La synthèse des protéines étape 2.
Révision ADN et protéines
Les acides nucléiques.
Le code génétique et Traduction
Régulation de l’expression génétique: la transcription
Pr B. AITABDELKADER CPMC
Régulation de l’expression génétique: la traduction
ULBI 101 Biologie Cellulaire L1 Le Système Membranaire Interne.
L’EXPRESSION DU PROGRAMME GENETIQUE
RASAHOLIARISON Nomena Interne 1 er semestre en Neurologie USFR Neurologie CHU-JRB FACULTE DE MEDECINE UNIVERSITE D’ANTANANARIVO Cours du 01 avril 2015.
Chapitre 2 2ème partie Transcription et traduction titre.
De l’ADN à la Protéine : Transcription et Traduction
ADN : Acide désoxyribonucléique Santatra Ratsitohara RAZAFINDRASATA Interne des hôpitaux en Neurologie 1 er semestre – USFR Neurologie CHU/JRB FACULTE.
Transcription de la présentation:

ADN / ARN Structure

ADN : Acides Désoxyribonucléiques (1) Un nucléoside Un nucléotide

Liaison phosphodiester ADN : Acides Désoxyribonucléiques (2) ADN Liaison phosphodiester Purines Pyrimidines

ARN ARN : Acides Ribonucléiques Purines Pyrimidines Uracile OH OH OH U

Evolution: deoxy: plus difficile à «fabriquer» que le ribose ARN vs ADN ARN ADN Uracile Thymine Evolution: deoxy: plus difficile à «fabriquer» que le ribose

Comparaison ADN - ARN 5’ 3’ ARN ADN

Nomenclature BASE NUCLEOSIDE ABBREVIATION (symboles IUB-IUPAC) Adenine Adenosine A Guanine Guanosine G Cytosine Cytidine C Uracile Uridine U (ARN) Thymine Thymidine T ---------------------------------------------------------------------- puRine G ou A R pYrimidine T ou C Y aMino A ou C M Keto G ou T K Weak interact. A ou T W (2 liaisons H) Strong interact. G ou C S (3 liaisons H) !A = B T ou G ou C B !C = D A ou T ou G D !T, !U = V A ou G ou C V !G = H A ou T ou C H A ou T ou G ou C X / N Base + sucre

Stockage de l’information génétique ADN Stockage de l’information génétique

ADN double hélice: appariement 5 ’ - CACCAGAAGTCCTG - 3 ’ |||||||||||||| 3 ’ - GTGGTCTTCAGGAC - 5 ’ règle de Chargaff (1950) concentration purine / concentration pyrimidine = 1 %G = %C et %A = %T Appariement de bases complémentaires par des liaisons hydrogène Règle: appariement d’une purine avec une pyrimidine A-T: 2 liaisons hydrogène G-C : 3 liaisons hydrogène A-U: 2 liaisons hydrogène (ADN/ARN, ARN/ARN) ‘ Paires canoniques ’

ADN double hélice: polarité et convention (1) 3’ 5’ Séquence orientée extrémités 5’ phosphate et 3’ hydroxyle ‘libres’ Brins anti-parallèles indispensable pour la formation des liaisons H Brins complémentaires Importance du sens de la lecture (convention) ! Brin 3’ 5’

ADN double hélice: polarité et convention (2) Par convention, seule la séquence 5’ -> 3’ du brin codant de l’ADN est représentée. ATGGCATGCAATAGCTCATCG... Brin codant Brin matrice

ADN double hélice: polarité et convention (3) 5’ AGTACG 3’ ou 5’ CGTACT 3’ codant 3’ TCATGC 5’ 3’ GCATGA 5’ matrice 5’ AGUACG 3’ ou 5’ CGUACU 3’ ARNm SerThr ArgSer protéine 5’  3’ 3’  5’ brin codant brin matrice sens anti-sens Watson Crick + - direct complémentaire D C Séquence représentée dans les bases

ADN double hélice: propriétés biochimiques Nombreuses liaisons - physiquement et chimiquement stable; de longues chaînes peuvent être conservées sans cassure Liaisons hydrogène (H) faibles - rupture facile (transcription; réplication) Double brin: information “redondante”, - essentielle: pour les processus de réparation de l’ADN (correction sur épreuve) pour la réplication de l’ADN et la transmission de l’information génétique (réplication semi-conservative) les 2 brins sont ‘codants’

B-ADN : structure 3D forme naturelle la plus fréquente; compatible avec le squelette sucre phosphate 10 paires de base par tour hélice (3.4 nm)  homme: 3 109 pb: environ 1 m; E. coli: 4 106 pb: 1.6 mm les bases sont à l’intérieur, perpendiculiares à l’axe de l’hélice 

ADN double hélice: structure Structure symétrique - interaction protéines-ADN Structure flexible (moins que les protéines) et dynamique Structure variable: en fonction de la séquence en acides nucléiques la plupart des protéines reconnaissent une séquence certaines protéines pourraient reconnaître une structure (ex: ADN cruciforme, Z-ADN)

Liaison à l’ADN d’un dimère de répresseur du bactériophage Lambda 434 Dimension du sillon majeur: 1.2 x 0.6 x 0.8 nm Diamètre d’une hélice alpha (protéine): 1.2 nm Copyright Anulka

ADN double hélice: structure 3D ADN double hélice circulaire plasmides, chromosome bactérien configuration superhélicoïdale (« supercoils » négative ou positive; rôle des topoisomérase);

Origine de réplication La réplication du chromosome est initiée dans une région conservée: l’origine de réplication. Chez E. coli une seule origine de réplication par molécule d’ADN. Séquence consensus de l’origine de réplication bactérienne déduite à partir de six espèces

ARN

ARN : propriétés et structures Génomes viraux: mono-, bicaténaire, linéaire ou circulaire; Cellules: monocaténaire; Peu stable chimiquement; demi-vie courte (qqes sec à plusieurs heures; important pour la cellule); Différences avec ADN: - Appariements G-A et G-U; - Nucléotides souvent modifés; - Structures très flexibles; plusieurs conformations possibles (difficiles à cristalliser); - Fonctions diverses

ARN : fonctions biologiques Intermédiaires dans la synthèse des protéines : ARN messager (ARNm); ARN de transfert (ARNt); ARN ribosomal (ARNr) Molécules de structure : ARN ribosomal (ARNr) Molécules catalytiques : ribozymes Prouvé en 2000 Science, 289, 920-930 Diapo 27

ARNs impliqués dans la synthèse des protéines DNA TRANSCRIPTION rRNA mRNA tRNA ribosome TRADUCTION Diapo 101 PROTEINE http://www.cbs.dtu.dk/dave/DNA_CenDog.html#1. Digital River

ARN de transfert : ARNt Il existe ~ 31 ARNt différents; composés de 75 à 95 nucléotides; Plusieurs milliers de copies dans le cytoplasme; différents dans la mitochondrie et dans le chloroplaste (code génétique différent) Intermédiaires indispensables dans la synthèse des protéines: compatibilité stéréochimique Diapo 30, diff: Plusieurs milliers de copies dans le cytoplasme; différents dans la mitochondrie et dans le chloroplaste (code génétique différent);

 Cours Analyse de séquences Prédiction des ARNt Les ARNt ont des éléments de séquences conservés Combinaison : recherche de motifs (pattern) + méthodes probabilistes  Cours Analyse de séquences (A. Viari, M-F Sagot)

http://www.genetics.wustl.edu/eddy/tRNAscan-SE/

Les différentes formes de l ’information génétique Virus: toutes ces formes sont retrouvées Eucaryotes: ADN double brin linéaire; ADN double brin circulaire; Procaryotes: ADN double brin circulaire; ADN double brin linéaire (chromosome et plasmides)

Les 3 règnes procaryote eucaryote La phylogénie moléculaire basée sur la comparaison des ARN ribosomaux 16S classe les êtres vivants en trois règnes ou lignées généalogiques : eucaryotes, eubactéries et archébactéries procaryote eucaryote

Génomes procaryotes - Pas de noyau. - Une molécule d’ADN circulaire sous forme superenroulée (supercoil négatif, sauf exceptions...) - Non associé avec des histones, mais on peut trouver des petites protéines “histone-like” qui contraignent l’ADN à se replier en structure plus compacte. - Le chromosome peut être associé à la membrane cellulaire. - Peu de séquences répétitives: répétitions non codantes chez E. coli: 0.7% du génome

Organisation des régions codantes (procaryotes) The cartoon guide to genetics, Larry Gonick & Mark Wheelis, HarperPerennial

Un gène codant pour une protéine comprend « généralement »: Gène : définition Séquence d’acides nucléiques nécessaire pour la synthèse - d’un polypeptide fonctionnel - d’un ARN fonctionnel (tRNA, rRNA,…) Un gène codant pour une protéine comprend « généralement »: - la séquence codante (CDS) - les régions de contrôle de la transcription et traduction …un gène comprend des régions codantes et non codantes…

Gène (procaryote) Unité de traduction Unité de transcription 5 ’ -1 +1 3 ’ RBS Start Stop -35 -10 Terminateur Promoteur Unité de transcription Signaux de régulation de la transcription Promoteur: -35, -10 Terminateur Signaux de régulation de la traduction RBS (Ribosome-Binding Site) = séquence de Shine-Delgarno (SD) Codon start (ATG, GTG, TTG) Codon stop (TAA, TAG, TGA) Légende

Promoteur (bactérie) ~ 10 The predominance of adenine and thymine bases means that hydrogen bonding between the two DNA strands in this region is relatively weak, enabling the strands to be separated more easily to permit transcription by RNA polymerase. See also TATA box. ~ 10

Promoteur (archae) Promoter TATA box Transcription start site The sequence elements of a typical promoter from the Archae Diapo 51

Site de terminaison de la transcription Stem-loop

Organisation des régions codantes (1) Le promoteur oriente l’ARN polymérase dans une direction ou dans l’autre Le promoteur détermine ainsi quel brin de l’ADN est transcrit

Organisation des régions codantes (2) Différents gènes d’une même région peuvent être orientés différemment Généralement un seul des 2 brins est codant (sauf exceptions…) 3 ’ 5 ’ 3 ’ 5 ’ rare 3 ’ 5 ’ encore + rare

Organisation fonctionnelle du génome (procaryote)

Estimation du nombre de gènes* Core proteome: 8,000 (familles) 20 % ~13,600 ~180,000,000 Drosophila melanogaster Gènes connus: ~24’000 4-7 % (?) ~40,000 (?) 28,000-154,000 ~3,000,000,000 Homo sapiens** 1000 cellules 21 % 17,687 17-19,000 87,567,338 Caenorhabditis elegans ~29 % ~ 26’000 ~135,000,000 Arabidopsis thaliana 72 % 6,551 12,057,849 Saccharomyces cerevisiae Archae 87 % 1,758 1,664,970 Methanococcus jannaschii Eubacterie 4,397 4,639,221 E.coli Remarques % codant Nombre de gènes Taille (bp) Organisme * CDS + rARN + tARN ** http://www.ensembl.org/genesweep.html

eucaryotes / procaryotes Transcription eucaryotes / procaryotes

Compartimentalisation et niveau de complexité Eucaryote Procaryote (Aussi valable pour chloroplaste / mitochondrie) La transcription et la traduction ont lieu dans des compartiments séparés chez les eucaryotes

Organisation des gènes Distance entre 2 gènes: courtes chez les procaryotes; < 100’000 nucléotides chez les eucaryotes

Région promotrice Facteur de transcription non obligatoire

Traduction: ARNm  protéine

Code génétique (1960) 3 bases (un codon) codent pour un acide aminé 3 nucléotides  43: 64 possibilités le code est dégénéré: 64 codons pour 20 acides aminés le code n’est pas “overlapping” et ne contient pas de ponctuation (sauf le point final)

Les ARN de transfert (ARNt) Chaque ARNt possède un anticodon et un acide aminé correspondant attaché en 3’ Il en existe ~30 (variable selon les espèces) pour 61 codons. Exemple: Tryptophane (Trp) codon UGG Le codon UGG est reconnu par l’ARNt possédant l’anti-codon ACC couplé au Trp

Code génétique Diapo 94 Les codons UAA, UAG et UGA sont des codons stop car il n’existe pas d’ARNt correspondant (sauf exception…) La méthionine initiatrice est codée par AUG (sauf exception)

Le code génétique est ‘ quasi ’ universel Autres exceptions “nucléaires” : ciliés, euplotides, bactéries, blephasrisma (macronuclear) Traduction de la séquence amino terminale de l’albumine humaine en utilisant différents codes génétiques Standard: MKWVTFISLLFLFSSAYSRG mito levure: MKWVTFISTTFTFSSAYSRG mito mam: MKWVTFISLLFLFSSAYS*G mito insect: MKWVTFISLLFLFSSAYSSG mito plantes: MKWVTFISLLFLFSSAYSRG

Dégénérescence du code génétique Le code génétique est redondant (dégénéré) plusieurs codons pour le même acide aminé protection contre les effets des mutations Question: les acides aminés les plus fréquents ont-ils plus de codons ? http://www.expasy.org/sprot/relnotes/relstat.html Fréquence des acides aminés dans SWISS-PROT

Usage des codons Différents organismes: fréquence d’utilisation différente des mêmes codons; Abondance relative des ARNt Usage des codons spécifiques à certains gènes Paramètre important pour les programmes de prédiction de gènes Exemple: Fréquence d’utilisation (%) des différents codons codant pour la sérine chez différents organismes Les codons les plus fréquemment utilisés ont une plus forte probabilité de se retrouver dans les CDS  utilisé pour la recherche de séquences codantes

Cadre de lecture Traduction conceptuelle: traduction selon le code génétique sans validation expérimentale une séquence d’ADN peut être traduite dans 6 cadres de lecture phase (n=3); phase inverse (n=3) Généralement, seul un des 6 cadres de lecture produira une protéine fonctionnelle (quelques exceptions chez des virus) Dans la cellule, le cadre de lecture est déterminé par les signaux d’initiation (START) et de terminaison (STOP)

Prédiction des régions codantes CDS (Coding Sequence) Séquence comprise entre un codon Start et un codon Stop (en phase) ? Stop Start Stop ORF (Open Reading Frame) Séquence comprise entre deux codons Stop (en phase) Codon start (ATG, GTG, TTG) Codon stop (TAA, TAG, TGA) ? Problème: détection du vrai Start Légende Module : Analyse de séquences (A. Viari)