Biosynthèse des protéines Cours 4
Biosynthèse des protéines La biosynthèse des protéines est l'ensemble des processus biochimiques permettant aux cellules de produire leurs protéines à partir de leurs gènes afin de compenser les pertes en protéines par sécrétion ou par dégradation. Elle recouvre les étapes de transcription de l'ADN en ARN messager. Elle est étroitement régulée à de multiples niveaux, principalement lors de la transcription et lors de la traduction.
Le matériel génétique des cellules est constitué d'ADN sur lequel l'information génétique est organisée en gènes, ou cistrons, et encodée sous forme de codons consécutifs de trois nucléotides. Chaque codon correspond à un acide aminé précis : la correspondance entre codons et acides aminés constitue le code génétique. La biosynthèse des protéines consiste à synthétiser une chaîne polypeptidique dont la séquence peptidique est déterminée par la séquence nucléotidique — et donc la succession des codons — du gène correspondant.
Pour ce faire, l'ADN est tout d'abord transcrit en ARN messager par une ARN polymérase. Chez les eucaryotes, cet ARN messager subit une série demodifications post-transcriptionnelles — ajout d'une coiffe, polyadénylation, épissage — puis gagne le cytoplasme à travers les pores nucléaires. Parallèlement, dans le cytoplasme, les acides aminés sont activés chacun sur leur ARN de transfert par leur aminoacyl-ARNt synthétase spécifique : il existe un type d'ARN de transfert et une aminoacyl-ARNt synthétase spécifique pour chacun des acides aminés protéinogènes. Chaque ARN de transfert étant différent, il possède un anticodon spécifique, composé de trois nucléotides formant une séquence complémentaire d'un codon d'ARN messager : c'est cette spécificité qui assure la correspondance entre un codon donné et un acide aminé unique lié à un ARN de transfert déterminé.
Une fois dans le cytoplasme, les ARN messagers sont lus séquentiellement par des organites spécialisés appelés : ribosomes, formés d'ARN ribosomiques complexés avec plus d'une cinquantaine de protéines différentes. Ces ribosomes assemblent les acides aminés au fur et à mesure qu'ils parcourent les codons de l'ARN messager, réalisant ainsi la traduction de ce dernier : les aminoacyl-ARNt se lient séquentiellement aux codons de l'ARN messager par leur anticodon, et le ribosome catalyse la formation d'une liaison peptidique entre la chaîne polypeptidique naissante et l'acide aminé apporté par l'ARN de transfert.
De cette façon, la séquence peptidique des protéines correspond fidèlement à la séquence nucléotidique des gènes exprimés. Chez les eucaryotes, la traduction de l'ARN messager en protéines par les ribosomes se déroule dans le réticulum endoplasmique dit rugueux. Elle est éventuellement suivie de modifications post-traductionnelles, comme la glycosylation (liaison covalente d'oses), dans l'appareil de Golgi, qui constituent un élément important de la signalisation cellulaire. Chez les procaryotes, la transcription de l'ADN en ARN messager et la traduction de ce dernier en protéines ont lieu dans le cytoplasme et peuvent être simultanées, la traduction débutant alors que la transcription n'est pas encore achevée. Cette simultanéité donne lieu à un important type de régulation de la traduction.
Les protéines fonctionnelles sont le plus souvent synthétisées à partir des gènes par traduction directe d'un ARN messager. Cependant, lorsqu'une protéine doit être produite très rapidement ou en grande quantité, c'est tout d'abord un précurseur protéique qui est produit par l'expression du gène. On appelle pro protéine une protéine inactive possédant un ou plusieurs peptides inhibiteurs ; elle peut être activée pour donner une protéine fonctionnelle en clivant ce peptide inhibiteur par protéolyse lors d'une modification post-traductionnelle. proinsulin On appelle pré protéine une forme contenant un peptide signal à son extrémité N-terminale qui spécifie son insertion dans où à travers une membrane et la désigne pour être sécrétée ; ce peptide signal est clivé dans le réticulum endoplasmique. On appelle pré pro protéine une forme possédant à la fois un peptide signal et un peptide inhibiteur.
Transcription de l'ADN en ARN La première étape de la synthèse des protéines est la transcription d'un gène d'ADN en une molécule d'ARN messager(ARNm). L'ARN a une structure très proche de celle de l'ADN, mais est monocaténaire tandis que l'ADN tend à former des structures bicaténaires, l'ose y est le ribose au lieu du désoxyribose, et l'uracile y remplace la thymine. Ce processus se déroule à l'intérieur même du noyau des cellules d'eucaryotes et dans le cytosol des cellules deprocaryotes ; cette différence a des conséquences importantes sur le traitement de l'ARN synthétisé. Chez les eucaryotes, le fait que l'ARN gagne le cytoplasme à travers les pores nucléaires est à l'origine de la dénomination d'ARN « messager ».
Localisation de la boîte TATA chez les eucaryotes La transcription peut être divisée en trois étapes : initiation, élongation et terminaison, chacune régulée par un grand nombre de protéines, telles que des facteurs de transcription et des coactivateurs qui assurent que le bon gène est bien transcrit. L'initiation commence à partir d'un promoteur, c'est-à-dire d'une séquence nucléotidique recouvrant des séquences typiques telles que la boîte TATA (séquence consensus TATAA) chez les eucaryotes et la boîte de Pribnow (séquence consensus TATAAT) chez les procaryotes. Ces séquences sont riches en paires adénine-thymine, unies par seulement deux liaisons hydrogène, à la différence des paires guanine-cytosine qui sont unies par trois liaison hydrogène : ceci facilite l'ouverture de la double hélice d'ADN par une hélicase, libérant l'un des deux brins pour être copié en ARN. Une ARN polymérase (ARN polymérase II chez les eucaryotes) lit ce segment d'ADN dans le sens 3’ → 5’ tout en synthétisant l'ARN messager dans le sens 5’ → 3’. 5'-XXXXXXXXXXXXXXXXXXPPPPXXXXXXXXXXXXXXXXXXXXXXXXXXGGGGGGGGGGGGGGGGGGGGGGGGGGGGGG-3' -30 TATA box gène d'intérêt Localisation de la boîte TATA chez les eucaryotes
Tous les gènes d'une cellule n'encodent pas nécessairement des protéines : un très grand nombre d'entre eux encodent des ARN dits « non codants » car il s'agit non pas d'ARN messager porteurs codons d'acides aminés mais, par exemple, d'ARN ribosomique ou d'ARN de transfert, de sorte que l'ARN messager constitue une partie seulement de l'ARN issue de la transcription des gènes par des ARN polymérases. Chez les procaryotes, le produit de la transcription d'un gène de protéine est directement utilisable comme ARN messager. Chez les eucaryotes, en revanche, on parle de transcrit primaire, qui doit encore subir un certain nombre de modifications post-transcriptionnelles constituant la maturation de l'ARN messager, avant de devenir fonctionnel.
Modifications post-transcriptionnelles Les principales modifications post-transcriptionnelles de l'ARN pré-messager : sont l'ajout d'une coiffe de 7-méthylguanosine triphosphate à l'extrémité 5' et d'une queue poly(A) (50 à250 nucléotides d'adénine) à l'extrémité 3', puis l'épissage, consistant en l'élimination des introns (segments du gène qui ne codent pas un polypeptide) séparant les exons (qui, eux, sont codants). Cet épissage peut être variable (épissage alternatif).
Traduction de l'ARN messager en protéine Une fois que le brin d'ARN messager a atteint le cytoplasme, où a lieu la traduction, il se lie à un ribosome. Organite constitué d'une sous-unité 60S et d'une sous-unité 40S chez les eucaryotes, et d'une sous-unité 50S et d'une sous-unité 30S chez les procaryotes. Les ribosomes sont des complexes de protéineset d'ARN dits ARN ribosomiques. Ils assemblent les acides aminés pour former les protéines en fonction de la séquences nucléotidique de l'ARN messager, chaque codon de cette séquence correspondant à un acide aminé de la protéine en cours de synthèse. Les ribosomes possèdent trois sites notables, notés A, P et E : le site A (pour « Acide aminé »), situé sur la petite sous-unité ribosomique, est celui sur lequel l'aminoacyl-ARNt correspondant au codon d'ARNm en cours de lecture vient se lier au complexe ribosome-ARNm ; le site P (pour « Peptide »), situé sur la grande sous-unité ribosomique, est celui sur lequel se fixe la chaîne polypeptidique naissante, liée à l'ARNt correspondant au codon précédant celui en cours de lecture ; le site E (pour « Exit ») est celui sur lequel vient se fixer l'ARNt débarrassé de la chaîne polypeptidique naissante lorsque celle-ci est transférée depuis le site P vers l'aminoacyl-ARNt du site A.
ARNt de phénylalanine chez la levure, indiquant l'anticodon en rouge et l'hydroxyle 3’–OH estérifié par l'acide aminé en haut.
Processus de traduction de l'ARN en protéine
L'ADN est transcrit en ARN qui, chez les eucaryotes, est épissé en ARN messager.
Epissage
Epissage alternatif
Activation des acides aminés sur leur ARN de transfert Afin d'être incorporé dans une protéine, un acide aminé protéinogène doit préalablement être fixé par une liaison ester à l'extrémité 3’ de l'ARN de transfertcorrespondant. Cette activation est réalisée par une aminoacyl-ARNt synthétase. Il existe autant d'ARN de transfert et d'aminoacyl-ARNt synthétases qu'il y a d'acide aminés. Parmi les 22 acides aminés protéinogènes, seule la sélénocystéine fait exception, car elle est produite directement sur son ARN de transfert à partir de la sérine.
Initiation Processus de traduction de l'ARN en protéine La biosynthèse de la chaîne polypeptidique commence généralement au niveau d'un codon AUG, encodant la méthionine. Chez les procaryotes, c'est un résidu de N-formylméthionine qui est incorporé en position initiale, tandis que, chez les eucaryotes, c'est un résidu de méthionine, qui peut être clivé par la suite. Il existe deux ARN de transferts distincts selon que le codon AUG est un codon d'initiation ou un codon d'élongation. Le codon d'initiation peut être différent du codon AUG : il peut s'agir par exemple des codons CUG et UUG, qui encodent normalement la leucine, mais, lorsqu'ils sont lus comme codons d'initiation, sont interprétés comme codons de méthionine.
Élongation Le ribosome parcourt le brin d'ARN messager codon par codon (translocation) et ajoute, par l'intermédiaire d'un ARN de transfert (ARNt), un acide aminé à la protéine en cours de synthèse en fonction du codon en cours de lecture. La protéine est produite en commençant par l'extrémité N-terminale et en terminant par l'extrémité C-terminale. Le ribosome progresse le long de l'ARN messager sous l'action de facteurs d'élongation, qui tirent leur énergie de l'hydrolyse d'une moléculde de GTP.
Terminaison Une fois un codon-stop atteint (UAA, UGA ou UAG), la synthèse de la protéine est terminée : le ribosome se détache de la protéine et du brin d'ARN messager, et la protéine est libérée dans la cellule. Le ribosome se scinde en ses deux sous-unités et peut conduire une autre synthèse sur un autre ARN messager. S'entame alors le transport des protéines, qui peut les mener hors de la cellule et dans le système sanguin, ou encore à l'intérieur même de la cellule les ayant synthétisées. Le même brin d'ARN messager peut servir à la biosynthèse simultanée de plusieurs molécules de protéines, lorsque plusieurs ribosomes s'en chargent. Avant d'être détruite, cette molécule participe à la synthèse d'environ 10 à 20 protéines.
Code génétique Le code génétique est l'ensemble des règles permettant de traduire les informations contenues dans le matériel génétique des cellules vivantes afin de synthétiser les protéines. Au sens large, il établit la correspondance entre le génotype et le phénotype d'un organisme. Ce code repose notamment sur la correspondance entre, d'une part, des triplets de nucléotides, appelés codons, sur l'ARN messager et, d'autre part, les acides aminés protéinogènes incorporés dans les protéines synthétisées lors de la phase de traduction de l'ARN messager par les ribosomes. https://fr.wikipedia.org/wiki/Code_g%C3%A9n%C3%A9tique
Le nombre de mots de trois lettres pris dans un alphabet de quatre lettres étant de 43, le code génétique comporte 64 codons différents, codant directement 20 acides aminés dits standards ainsi que le signal de fin de la traduction, ce dernier étant codé par trois codons-stop ou codons de terminaison
Un codon est défini par le premier nucléotide à partir duquel la traduction commence. Ainsi la chaîne GGGAAACCC peut être lue selon les codons GGG·AAA·CCC, GGA·AAC et GAA·ACC selon qu'on commence la lecture des codons à partir du premier, du deuxième et du troisième nucléotide respectivement. Toute séquence nucléotidique peut ainsi être lue selon trois cadres de lecture distincts, qui résultent en des traductions en acides aminés totalement différentes : dans notre exemple, on aurait respectivement les acides aminés Gly–Lys–Pro, Gly–Asn et Glu–Thr.
Un cadre de lecture commence généralement avec un codon AUG codant pour la méthionine, ou la N-formylméthionine chez les bactéries et dans les mitochondries et les chloroplastes des eucaryotes. Le codon d'initiation le plus courant est AUG,
Dégénérescence du code génétique Le fait que les 64 codons encodent seulement 22 acides aminés protéinogènes plus la terminaison conduit à de très nombreuses redondances, faisant qu'un acide aminé standard est codé en moyenne par trois codons distincts — jusqu'à six codons différents. On parle de codons synonymes. Parmi les 20 acides aminés standards, seuls la méthionine et le tryptophane ne sont codés que par un codon, tandis que : l'asparagine, l'aspartate, la cystéine, le glutamate, la glutamine, l'histidine, la lysine, la phénylalanine et la tyrosine sont codés par deux codons distincts, l'isoleucine et la terminaison de traduction sont codées par trois codons distincts, la thréonine, la proline, l'alanine, la glycine et la valine sont codées par quatre codons distincts, et l'arginine, la leucine et la sérine sont codées par six codons.
A U G G C G U U C A G A A C U G A U A C G U A A
Le brin d'ARN messager est : A U G G C G U U C A G A A C U G A U A C G U A A Les différents codons sont donc : AUG · GCG · UUC · AGA · ACU · GAU · ACG · UAA Les ARN de transfert se fixent UAC CGC AAG UCU UGA CUA UGC AUU par complémentarité et apportent les acides aminés appropriés : Met Ala Phe Arg Thr Asp Thr Stop
L'insuline Un exemple de protéine L'insuline est faite de 2 chaînes de 21 et 30 acides aminés, nommées Chaîne A (21 a.a.) et B (30 a.a.). La séquence d'acides aminés de l'insuline : Chaîne A : Gly-Ile-Val-Glu-Gln-Cys-Cys-Thr-Ser-Ile-Cys-Ser-Leu-Tyr-Glu-Leu-Glu-Asn-Tyr-Cys-Asn Chaîne B : Phe-Val-Asn-Gln-His-Leu-Cys-Gly-Ser-His-Leu-Val-Glu-Ala-Leu-Tyr-Leu-Val-Cys-Gly-Glu-Arg-Gly-Phe-Phe-Tyr-Thr-Pro-Lys-Thr Les 2 chaînes sont liées par des ponts disulfures (-S-S-) En effet, les a.a. Cys peuvent se lier entre eux, solidifiant une forme particulière dans l'espace. La forme réelle de l'insuline -comme celle de beaucoup de protéines- est assez globulaire : “patatoïdale” :