2IBS Master 2 Jérôme Pelloux / Valérie Lefebvre Îlot des Poulies, 1er étage gauche jerome.pelloux@u-picardie.fr valerie.lefebvre@u-picardie.fr
Introduction – concepts de biologie moléculaire
Les êtres vivants sont des machines - qui se reproduisent à l'identique - qui se différencient de manière autonome Ces propriétés leur sont conférées par une information Cette information est contenue dans leur génome Un génome peut être représenté par une séquence = suite de nucléotides {A,C,G,T} = ADN
Structure des gènes eucaryotes promoteur exons introns ADN 5’ 3’ 5’UTR 3’UTR Régions non traduites (UTR) Régions traduites (CDS)
Structure de l’ADN
Transcription de l’ADN ADN ARN = expression de l’information génétique 5’ 3’ 3’ 5’ T T T T 5’ 3’
Transcription de l’ADN ADN ARN = expression de l’information génétique complémentarité de bases 3’ 5’ ARNm Matrice ADN transcrite codante
Traduction de l’ARN ARN protéine T T T T 5’ 3’
Traduction de l’ARN ARN protéine Universel Dégénéré Non chevauchant ADN et ARN = information CODÉE = code génétique Universel Dégénéré Non chevauchant Code non chevauchant : cadre de lecture défini un START et un STOP en phase 3 cadres de lecture possibles GGTCTGCTTCATGACACCGATACAATGAGATAA 5’ 3’ start stop
Traduction de l’ARN ARN protéine Universel Dégénéré Non chevauchant ADN et ARN = information CODÉE = code génétique Universel Dégénéré Non chevauchant Code non chevauchant : cadre de lecture défini un START et un STOP en phase 3 cadres de lecture possibles 5’ GGTCTGCTTCATGACACCGATACAATGAGATAA 3’ start stop
Traduction de l’ARN ARN protéine Universel Dégénéré Non chevauchant ADN et ARN = information CODÉE = code génétique Universel Dégénéré Non chevauchant Code non chevauchant : cadre de lecture défini un START et un STOP en phase 3 cadres de lecture possibles GGTCTGCTTCATGACACCGATACAATGAGATAA 5’ 3’ stop
Expression génétique = flux unidirectionnel ADN ARN protéine Réplication (ADNADN) ADN 5’ 3’ Information ADN 3’ 5’ Transcription (ADNARN) ARN Décodage en 2 étapes aboutit à la synthèse de la protéine ARNm Intermédiaire 5’ 3’ Traduction (ARNprotéine) NH2 COOH Fonction protéine http://en.wikipedia.org/wiki/File:Central_Dogma_of_Molecular_Biochemistry_with_Enzymes.jpg
APPLICATION : TRANSCRIPTION ET TRADUCTION 5’ CATGCCGATATGGGTTCGCTTCAGACACCGATACAAATGAGATAAAAAATACC 3’ ADN
APPLICATION : TRANSCRIPTION ET TRADUCTION 5’ CATGCCGATATGGGTTCGCTTCAGACACCGATACAAATGAGATAAAAAATACC 3’ 3’ GTACGGCTATACCCAAGCGAAGTCTGTGGCTATGTTTACTCTATTTTTTATGG 5’ ADN
5’ CATGCCGATATGGGTTCGCTTCAGACACCGATACAAATGAGATAAAAAATACC 3’ 3’ GTACGGCTATACCCAAGCGAAGTCTGTGGCTATGTTTACTCTATTTTTTATGG 5’ ADN ARN
5’ CATGCCGATATGGGTTCGCTTCAGACACCGATACAAATGAGATAAAAAATACC 3’ 3’ GTACGGCTATACCCAAGCGAAGTCTGTGGCTATGTTTACTCTATTTTTTATGG 5’ ADN ARN 5’ CATGCCGATATGGGTTCGCTTCAGACACCGATACAAATGAGATAAAAAATAGC 3’ ARN 5’ CATGCCGATATGGGTTCGCTTCAGACACCGATACAAATGAGATAAAAAATAGC 3’ ARN 5’ CATGCCGATATGGGTTCGCTTCAGACACCGATACAAATGAGATAAAAAATAGC 3’
5’ CATGCCGATATGGGTTCGCTTCAGACACCGATACAAATGAGATAAAAAATACC 3’ 3’ GTACGGCTATACCCAAGCGAAGTCTGTGGCTATGTTTACTCTATTTTTTATGG 5’ ADN ARN 5’ CATGCCGATATGGGTTCGCTTCAGACACCGATACAAATGAGATAAAAAATAGC 3’ ARN 5’ CATGCCGATATGGGTTCGCTTCAGACACCGATACAAATGAGATAAAAAATAGC 3’ ARN 5’ CATGCCGATATGGGTTCGCTTCAGACACCGATACAAATGAGATAAAAAATAGC 3’ 5’ ATGCCGATATGGGTTCGCTTCAGACACCGATACAAATGA 3’ Séquences traduites 5’ ATGGGTTCGCTTCAGACACCGATACAAATGAGATAA 3’ 5’ ATGAGATAA 3’
Met Gly Ser Leu Gln Thr Pro Ile Gln Met Arg 5’ CATGCCGATATGGGTTCGCTTCAGACACCGATACAAATGAGATAAAAAATACC 3’ 3’ GTACGGCTATACCCAAGCGAAGTCTGTGGCTATGTTTACTCTATTTTTTATGG 5’ ADN ARN 5’ CATGCCGATATGGGTTCGCTTCAGACACCGATACAAATGAGATAAAAAATAGC 3’ ARN 5’ CATGCCGATATGGGTTCGCTTCAGACACCGATACAAATGAGATAAAAAATAGC 3’ ARN 5’ CATGCCGATATGGGTTCGCTTCAGACACCGATACAAATGAGATAAAAAATAGC 3’ 5’ ATGCCGATATGGGTTCGCTTCAGACACCGATACAAATGA 3’ Séquences traduites 5’ ATGGGTTCGCTTCAGACACCGATACAAATGAGATAA 3’ 5’ ATGAGATAA 3’ Protéines Met Pro Ile Trp Val Arg Phe Arg His Arg Tyr Lys Met Gly Ser Leu Gln Thr Pro Ile Gln Met Arg Met Arg
Structure des génomes L’ADN constitue le support de l’information génétique dont les unités sont les gènes Un gène code généralement une protéine Un gène est «orienté » : il se lit de 5’ vers 3’ Un gène peut être codé sur l’un ou l’autre des 2 brins d’ADN
Structure des gènes eucaryotes un ARN code une protéine Les gènes sont séparés par des régions intergéniques Les gènes sont constitués d’éléments non-transcrits et d’éléments transcrits 1- le promoteur démarrage de la transcription régulation de la transcription 2- 5’ UTR untranslated region = région non traduite 3- les exons régions codantes des gènes = CDS (coding sequences) 4- les introns régions non-codantes, séparent les exons seront épissés après transcription : ARN mature 5- 3’ UTR
Structure des gènes eucaryotes promoteur exons introns ADN 5’ 3’ 5’UTR 3’UTR Régions non traduites (UTR) Régions traduites (CDS)
Structure des gènes eucaryotes promoteur exons introns ADN 5’ 3’ 5’UTR 3’UTR TRANSCRIPTION préARNm ATG STOP Régions non traduites (UTR) Régions traduites (CDS)
Structure des gènes eucaryotes promoteur exons introns ADN 5’ 3’ 5’UTR 3’UTR TRANSCRIPTION préARNm ATG STOP MATURATION / EPISSAGE signaux d’épissage donneur accepteur ARNm ATG STOP Régions non traduites (UTR) Régions traduites (CDS) AG GU AG GU
Structure des gènes eucaryotes promoteur exons introns ADN 5’ 3’ 5’UTR 3’UTR TRANSCRIPTION préARNm ATG STOP MATURATION / EPISSAGE signaux d’épissage donneur accepteur ARNm ATG STOP Régions non traduites (UTR) Régions traduites (CDS) AG GU AG GU TRADUCTION point de branchement Protéine
Structure des gènes eucaryotes promoteur exons introns ADN 5’ 3’ 5’UTR 3’UTR TRANSCRIPTION préARNm ATG STOP MATURATION / EPISSAGE signaux d’épissage donneur accepteur ARNm ATG STOP Régions non traduites (UTR) Régions traduites (CDS) AG GU AG GU TRADUCTION point de branchement Protéine MODIFICATIONS POST-TRADUCTIONNELLES Fonction
Structure des gènes eucaryotes promoteur exons introns ADN 5’ 3’ 5’UTR 3’UTR TRANSCRIPTION préARNm ATG STOP EPISSAGE ALTERNATIF ATG STOP ATG STOP ARNm Protéine
Structure des gènes eucaryotes promoteur exons introns ADN 5’ 3’ 5’UTR 3’UTR TRANSCRIPTION préARNm ATG STOP EPISSAGE ALTERNATIF ATG STOP ATG STOP ARNm TRADUCTION Protéine
POST-TRADUCTIONNELLES Structure des gènes eucaryotes promoteur exons introns ADN 5’ 3’ 5’UTR 3’UTR TRANSCRIPTION préARNm ATG STOP EPISSAGE ALTERNATIF ATG STOP ARNm ATG STOP TRADUCTION Protéine MODIFICATIONS POST-TRADUCTIONNELLES Fonction 1 Fonction 2
Régulation de l’expression Au niveau transcriptionnel : La régulation de l’expression des gènes se fait généralement grâce à des séquences particulières situées au niveau des promoteurs des gènes. initiation de la transcription régulation de la transcription dans le temps et l’espace ou en réponse à des signaux extérieurs par fixation de facteurs sur des séquence particulières
Régulation de l’expression Au niveau transcriptionnel : La régulation de l’expression des gènes se fait généralement grâce à des séquences particulières situées au niveau des promoteurs des gènes. initiation de la transcription régulation de la transcription dans le temps et l’espace ou en réponse à des signaux extérieurs par fixation de facteurs sur des séquence particulières Au niveau post traductionnel : L’adressage particulier des protéines (organite particulier) se fait par clivage de peptides signaux
Particularités des génomes eucaryotes Chez l’homme, 25 000 gènes sur 3.109 bases Chez l’homme, 98.5% du génome est non codant Eléments régulateurs de l’expression : 5% les répétitions en tandem : 5% les éléments transposables (éléments répétés) : 45% (80% chez le blé) L’ADN condensé (au niveau des centromères et des télomères) : 10% Problème d’assemblage des génomes lors du séquençage
Introduction à la transcriptomique Bioinformatique et Analyse des génomes
Génomique fonctionnelle Comment les gènes sont-ils régulés? Comment les gènes ou les produits de ces gènes interagissent-ils? Comment l’expression des gènes est elle régulée entre différents types cellulaires? Comment l’expression des gènes est elle régulée en fonction de différents traitements? Rôle fonctionnel de ces gènes?
Mesure de l’expression des gènes Northern blot RT-PCR 1 gène/tissu cDNA AFLP Amplified Fragment Length Polymorphism ens gènes SAGE (Serial Analysis of Gene Expression) ens gènes Microarray 10000 gènes/tissu ens gènes
Northern-Blotting Extraction des ARN totaux d’un tissu/culture cellule Purification des polyA+ Séparation des ARN grâce à l’électrophorèse (taille) en gel agarose dénaturant (formaldéhyde) Transfert sur une membrane (nylon ou nitrocellulose) Hybridation avec une sonde marquée Détection
Northern-Blotting Points critiques – Extraction ARN
RT-PCR Extraction des ARN totaux d’un tissu/culture cellule Purification des polyA+ Obtention des ADNc par reverse transcription ADNc sont utilisés pour des réactions de PCR Séparation des produits de PCR sur gel d’Agarose Traitement des signaux si quantification relative
RT Utilisation de transcriptase reverse Amorces (primers) spécifiques ou oligo-dT (18 à 20 T) ADNc stable à -20°C Design d’amorces spécifiques du gène d’intérêt pour la PCR
RT-PCR : choix des amorces pour la RT AAAAAAAA TTTTTTTT OligodT RT AAAAAAAA hexanucléotides AAAAAAAA RT Amorce spécifique
RT-PCR
RT-PCR Design d’amorces spécifiques du gène d’intérêt pour la PCR • Nécessite la connaissance d’une partie de la séquence d’ADN à amplifier, ou celle d’espèces très proches (BLAST- CLUSTAL) • Sélectionner des amorces avec un % de GC de l’ordre de 50% et une distribution aléatoire des bases • Eviter les séries (stretches) de polypurines ou polypyrimidines du type CCCCCCCC • Eviter les séquences possédant des structures secondaires importantes, principalement du coté 3’ • Vérifier les amorces pour éviter qu’elles soient complémentaires, afin d’éviter la formation de dimères • Amorces doivent avoir une longueur de 20-30 pb, et un Tm élevé (55 à 60°C)
RT-PCR Design d’amorces spécifiques du gène d’intérêt pour la PCR • Paires d’amorces 5’- ACGGATACGTTACGCTGAT-3’ 5’- TCCAGATGTACCTTATCAG -3’ • Complémentarité des extrémités 3’ 5’-ACGGATACGTTACGCTGAT-3’ 3’-GACTATTCCATGTAGACCT-5’ • Structures secondaires du coté 3’ (et 5’) 5'-ACGGATACGTTACGCTGCG-3'
RT-PCR Machine Programmation
RT-PCR - Principe Produits PCR nb Cycle 1 2 3 Electrophorèse Prod PCR Marqueur Electrophorèse Gel agarose
Zone d’amplification exponentielle Zone d’amplification limitée RT-PCR - Principe Détermination de la zone linéaire Quantité produit [DNA] Nombre de Cycles (N) Zone d’amplification exponentielle [DNA](N) =[DNA]0X2N Zone d’amplification limitée
RT-PCR - Principe Quantité prduit [DNA] Zone d’amplification limitée Nombre de Cycles (N) Zone d’amplification exponentielle visible [DNA](N) =[DNA]0X2N
RT-PCR - Principe 1 2 3 Quantité produit [DNA] Nombre de Cycles (N) n cycles
Nombre de cycles de PCR nécessaire pour atteindre la phase linéaire RT-PCR - Principe Détermination de la zone linéaire d’amplification Nombre de cycles de PCR nécessaire pour atteindre la phase linéaire 21 22 23 24 25 26 27 28 29 30 Contrôle (gène constitutif) Oléosine 11-b-hydroxysteroid dehydrogenase L. Gutierrez. Thèse.
RT-PCR - Principe PCR et gel. Coloration EtBr ou SYBRI Embryon 10 jours Embryon 20 jours Embryon 30 jours Embryon 40 jours Embryon 50 jours Graine mature végétatif Contrôle (gène constitutif) Oléosine 11-b-hydroxysteroid dehydrogenase L. Gutierrez. Thèse.
RT-PCR - Principe Scan des gel et intégration des donnéees
RT-PCR Méthode permet d’utiliser des quantités de matériel faibles PCR permet d’amplifier des gènes peu exprimés Multiplication des expériences possibles Nécessite de nombreuses mises au point quant au nombre de cycles Quantification à soigner
RT-PCR temps réel Méthode nécessite obtention ADNc Conditions de PCR semblable à RT-PCR semi-quantitative Taq, MgCl2, dNTP Mais addition de fluorophore SYBR green I dans le mélange réactionnel 497 nm 521 nm
RT-PCR temps réel Réactions en tubes ou capillaires selon appareillage Capillaires verre Tubes plastiques
RT-PCR temps réel Permet de suivre l’apparition du produit sur le moniteur grâce à un microspectrophotomètre
RT-PCR temps réel Trois gènes avec des niveaux d’expression différents Fluorescence [DNA] [DNA] CP1 CP2 CP3 Nombre de Cycles (N) CP = CROSSING POINT Ct = Cycle threshold
RT-PCR temps réel Quantification du niveau d’expression par rapport à un gène constitutif Gène cible Gène de référence Fluorescence [DNA] [DNA] CP2 Nombre de Cycles (N) CP1 CP3
RT-PCR - Principe 1 2 3 Quantité produit [DNA] Nombre de Cycles (N) n cycles
RT-PCR temps réel Exemple At5g49180 Cp RT-PCR temps réel Si F + T H G Fl Si RT-PCR classique
RT-PCR temps réel Exemple At5g49180 Si F + T Cp
RT-PCR temps réel Exemple At5g49180 Quantification par rapport à un gène constitutif (actine par ex)
RT-PCR temps réel Exemple At5g49180 Quantification par rapport à un gène constitutif (actine par ex) Quantification est très précise (sensibilité 1 copie) Quantification est très rapide Autres avantages…..
Quantité de données Plan de plaque qRT-PCR Validation Gène de référence septembre 2013 cDNA Couples d'amorces testés 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 PPR H2O Col Sk0244 Sk017 Sk0319 Sk0542 Sk0674 Sk0957 G052 W489 APT1 Clathrin At4g26410 TIP41 At4g33380 EF1a At1g53830 At1g62770 At1g11580 At1g67750 At4g00080 At4g24780 At5g14650 Gène de référence Faire un mix pour chaque couple d’amorce de gène de ref et déposer 7.5 µl de mix sur toute la ligne correspondante Déposer 2.5 µl ADNc dans les puits correspondants à l’aide de la pipette multicanaux et des barrettes d’ADNc Recouvrir la plaque d’un film transparent adapté pour qPCR Vortexer la plaque et centrifuger quelques secondes pour bien homogénéiser Lancer le LightCycler At1g53830 At1g62770 At1g11580 At1g67750 At4g00080 At4g24780 At5g14650 Gène de référence
LightCycler 480:
Résultat de la première plaque: - Lorsque le run est terminé, cette fenêtre apparaît. - Cliquer alors sur « Analysis » pour connaître la valeur des CT sortant pour chaque gène de ref sur chaque cDNA
Microarrays / DNA chips Que sont les microarrays? Comment les utiliser? Comment sont ils faits?
Microarray technology Microarrays Microarray technology Permettent d’étudier le transcriptome à une grande échelle (10 0000/ens des gènes ) Permettent de comparer l’expression des gènes entre Deux traitements Mutant vs sauvage Mutant vs transgéniques Cinétique d’expression
Microarrays / DNA chips Les microarrays correspondent à des dépôts d’acides nucléiques sur une lame microscope Taille des dépôts de 50 à 100 mm Haute densité (10 à 50 dépôts / mm2) Trois types de dépôts ESTs GSTs Oligonucléotides
Microarrays / DNA chips Exemple d’expérience Extraction ARN (4mg total) RT en présence de marqueurs fluorescents Cy-3 et Cy-5 ont une fluorescence différente Hybridation avec lame Lavages (stringence) 2 lasers Intégration des spots
Microarrays / DNA chips Arabidopsis whole genome H2O2 treatment, 0 hr to 0 hr, whole genome http://atarrays.tigr.org/arabdata.shtml Traitement bioinformatique Analyse des données
Microarrays / DNA chips Spécificité
Microarrays / DNA chips Traitement de l’image Scan de la lame Quantification de la fluorescence de chaque spot Soustraire le bruit de fond Normaliser le signal Exporter sous forme d’un tableau avec les intensités de fluorescence pour chaque gène dans l’array Automatique avec logiciel Des erreurs dans quantification possibles, mais vérifier des milliers de spots à l’œil?
Programme élimine les spots avec Microarrays / DNA chips Traitement de l’image Gridding = identification de ce qui est spot Programme élimine les spots avec -forme ou taille irrégulière -mauvaise localisation -faible intensité -saturation du signal -variation du bruit de fond Segmentation
Microarrays / DNA chips Identification de variations entre traitement Cluster de gènes ayant la même réponse = regroupement des gènes ayant un même profil d’expression Seules variations de x2 sont prises en compte
Microarrays / DNA chips Analyse par cluster hierarchisé Même rôle?? Même rôle??
Microarrays / DNA chips Analyse par cluster hierarchisé
Microarrays / DNA chips Variabilité des données Très variable car des taux d’expression sont mesurés Mesure de milliers de valeurs Réplicats et statistiques nécessaires afin de montrer que les différences mesurées sont réelles Utiliser des réplicats d’expérience, pas d’échantillons
Microarrays / DNA chips Origine de la variabilité Analyse de l’image (identification et quantification des spots) Scanning (laser et detecteur, chimie du marquage) Hybridation (température, mélange) Extraction de l’ARN Variabilité biologique
Microarrays / DNA chips Origine de la variabilité Analyse de l’image (identification et quantification des spots) Scanning (laser et detecteur, chimie du marquage) Hybridation (température, mélange) Marquage de la sonde Extraction de l’ARN Variabilité biologique
Microarrays / DNA chips Origine de la variabilité Deux qualités de lames différentes……
Microarrays / DNA chips Origine de la variabilité Conditions de dépots (température/humidité)…… Tampon de dépôt 50% dimethyl-sulfoxide sulfoxide (DMSO), 20mM Tris HCl, 50mM KCl, pH 6.5
Microarrays / DNA chips Outil très puissant En plein développement Aide d’un bioinformaticien indispensable Permet de mettre en évidence la réponse de voies métaboliques à un stress Mais étudier les variations de quantité de transcrits ne donne pas d’indication sur le contenu protéique….
Microarrays / DNA chips Outil très puissant En plein développement Aide d’un bioinformaticien indispensable Permet de mettre en évidence la réponse de voies métaboliques à un stress Mais étudier les variations de quantité de transcrits ne donne pas d’indication sur le contenu protéique….
Bases de données microarray http://genome-www5.stanford.edu/
http://www.ebi.ac.uk/arrayexpress/