Les méthodes d’analyse des transcrits différentiels Christine Bole-Feysot
INTRODUCTION Qu’est-ce qui caractérise une cellule ? -les gènes exprimés -leur niveau d’expression Les mécanismes moléculaires à l’origine de tous les processus biologiques normaux et pathologiques passent par des modifications quantitatives et qualitatives des ARN et des protéines. Méthodes permettant de repérer et d’identifier les ARN et les protéines dont la quantité varie
La régulation de l’expression des gènes chez les organismes eucaryotes
Définitions Protéome : ensemble des protéines présentes dans une cellule ou un tissu Transcriptome : ensemble des ARN présents dans une cellule ou un tissu Transcrit ou Protéine différentielle : Transcrit ou Protéine dont la quantité est modifiée ( ou )
Historique des techniques d’analyse des transcrits différentiels Technologies appliquées aux ADNc Techniques d’analyse des transcrits différentiels dérivées Caractéristiquede l’analyse Années 80 Banques d’ADN complémentaires Banques soustractives Qualitative Non exhaustive Années 90 PCR -Differential Display, CDNA-AFLP -RDA -SSH Facile à réaliser Fin années 90 Séquençage systématique : -de génomes entiers -de séquences exprimées (EST) Bio-informatique Microtechniques appliquées à la biologie moléculaire -SAGE -microarrays puces à ADN (« DNA chips ») Quantitative « exhaustive » lourde et onéreuse
BANQUE SOUSTRACTIVE Cellules A Cellules B ARNm A ARNm B ADNc A ADNc B dNTP-Biotine Hybridation A /A A /B B /B Elimination des ADNc portant de la biotine Banque soustractive A-B
Méthodes d’analyses des transcrits différentiels A PETITE ECHELLE mRNA Differential Display PCR soustractive : Representational Difference Analysis (RDA) Subtractive Suppressive Hybridization (SSH) Arrays sur membrane
mRNA - DIFFERENTIAL DISPLAY CMAAAAAAAAA-An Transcription inverse 5’-TTTTTTTTTTTTMG-3’ (T12MG) dNTPs Transcriptase inverse CMAAAAAAAAA-An GMTTTTTT Amplification par PCR 5’-AGCCAGCGAA-3’ (amorce AP1) 5’-TTTTTTTTTTTTMG-3’ (T12MG) dNTPs a-(35S-dATP) ou a-(33P-dATP) Taq polymerase AGCCAGCGAA GMTTTTTT AGCCAGCGAA GMTTTTTT AGCCAGCGAA GMTTTTTT
mRNA - DIFFERENTIAL DISPLAY Cellules A Cellules B ARNm A ARNm B AAAAAAAAAAA AAAAAAAAAAA RT (oligodT ancré) RT(oligodT ancré) AAAAAAAAAAA AAAAAAAAAAA TTTTTTT TTTTTTT PCR (oligodT/amorce aléatoire) dATP-S35 PCR (oligodT/amorce aléatoire) dATP-S35 AGCCAGCAA AGCCAGCAA TTTTTTT TTTTTTT ADNc A ADNc B Electrophorèse (polyacrylamide) Autoradiographie A B Bande « positive » Extraction des bandes « positives » du gel PCR Analyse des ADNc positifs potentiels (clonage, élimination des « faux positifs »)
Autoradiogramme de Differential Display Comparaison des cellules A et B A B A B A B A B A B A B
T AA TTTTTTTTTTTTCC GG Nombre d’oligonucléotides et de PCR possibles mRNA Differential Display Nombre d’oligonucléotides et de PCR possibles - Transcription inverse T AA TTTTTTTTTTTTCC GG 12 oligonulcéotides différents 3 possibilités 4 possibilités - PCR Primer 3’ (T12MX) : 12 possibilités Primer 5’ (10-mers) : 16 possibilités Nombre de PCR différentes possibles par échantillon : 12 x 16 = 192 Pour 2 échantillons : 192 x 2 = 384 PCR Pour 2 échantillons, PCR en duplicat ou triplicat : 768 ou 1152 PCR !!!
Autoradiogramme de Differential Display Comparaisons Contrôle et échantillon : C / E2 (3 PCR différentes pour C et 3 PCR différentes pour E2) Induced Constant
Avantages du mRNA Differential Diplay Peu d’ARN nécessaire Détection possible des transcrits différentiels correspondant à des gènes : - faiblement exprimés (en principe) - inconnus soumis à épissage alternatif Comparaison simultanée de plusieurs échantillons (cinétique, dose/réponse…) Mise en évidence de régulation positive et négative Facile à mettre en œuvre Très rapide Peu onéreux
Inconvénients du mRNA Differential Diplay Non exhaustif -compatibilité avec les oligonucléotides de PCR -Taille des produits de PCR ne doit pas excéder 500 pb Biais de la PCR : Grand nombre de « faux positifs » température d’annealing trop basse PCR manque de reproductibilité Elimination des faux positifs longue et fastidieuse Amplification préférentielle de certains ADNc - Réduction de la complexité des ADNc - Représentation de chaque type d’ADNc très différente de celle des ARNm dont ils sont issus Identification des ADNc pas toujours facile (dépend de l’espèce)
Ligation d’adaptateurs Electrophorèse (polyacrylamide) cDNA - AFLP Cellules A Cellules B ARNm A ARNm B ADNc A ADNc B Digestion enzymatique Ligation d’adaptateurs PCR Electrophorèse (polyacrylamide) Autoradiographie A B Bande « positive »
Principe général des techniques de PCR soustractives (RDA & SSH) Cellules A Cellules B ARNm A ARNm B ADNc A ADNc B Digestion enzymatique Ligation d’adaptateurs PCR Digestion enzymatique Hybridation B/B Pas d’amplification A/B Amplification linéaire A/A Amplification exponentielle PCR suppressive A - B Sous-clonage Banque soustractive A - B
REPRESENTATIONAL DIFFERENCE ANALYSIS (RDA)
SUBTRACTIVE SUPPRESSIVE HYBRIDIZATION (SSH) Banque soustractive A - B
Avantages de la RDA et de la SSH Peu d’ARN nécessaire Détection possible des transcrits différentiels correspondant à des gènes : - faiblement exprimés (SSH surtout) - inconnus soumis à épissage alternatif Identification facile des cDNA Assez facile à mettre en œuvre Rapide Peu onéreux
Inconvénients de la RDA et de la SSH Comparaison simultanée de plusieurs échantillons difficile Non exhaustif Les cDNA doivent avoir un minimum de 2 sites de restriction pour générer des produits amplifiables. Fabrication de 2 banques soustractives pour voir les gènes induits ET réprimés Biais de la PCR : Amplification préférentielle de certains ADNc - Réduction de la complexité des ADNc - Détection préférentielle des transcrits différentiels abondants -Faux positifs
MACROARRAYS ADNc « positif » indétectable
MACROARRAYS NS GA G1 G1/S G2 Analyse de l’expression de 96 gènes au cous du cycle cellulaire d’une lignée synchronisée NS GA G1 G1/S G2 Cellules non synchronisées (NS), en arrêt de croissance (GA), en phases G1, G1/S et G2 du cycle cellulaire.
Avantages des macroarrays Peu d’ARN nécessaire Comparaison simultanée de plusieurs échantillons (cinétique, dose/réponse…) Choix du matériel à spotter sur les membranes : -produits de PCR : RT-PCR, plasmides ou lysats bactériens amplifiés -clones bactériens : issus de banques d’ADNc, de banques soustractives Assez facile à mettre en œuvre (automatisation possible)
Inconvénients des macroarrays Non exhaustif Préparation des membranes peut être longue Attention à la qualité du matériel spotté Cross-hybridation (faux négatifs)
Microarrays sur Nylon 8000 gènes
Méthodes d’analyses des transcrits différentiels A GRANDE ECHELLE Serial Analysis of Gene Expression (SAGE) Microarrays sur lames, DNA chips (puces à ADN)
Serial Analysis of Gene Expression (SAGE)
SERIAL ANALYSIS OF GENES EXPRESSION (SAGE) Digestion (bouts francs) AAAAAA ARNm Transcription inverse sur bille AAAAAA TTTTTT Digestion par l ’enzyme d ’ancrage Ligation d’adaptateurs (A ou B) AAAAAA A TTTTTT AAAAAA B TTTTTT Digestion par l’enzyme d ’étiquettage A B Digestion (bouts francs) Ligation Amplification par PCR B A Digestion, Concaténattion Clonage, Séquençage
SAGE
ADNc complet 5’ NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCATGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCATGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCATGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCATGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCATGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAATAAANNNNNNNNNNNNNAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 3’ CATGNNNNNNNNNN : 14 pb 4 pb site de restriction pour NlaIII + 10 pb étiquette (TAG) spécifique
SAGE : analyse des résultats Compilation des résultats de séquençage Calcul de la fréquence d’apparition Séquençage en série NB : La qualité des résultats dépend du nombre de Tags séquencés 1-Précision du SAGE: Echantillonnage de Tags statistiquement représentatif de la totalité du transcriptome : 50 000 Tags ->Quantitatif En-dessous de 50 000 Tags les quantités relatives calculées de chaque transcrit ne sont pas constantes (pour 1000, 1500, 2000 Tags) -> seulement semi-quantitatif 2-Sensibilité du SAGE : dépend du nombre de Tags séquencés (résultats moins fiables pour les transcrits rares)
Avantages du SAGE ~ Exhaustif Bilan transcriptionnel Détection possible des transcrits différentiels correspondant à des gènes : - faiblement exprimés (limite en fonction du nombre de tags séquencés) Inconnus Mise en évidence de régulation positive et négative Construction de bases de données de SAGE
Inconvénients du SAGE Techniquement difficile à mettre en œuvre Haute capacité de séquençage nécessaire Long et onéreux Identification des ADNc pas toujours facile - Attention aux erreurs de séquençage (des Tags de SAGE et des bases de données) - Identification très difficile pour les espèces « exotiques » - Comparaison d’un grand nombre d’échantillon difficile Initialement beaucoup d’ARN nécessaire Optimisation MicroSAGE, SADE Biais de la PCR : - Amplification préférentielle de certains ADNc (même avec des amplicons de taille identique) - Modification de la représentation de chaque type d’ADNc par rapport à celle des ARNm dont ils sont issus - Parfois grand nombre de Ditags identiques : artefacts