Les réseaux d’interactions protéine-protéine INTERACTOMES

Slides:



Advertisements
Présentations similaires
TP master 1 Transfection
Advertisements

Un aperçu de la bioinformatique moléculaire
La génétique bactérienne cours 5
I) Obtention de l’ADN recombinant
I) Obtention de l’ADN recombinant
VACCINS ISSUS DU GÉNIE GÉNÉTIQUE : QUELS RISQUES ?
PLAN I. Support et organisation de l'IG
I. Support et organisation de l'IG II. Méca
Génomique et post-génomique végétale
Le système de sécrétion de type II chez V. cholerae
Bioinformatique =?? génomique protéomique
Licence professionnelle de Génomique
Genetic Suppression of Polyglutamine Toxicity in Drosophila
Transcription in vitro : principe et applications
L’isolement et la manipulation des gènes
Biochimie structurale
Responsables P. Maury & R. Babilé
Genetic Suppression of Polyglutamine Toxicity in Drosophila Parsa Kasemi-Esfarjani, et al ; Science 287, 1837 (2000)
UBLO Comparaison de génomes bactériens : questions méthodologiques autour de la définition du squelette et des boucles
The origin and evolution of synapses
Hervé PHILIPPE BIN1001 – hiver 2006
Bi 231: Ingénierie des Protéines
CHAPITRE 19 - La génétique des populations
Chapitre 3 - Les fondements chromosomiques de l'hérédité
Expression du Génome Le transcriptome.
Clonage Moléculaire.
La méthode enzymatique de séquençage, dite de (Sanger; didésoxy)
Biologie Moléculaire Travailler avec l’ADN.
Des Protéines aux Gènes …
Les bactéries Gram négatives possèdent plusieurs systèmes pour transférer le matériel génétique. L’un de ces mécanismes est le système de conjugaison.
Prédiction d’interactions protéine-protéine
LA REGULATION DE L’EXPRESSION DES GENES
Ordre de passage pour les présentations
ECUE Méthodologie de la Génétique Moléculaire
Induction de l’expression de la frataxine avec des protéines TALEs ciblant son promoteur Dr. Jacques P. Tremblay Université Laval Québec., Canada.
Réseau d’interactions Développement, reproduction,
Co-expression = fonction (Eisen et al., PNAS 1998)
Real-Time PCR assay for rapid and accurate detection of point mutations conferring resistance to clarithromycin in Helicobacter pylori.
Mutagenèse chez la drosophile
Introduction Matériels et méthodes Résultats
Efficient concerted integration by recombinant HIV-1 integrase without cellular or viral cofactors Sapna Sinha, Michael H. Pursley and Duane P. Grandgenett.
E.R. Gauthier, Ph.D.CHMI 3216F – A20091 Bioingénierie de l’A.D.N. CHMI 3216 F 14 Septembre 2009 Boîte à outils, 2 ième partie (suite). Plasmides, clonage.
CHMI 2227F Biochimie I Expression des gènes
Réseau d’interactions Développement, reproduction,
Étude de la régulation des protéines Rho3 et Rho4: recherche des kinases responsables de la phosphorylation de la RhoGAP Rgd1 chez la levure Saccharomyces.
Dénturation/hybridation Population A Tester Population B Driver RNA RNA RT avec oligodT cDNA Dénturation/hybridation Excès de driver Clonage dans.
Evidence for a functional RNA element in the hepatitis C virus core gene Laura K. McMullan, Arash Grakoui, Matthew J. Evans, Kathleen Mihalik, Montserrat.
Clonage Moléculaire.
Arbre = réseau connexe non cyclique
Les biotechnologies.
Cartographie génomes entiers
L’analyse d’ADN et la génomique
Aspects techniques des biotechnologies
REGULATION DE L’EXPRESSION DES GENES
Régulation de l’expression génétique: Régulation procaryotes
Introduction à la Bio-Informatique
TD-1 régulation de l’expression génique
Régulation de l’expression génétique: la transcription
CHMI 4206 Bioinformatique appliquée
CHMI 4206 Bioinformatique appliquée
CHMI 4206 Bioinformatique appliquée
Aspects techniques des biotechnologies
Techniques d’Analyse Moléculaire
Projet IRIS : Impact des Radiations IonisanteS sur l’évolution des bactéries E.coli LPC, CNRS- IN2P3, Université Blaise Pascal Marianne Coulon, Nathanael.
Projet IRIS : Impact des Radiations IonisanteS sur l’évolution des bactéries E.coli LPC, UMR 6533 CNRS- IN2P3, Université Blaise Pascal Marianne Coulon,
La parasexualité des bactéries Le génome bactérien.
Plan du cours 1. Introduction 2. L’eau 3. Les acides aminés, les peptides et les protéines 4. La structure tridimensionnelle des protéines 5. Exploration.
L’histoire du gène depuis le début du 20 e siècle jusqu’à aujourd’hui Michel Morange, Centre Cavaillès, République des savoirs USR 3608, Ecole normale.
Transcription de la présentation:

Les réseaux d’interactions protéine-protéine INTERACTOMES Emmanuelle Bouveret Laboratoire d'Ingénierie des Systèmes Macromoléculaires bouveret@ibsm.cnrs-mrs.fr Les réseaux d’interactions protéine-protéine INTERACTOMES M2, 2007

Techniques de détection des interactions protéine-protéine Introduction : notions Génomique Protéomique Organisation supramoléculaire Identification de la fonction des gènes Construction systématique de cartes d’interactions protéine-protéine à grande échelle Par double-hybride Par purification de complexes Principe d’identification des protéines par spectrométrie de masse Description de la méthode TAP Autres méthodes et comparaisons Techniques de détection des interactions protéine-protéine Double-hybride chez la levure Double-hybride bactérien Co-purifications par affinité Purification de complexes

La génomique (1) Escherichia coli 370 génomes procaryotes entièrement séquencés (2007) http://cmr.tigr.org Les eucaryotes aussi: Saccharomyces cerevisiae (1996) Caenorabditis elegans (1998) Drosophila melanogaster (2000) Arabidopsis, Zebrafish, Souris, Rat, Humain … (2002) Escherichia coli Rajouter un dessin d’un génome procaryote

La génomique (2) nombre de gènes: Comment déterminer la fonction de ces gènes à grande échelle? 2000-6000 6000 19000 13500 30000

Comment trouver la fonction des gènes? Evolution, liens entre les gènes Homologies de séquences Expression Régulation Co-purifications Activité enzymatique ... Phénotype knockout, RNAi Expression Localisation Homologies de structure Biologie moléculaire: Purification de partenaires dont la fonction est connue

Un seul génome… … plusieurs protéomes

Le protéome PM pI Années 70, définition classique: catalogue de gels 2D, expression différentielle Années 80: révolution de la biologie moléculaire Années 90: avancées dans les techniques de spectrométrie de masse La spectrométrie de masse associée à la génomique permet d’identifier la composition protéique d’une cellule à un instant donné. Ideal serait de mettre en premier un gel sans annotation puis faire apparaître le nom des proteines. pI

Organisation supramoléculaire Interactome Les protéines n’agissent pas seules et isolées. De la description des composants (génome et protéome), il est nécessaire de comprendre l’organisation et la dynamique des réseaux d’interactions. David S. Goodsell

La protéomique « fonctionnelle » Description exhaustive de la composition en ARN, ou en protéines d’une cellule. Mais qu’en est-il de la fonction et de l’organisation de ces protéines? On aboutit à une nouvelle définition de la protéomique. = Identification systématique des partenaires protéiques Description de l’  « interactome » d’une cellule Notion de « coupable par association »

Techniques d’obtention de cartes d’interactions à grande échelle Interactions physiques entre protéines Double hybride dans la levure Purification de complexes et spectrométrie de masse Associations fonctionnelles entre gènes Co-expression ARNm Association génétique: synthétiques létaux Interaction in silico Fusion de gènes, association de gènes, profile phylogénétique

La modularité des facteurs de transcription principe élémentaire du double hybride dans la levure DF DA Facteur de transcription ARN messager DF DA Gène Site de fixation pour le facteur de transcription DF: Domaine de fixation à l'ADN + DA: Domaine d'activation de la transcription

Le double hybride dans la levure le test DA Proie Y DF Appât X Gène rapporteur La protéine APPÂT est fusionnée au domaine de fixation à l'ADN DF. Les protéines PROIES sont fusionnées au domaine d'activation de la machinerie basale de transcription DA. Les protéines fusions sont exprimées dans des cellules de levure contenant un gène rapporteur dont l'expression est placée sous le contrôle du site de fixation pour le domaine de fixation à l'ADN DF.

Le double hybride dans la levure le test DA Proie Y ARN rapporteur DA Proie Y DF Appât X Gène rapporteur Lorsque la protéine proie Y est capable d'interagir avec la protéine appât X, le domaine d'activation se retrouve à proximité du promoteur du gène rapporteur et la transcription a lieu.

Principe du double-hybride dans la levure (2) Criblage d’une banque But: identifier les partenaires protéiques d’une protéine appât choisie 1- Construction d’une banque d’expression 2- Sélection GAL4AD Y1 Y2 Yn Proies GAL4DB Ma protéine Appât Identification des partenaires de ma protéine NB: protéines de n’importe quel organisme, mais système hétérologue.

Le double-hybride systématique Idée: prendre tous les gènes d’un organisme comme appâts. cribler tous ces appâts contre une banque de proies. identifier toutes les interactions protéine-protéine possibles. Nécessité du haut débit, automatisation Plusieurs études systématiques 2 sur la levure 1 sur Helicobacter pylori 1 sur Caenorabditis elegans 1 sur l’homme Possibilite de rajouter l’etude sur C. elegans

Génétique dans la levure Auxotrophie (HIS, TRP, LEU, ADE, URA …) Haploidie/diploidie Mating type Vecteurs/selection

Le double-hybride systématique sur le génome de la levure (1) Ito et al. (2001) PNAS * GAL4 DNA binding domain * Souche avec gènes rapporteurs ADE2 et HIS * GAL4 activation domain * Souche avec gène rapporteur URA - tous les ORFs de la levure fusion GAL4-DB fusion GAL4-AD - jeter les appâts faux positifs - 62 pools de 96 (c.a.d.?) - 62x62 réactions de mating - sélection - PCR des inserts - paires de séquences=ISTs Appâts Proies 841 interactions avec 3 ISTs

Le double-hybride systématique sur le génome de la levure (2) Uetz et al. (2000) Nature Tous les ORFs de la levure (6000), fusion DNA binding domain GAL4 et activating domain GAL4. 6000x6000, Idem étude précédente Array des 6000 souches haploides de levure Exprimant une fusion GAL4 activation domain Mating avec 192 clones exprimant une fusion GAL4-DNA binding domain Haut débit Lsm5 Clp1 Exemple: DBGAL4-Pcf11 Ada2 Rna15 817 ORFs avec partenaires. 692 interactions Faible débit 87 reproductibles, 281 interactions

Interactome de la levure red, lethal green, non-lethal orange, slow growth yellow, unknown

Le double-hybride systématique sur le génome d’Helicobacter pylori, Rain et al. (2001) Nature Principe différent: Construction dune banque de fragments génomiques aléatoires Définition de domaines d’interaction Calcul d’un score possible Data accessibles= Carte d’interaction

“PIM viewer” pim.hybrigenics.com/pimrider/pimriderlobby/PimRiderLobby.jsp

Avantages/Inconvénients de l’approche double-hybride Protéines chimères Protéines hétérologues 2 protéines à la fois Compartiment cellulaire=noyau de la levure Les faux positifs (auto-activateurs, protéines ‘collantes’) Les faux négatifs Conditions fixes 90% d’interactions déjà connues non retrouvées! les moins In vivo Interactions transitoires ou instables Indépendant du niveau d’expression naturel des protéines Haut-débit Avec une banque, définition de domaines d’interaction (SID dans l’étude sur Helicobacter) les plus

bacterial adenylate cyclase two hybrid Karimova et al. J Bacteriol (2005) X Y X Y Basé sur la reconstitution de l’activité adénylate cyclase de la toxine CyaA de Bordetella pertussis T18 T25 T18 T25 Pas d’AMPc synthétisé ATP AMPc+PPi CAP Expression des gènes soumis à la répression catabolique (lactose, maltose)

Beta-Gal activity (U/mg) X ori p15A Y ori pUC pUT18 + X pKNT25 + Y T25 T18 AmpR KmR Cotransformation dans une souche cya- Etude des interactions entre protéines membranaires impliquées dans la division cellulaire Recherche d’une activité AC Ex : détection activité b-galactosidase T18 + T25 Pas d’interaction Beta-Gal activity (U/mg) T18-X + T25-Y Interaction entre X et Y T18-fused proteins Milieu Amp+Km+Xgal (+IPTG) Karimova, G. et al., J Bact (2005)

PAUSE

La protéomique « fonctionnelle » Identification systématique des partenaires protéiques: Description de l’interactome” À partir des séquences Par identification de protéines Double-hybride Co-purifications par affinité

Purification systématique des complexes protéiques d’un organisme Idée: * choisir une technique de co-purification par affinité. * construire une protéine recombinante étiquetée pour chaque gène de l’organisme choisi. * purifier tous les complexes. * identifier les composants par spectrométrie de masse. Atouts évidents: * Interactions stabilisées par plus d’un partenaire. * Caractérisation biochimique authentique. * Dans l’organisme d'intérêt.

Purification systématique de complexes Idée: * choisir une technique de co-purification par affinité. * construire une protéine recombinante étiquetée pour chaque gène de l’organisme choisi. * purifier tous les complexes. * identifier les composants par spectrométrie de masse. Exemples: * méthodes - TAP ou SPA * études systématiques - 2 chez la levure - chez E. coli

Tandem Affinity Purification Rigaut et al. (1999) Nat. Biotech. Méthode 2 étapes de purification par affinité Conditions d’élution douces Pas de surproduction de la protéine étiquetée. Etiquette TAP Calmodulin Binding Peptide (5kDa) Site de coupure par la protéase TEV 2 domaines de fixation aux IgG de la protéine A (20 kDa) Variante: étiquette SPA (Zeghouf et al., 2004) 3 répétitions de l’épitope Flag

Tandem Affinity Purification Rigaut et al. (1999) Nat. Biotech. Identification par spectrométrie de masse

Identification des protéines par spectrométrie de masse (1) l’échantillon Une protéine en solution, une protéine sur gel SDS-PAGE (mono ou bi-dimensionnel), ou un mélange de protéines Exemple de purification d’un complexe: Protéines associées à l’Acyl Carrier Protein chez Escherichia coli EB47 ? EB48 EB49 ACP-TAP TEV ACP-CBP Gel SDS-PAGE 12% Coloré au Bleu de Coomassie

Identification des protéines par spectrométrie de masse (1) la mesure Découpe et lavage des bandes (H20, NH4HCO3, CH3CN) Réduction (DTT) et alkylation (Iodoacétamide) Digestion à la trypsine (clive après Lysine et Arginine) et élution des peptides Dessalage et mesure de masse des peptides Obtention d’une liste de masses pic d’autolyse de la trypsine Étalonnage interne avec les ions d ’autolyse de la trypsine

Interactome de la levure Saccharomyces cerevisiae Yeast genome 6,466 ORFs TAP cassette integration 5,474 (85%) TAP fusion expression 3,206 (59%) Overall purifications 3,206 Successful purifications 1,993 (62%) MS protein identifications 2,760 (58%) Complexes 491 Puissance de la technique= construction de l’interactome de la levure. Technique efficace= pari de construire l’interactome. Startup à l’EMBL=Cellzome Faisabilité= un chromosome entier etiqueté=Nature en 2002. Chiffres= dans les conditions standards de culture. Dire 2 papiers back to back. Generera sans doute des tas de commentaires. CELLZOME Gavin et al. (2002) Nature - Gavin et al. (2006) Nature - Krogan et al. (2006) Nature

Validation des nouvelles interactions Purification “inverse” Autre technique Spécificité Mutations annulant l’interaction … Ici faire le topo sur l’importance de la validation d’apres Bret and Finley, inventeurs de 2hybrid D’après Bret and Finley (1997) Annu. Rev. Genet. pour le double hybride de levure

Interactome de Escherichia coli (1) Butland et al. (2005) Science Etiquette SPA (Sequential Peptide Affinity) CBP-Tev-3xFlag Méthode d’insertion chromosomique chez E. coli

Interactome de Escherichia coli (2)

Interactome de Escherichia coli (3)

Avantages/Inconvénients de l’approche par purification Protéines recombinantes Expression faible ou artificielle Haut-débit possible mais lourd Contaminants (30% douteux!) Interactions faibles perdues Conditions fixes Les moins Complexes en conditions natives Complexes avec plus de 2 composants Définition d’un réseau d’ordre supérieur entre les complexes Les plus

Interactomes publiés Bactériophage T7 (1996) 2-hybrid Vaccinia virus (2000) 2-hybrid Hepatitis C virus (2000) 2-hybrid Helicobacter pylori (2001) 2-hybrid S. cerevisiae (2000-2006) 2-hybrid et TAP et Flag C. elegans (2000-2005) 2-hybrid Escherichia coli (2005) TAP et SPA Homme (2004) 2-hybrid (partiel)

Interactomes publiés coli levure caenorhabditis homme 2005 2000 2005

Que peut nous dire cette masse de données? Organisation et caractéristiques du réseau Statistique Description Règles de prédiction Identifier la fonction des gènes inconnus

Description des réseaux Réseaux de type « scale free » Petits mondes Levure Téléchargements peer to peer Réseau aléatoire

Description des réseaux -> protéines structurantes -> protéines létales

Description des réseaux modules fonctionnels Complexes (simultanées) Signalisation (consécutives)

Organisation de l’interactome de la levure Gavin et al. (2006) Nature; Krogan et al. (2006) Nature Réseau de complexes et Modules Etudes de 2001-2002: reseau de proteines On est passé à réseau de complexes. Réseau de protéines Jeong et al. (2001) Nature

Prédiction de la fonction des gènes Nécessité de méthodes bioinformatiques pour l’inférence à grande échelle. Point de départ pour des études particulières. Exemple: machinerie de polyadenylation dans la levure

La protéomique « fonctionnelle » Interaction physique Double hybride dans la levure Purification de complexes Association fonctionnelle Co-expression des ARNm (régulation commune) Association génétique (synthétiques létaux) Interactions prédites in silico Fusion de gènes ou proximité Conservation phylogénétique

Exemple du serveur STRING http://www.bork.embl-heidelberg.de/STRING

Interaction génétique Aperçu des autres approches de détection des interactions protéine-protéine à haut débit Expression corrélée Interaction génétique Prédictions In Silico - * Pas interaction physique * Sensible aux conditions d’analyse * Prédiction * Identification des orthologues + * In vivo * Différentes conditions * Peu de biais * Rapide et bon marché * Couverture augmente avec les séquençages

Comparaison des différentes techniques protéines purifiées pour 93 appâts communs TAP 444 Flag 744 133 (10%) 577 877 pour 48 appâts de Schevchenko et al. (2002) Double-hybride 165 interactants TAP 220 interactants 23 (14%) Schevchenko et al. (2002) Gavin et al. (2002) Ho et al. (2002) Uetz et al. (2000) nombre d’interactions détectées Double-hybride 1403 TAP 3222 54 (2-4%) Gavin et al. (2002) Uetz et al. (2000) Explications possibles de ces résultats: Les expériences ne sont pas à saturation. Il y a une énorme proportion de faux positifs. Des biais pour certains types d’interactions. D’après les données de Ito et al. (2002) Mol. Cell. Proteomics; Shevchenko et al. (2002) Mol. Cell. Proteomics; Salwinski et Eisenberg (2003) Curr. Op. Struct. Biol.

Evaluation des résultats des différentes études (1) Comment évaluer le taux de faux-positifs ? anti-correlation avec annotation fonctionnelle 80% interactions OK dans l’ensemble de référence 50% pour l’interaction de 2 méthodes 20% en moyenne pour les études a grand échelle anti-correlation avec localisation cellulaire (figure) ARNm co-expression: 60% pour ensemble de référence 56% et 43% pour purifications 39% et 35% pour 2-hybrid * * * *

Evaluation des résultats des différentes études (2) par rapport à un set d’interactions reconnues Accuracy 27,8% TAP 6,8% Flag 3,7% 2-hybrid

Les réseaux d’interactions à grande échelle Conclusion Les réseaux d’interactions à grande échelle Faisabilité Données à saturation maximum d’interactions Croisement de différentes méthodes minimum de faux positifs Intégration de données complémentaires: Quantité Localisation Dynamique Motivation Comprendre l’organisation supramoléculaire de la cellule Identifier la fonction des gènes dans une approche globale