La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Les réseaux d’interactions protéine-protéine INTERACTOMES

Présentations similaires


Présentation au sujet: "Les réseaux d’interactions protéine-protéine INTERACTOMES"— Transcription de la présentation:

1 Les réseaux d’interactions protéine-protéine INTERACTOMES
Emmanuelle Bouveret Laboratoire d'Ingénierie des Systèmes Macromoléculaires Les réseaux d’interactions protéine-protéine INTERACTOMES M2, 2007

2 Techniques de détection des interactions protéine-protéine
Introduction : notions Génomique Protéomique Organisation supramoléculaire Identification de la fonction des gènes Construction systématique de cartes d’interactions protéine-protéine à grande échelle Par double-hybride Par purification de complexes Principe d’identification des protéines par spectrométrie de masse Description de la méthode TAP Autres méthodes et comparaisons Techniques de détection des interactions protéine-protéine Double-hybride chez la levure Double-hybride bactérien Co-purifications par affinité Purification de complexes

3

4 La génomique (1) Escherichia coli
370 génomes procaryotes entièrement séquencés (2007) Les eucaryotes aussi: Saccharomyces cerevisiae (1996) Caenorabditis elegans (1998) Drosophila melanogaster (2000) Arabidopsis, Zebrafish, Souris, Rat, Humain … (2002) Escherichia coli Rajouter un dessin d’un génome procaryote

5 La génomique (2) nombre de gènes: Comment déterminer la fonction de ces gènes à grande échelle? 6000 19000 13500 30000

6 Comment trouver la fonction des gènes?
Evolution, liens entre les gènes Homologies de séquences Expression Régulation Co-purifications Activité enzymatique ... Phénotype knockout, RNAi Expression Localisation Homologies de structure Biologie moléculaire: Purification de partenaires dont la fonction est connue

7 Un seul génome… … plusieurs protéomes

8 Le protéome PM pI Années 70, définition classique:
catalogue de gels 2D, expression différentielle Années 80: révolution de la biologie moléculaire Années 90: avancées dans les techniques de spectrométrie de masse La spectrométrie de masse associée à la génomique permet d’identifier la composition protéique d’une cellule à un instant donné. Ideal serait de mettre en premier un gel sans annotation puis faire apparaître le nom des proteines. pI

9 Organisation supramoléculaire Interactome
Les protéines n’agissent pas seules et isolées. De la description des composants (génome et protéome), il est nécessaire de comprendre l’organisation et la dynamique des réseaux d’interactions. David S. Goodsell

10 La protéomique « fonctionnelle »
Description exhaustive de la composition en ARN, ou en protéines d’une cellule. Mais qu’en est-il de la fonction et de l’organisation de ces protéines? On aboutit à une nouvelle définition de la protéomique. = Identification systématique des partenaires protéiques Description de l’  « interactome » d’une cellule Notion de « coupable par association »

11 Techniques d’obtention de cartes d’interactions à grande échelle
Interactions physiques entre protéines Double hybride dans la levure Purification de complexes et spectrométrie de masse Associations fonctionnelles entre gènes Co-expression ARNm Association génétique: synthétiques létaux Interaction in silico Fusion de gènes, association de gènes, profile phylogénétique

12 La modularité des facteurs de transcription
principe élémentaire du double hybride dans la levure DF DA Facteur de transcription ARN messager DF DA Gène Site de fixation pour le facteur de transcription DF: Domaine de fixation à l'ADN + DA: Domaine d'activation de la transcription

13 Le double hybride dans la levure
le test DA Proie Y DF Appât X Gène rapporteur La protéine APPÂT est fusionnée au domaine de fixation à l'ADN DF. Les protéines PROIES sont fusionnées au domaine d'activation de la machinerie basale de transcription DA. Les protéines fusions sont exprimées dans des cellules de levure contenant un gène rapporteur dont l'expression est placée sous le contrôle du site de fixation pour le domaine de fixation à l'ADN DF.

14 Le double hybride dans la levure
le test DA Proie Y ARN rapporteur DA Proie Y DF Appât X Gène rapporteur Lorsque la protéine proie Y est capable d'interagir avec la protéine appât X, le domaine d'activation se retrouve à proximité du promoteur du gène rapporteur et la transcription a lieu.

15 Principe du double-hybride dans la levure (2)
Criblage d’une banque But: identifier les partenaires protéiques d’une protéine appât choisie 1- Construction d’une banque d’expression 2- Sélection GAL4AD Y1 Y2 Yn Proies GAL4DB Ma protéine Appât Identification des partenaires de ma protéine NB: protéines de n’importe quel organisme, mais système hétérologue.

16 Le double-hybride systématique
Idée: prendre tous les gènes d’un organisme comme appâts. cribler tous ces appâts contre une banque de proies. identifier toutes les interactions protéine-protéine possibles. Nécessité du haut débit, automatisation Plusieurs études systématiques 2 sur la levure 1 sur Helicobacter pylori 1 sur Caenorabditis elegans 1 sur l’homme Possibilite de rajouter l’etude sur C. elegans

17 Génétique dans la levure
Auxotrophie (HIS, TRP, LEU, ADE, URA …) Haploidie/diploidie Mating type Vecteurs/selection

18 Le double-hybride systématique sur le génome de la levure (1) Ito et al. (2001) PNAS
* GAL4 DNA binding domain * Souche avec gènes rapporteurs ADE2 et HIS * GAL4 activation domain * Souche avec gène rapporteur URA - tous les ORFs de la levure fusion GAL4-DB fusion GAL4-AD - jeter les appâts faux positifs - 62 pools de 96 (c.a.d.?) - 62x62 réactions de mating - sélection - PCR des inserts - paires de séquences=ISTs Appâts Proies 841 interactions avec 3 ISTs

19 Le double-hybride systématique sur le génome de la levure (2) Uetz et al. (2000) Nature
Tous les ORFs de la levure (6000), fusion DNA binding domain GAL4 et activating domain GAL4. 6000x6000, Idem étude précédente Array des 6000 souches haploides de levure Exprimant une fusion GAL4 activation domain Mating avec 192 clones exprimant une fusion GAL4-DNA binding domain Haut débit Lsm5 Clp1 Exemple: DBGAL4-Pcf11 Ada2 Rna15 817 ORFs avec partenaires. 692 interactions Faible débit 87 reproductibles, 281 interactions

20 Interactome de la levure
red, lethal green, non-lethal orange, slow growth yellow, unknown

21 Le double-hybride systématique sur le génome d’Helicobacter pylori, Rain et al. (2001) Nature
Principe différent: Construction dune banque de fragments génomiques aléatoires Définition de domaines d’interaction Calcul d’un score possible Data accessibles= Carte d’interaction

22 “PIM viewer” pim.hybrigenics.com/pimrider/pimriderlobby/PimRiderLobby.jsp

23 Avantages/Inconvénients de l’approche double-hybride
Protéines chimères Protéines hétérologues 2 protéines à la fois Compartiment cellulaire=noyau de la levure Les faux positifs (auto-activateurs, protéines ‘collantes’) Les faux négatifs Conditions fixes 90% d’interactions déjà connues non retrouvées! les moins In vivo Interactions transitoires ou instables Indépendant du niveau d’expression naturel des protéines Haut-débit Avec une banque, définition de domaines d’interaction (SID dans l’étude sur Helicobacter) les plus

24 bacterial adenylate cyclase two hybrid
Karimova et al. J Bacteriol (2005) X Y X Y Basé sur la reconstitution de l’activité adénylate cyclase de la toxine CyaA de Bordetella pertussis T18 T25 T18 T25 Pas d’AMPc synthétisé ATP AMPc+PPi CAP Expression des gènes soumis à la répression catabolique (lactose, maltose)

25 Beta-Gal activity (U/mg)
X ori p15A Y ori pUC pUT18 + X pKNT25 + Y T25 T18 AmpR KmR Cotransformation dans une souche cya- Etude des interactions entre protéines membranaires impliquées dans la division cellulaire Recherche d’une activité AC Ex : détection activité b-galactosidase T18 + T25 Pas d’interaction Beta-Gal activity (U/mg) T18-X + T25-Y Interaction entre X et Y T18-fused proteins Milieu Amp+Km+Xgal (+IPTG) Karimova, G. et al., J Bact (2005)

26 PAUSE

27 La protéomique « fonctionnelle »
Identification systématique des partenaires protéiques: Description de l’interactome” À partir des séquences Par identification de protéines Double-hybride Co-purifications par affinité

28 Purification systématique des complexes protéiques d’un organisme
Idée: * choisir une technique de co-purification par affinité. * construire une protéine recombinante étiquetée pour chaque gène de l’organisme choisi. * purifier tous les complexes. * identifier les composants par spectrométrie de masse. Atouts évidents: * Interactions stabilisées par plus d’un partenaire. * Caractérisation biochimique authentique. * Dans l’organisme d'intérêt.

29 Purification systématique de complexes
Idée: * choisir une technique de co-purification par affinité. * construire une protéine recombinante étiquetée pour chaque gène de l’organisme choisi. * purifier tous les complexes. * identifier les composants par spectrométrie de masse. Exemples: * méthodes - TAP ou SPA * études systématiques - 2 chez la levure - chez E. coli

30 Tandem Affinity Purification Rigaut et al. (1999) Nat. Biotech.
Méthode 2 étapes de purification par affinité Conditions d’élution douces Pas de surproduction de la protéine étiquetée. Etiquette TAP Calmodulin Binding Peptide (5kDa) Site de coupure par la protéase TEV 2 domaines de fixation aux IgG de la protéine A (20 kDa) Variante: étiquette SPA (Zeghouf et al., 2004) 3 répétitions de l’épitope Flag

31 Tandem Affinity Purification Rigaut et al. (1999) Nat. Biotech.
Identification par spectrométrie de masse

32 Identification des protéines par spectrométrie de masse (1) l’échantillon
Une protéine en solution, une protéine sur gel SDS-PAGE (mono ou bi-dimensionnel), ou un mélange de protéines Exemple de purification d’un complexe: Protéines associées à l’Acyl Carrier Protein chez Escherichia coli EB47 ? EB48 EB49 ACP-TAP TEV ACP-CBP Gel SDS-PAGE 12% Coloré au Bleu de Coomassie

33 Identification des protéines par spectrométrie de masse (1) la mesure
Découpe et lavage des bandes (H20, NH4HCO3, CH3CN) Réduction (DTT) et alkylation (Iodoacétamide) Digestion à la trypsine (clive après Lysine et Arginine) et élution des peptides Dessalage et mesure de masse des peptides Obtention d’une liste de masses pic d’autolyse de la trypsine Étalonnage interne avec les ions d ’autolyse de la trypsine

34 Interactome de la levure Saccharomyces cerevisiae
Yeast genome 6,466 ORFs TAP cassette integration 5,474 (85%) TAP fusion expression 3,206 (59%) Overall purifications 3,206 Successful purifications 1,993 (62%) MS protein identifications 2,760 (58%) Complexes 491 Puissance de la technique= construction de l’interactome de la levure. Technique efficace= pari de construire l’interactome. Startup à l’EMBL=Cellzome Faisabilité= un chromosome entier etiqueté=Nature en 2002. Chiffres= dans les conditions standards de culture. Dire 2 papiers back to back. Generera sans doute des tas de commentaires. CELLZOME Gavin et al. (2002) Nature - Gavin et al. (2006) Nature - Krogan et al. (2006) Nature

35 Validation des nouvelles interactions
Purification “inverse” Autre technique Spécificité Mutations annulant l’interaction Ici faire le topo sur l’importance de la validation d’apres Bret and Finley, inventeurs de 2hybrid D’après Bret and Finley (1997) Annu. Rev. Genet. pour le double hybride de levure

36 Interactome de Escherichia coli (1) Butland et al. (2005) Science
Etiquette SPA (Sequential Peptide Affinity) CBP-Tev-3xFlag Méthode d’insertion chromosomique chez E. coli

37 Interactome de Escherichia coli (2)

38 Interactome de Escherichia coli (3)

39 Avantages/Inconvénients de l’approche par purification
Protéines recombinantes Expression faible ou artificielle Haut-débit possible mais lourd Contaminants (30% douteux!) Interactions faibles perdues Conditions fixes Les moins Complexes en conditions natives Complexes avec plus de 2 composants Définition d’un réseau d’ordre supérieur entre les complexes Les plus

40 Interactomes publiés Bactériophage T7 (1996) 2-hybrid
Vaccinia virus (2000) 2-hybrid Hepatitis C virus (2000) 2-hybrid Helicobacter pylori (2001) 2-hybrid S. cerevisiae ( ) 2-hybrid et TAP et Flag C. elegans ( ) 2-hybrid Escherichia coli (2005) TAP et SPA Homme (2004) 2-hybrid (partiel)

41 Interactomes publiés coli levure caenorhabditis homme 2005 2000 2005

42 Que peut nous dire cette masse de données?
Organisation et caractéristiques du réseau Statistique Description Règles de prédiction Identifier la fonction des gènes inconnus

43 Description des réseaux
Réseaux de type « scale free » Petits mondes Levure Téléchargements peer to peer Réseau aléatoire

44 Description des réseaux
-> protéines structurantes -> protéines létales

45 Description des réseaux
modules fonctionnels Complexes (simultanées) Signalisation (consécutives)

46 Organisation de l’interactome de la levure
Gavin et al. (2006) Nature; Krogan et al. (2006) Nature Réseau de complexes et Modules Etudes de : reseau de proteines On est passé à réseau de complexes. Réseau de protéines Jeong et al. (2001) Nature

47 Prédiction de la fonction des gènes
Nécessité de méthodes bioinformatiques pour l’inférence à grande échelle. Point de départ pour des études particulières. Exemple: machinerie de polyadenylation dans la levure

48 La protéomique « fonctionnelle »
Interaction physique Double hybride dans la levure Purification de complexes Association fonctionnelle Co-expression des ARNm (régulation commune) Association génétique (synthétiques létaux) Interactions prédites in silico Fusion de gènes ou proximité Conservation phylogénétique

49 Exemple du serveur STRING http://www.bork.embl-heidelberg.de/STRING

50 Interaction génétique
Aperçu des autres approches de détection des interactions protéine-protéine à haut débit Expression corrélée Interaction génétique Prédictions In Silico - * Pas interaction physique * Sensible aux conditions d’analyse * Prédiction * Identification des orthologues + * In vivo * Différentes conditions * Peu de biais * Rapide et bon marché * Couverture augmente avec les séquençages

51 Comparaison des différentes techniques
protéines purifiées pour 93 appâts communs TAP 444 Flag 744 133 (10%) 577 877 pour 48 appâts de Schevchenko et al. (2002) Double-hybride 165 interactants TAP 220 interactants 23 (14%) Schevchenko et al. (2002) Gavin et al. (2002) Ho et al. (2002) Uetz et al. (2000) nombre d’interactions détectées Double-hybride 1403 TAP 3222 54 (2-4%) Gavin et al. (2002) Uetz et al. (2000) Explications possibles de ces résultats: Les expériences ne sont pas à saturation. Il y a une énorme proportion de faux positifs. Des biais pour certains types d’interactions. D’après les données de Ito et al. (2002) Mol. Cell. Proteomics; Shevchenko et al. (2002) Mol. Cell. Proteomics; Salwinski et Eisenberg (2003) Curr. Op. Struct. Biol.

52 Evaluation des résultats des différentes études (1)
Comment évaluer le taux de faux-positifs ? anti-correlation avec annotation fonctionnelle 80% interactions OK dans l’ensemble de référence 50% pour l’interaction de 2 méthodes 20% en moyenne pour les études a grand échelle anti-correlation avec localisation cellulaire (figure) ARNm co-expression: 60% pour ensemble de référence 56% et 43% pour purifications 39% et 35% pour 2-hybrid * * * *

53 Evaluation des résultats des différentes études (2) par rapport à un set d’interactions reconnues
Accuracy 27,8% TAP 6,8% Flag 3,7% 2-hybrid

54 Les réseaux d’interactions à grande échelle
Conclusion Les réseaux d’interactions à grande échelle Faisabilité Données à saturation maximum d’interactions Croisement de différentes méthodes minimum de faux positifs Intégration de données complémentaires: Quantité Localisation Dynamique Motivation Comprendre l’organisation supramoléculaire de la cellule Identifier la fonction des gènes dans une approche globale


Télécharger ppt "Les réseaux d’interactions protéine-protéine INTERACTOMES"

Présentations similaires


Annonces Google