Prédiction d’interactions protéine-protéine
Plan Introduction Prédiction d’interactions protéine-protéine par détection de mutations corrélées et comparaison d’arbres phylogénétiques Tests: Méthodologie Résultats et discussion
Introduction Détection d’interactions protéine-protéine Expérimentales: double-hybride Théoriques: différentes méthodes tentent de prédire les interactions protéiques à partir de la séquence: exemples Conservation des positions des gènes Fusion de domaines (Rosetta stone) Comparaison de profils phylogénétiques Détection de mutations corrélées Comparaison d ’arbres phylogénétiques
Conservation de l ’ordre des gènes génome1 génome2 Gènes orthologues Fusion de domaines (Rosetta stone) Génome 1 Génome 2 Profils phylogénétiques org1 org2 org3 org4 Protéine A 0 0 1 1 Protéine B 1 0 1 0 Protéine C 0 0 1 1 Profils identiques
Deuxième mutation compensatoire Prédiction d’interactions protéine-protéine par la méthode de Florencio Pazos Hypothèse Stabilité Mutation ponctuelle I F V F I L Deuxième mutation compensatoire Stabilité rétablie
Deuxième mutation compensatoire Les mutations corrélées peuvent être détectées à partir d’alignements multiples de séquences V F V F V F Alignement de séquences I L V F Mutation ponctuelle I F V F Deuxième mutation compensatoire I L
Prédiction de résidus en contact dans une protéine par détection de mutations corrélées
Prédiction d ’interactions protéine-protéine par détection de mutations corrélées inter-protéines
Prédiction d ’interactions par comparaison d ’arbres phylogénétiques
Méthodologie Sélection des séquences similaires de E value<10-5 Génome B. melitensis (2920 ORFs)prédites) Méthodologie Recherche en banque de données (BLAST nr) Sélection des séquences similaires de E value<10-5 Alignement de séquences (ClustalW) 2317 alignements Prédiction d’interactions protéiques pour quelques protéines
Résultats RBME02068 2,161 0,803 0,175 15 RBME01398 1,88 0,929 0,212 21 RBME00209 1,808 0,657 0,175 11 RBME01533 1,73 0,27 0,219 11 RBME01224 1,724 0,424 0,16 11 RBME02484 1,684 0,696 0,164 11 RBME01394 1,679 0,889 0,19 15 RBME01246 1,614 0,737 0,2 11 RBME02787 1,6 0,377 0,159 13 RBME00875 1,575 0,491 0,141 12 RBME01395 1,557 0,918 0,177 14 RBME00751 1,539 0,565 0,156 11 RBME01216 1,529 0,278 0,14 12 RBME01452 1,513 0,643 0,158 11 RBME00762 1,504 0,13 0,174 11 RBME01739 1,5 0,385 0,154 12 omp 16 virB4 membrane metalloprotease excinuclease ABC subunit B transcriptional regulator virB9 permeases transposase spermidine/putresceine transport system permease protein POTC VirB8 transporter dnaJ protein myo-inositol (OR4) -monophosphatase 1 (EC 3.1.3.25)
Tests de la méthode
Test sur quelques protéines de C. elegans 29 protéines impliquées dans le développement vulval de C.elegans et ayant des interactions confirmées expérimentalement (11) Méthodologie: idem Brucella . Les protéines ont été collectées dans la banque de données WPD
Méthodologie Sélection des séquences similaires de E value<10-5 29 ORFs de C. elegans Méthodologie Recherche en banque de données (BLAST nr) Sélection des séquences similaires de E value<10-5 Alignement de séquences (ClustalW) 27alignements Prédiction d’interactions protéiques pour quelques protéines
Test sur quelques protéines de C. elegans La plupart des scores <1 Sur 11 interactions confirmées expérimentalement, le programme n’a trouvé que deux interactions potentielles dont les scores sont: 0,794 0,649
Test sur quelques protéines de C. elegans Sur 11 interactions confirmées expérimentalement: 4 interactions pour lesquelles pas d ’alignement de séquences 2 interactions dimériques 1 interaction non trouvée car séquence non disponible
Test sur quelques protéines de S. cerevisiae 78 protéines impliquées dans le cycle cellulaire et dans le trafic des protéines vers la membrane plasmique 80 interactions confirmées (dans YPD) à tester (certaines étaient impossibles à tester car pas de séquence) Méthodologie: idem Brucella + application du filtre : au dessus de 50% de séquences identiques dans les deux alignements , les scores ne sont pas pris en compte
Méthodologie Sélection des séquences similaires de E value<10-5 78 ORFs de S. cerevisiae Méthodologie Recherche en banque de données (BLAST nr) Sélection des séquences similaires de E value<10-5 Alignement de séquences (ClustalW) 47 alignements Prédiction d’interactions protéiques pour 37 protéines
Test sur quelques protéines de S. cerevisiae La plupart des scores <2,5 Sur 80 interactions confirmées expérimentalement, le programme n’a trouvé que 10 interactions potentielles dont les scores sont <2 après application du filtre On ne peut pas distinguer les protéines qui interagissent de celles qui a priori n’interagissnt pas
Discussion
Discussion Limites des deux méthodes non applicable à des homodimères et à deux protéines dont les alignements sont quasi identiques (filtre) si une protéine n ’a pas /peu d ’homologues dans les bd : interaction n ’est pas détectée pas de cutoff défini: pour les protéines qui ont été testées, il n ’a pas été possible de discriminer les protéines qui interagissaient réellement de celles qui a priori n ’interagissaient pas.
Discussion Limites des deux méthodes mutations corrélées: interactions? prot multidomaines : beaucoup d ’interactions --> possible de discriminer les domaines qui interagissent par rapport au bruit de fond MAIS pour des interactions inter-protéines, il se peut que le nombre d ’interactions soit plus faible --> moins de mutations corrélées mirror tree: coévolution