Les hélices des protéines transmembranaires Etude des structures des protéines transmembranaires. Analyse des hélices. Jean Pylouster1, 2 1MNHN – Laboratoire de Biophysique, 43 rue Cuvier ; 75231 PARIS Cedex 05 – France 2Equipe de Bioinformatique Génomique et Moléculaire (EBGM) INSERM U726 / Université Paris VII 75251 PARIS Cedex 05 – France Stage sous la direction d’Alexandre de Brevern 30 juin 2005
But Analyse des méthodes d’assignation de structures secondaires Les hélices des protéines transmembranaires But Analyse des méthodes d’assignation de structures secondaires et prédiction de ces structures
Les hélices des protéines transmembranaires Plan 1- Introduction générale 2- Banque de données 3- Méthodes d’assignations de structures secondaires 4- Analyse des assignations et des courbures d’hélices 5- Analyse de la relation séquence structure 6- Méthodes de prédictions 7- Conclusion et perspectives
Les hélices des protéines transmembranaires 1- Introduction générale Les protéines transmembranaires : Représentent 25% à 30% du génome humain Possèdent des fonctions biologiques essentielles Cible de 70% des médicaments Peu de structures dans la PDB (environ 500)
Les hélices des protéines transmembranaires 1- Introduction générale Méthode Banque de données Nettoyage Structures 3D “propres” Assignation des structures secondaires Analyse des structures/ comparaison des méthodes Méthodes de prédictions
Les hélices des protéines transmembranaires 2- Banque de données Zhou & Zhou (Protein Sci., 2003) : 73 structures de protéines Elimination du quart des protéines : -Structures issues de RMN, -Structure composée exclusivement de Ca, -Partie transmembranaire non résolue 1FDM Position putative de l’hélice
Les hélices des protéines transmembranaires 3- Comparaison des méthodes d’assignations Les critères : le C3 AA WDKYAQEVYEMNFGEKPEGDITQV DSSP CCCHHHHHHHHHHHCCCCCCCCCC STRIDE CCHHHHHHHHHHHHHHCCCCCCCC PSEA CCHHHHHHHHCCCCCCCCCCCCCC PCURVE CCHHHHHHHHHHCCCCCCCCCCCC DSSP CCCHHHHHHHHHHHCCCCCCCCCC STRIDE CCHHHHHHHHHHHHHHCCCCCCCC **#***********##********
Les hélices des protéines transmembranaires 3- Comparaison des méthodes d’assignations Les critères : Segment Overlap (SOV, Zemla et al., 1999) DSSP CCCHHHHHHCHHHHCCCCCCCCCC STRIDE CHHHHHHCCCHHHHHHHCCCCCCC ******** ******* ---- ---- (*) maxov : recouvrement maximal (-) minov : recouvrement minimal Exemple: sov(H) = 86,7%
Les hélices des protéines transmembranaires 3- Comparaison des méthodes d’assignations 82-89% ~50% 92-95% ~58% Projection des valeurs de C3 à l’aide d’une carte de Sammon SOV: critère plus fin, met une vraie différence entre (DSSP, SECSTR, STRIDE) et (PCURVE, KAKSI).
Les hélices des protéines transmembranaires 4- Analyse des assignations et des courbures d’hélices -Hétérogénéité de la longueur des hélices entre les méthodes: - Entre 14 et 18 résidus, principalement - Différence entre DSSP : 14,6 et STRIDE : 17,4 - Zhou & Zhou : longueur de 24,1 résidus (4 fois moins d’hélices assignées en moyenne) Courbure des hélices : - Nombre faible d’assignation d’hélices linéaires - Nombre important d’assignation d’hélices courbées ou cassées - DSSP : assignation des hélices les plus courtes mais aussi les plus cassées
Les hélices des protéines transmembranaires 5- Analyse de la relation séquence structure Z-scores des (a) hélices et (b) boucles assignés par DSSP. (c) gradient de couleur -Analyse de sur (resp. sous) représentations de certains acides aminés - Quelques spécificités aux extrémités des hélices -Même répartition des a.a. dans l’ensemble des méthodes d’assignation.
Les hélices des protéines transmembranaires 6- Méthodes de prédictions Approche bayésienne 15 résidus Matrice centrée en H Matrice centrée en C
Les hélices des protéines transmembranaires 6- Méthodes de prédictions Approche bayésienne Échantillon de validation Ensemble des taux de prédiction correcte (entre 67 et 72%) Pas de déséquilibre entre les deux états hélices - non hélices
Les hélices des protéines transmembranaires 6- Méthodes de prédictions - Méthode avec une approche « agents »(1) Ensemble de N agents Chaque agent possède une « mémoire » : fenêtre d’observation de 15 résidus. m déplacements aléatoire sur la séquence par agent Chaque agent lit toutes les séquences de structures de la banque Agent 1 Agent 2 15 résidus Déplacements aléatoires
Les hélices des protéines transmembranaires 6- Méthodes de prédictions Échantillon de validation Méthode avec une approche « agents » -Augmentation de 4% pour l’ensemble des méthodes classiques -Augmentation de 30% pour Z&Z : biais de l’assignation (taux de prédiction > au HMM + homologie 88,0%, Viklund 2004)
Les hélices des protéines transmembranaires 7- Conclusion et perspectives -Analyse de la Banque de données de Zhou & Zhou : résultats surprenant : retrait d’un quart des structures -Comparaison des méthodes d’assignation : C3 et SOV comparables aux résultats sur les protéines globulaires -Analyse des structures d’hélices assez forte hétérogénéité observée entre les méthodes classiques taille et nombre d’hélices assignés varient fortement => impact sur la prédiction
Les hélices des protéines transmembranaires 7- Conclusion et perspectives -Méthodes de prédiction de structures secondaires : Bayésien : Prédiction non déséquilibré en faveur de l’une ou l’autre des méthodes Par « agent » : résultat supérieur à l’approche statistique (et a beaucoup d’autres méthodes) biais de Zhou & Zhou (optimisation pour la prédiction) - Perspectives: analyse fine des paramètres Bonne perspective d’évolution : communication entre agents prédiction de la classe de l’hélice
Les hélices des protéines transmembranaires Merci de votre attention
Les hélices des protéines transmembranaires 3- Comparaison des méthodes d’assignations C3 SOV (référence : DSSP)
Les hélices des protéines transmembranaires Nouvelle séquence SFITPVPGGVGPMTVFLEMDLTNKNVIFVADKRKGGPGGIIANICVHTFNSWLDVEPRVAIEANKNGAIWKLDLAIWKLDLGTLEAIEWWDSHIGAFLDKPKMENAQGQGNGLRYGLSSDAHTAVIGLPSGLESAVIGLPSGLESWSFFFAVYDGHAGSQVAKY... Prédiction Bayésienne Repliement local (PB) Théorème de Bayes Matrice d’occurrence acides aminés Positions SYARMDIGTTHDDYA RMDIGTTHDDYANDV IHEVLAPGCLDAFPL GRDTSVEGSEMVPGK VIGLLEPMKKSMVPV CVMLKSRGSRGHVRF GRLGLGEGAEEKSIP HLWVHQEGIYRDEYQ LMWQLYPEERYMDNN MWQLYPEERYMDNNS QIAKYFDRKQIGNAM ... Prédiction