La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

BIOSIRIS - Guillaume ASSET - Science Park Crealys - Cassiopée

Présentations similaires


Présentation au sujet: "BIOSIRIS - Guillaume ASSET - Science Park Crealys - Cassiopée"— Transcription de la présentation:

1 BIOSIRIS - Guillaume ASSET - Science Park Crealys - Cassiopée
30 rue Phocas Lejeune – Bte 17 5032 Gembloux Belgique - - - Guillaume ASSET -

2 ULP, Faculté de chimie 1 rue Blaise Pascal 67070 Strasbourg Cedex
PLAN Travail réalisé dans le cadre du Master (II) ChemoInformatique ULP, Faculté de chimie 1 rue Blaise Pascal Strasbourg Cedex Veille technologique Prédiction de sites de clivage protéolytique Tango Prédicteur d’activité membranaire

3 VEILLE TECHNOLOGIQUE :
1) Predicteurs de clivage protéolytique Rupture des liaisons peptidiques entre AA par des enzymes, les protéases (ou peptidases) Modification de la structure Perte / Modification d’activité de la protéine A prendre en compte dans l’étude exhaustive d’une protéine et de ses potentialités (environ 8000 études par an)

4 VEILLE TECHNOLOGIQUE :
1) Predicteurs de clivage protéolytique 3 prédicteurs de sites de clivage sur Internet SHUBOS PepCutter ExPASy PeptideCutter PROLYSIS Cutter

5 VEILLE TECHNOLOGIQUE :
1) Predicteurs de clivage protéolytique a. SHUBOS PepCutter séquence FASTA QAKEPCVESLVSQYFQTVTDYGKDLMEKVKSPELQAEAKSYFEKS… recherche de motif AA Trypsine : K (lysine) QAK / EPCVESLVSQYFQTVTDYGK / DLMEK / VK / SPELQAEAK / SYFEK / S… découpage 11 motifs implémentés + possibilité de paramétrer le sien Algorithme simpliste aux sources inconnues

6 VEILLE TECHNOLOGIQUE :
1) Predicteurs de clivage protéolytique b. ExPASy PeptideCutter c. PROLYSIS Cutter + Pas de protection par copyright Formats d’entrée : FASTA, Swiss-Prot, TrEMBL 32 protéases implémentées Tient compte des positions relatives des AA voisins Scheter & Berger, « On The Size Of The Active Site In Proteases », Biochem. Biophys. Res. Commun., Paramètres optionnels de classement de résultats Sources bibliographiques mentionnées Format d’entrée : FASTA Tient compte des positions relatives des AA voisins Scheter & Berger, « On The Size Of The Active Site In Proteases », Biochem. Biophys. Res. Commun., Paramètres optionnels de classement de résultats Paramètres optionnels d’état des résidus et du C/N-terminal - Pas de motif personnalisé Protection par copyright 11 protéases seulement Pas de motif personnalisé Sources bibliographiques non mentionnées

7 VEILLE TECHNOLOGIQUE :
1) Predicteurs de clivage protéolytique Problèmes rencontrés avec ces algorithmes : - Analyse séquentielle aucune implication des structures secondaire et tertiaire : pas de prise en compte de l’accessibilité des résidus, etc. - Aucune estimation fiable pas de moyen efficace d’évaluer les probabilités de clivage et donc de fournir une analyse précise Très bons outils pour le chercheur, mais les performances ne sont pas assez satisfaisantes pour intégrer l’un d’eux dans Protein InvestigatorTM

8 VEILLE TECHNOLOGIQUE :
2) Algorithme Tango Algorithme de prédiction de zones d’agrégation (feuillet β, coude β, hélice α, agrégation β) - Format d’entrée : FASTA Plusieurs paramètres pris en compte (pH, T, force ionique, [TFE], stabilité de la protéine, protection des C/N terminaux)

9 VEILLE TECHNOLOGIQUE :
2) Algorithme Tango AVGIVGAMFLGFLGAAGSTMGAVSLT… Corrélations entre les résultats de TANGO (pour les agrégations β) et ceux de la méthode des Peptides Obliques développée au CBMN Centre de Biophysique Moléculaire Numérique Faculté Universitaire de Sciences Agronomiques 5030 Gembloux Belgique TANGO Agregation β sequence probabilité L’influence des paramètres initiaux (force ionique, concentration en TFE…) a des effets négligeables sur les résultats de Tango (tant que nous nous contentons des résultats qualitatifs).

10 VEILLE TECHNOLOGIQUE :
2) Algorithme Tango Zone hydrophobe Les peptides obliques*: Bicouche lipidique Protéine Oblicité : Destabilisation de la membrane : permet les processi membranaires Parallélisme : stabilité * Brasseur R, « Tilted peptides : a motif for membrane destabilization (Hypothesis) », Molecular Membrane Biology, 2000, 17, 31-40

11 VEILLE TECHNOLOGIQUE :
2) Algorithme Tango Détection automatique des PO (Z-Prot) : séquence FASTA peptides de 11 à 18 résidus structurés en hélice α analyse HCA Hydrophobie moyenne positive Rapport pho/phi>0.4 minimisation de l’énergie, modélisation Angle oblique entre 30° et 60° calcul de l’interaction par hypermatrice * * Brasseur & Ruysschaert, 1986

12 VEILLE TECHNOLOGIQUE :
2) Algorithme Tango Exemple pour HIV-1 : Corrélations qualitatives entre les prédictions de Tango, les scores de Z-Prot, et les résultats expérimentaux : Utilisation comme critère discriminant pour augmenter le taux de confiance de Z-Prot?

13 VEILLE TECHNOLOGIQUE :
2) Algorithme Tango Etude portant sur 10 protéines avec résultats exp. Prédictions de Z-Prot Calculs de Tango Comparaison avec exp. 37.5% Des domaines communs à Tango et Z-Prot sont des PO 48% Des PO sont détectés par Tango et Z-Prot à la fois Il reste encore trop de faux positifs (62.5%) pour que les résultats de Z-Prot soient assez fiables pour l’intégrer dans Protein InvestigatorTM

14 Nécessité d’améliorer le pouvoir prédicteur de Z-Prot
PREDICTEUR D’ACTIVITE MEMBRANAIRE Nécessité d’améliorer le pouvoir prédicteur de Z-Prot Seulement 10 protéines pour lesquelles les résultats expérimentaux sont connus Banque de données petite 2 optiques étudiées Module EN AVAL de Z-Prot diminuer le taux de faux positifs augmenter ainsi la fiabilité du programme Application EN PARALLELE à Z-Prot prédicteur autonome résultats croisés avec ceux obtenus par Z-Prot

15 PREDICTEUR D’ACTIVITE MEMBRANAIRE
I. EN AVAL DE Z-PROT Données initiales : 10 protéines (10² à 103 résidus) Paramètres par défaut de Z-Prot Total de 1375 peptides reconnus comme obliques Descripteurs disponibles : Hydrophobicité Energie minimum Pénétration membranaire Angle de pénétration Critère d’activité (par peptide) : 1 si oblique exp. 0 sinon Régression linéaire multiple

16 PREDICTEUR D’ACTIVITE MEMBRANAIRE
I. EN AVAL DE Z-PROT Critères statistiques de sélection d’un modèle QSAR : Coefficient de corrélation carré R²>0.6 Coefficient de validation croisée Q²>0.5 Écart type (RMS, root mean square) + Application des tests de Golbraikh & Tropsha

17 Calcul sur le jeu total :
PREDICTEUR D’ACTIVITE MEMBRANAIRE I. EN AVAL DE Z-PROT Calculs préalables : aperçu par protéine R² < 0.38 0.17 < RMS < 0.47 Très insuffisant ! Calcul sur le jeu total : Golbraikh-Tropsha : [(R²-R0²)/R²] > 2986 [(R²-R’0²)/R²] = 0 k = k’ = 1 R = 0.190 R² = 0.033 RMS = 0.48 Q² = 0.036 MODELE NON EXPLOITABLE ! Explications : trop peu de descripteurs disponibles avec le fichier de sortie de Z-Prot Pas assez de données initiales

18 38 descripteurs physico-chimiques
PREDICTEUR D’ACTIVITE MEMBRANAIRE II. EN PARALLELE A Z-PROT Descripteurs disponibles : Surface standard A0 Surface accessible A Rapport (A0-A)/A0 Distance entre les barycentres phi et pho Gradient d’hydrophobicité Entropie de la side chain Entropie du backbone Entropie (side chain + backbone) Charge effective Volume de Van der Waals Données initiales : 10 protéines (10² à 103 résidus) Total de 1375 peptides reconnus comme obliques Cette fois, on raisonne en terme de résidus et non en terme de peptides, pour déterminer les domaines présentant une activité avec la membrane cellulaire Forme normale et logarithmique 2 fonctions de Jähnig * 38 descripteurs physico-chimiques + nature du résidu * Jähnig F. « Structure predictions of membrane proteins are not that bad », TIBS, 1990, 15, 93-95

19 II. EN PARALLELE A Z-PROT
PREDICTEUR D’ACTIVITE MEMBRANAIRE II. EN PARALLELE A Z-PROT Fonctions de Jähnig : contributions des voisins H7 residu I-3 I-2 I-1 I I+1 I+2 I+3 coefficient 1 HA residu I-8 I-7 I-6 I-5 I-4 coeff. 1 0.25 I-3 I-2 I-1 I I+1 I+2 I+3 0.75 0.5 I+4 I+5 I+6 I+7 I+8

20 PREDICTEUR D’ACTIVITE MEMBRANAIRE
II. EN PARALLELE A Z-PROT 3346 résidus 316 positifs 3030 négatifs Rapport 1/10 : peu idéal Préparation de 3 jeux de données COMPLET (3346) : 316 positifs négatifs PARTIEL ‘A’ (600) : 300 positifs négatifs PARTIEL ‘B’ (1200) : 300 positifs négatifs

21 II. EN PARALLELE A Z-PROT
PREDICTEUR D’ACTIVITE MEMBRANAIRE II. EN PARALLELE A Z-PROT Analyse statistique via SAS régression logistique Tri des descripteurs (Fischer) Modélisation DONNEES Pour chaque peptide, probabilité (0 à 1) d’activité oblique. Seuil décisionnel ajustable (défaut : 0.5) Fonction logit(x) P = ex /(1+ex)

22 PREDICTEUR D’ACTIVITE MEMBRANAIRE
II. EN PARALLELE A Z-PROT Modélisation du jeu total : Critère de Corrélation de Matthews Sensitivité extrêmement faible (à 0.5, le prédicteur rate 92% des sites pour lesquel il a été conçu) Coefficient de Matthews* de au mieux (modèle pertinent à partir de 0.4) * Matthews B.W., « Comparison of predicted and observed secondary structure of t4 phage lysozyme », Biochim. Biophys. Acta, 1975, 405,

23 II. EN PARALLELE A Z-PROT
PREDICTEUR D’ACTIVITE MEMBRANAIRE II. EN PARALLELE A Z-PROT Modèle du jeu total appliqué aux deux jeux partiels : Les performances augmentent avec la proportion de positifs dans le jeu Ces tests sont faits à titre indicatif (peu de données initiales faussent le pouvoir prédicteur)

24 II. EN PARALLELE A Z-PROT
PREDICTEUR D’ACTIVITE MEMBRANAIRE II. EN PARALLELE A Z-PROT Modèle réalisé à partir du jeu de 600 résidus : Modèle sensiblement différent du précédent : plus adapté à ce jeu précis Performances de l’ordre du modèle précédent appliqué à ce jeu de données tout en étant meilleures

25 CONCLUSIONS La base de données relatives aux peptides obliques n’est pas assez vaste pour obtenir une corrélation entre résultats théoriques et expérimentaux. Une analyse totalement automatique n’est pas possible pour l’instant. Même s’ils sont insuffisants dans le cadre du service Protein InvestigatorTM, les résultats prouvent que la méthode employée est appropriée, et l’approche exploitable.


Télécharger ppt "BIOSIRIS - Guillaume ASSET - Science Park Crealys - Cassiopée"

Présentations similaires


Annonces Google