La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

BIOSIRIS Science Park Crealys - Cassiopée 30 rue Phocas Lejeune – Bte 17 5032 Gembloux Belgique - www.biosiris.com - www.biosiris.com - Guillaume ASSET.

Présentations similaires


Présentation au sujet: "BIOSIRIS Science Park Crealys - Cassiopée 30 rue Phocas Lejeune – Bte 17 5032 Gembloux Belgique - www.biosiris.com - www.biosiris.com - Guillaume ASSET."— Transcription de la présentation:

1 BIOSIRIS Science Park Crealys - Cassiopée 30 rue Phocas Lejeune – Bte Gembloux Belgique Guillaume ASSET -

2 PLAN Veille technologique Veille technologique – Prédiction de sites de clivage protéolytique – Tango Prédicteur d’activité membranaire Prédicteur d’activité membranaire Travail réalisé dans le cadre du Master (II) ChemoInformatique ULP, Faculté de chimie 1 rue Blaise Pascal Strasbourg Cedex

3 VEILLE TECHNOLOGIQUE : Rupture des liaisons peptidiques entre AA par des enzymes, les protéases (ou peptidases) 1) Predicteurs de clivage protéolytique Modification de la structure Perte / Modification d’activité de la protéine A prendre en compte dans l’étude exhaustive d’une protéine et de ses potentialités (environ 8000 études par an)

4 VEILLE TECHNOLOGIQUE : 1) Predicteurs de clivage protéolytique 3 prédicteurs de sites de clivage sur Internet SHUBOS PepCutter ExPASy PeptideCutter PROLYSIS Cutter

5 a. SHUBOS PepCutter VEILLE TECHNOLOGIQUE : 1) Predicteurs de clivage protéolytique séquenceFASTA recherche de motif AA découpage QAKEPCVESLVSQYFQTVTDYGKDLMEKVKSPELQAEAKSYFEKS… Trypsine : K (lysine) (lysine) // QAK / EPCVESLVSQYFQTVTDYGK / //// DLMEK / VK / SPELQAEAK / SYFEK / S… 11 motifs implémentés + possibilité de paramétrer le sien 11 motifs implémentés + possibilité de paramétrer le sien Algorithme simpliste aux sources inconnues Algorithme simpliste aux sources inconnues

6 b. ExPASy PeptideCutter VEILLE TECHNOLOGIQUE : 1) Predicteurs de clivage protéolytique Pas de protection par copyright Pas de protection par copyright Formats d’entrée : FASTA, Swiss-Prot, TrEMBL Formats d’entrée : FASTA, Swiss-Prot, TrEMBL 32 protéases implémentées 32 protéases implémentées Tient compte des positions relatives des AA voisins Scheter & Berger, « On The Size Of The Active Site In Proteases », Biochem. Biophys. Res. Commun., Paramètres optionnels de classement de résultats Sources bibliographiques mentionnées Sources bibliographiques mentionnées Pas de motif personnalisé- + c. PROLYSIS Cutter Format d’entrée : FASTA Tient compte des positions relatives des AA voisins Scheter & Berger, « On The Size Of The Active Site In Proteases », Biochem. Biophys. Res. Commun., Paramètres optionnels de classement de résultats Paramètres optionnels d’état des résidus et du C/N-terminal Paramètres optionnels d’état des résidus et du C/N-terminal Protection par copyright 11 protéases seulement Pas de motif personnalisé Sources bibliographiques non mentionnées

7 VEILLE TECHNOLOGIQUE : 1) Predicteurs de clivage protéolytique Problèmes rencontrés avec ces algorithmes : - Analyse séquentielle aucune implication des structures secondaire et tertiaire : pas de prise en compte de l’accessibilité des résidus, etc. aucune implication des structures secondaire et tertiaire : pas de prise en compte de l’accessibilité des résidus, etc. - Aucune estimation fiable pas de moyen efficace d’évaluer les probabilités de clivage et donc de fournir une analyse précise pas de moyen efficace d’évaluer les probabilités de clivage et donc de fournir une analyse précise Très bons outils pour le chercheur, mais les performances ne sont pas assez satisfaisantes performances ne sont pas assez satisfaisantes pour intégrer l’un d’eux dans Protein Investigator TM

8 VEILLE TECHNOLOGIQUE : 2) Algorithme Tango - Algorithme de prédiction de zones d’agrégation (feuillet β, coude β, hélice α, agrégation β) (feuillet β, coude β, hélice α, agrégation β) - Format d’entrée : FASTA - Plusieurs paramètres pris en compte (pH, T, force ionique, [TFE], stabilité de la protéine, protection (pH, T, force ionique, [TFE], stabilité de la protéine, protection des C/N terminaux) des C/N terminaux)

9 VEILLE TECHNOLOGIQUE : 2) Algorithme Tango AVGIVGAMFLGFLGAAGSTMGAVSLT… sequence probabilité TANGO Agregation β Corrélations entre les résultats TANGO de TANGO (pour les agrégations β) et ceux de la méthode des Peptides Obliques développée au CBMN Centre de Biophysique Moléculaire Numérique Faculté Universitaire de Sciences Agronomiques 5030 Gembloux Belgique L’influence des paramètres initiaux (force ionique, concentration en TFE…) a des effets négligeables sur les résultats de Tango (tant que nous nous contentons des résultats qualitatifs).

10 VEILLE TECHNOLOGIQUE : 2) Algorithme Tango Les peptides obliques*: * * Brasseur R, « Tilted peptides : a motif for membrane destabilization (Hypothesis) », Molecular Membrane Biology, 2000, 17, Zonehydrophobe Zonehydrophobe Parallélisme : stabilité Oblicité : Destabilisation de la membrane : permet les processi membranaires Protéine Bicouch e lipidiqu e

11 VEILLE TECHNOLOGIQUE : 2) Algorithme Tango Détection automatique des PO (Z-Prot) : séquenceFASTA peptides de 11 à 18 résidus structurés en hélice α analyseHCA Hydrophobie moyenne positive Rapport pho/phi>0.4 pho/phi>0.4 minimisation de l’énergie,modélisation Angle oblique entre 30° et 60° calcul de l’interaction par hypermatrice * * * Brasseur & Ruysschaert, 1986

12 VEILLE TECHNOLOGIQUE : 2) Algorithme Tango Exemple pour HIV-1 : Corrélations qualitatives entre les prédictions de Tango, les scores de Z-Prot, et les résultats expérimentaux : Utilisation comme critère discriminant pour augmenter le taux de confiance de Z-Prot?

13 VEILLE TECHNOLOGIQUE : 2) Algorithme Tango Etude portant sur 10 protéines avec résultats exp. Prédictions de Z-Prot Prédictions de Z-Prot Calculs de Tango Calculs de Tango Comparaison avec exp. Comparaison avec exp. 37.5% Des domaines communs à Tango et Z-Prot sont des PO Tango et Z-Prot sont des PO48% Des PO sont détectés par Tango et Z-Prot à la fois Il reste encore trop de faux positifs (62.5%) pour que les résultats de Z-Prot soient assez fiables pour l’intégrer dans Protein Investigator TM

14 PREDICTEUR D’ACTIVITE MEMBRANAIRE Nécessité d’améliorer le pouvoir prédicteur de Z-Prot - Seulement 10 protéines pour lesquelles les résultats expérimentaux sont connus - Banque de données petite EN AVAL Module EN AVAL de Z-Prot - - diminuer le taux de faux positifs - - augmenter ainsi la fiabilité du programme EN PARALLELE Application EN PARALLELE à Z-Prot - - prédicteur autonome - - résultats croisés avec ceux obtenus par Z-Prot 2 optiques étudiées

15 PREDICTEUR D’ACTIVITE MEMBRANAIRE Données initiales : - 10 protéines (10² à 10 3 résidus) - Paramètres par défaut de Z-Prot - Total de 1375 peptides reconnus comme obliques I. EN AVAL DE Z-PROT Descripteurs disponibles : - Hydrophobicité - Energie minimum - Pénétration membranaire - Angle de pénétration Critère d’activité (par peptide) : - 1 si oblique exp. - 0 sinon Régression linéaire multiple

16 PREDICTEUR D’ACTIVITE MEMBRANAIRE I. EN AVAL DE Z-PROT Coefficient de corrélation carré R²>0.6 Coefficient de validation croisée Q²>0.5 Écart type (RMS, root mean square) + Application des tests de Golbraikh & Tropsha Critères statistiques de sélection d’un modèle QSAR :

17 PREDICTEUR D’ACTIVITE MEMBRANAIRE I. EN AVAL DE Z-PROT Calculs préalables : aperçu par protéine R² < < RMS < 0.47 Très insuffisant ! Calcul sur le jeu total : R = R² = RMS = 0.48 Q² = MODELE NON EXPLOITABLE ! Golbraikh-Tropsha : [(R²-R 0 ²)/R²] > 2986 [(R²-R’ 0 ²)/R²] = 0 k = k’ = 1 Explications : - trop peu de descripteurs disponibles avec le fichier de sortie de Z-Prot - Pas assez de données initiales

18 PREDICTEUR D’ACTIVITE MEMBRANAIRE II. EN PARALLELE A Z-PROT Données initiales : - 10 protéines (10² à 10 3 résidus) - Total de 1375 peptides reconnus comme obliques Descripteurs disponibles : - Surface standard A0 - Surface accessible A - Rapport (A0-A)/A0 - Distance entre les barycentres phi et pho - Gradient d’hydrophobicité - Entropie de la side chain - Entropie du backbone - Entropie (side chain + backbone) - Charge effective - Volume de Van der Waals Forme normale et logarithmique * 2 fonctions de Jähnig * * * Jähnig F. « Structure predictions of membrane proteins are not that bad », TIBS, 1990, 15, descripteurs physico-chimiques + nature du résidu Cette fois, on raisonne en terme de résidus et non en terme de peptides, pour déterminer les domaines présentant une activité avec la membrane cellulaire

19 PREDICTEUR D’ACTIVITE MEMBRANAIRE II. EN PARALLELE A Z-PROT Fonctions de Jähnig : contributions des voisins H7residuI-3I-2I-1II+1I+2I+3coefficient HAresiduI-8I-7I-6I-5I-4coeff residuI-3I-2I-1II+1I+2I+3coeff residuI+4I+5I+6I+7I+8coeff

20 PREDICTEUR D’ACTIVITE MEMBRANAIRE II. EN PARALLELE A Z-PROT 3346 résidus positifs négatifs Rapport 1/10 : peu idéal Préparation de 3 jeux de données PARTIEL ‘B’ (1200) : 300 positifs négatifs COMPLET (3346) : 316 positifs négatifs PARTIEL ‘A’ (600) : 300 positifs négatifs

21 PREDICTEUR D’ACTIVITE MEMBRANAIRE II. EN PARALLELE A Z-PROT DONNEES Analyse statistique via SAS - régression logistique - Tri des descripteurs (Fischer) - Modélisation - Pour chaque peptide, probabilité (0 à 1) d’activité oblique. - Seuil décisionnel ajustable (défaut : 0.5) Fonction logit(x) P = e x /(1+e x )

22 PREDICTEUR D’ACTIVITE MEMBRANAIRE II. EN PARALLELE A Z-PROT Modélisation du jeu total : Critère de Corrélation de Matthews - Sensitivité extrêmement faible (à 0.5, le prédicteur rate 92% des sites pour lesquel il a été conçu) - Coefficient de Matthews* de au mieux (modèle pertinent à partir de 0.4) * * Matthews B.W., « Comparison of predicted and observed secondary structure of t4 phage lysozyme », Biochim. Biophys. Acta, 1975, 405,

23 PREDICTEUR D’ACTIVITE MEMBRANAIRE II. EN PARALLELE A Z-PROT Modèle du jeu total appliqué aux deux jeux partiels : - Les performances augmentent avec la proportion de positifs dans le jeu - Ces tests sont faits à titre indicatif (peu de données initiales faussent le pouvoir prédicteur)

24 PREDICTEUR D’ACTIVITE MEMBRANAIRE II. EN PARALLELE A Z-PROT Modèle réalisé à partir du jeu de 600 résidus : - Modèle sensiblement différent du précédent : plus adapté à ce jeu précis - Performances de l’ordre du modèle précédent appliqué à ce jeu de données tout en étant meilleures

25 CONCLUSIONS La base de données relatives aux peptides obliques n’est pas assez vaste pour obtenir une corrélation entre résultats théoriques et expérimentaux. Une analyse totalement automatique n’est pas possible pour l’instant. La base de données relatives aux peptides obliques n’est pas assez vaste pour obtenir une corrélation entre résultats théoriques et expérimentaux. Une analyse totalement automatique n’est pas possible pour l’instant. Même s’ils sont insuffisants dans le cadre du service Protein Investigator TM, les résultats prouvent que la méthode employée est appropriée, et l’approche exploitable. Même s’ils sont insuffisants dans le cadre du service Protein Investigator TM, les résultats prouvent que la méthode employée est appropriée, et l’approche exploitable.


Télécharger ppt "BIOSIRIS Science Park Crealys - Cassiopée 30 rue Phocas Lejeune – Bte 17 5032 Gembloux Belgique - www.biosiris.com - www.biosiris.com - Guillaume ASSET."

Présentations similaires


Annonces Google