Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie de prédiction du métabolisme (PRIAM)
Modularité des protéines à domaine PAS o0359_Synsp BAT_HALHA Orf1_Tn1721 TlpA_Ecoli NIFL_AZOVI NIFL_KLEPN NifL_KPASy NifL_Entag Elk_Drome CIKE_DROME Erg_Human Eag_mouse Eag_rat Plkin_pea Plkin_ice Plkin_spinach PAS sensor kinase voltage gated K+ channel S/T kinase
1. Le programme MKDOM
Durée d’exécution de MKDOM sur l’ensemble des séquences Version Date n j n2/j x 1e10 2001.2 Mai 2001 339763 31 2.69 2001.3 Sept 2001 373869 46 3.29 2002.1 Mai 2002 481952 64 2.76
Améliorer l’algorithme Algorithme quadratique/nb de séquences n double tous les 18 mois Pcalcul double tous les 18 mois Le temps de calcul double tous les 18 mois
Parallélisation ? Paralléliser la boucle principale ? N requêtes simultanées Vérification a posteriori de leur compatibilité Procéder en deux phases ? PSI-BLAST tout contre tout Puis mimer MKDOM Changer d’algorithme ?
Le programme ADDA Heger & Holm, 2003 J. Mol. Biol. 328, 749-767
Exemple d’utilisation de MKDOM: Analyse de la famille des cyclases de Rhizobium Engendrer une matrice de score position-spécifique (PSSM) pour le domaine catalytique Recherche exhaustive dans les génomes de S. meliloti et M. loti Analyse en domaines utilisant MKDOM Visualisation par XDOM Classification des cyclases
CyaF : SM:7 ML:4, Cterm-domain = TPR CyaG : SM:3 ML:1 CyaD : SM:3 ML:0 CyaH : SM:1 ML:2 CyaE : SM:2 ML:0, Nterm-domain = TM CyaB, Nterm domain = SignalP and TM CyaC, Nterm domain = TM CyaJ, Cterm domain = TM CyaA
de familles de domaines protéiques 2. La base ProDom de familles de domaines protéiques www.toulouse.inra.fr/prodom.html GerE LuxR FixJ OmpR SpoOA NtrC NifA
Structures de protéines Intégration des données protéiques Structures de protéines (1,n) (1,n) Séquences Structures de domaines (n,n) (1,n) Base de domaines protéiques Collaboration européenne Projet InterPro coordonné par l’EBI (1,n) Données biochimiques
Domain motif Links to other representations of the family Links to other databases
3. Prédiction du métabolisme Le projet PRIAM Profils pour l’Identification Automatique du Métabolisme Clotilde RENARD-CLAUDEL Collaboration Claude CHEVALET a) Construction d’un ensemble de matrices de profil représentatif à partir de la base ENZYME b) Prédiction des voies métaboliques
Construction des matrices de profil représentatives 1502 collections enzymatiques (base ENZYME) Détection de segments homologues dans chaque collection Sélection d’un ensemble minimum recouvrant Construction de matrices de profil
Utilisation de MKDOM
Collections contenant des multi-enzymes Ex: Homosérine déshydrogénase AKH également aspartokinase
Collections hétérogènes - Enzymes non homologues Ex: Glucose déshydrogénase DHGA_ACICA et DHGB_ACICA - Enzymes oligomériques Ex: NO réductase NORB_PSEAE NORC_PSEAE Génération automatique de règles
Prédiction de voies métaboliques http://genopole.toulouse.inra.fr/bioinfo/priam/ Cribler l’ensemble des gènes d’un organisme avec les profils de PRIAM On obtient pour chaque protéine les meilleurs profils non complètement chevauchants Application des règles spécifiques à chaque EC Visualisation des résultats sur les cartes de KEGG
Visualisation des voies métaboliques
L’équipe ProDom Collaborations Soutien financier INRA Toulouse Jérome GOUZY Emmanuel COURCELLE Florence SERVANT Yoann BEAUSSE Catherine BRU Sébastien CARRERE Daniel KAHN Florence CORPET INRA Toulouse Clotilde CLAUDEL-RENARD Claude CHEVALET IBCP, Lyon Gilbert DELEAGE Christophe GEOURJON EBI, Hinxton Rolf APWEILER IRISA, Rennes Dominique LAVENIER Soutien financier Programme Bio-Informatique Inter-Organismes Génopole - Union Européenne (InterPro)