Méthodes et usages de l’analyse de la modularité des protéines

Slides:



Advertisements
Présentations similaires
Ministère de l'Écologie, de l'Énergie, du Développement durable et de la Mer en charge des Technologies vertes et des Négociations sur le climat
Advertisements

Journées AReNA, Strasbourg,18-20 Avril 2005 Problèmes liés à lidentification de gènes bactériens exprimant des ARN non traduits en protéines UPRES JE 2311,
Applications de GdX Coordinateur thématique : Christophe Cérin
Informatique en Biologie Institut Pasteur S P I N Search in Protein Interaction Network Elisabeth Rémy Karine Robbe Mathieu Barthélémy Tuteur :
Image et apprentissage
I. Recherche du gène correspondant aux séquences initiales.
I) Obtention de l’ADN recombinant
Prédiction de sites dinteraction des protéines par analyse darbres phylogénétiques Stéfan Engelen Génomique Analytique, INSERM U511 Université Pierre et.
Colloque Traitement et Analyse de séquences : compte-rendu
Rappel des objectifs du WP10
Université Paris XII - IUP SIAL maîtrise Breton Elodie – Royer Gwladys
Le remplacement moléculaire
Laurent Labarre AGC - UMR Génoscope
Recherche de similarité de séquences à grande échelle S. Penel, P. Calvat, Y. Cardenas LBBE, CCIN2P3 Calculs BLAST intensifs sur la plateforme TIDRA -
Les bases de données biologiques au LBBE
Projet 4info.
Recherche heuristique de similitudes dans les séquences dADN École Jeunes Chercheurs en Algorithmique et Calcul Formel Laurent Noé
Sélection automatique d’index et de vues matérialisées
Caractérisation structurale d ’un régulateur transcriptionnel du « Quorum Sensing » chez Brucella abortus.
Boudouma Nedjma et Hoarau Ludovic
DEA Intelligence Artificielle et Optimisation Combinatoire
Yoann Beausse Journée Bioinformatique des Génopoles
Réalisateur : PHAM TRONG TÔN Tuteur : Dr. NGUYEN DINH THUC
Champs de Markov cachés pour la classification de gènes..
Construction de modèles visuels
Phylogenetik Conception, développement et tests d’un logiciel en java
UBLO Comparaison de génomes bactériens : questions méthodologiques autour de la définition du squelette et des boucles
IFT – Ingénierie des connaissances Exposé darticle « Applying a library of problem-solving methods on a real-life task » Piet-Hein Speel et Manfred.
La Bioinformatique à Nancy
© Petko ValtchevUniversité de Montréal Janvier IFT 2251 Génie Logiciel Notions de Base Hiver 2002 Petko Valtchev.
Le projet BENEBUS: Benchmarking of e-business solutions for Western and Eastern Europe SMEs Contract no.:IST a rassemblé des.
Exemples de contrôle de voies métaboliques
Prédiction d’interactions protéine-protéine
Développement informatique : Outils dexploitation de films infrarouges Projet dimagerie : Reconnaissance automatique de lemplacement dobjets sur des imagesinfrarouges.
L3 Module Libre Année universitaire Initiation à la Bioinformatique Jean-Michel RICHER.
Annotation de génomes complets
BIOS – – Mise en œuvre Projet RosEST Développements Sebastien Carrere, LIPM Thibaut Hourlier, LIPM Coordination.
BIOS – – Un environnement de développement et de production de web-services BioMOBY Sébastien Carrere.
L’adaptativité pour un solveur de l’équation de Vlasov
Recherche heuristique dans les bases de données L’algorithme BLAST
Cours du 25 octobre Mardi le 24 octobre
Outils graphiques de conception et de débogage sous Eclipse
Le webclasseur orientation
Integration des pipelines d’analyse
E.Dot – juillet 2005 Page 1 Conclusion [ Lot 4. Validation et Évaluation ] Rapport Final 4 juillet 2005.
UML.
Projet pour la génération de cartes choroplèthes – SIGMA – février 2009 DEVELOPPEMENT DU PROTOTYPE D ’ UNE APPLICATION WEB DE GENERATION DE CARTES CHOROPLETHES.
GRAPHES EN INFORMATIQUE. INTRODUCTION Les objets mathématiques appelés graphes apparaissent dans de nombreux domaines comme les mathématiques, la biologie,
Projet de Recherche Nathalie GORMEZANO Directrice générale de l’ISIT
Génétique Animale Vision et attentes vis-à-vis de Bios4Biol.
PRESENTATION GENERALE DE DRCAD D R C A D
Co-expression = fonction (Eisen et al., PNAS 1998)
Graph cuts et applications
OMRON ® Contrôle de mouvements 1. OMRON ® Contrôle de mouvements 2 CX-Position Démarrage d ’un nouveau projet Démarrez CX-Position, créez un nouveau projet.
Génération de tests pour la localisation automatique d’erreurs Yves Le Traon et Franck FLEUREY.
Optimisation de requêtes
Calcul parallèle => partitionner les données en sous-groupes associés aux processeurs. P0 P2 P1.
Agathe Madeleine Développement d’un logiciel de visualisation de données métaboliques Stage DESS CCI, Université F. Rabelais (Tours)
Réseau d’interactions Développement, reproduction,
Banques de données en bio-informatique
3D MEsh Processing Platform
MobyleNet – – Un environnement de développement et de production de web-services BioMOBY Sébastien Carrere.
Projet GenoTo3D Apprentissage automatique appliqué à la prédiction de la structure tertiaire des protéines GenoTo3D Guermeur Y 1, Benabdelsem K 2, Bréhélin.
Recherche heuristique dans les bases de données L’algorithme BLAST
Introduction à la Bio-Informatique
Mais d’abord rappelez-vous!!
Temps et évolution chimique
Reconnaissance d’objets 3D –point de vue complètement différent –pas d’invariant 3D Difficultés :
Bio-Informatique Analyse de séquences nucléotidiques
Transcription de la présentation:

Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques  3. Méthodologie de prédiction du métabolisme (PRIAM)

Modularité des protéines à domaine PAS o0359_Synsp BAT_HALHA Orf1_Tn1721 TlpA_Ecoli NIFL_AZOVI NIFL_KLEPN NifL_KPASy NifL_Entag Elk_Drome CIKE_DROME Erg_Human Eag_mouse Eag_rat Plkin_pea Plkin_ice Plkin_spinach PAS sensor kinase voltage gated K+ channel S/T kinase

1. Le programme MKDOM

Durée d’exécution de MKDOM sur l’ensemble des séquences Version Date n j n2/j x 1e10 2001.2 Mai 2001 339763 31 2.69 2001.3 Sept 2001 373869 46 3.29 2002.1 Mai 2002 481952 64 2.76

Améliorer l’algorithme Algorithme quadratique/nb de séquences n double tous les 18 mois Pcalcul double tous les 18 mois Le temps de calcul double tous les 18 mois

Parallélisation ? Paralléliser la boucle principale ? N requêtes simultanées Vérification a posteriori de leur compatibilité Procéder en deux phases ? PSI-BLAST tout contre tout Puis mimer MKDOM Changer d’algorithme ?

Le programme ADDA Heger & Holm, 2003 J. Mol. Biol. 328, 749-767

Exemple d’utilisation de MKDOM: Analyse de la famille des cyclases de Rhizobium Engendrer une matrice de score position-spécifique (PSSM) pour le domaine catalytique Recherche exhaustive dans les génomes de S. meliloti et M. loti Analyse en domaines utilisant MKDOM Visualisation par XDOM Classification des cyclases

CyaF : SM:7 ML:4, Cterm-domain = TPR CyaG : SM:3 ML:1 CyaD : SM:3 ML:0 CyaH : SM:1 ML:2 CyaE : SM:2 ML:0, Nterm-domain = TM CyaB, Nterm domain = SignalP and TM CyaC, Nterm domain = TM CyaJ, Cterm domain = TM CyaA

de familles de domaines protéiques 2. La base ProDom de familles de domaines protéiques www.toulouse.inra.fr/prodom.html GerE LuxR FixJ OmpR SpoOA NtrC NifA

Structures de protéines Intégration des données protéiques Structures de protéines (1,n) (1,n) Séquences Structures de domaines (n,n) (1,n) Base de domaines protéiques Collaboration européenne Projet InterPro coordonné par l’EBI (1,n) Données biochimiques

Domain motif Links to other representations of the family Links to other databases

3. Prédiction du métabolisme Le projet PRIAM Profils pour l’Identification Automatique du Métabolisme Clotilde RENARD-CLAUDEL Collaboration Claude CHEVALET a) Construction d’un ensemble de matrices de profil représentatif à partir de la base ENZYME b) Prédiction des voies métaboliques

Construction des matrices de profil représentatives 1502 collections enzymatiques (base ENZYME) Détection de segments homologues dans chaque collection Sélection d’un ensemble minimum recouvrant Construction de matrices de profil

Utilisation de MKDOM

Collections contenant des multi-enzymes Ex: Homosérine déshydrogénase AKH également aspartokinase

Collections hétérogènes - Enzymes non homologues Ex: Glucose déshydrogénase DHGA_ACICA et DHGB_ACICA - Enzymes oligomériques Ex: NO réductase NORB_PSEAE NORC_PSEAE Génération automatique de règles

Prédiction de voies métaboliques http://genopole.toulouse.inra.fr/bioinfo/priam/ Cribler l’ensemble des gènes d’un organisme avec les profils de PRIAM On obtient pour chaque protéine les meilleurs profils non complètement chevauchants Application des règles spécifiques à chaque EC Visualisation des résultats sur les cartes de KEGG

Visualisation des voies métaboliques

L’équipe ProDom Collaborations Soutien financier INRA Toulouse Jérome GOUZY Emmanuel COURCELLE Florence SERVANT Yoann BEAUSSE Catherine BRU Sébastien CARRERE Daniel KAHN Florence CORPET INRA Toulouse Clotilde CLAUDEL-RENARD Claude CHEVALET IBCP, Lyon Gilbert DELEAGE Christophe GEOURJON EBI, Hinxton Rolf APWEILER IRISA, Rennes Dominique LAVENIER Soutien financier Programme Bio-Informatique Inter-Organismes Génopole - Union Européenne (InterPro)