Prédiction d’interactions protéine-protéine

Slides:



Advertisements
Présentations similaires
Taxonomie bactérienne
Advertisements

Journées AReNA, Strasbourg,18-20 Avril 2005 Problèmes liés à lidentification de gènes bactériens exprimant des ARN non traduits en protéines UPRES JE 2311,
Evaluation dheuristiques pour lalignement de séquences génomiques Stéphane Guyetant Séminaire Symbiose du 23/01/03.
Recherche de motifs par méthodes exploratoires: Comparaisons de performances et statistiques sur le score.
Informatique en Biologie Institut Pasteur S P I N Search in Protein Interaction Network Elisabeth Rémy Karine Robbe Mathieu Barthélémy Tuteur :
Mardi 12 décembre h30 (50 min) La phylogénie, ses concepts et ses applications à la génomiqueLa phylogénie, ses concepts et ses applications à la.
Correction des flats-fields Nadège Meunier Atelier MTR, 17 janvier 2006, Tarbes.
L’outil bio-informatique pour la génomique structurale
DE ZÉRO à PAUP : Délimitation du groupe d'intérêt ("ingroup")
Variabilité nucléotidique du gène de l'acétyl coenzyme A carboxylase et Signature de sélection par un herbicide chez la plante Alopecurus myosuroides (Huds.)
I. Recherche du gène correspondant aux séquences initiales.
OBJECTIFS FouDanGA : Fouille de données pour lannotation de génomes dactinomycètes CONTEXTE Laccumulation des séquences.
Prédiction de sites dinteraction des protéines par analyse darbres phylogénétiques Stéfan Engelen Génomique Analytique, INSERM U511 Université Pierre et.
Colloque Traitement et Analyse de séquences : compte-rendu
Initiation à la bioinformatique
Le remplacement moléculaire
Laurent Labarre AGC - UMR Génoscope
Les bases de données biologiques au LBBE
Bioinformatique: prédiction de gènes
Analyse bioinformatique de données de séquençage NGS médicales
Tester et mesurer lassociation spatiale entre 2 groupes darbres et des variables environnementales Quelles approches ? Dans le cadre des processus ponctuels.
Caractérisation structurale d ’un régulateur transcriptionnel du « Quorum Sensing » chez Brucella abortus.
Yoann Beausse Journée Bioinformatique des Génopoles
La phylogénomique sans alignement de séquences
Prédiction de la structure 3-D des protéines
UBLO Comparaison de génomes bactériens : questions méthodologiques autour de la définition du squelette et des boucles
Faculté de Médecine Lyon-Sud Module Optionnel de préparation à la lecture critique d articles Multiplicité.
Algorithme de lecture critique: validité interne
Plan Buts principaux Intérêt et pertinence du projet Rappel concernant la phylogénie Travail accompli jusquà maintenant Travail restant à accomplir Difficultés.
Les bactéries Gram négatives possèdent plusieurs systèmes pour transférer le matériel génétique. L’un de ces mécanismes est le système de conjugaison.
Recherche heuristique dans les bases de données L’algorithme BLAST
Etienne Danchin & Amandine Campan Présentation interne, pôle Santé des Plantes, Sophia - Antipolis Mercredi 21 avril 2010 Grille PACA ProActive : retour.
Alignements de séquences par paires
IGM LRI LaBRI Claire Herrbach François Lefèvre
La génétique et la biométrie
Sous la tutelle de Laurence Casalot Diagnostic Moléculaire
Real-Time PCR assay for rapid and accurate detection of point mutations conferring resistance to clarithromycin in Helicobacter pylori.
Formation Bio-informatique IRD
M2 Sciences des Procédés - Sciences des Aliments
Analyses phylogénétiques
Introduction à la Pathologie Moléculaire du Gène
Familles de gènes Nadia El-Mabrouk.
Module « Epidémiologie »
La qualité des services de garde en milieu scolaire IntroductionIntroduction ProblématiqueProblématique Cadre théoriqueCadre théorique MéthodologieMéthodologie.
Alignement de séquences biologiques
Étude de la corrélation entre la densité de marquage des cibles et la puissance du scanner lors d’une expérience de puce à ADN Axel POULET.
Réseau d’interactions Développement, reproduction,
Protéine.
TP 3 : Familles multigeniques
Evidence for a functional RNA element in the hepatitis C virus core gene Laura K. McMullan, Arash Grakoui, Matthew J. Evans, Kathleen Mihalik, Montserrat.
Réunion MODULOME 15/10/2007 Christine ROUSSEAU Recherche des CRISPRs : Résultats MODULOME.
Présenté par Mathieu Almeida, Amine Ghozlane
Test.
Introduction à la Bio-Informatique
PAA 1140 Biochimie vétérinaire, cours 9
Recherche heuristique dans les bases de données L’algorithme BLAST
« Ecologie et dynamique des populations » Unité de Pathologie Végétale
On s‘intéressera à 3 gènes paralogues humains : HTR2A, HTR2B et HTR2C du récepteur de la sérotonine humaine (Swissprot : 5HT2A_HUMAN, 5HT2B_HUMAN, 5HT2C_HUMAN).
Introduction à la Bio-Informatique
CHMI 4206 Bioinformatique appliquée
Les banques de séquences nucléiques
CHMI 4206 Bioinformatique appliquée
Bio-Informatique Analyse de séquences nucléotidiques
Jean Gaudart1 Détection de clusters spatiaux d'évènements Jean Gaudart Labo. Biostatistiques Faculté de Médecine de Marseille.
Test.
Test.
test
TEST.
Test test.
Transcription de la présentation:

Prédiction d’interactions protéine-protéine

Plan Introduction Prédiction d’interactions protéine-protéine par détection de mutations corrélées et comparaison d’arbres phylogénétiques Tests: Méthodologie Résultats et discussion

Introduction Détection d’interactions protéine-protéine Expérimentales: double-hybride Théoriques: différentes méthodes tentent de prédire les interactions protéiques à partir de la séquence: exemples Conservation des positions des gènes Fusion de domaines (Rosetta stone) Comparaison de profils phylogénétiques Détection de mutations corrélées Comparaison d ’arbres phylogénétiques

Conservation de l ’ordre des gènes génome1 génome2 Gènes orthologues Fusion de domaines (Rosetta stone) Génome 1 Génome 2 Profils phylogénétiques org1 org2 org3 org4 Protéine A 0 0 1 1 Protéine B 1 0 1 0 Protéine C 0 0 1 1 Profils identiques

Deuxième mutation compensatoire Prédiction d’interactions protéine-protéine par la méthode de Florencio Pazos Hypothèse Stabilité Mutation ponctuelle I F V F I L Deuxième mutation compensatoire Stabilité rétablie

Deuxième mutation compensatoire Les mutations corrélées peuvent être détectées à partir d’alignements multiples de séquences V F V F V F Alignement de séquences I L V F Mutation ponctuelle I F V F Deuxième mutation compensatoire I L

Prédiction de résidus en contact dans une protéine par détection de mutations corrélées

Prédiction d ’interactions protéine-protéine par détection de mutations corrélées inter-protéines

Prédiction d ’interactions par comparaison d ’arbres phylogénétiques

Méthodologie Sélection des séquences similaires de E value<10-5 Génome B. melitensis (2920 ORFs)prédites) Méthodologie Recherche en banque de données (BLAST nr) Sélection des séquences similaires de E value<10-5 Alignement de séquences (ClustalW) 2317 alignements Prédiction d’interactions protéiques pour quelques protéines

Résultats RBME02068 2,161 0,803 0,175 15 RBME01398 1,88 0,929 0,212 21 RBME00209 1,808 0,657 0,175 11 RBME01533 1,73 0,27 0,219 11 RBME01224 1,724 0,424 0,16 11 RBME02484 1,684 0,696 0,164 11 RBME01394 1,679 0,889 0,19 15 RBME01246 1,614 0,737 0,2 11 RBME02787 1,6 0,377 0,159 13 RBME00875 1,575 0,491 0,141 12 RBME01395 1,557 0,918 0,177 14 RBME00751 1,539 0,565 0,156 11 RBME01216 1,529 0,278 0,14 12 RBME01452 1,513 0,643 0,158 11 RBME00762 1,504 0,13 0,174 11 RBME01739 1,5 0,385 0,154 12 omp 16 virB4 membrane metalloprotease excinuclease ABC subunit B transcriptional regulator virB9 permeases transposase spermidine/putresceine transport system permease protein POTC VirB8 transporter dnaJ protein myo-inositol (OR4) -monophosphatase 1 (EC 3.1.3.25)

Tests de la méthode

Test sur quelques protéines de C. elegans 29 protéines impliquées dans le développement vulval de C.elegans et ayant des interactions confirmées expérimentalement (11) Méthodologie: idem Brucella . Les protéines ont été collectées dans la banque de données WPD

Méthodologie Sélection des séquences similaires de E value<10-5 29 ORFs de C. elegans Méthodologie Recherche en banque de données (BLAST nr) Sélection des séquences similaires de E value<10-5 Alignement de séquences (ClustalW) 27alignements Prédiction d’interactions protéiques pour quelques protéines

Test sur quelques protéines de C. elegans La plupart des scores <1 Sur 11 interactions confirmées expérimentalement, le programme n’a trouvé que deux interactions potentielles dont les scores sont: 0,794 0,649

Test sur quelques protéines de C. elegans Sur 11 interactions confirmées expérimentalement: 4 interactions pour lesquelles pas d ’alignement de séquences 2 interactions dimériques 1 interaction non trouvée car séquence non disponible

Test sur quelques protéines de S. cerevisiae 78 protéines impliquées dans le cycle cellulaire et dans le trafic des protéines vers la membrane plasmique 80 interactions confirmées (dans YPD) à tester (certaines étaient impossibles à tester car pas de séquence) Méthodologie: idem Brucella + application du filtre : au dessus de 50% de séquences identiques dans les deux alignements , les scores ne sont pas pris en compte

Méthodologie Sélection des séquences similaires de E value<10-5 78 ORFs de S. cerevisiae Méthodologie Recherche en banque de données (BLAST nr) Sélection des séquences similaires de E value<10-5 Alignement de séquences (ClustalW) 47 alignements Prédiction d’interactions protéiques pour 37 protéines

Test sur quelques protéines de S. cerevisiae La plupart des scores <2,5 Sur 80 interactions confirmées expérimentalement, le programme n’a trouvé que 10 interactions potentielles dont les scores sont <2 après application du filtre On ne peut pas distinguer les protéines qui interagissent de celles qui a priori n’interagissnt pas

Discussion

Discussion Limites des deux méthodes non applicable à des homodimères et à deux protéines dont les alignements sont quasi identiques (filtre) si une protéine n ’a pas /peu d ’homologues dans les bd : interaction n ’est pas détectée pas de cutoff défini: pour les protéines qui ont été testées, il n ’a pas été possible de discriminer les protéines qui interagissaient réellement de celles qui a priori n ’interagissaient pas.

Discussion Limites des deux méthodes mutations corrélées: interactions? prot multidomaines : beaucoup d ’interactions --> possible de discriminer les domaines qui interagissent par rapport au bruit de fond MAIS pour des interactions inter-protéines, il se peut que le nombre d ’interactions soit plus faible --> moins de mutations corrélées mirror tree: coévolution