La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Informatique en Biologie 2004, Institut Pasteur Search in Protein Interaction Network SPIN Elizabeth Remy Karine Robbe Mathieu Barthelemy Recherche pour.

Présentations similaires


Présentation au sujet: "Informatique en Biologie 2004, Institut Pasteur Search in Protein Interaction Network SPIN Elizabeth Remy Karine Robbe Mathieu Barthelemy Recherche pour."— Transcription de la présentation:

1 Informatique en Biologie 2004, Institut Pasteur Search in Protein Interaction Network SPIN Elizabeth Remy Karine Robbe Mathieu Barthelemy Recherche pour une protéine à partir de son identifiant de lensemble des protéines du même organisme qui pourraient lui être associées structuralement ou fonctionnellement. Le « spider » : Projet encadré par Thierry Rose

2 Rosetta Base de données dinteractions DIP (fichier XML) BIND Données personnelles Liste de paires au format simplifié SPIN spider Interface utilisateur Identifiant de la protéine Requête graphe

3 SPIN spider : parcours de graphe Protéine de la requête G_ G_ Immunoprecipitation qu file pointer Le réseau dinteractions protéine-protéine obtenu est un graphe: - connexe et cyclique - un vertex = une protéine (identifiant gi) - une arête = une interaction protéine-protéine - il peut exister plusieurs arrêtes entre 2 vertex (plusieurs méthodes) Protéome de lorganisme de requête

4 SPIN spider : interaction prédictive déduite du Blast Protéine de la requête Protéome de lorganisme de requête Autre organisme Blast Protéines de la base de données dinteractions

5 SPIN spider : interaction prédictive déduite du Blast Protéine de la requête Protéome de lorganisme de requête Autre organisme Blast Protéines de la base de données dinteraction

6 SPIN spider : interaction prédictive déduite du Blast Protéine de la requête Protéome de lorganisme de requête Autre organisme Blast Protéines de la base de données dinteraction Blast Protéines de la base de données non redondante du NCBI Method = Blast predictive

7 SPIN spider : problèmes des identifiants du NCBI gi et taxon-id la ligne dinteraction utilise le gi et le taxon-id: gi - 2 gi différents pour la même protéine - base de données pas formatable pour le Blast Prend le premier gi de la liste taxon-id G_ G_ Immunoprecipitation qu file pointer - lors de la remontée du Blast, lorganisme est un nom est en latin => Il faut trouver le taxon-id Format fasta

8 SPIN spider : parseur de la sortie du Blast

9 Choix de lalgorithme: Parcours en largeur Premiers tests de création/parcours de graphe: Le réseau comportant la protéine peut être très important (exemple: un réseau de la levure S. saccharomyces cerevisiae : interactions, 4927 protéines) Introduire la notion de niveau pour lutilisateur, qui correspondra a la distance entre le vertex (la protéine) considéré et le vertex (la protéine) de départ Parcours en largeur : Inspiré de lalgorithme du BFS (Breadth First Search) Protéine de la requête

10 SPIN spider: Structure du programme Protein __dict__ Attributs dict_index Fonctions find_interactions() add-interaction() fasta_file() instance __dict__ Attributs gi org graph interact find_inter distance __class__ BFS() black_interaction() print_interaction() Class Protein Spider Blast interrog_blast() parse_blast() find_predictive_interactions() Protéine de la requête

11 SPIN spider: Structure du programme Protein __dict__ Attributs dict_index Fonctions find_interactions() add-interaction() fasta_file() instance __dict__ Attributs gi org graph interact find_inter distance __class__ BFS() black_interaction() print_interaction() Class Protein Spider Blast interrog_blast() parse_blast() find_predictive_interactions() Protéine de la requête

12 SPIN spider: Structure du programme Protein __dict__ Attributs dict_index Fonctions find_interactions() add-interaction() fasta_file() instance __dict__ Attributs gi org graph interact find_inter distance __class__ BFS() black_interaction() print_interaction() Class Protein Spider Blast interrog_blast() parse_blast() find_predictive_interactions() Protéine de la requête

13 SPIN spider: Structure du programme Protein __dict__ Attributs dict_index Fonctions find_interactions() add-interaction() fasta_file() instance __dict__ Attributs gi org graph interact find_inter distance __class__ BFS() black_interaction() print_interaction() Class Protein Spider Blast interrog_blast() parse_blast() find_predictive_interactions() Protéine de la requête

14 SPIN spider: Structure du programme Protein __dict__ Attributs dict_index Fonctions find_interactions() add-interaction() fasta_file() instance __dict__ Attributs gi org graph interact find_inter distance __class__ BFS() black_interaction() print_interaction() Class Protein Spider Blast interrog_blast() parse_blast() find_predictive_interactions() Protéine de la requête

15 SPIN spider: Structure du programme Protein __dict__ Attributs dict_index Fonctions find_interactions() add-interaction() fasta_file() instance __dict__ Attributs gi org graph interact find_inter distance __class__ BFS() black_interaction() print_interaction() Class Protein Spider Blast interrog_blast() parse_blast() find_predictive_interactions() Protéine de la requête

16 SPIN spider: exemple de résultats par niveaux Homo sapiens gi: Homo sapiens gi :66820 S. cerevisiae gi :82888S. cerevisiae gi : fichier level 4926 protéines 285 protéines 4926 protéines E. coli gi : protéines Nombre protéines nouvelles par niveau = f (niveau) Niveau = nombre dintermédiaires

17 fichier pairs niveauAorgABorgBméthode

18 Test 1: gi= niveau= 1, 2 et 4 Test 2: gi=8288 niveau= 3, 4 et 7 SPIN spider: Optimisation Protein __dict__ Attributs dict_index Fonctions find_interactions() add-interaction() fasta_file() instance __dict__ Attributs gi org graph interact find_inter distance __class__ Calcul en CPU.s = f (niveau) niveau + index - index niveau + index - index

19 SPIN spider: entrée/sortie DIP (fichier XML) Liste de paires au format simplifié fasta database index gml file2fastadatabase -index simple2gml SPIN spider level gml Requête (gi,niveau) pairslist_gifasta simple2gml Liste_simple

20 fichier mis au format gml Sortie graphique Sur yEd Graph Editor

21 Rosetta Base de données dinteractions DIP (fichier XML) BIND Données personnelles Liste de paires au format simplifié SPIN spider Interface utilisateur Identifiant de la protéine Requête

22 Rosetta Base de données dinteractions DIP (fichier XML) BIND Données personnelles Liste de paires au format simplifié Interface utilisateur Requête Grapher: interfaceTK Client form CGI - Identifiant de la protéine (gi) - Niveau (distance) - Méthode (immunoprécipitation) http SPIN spider Création de 5 fichiers temporaires (propriétaire =www) Ecriture

23

24

25


Télécharger ppt "Informatique en Biologie 2004, Institut Pasteur Search in Protein Interaction Network SPIN Elizabeth Remy Karine Robbe Mathieu Barthelemy Recherche pour."

Présentations similaires


Annonces Google