Informatique en Biologie 2004 - Institut Pasteur S P I N Search in Protein Interaction Network Elisabeth Rémy Karine Robbe Mathieu Barthélémy Tuteur :

Slides:



Advertisements
Présentations similaires
Optimisation SQL Server
Advertisements

France Telecom Matthieu Leclercq
Evaluation dheuristiques pour lalignement de séquences génomiques Stéphane Guyetant Séminaire Symbiose du 23/01/03.
Informatique en Biologie 2004, Institut Pasteur
Introduction à l’Algorithmique
Agréger les infos SITRA et réservation sur mon site
I. Recherche du gène correspondant aux séquences initiales.
Cours n° 8 Conception et Programmation à Objets
Master Génie Biologique et Informatique, première année
Étude thématique Protégé 2000 Mathieu Besnard Elie Huvier.
TP 3-4 BD21.
Optimisation de Requêtes
Recherche de similarité de séquences à grande échelle S. Penel, P. Calvat, Y. Cardenas LBBE, CCIN2P3 Calculs BLAST intensifs sur la plateforme TIDRA -
Algorithmique et Structures de données
La balise <FORM>:
LOG 02 Bases de Données Avancées Rappels sur JSP / Servlet
Sympa et les familles de listes
OMNIDIA 5.3. OMNIDIA 5.3 OMNIDIA 5.3 OMNIDIA 5.3.
Sélection doligonucléotides spécifiques à laide de familles de graines AS Indexation de Texte et Découverte de Motifs Lina (Nantes) mai 2004.
Administration de bases de données spatiales avec SavGIS
Conception de la mise en page
Programme de baccalauréat en informatique Programmation Orientée Objets IFT Thierry EUDE Module 7 : Classes et fonctions paramétrables Département.
Algorithme Génétique et Gestion de Projet
Le langage ASP Les formulaires avec Request. Les formulaires sont employés pour transmettre des informations saisies par un client à une application Web.
Présentation Structures de Données et TDA
Module 2 : Préparation de l'analyse des performances du serveur
Prédiction d’interactions protéine-protéine
BIOS – – Un environnement de développement et de production de web-services BioMOBY Sébastien Carrere.
OPTIMISATION DE BASE DE DONNEES ORACLE
Recherche heuristique dans les bases de données L’algorithme BLAST
1212 Entrée et sortie de fichiers Objectifs À la fin de ce cours, vous serez capables de : • Lire à partir de la console • Écrire sur la console.
Etienne Danchin & Amandine Campan Présentation interne, pôle Santé des Plantes, Sophia - Antipolis Mercredi 21 avril 2010 Grille PACA ProActive : retour.
Programmation Internet en PHP SIL module M12
Linq & les expressions lambda. L Language In Integrated Q Query.
VISITE AUTOMATIQUE GUIDÉE SOUS VREng. Fonctionnement de VREng Avatar représentant l’utilisateur Chat permettant aux utilisateurs de discuter Panel de.
Projet ANIM : Indexation d’objets 3D :
Module 8 : Surveillance des performances de SQL Server
Chapitre 3.
Optimisation de requêtes
Concepts intermédiaires de VHDL
420-B63 Programmation Web Avancée Auteur : Frédéric Thériault 1.
Application de gestion des retards
Intégration de schémas
Acquisition d’information sur internet
SMIL Synchronized Multimedia Integration Language
MJ. Blin et M. CsernelPoleInfo31 XML et ses environnements Documents XML bien formés Prologue Arbre d'éléments Attributs Commentaires Entités internes.
Simulation du rôle de la communication dans l’établissement d’un réseau de liens sociaux Projet GPL :
INTERNET Le langage HTML
Modélisation des documents: DTD et Schéma
LDAP La gestion des groupes Gestionnaire de groupes uPortal permet de brancher plusieurs types (services) de gestion de groupes. Les groupes peuvent être.
L T I Laboratoire de Téléinformatique 2 Projet de semestre Parseur XML basé sur la DTD : Buts –Utiliser la grammaire définissant un type de fichiers XML.
Exploration immersive de données génomiques textuelles et factuelles
MobyleNet – – Un environnement de développement et de production de web-services BioMOBY Sébastien Carrere.
Auteur: Dr Clara BRICHANT-PETITJEAN
06/04/06 LES BASES DE DONNEES INTRODUCTION CogniTIC – Bruxelles Formation - Cepegra.
Recherche heuristique dans les bases de données L’algorithme BLAST
A b a a b a a b a P1 V1 _a _b2 5 ; 1 4 ; 6 3 aa ba P2 ab 5 2 V2 Q2 aa k= aaabbaab ba Look at +k Put.
Présentation de Qt Iris 1
L. Gurret – M. Herve – P. Mignon – J. Prarioz. Introduction  Dernière étape d’analyse  Cahier des charges, spécifications et conception orientée objet.
Générateur d’applications WEB de gestion de données Module List.
Initialisation au logiciel (Statistical Analysis System)
Traitement d’images Semaine 09 v.A15.
Mais d’abord rappelez-vous!!
Les banques de séquences nucléiques
Les calques Les Template (modèles) Les Comportements Les scénarios Les formulaires Les CSS Le serveur Web de l’UTC Présentation.
Algorithmes Branch & Bound Module IAD/RP/RO Master d ’informatique Paris 6 Philippe Chrétienne.
Les bases de données Séance 4 Construction du Modèle Physique (la BDD)
Gabrion Thomas 1. Sommaire I Présentation du LAPP - LAPTH II Contexte du stage III Réalisation du stage IV Bilan 2.
© 2013 Association for Computing Machinery Algérie – Novembre 2014 Philippe MARTIN, TSP Diffusion
Transcription de la présentation:

Informatique en Biologie Institut Pasteur S P I N Search in Protein Interaction Network Elisabeth Rémy Karine Robbe Mathieu Barthélémy Tuteur : Thierry Rose

Search in Protein Interaction Network : La fonction dune protéine peut être déduite de celle de ses partenaires. LISTER :- récupérer ou créer des listes dinteraction protéine/protéine, - normaliser leur format, - éliminer les redondances, - constituer les listes de références. SPIDER :- utiliser les listes de référence pour retrouver le graphe connexe qui contient une protéine requête, suivant des contraintes fixées. GRAPHER :- représenter les graphes. Informatique en Biologie Institut Pasteur

Bases de données DIP : intéractions BIND : intéractions … Création - Prédiction Rosetta stone Profiles de conservation Gènes voisins … Saisie Le chercheur … Futur Puces Text mining … LISTER SPIDER GRAPHER Informatique en Biologie Institut Pasteur Architecture

DIP XML PSI MI BIND Texte simple Texte délimité par des tabulations BASE DE DONNEES XML au format PSI MI LISTE SIMPLE direct PSI MI Maker XML Flattener Saisie Analyseur syntaxique : Module EXPAT de Python Informatique en Biologie Institut Pasteur Choix du format des données

LISTE SIMPLE : OBJECTIF XML PSI MI : LISTE SIMPLE : RESULTAT

Algorithme de prédiction dintéraction : Rosetta stone Marcotte et al., Informatique en Biologie Institut Pasteur S. cerevisiae topo II E. coli gyrB Parfois, 2 protéines A et B dun organisme sont fusionnées dans un autre organisme. Les protéines A et B ont des chances dinteragir. Base non redondante (nr) : protéines... E. coli x S. cerevisiae 4300 x 6200 E. coli gyrA

Informatique en Biologie Institut Pasteur Algorithme de prédiction dintéraction : Rosetta stone query_file my_db pb formatdb look for pairs rosetta pairs history une ligne par paire : concatenation de 2 lignes de la sortie Blast : historique de lassociation en paire. list_ids liste des gi de chaque protéine impliquée dans une paire prédictive. list_pairs liste des paires, tuples de gi. build fasta file buil simple list iterator BioFasta fichier FASTA (requêtes au NCBI)

Algorithme de prédiction dintéraction : Rosetta stone query_filemy_db fonction look for pairs iterator BioFasta single_query fonction runblast : pb blastall -p blastp -e 0,001 -m 8 -d user/my_db -i single_query Q ligne par hit : instanciations de la classe Hit la ligne est un attribut de Hit les paramètres sont définis ici (par défaut) méthode covers : recouvrement dans la protéine requête si Hit.target est vrai, lobjet est placé dans une liste fonction extractpairs : stocke la position dans la liste des objets Hit formant une paire (méthode covers) -> liste de tuples de position fonction builsrosettalist : concatène les attributs line de 2 objets Hit formant une paire, ecrit la ligne dans un fichier Informatique en Biologie Institut Pasteur

Algorithme de prédiction dintéraction : Rosetta stone temps dexécution, paramètres et contrôles, optimisations S.cerevisiae x E. coli 6200 x h35 de calcul E value < E value < E value < paire gyrA gyrB+++ nb de paires prédites NR jours de calcul Faire varier le score, la taille des domaines dhomologie, des domaines non recouvrants.

Saisie dintéractions : Formulaire et CGI CGI avec méthode POST

Bases de données DIP : intéractions BIND : intéractions … Création - Prédiction Rosetta stone Gènes voisins … Saisie Le chercheur … Futur Puces Text mining … LISTER SPIDER GRAPHER DIP : intéractions Rosetta stone Le chercheur Profiles de conservation SPIN LISTER