Rappel des objectifs du WP10 Mois 6 : cahier des charges de la bioinformatique pour un environnement transparent de calcul largement distribué Mois 12 : cahier des charges pour un banc-test, sélection d’une application et document de planification Mois 24 : rapport sur la première version d’une application biologique sur le banc-test Mois 36 : rapport final incluant le compte-rendu de la deuxième version de l’application biologique sur le banc-test
Comparaison des besoins des biologistes et des physiciens Biologistes/Médecins Physiciens Architecture Plate Hiérarchisée (CERN) Données Copies multiples Formats variables Découpage des bases de données Read/Write Peu de copies Peu de formats (4) Idem Read OU Write Calcul Mise à jour quotidienne Interactif -> Temps réel Parallélisé (BLAST) Pas de mise a jour Batch Pas de parallélisme
Evaluation des environnements existants Calcul distribué : Tests de Globus (Exposé Y. Legré, R. Météry) Contacts avec le Laboratoire d’Informatique de Lille : FOCALE Plates-formes bioinfo : Tests d’Applab (EBI) Contacts avec INRIA Grenoble
Une alternative pour le calcul distribué : FOCALE (LIFL) Fédération de serveurs distants Approche composants Echange de données entre composants sur un bus CORBA Interface graphique pour assembler les composants (pipelining)
Generic component description Trader entry properties (name = value) “name”=“mycomp” Binary file path command line I/O streams spec. Type, location... Factory Trader entry Binary Properties File Input Output
Component producing data Component consuming data Connector Any stream to any stream connectors File File Socket Socket Component producing data Component consuming data ConnectorOutput ConnectorInput CORBA Console Console Method Method
Un besoin à terme: la partition des bases de données Objectif : accélérer tous les algorithmes de comparaison de séquences Exemple : BLAST, recherche d’homologie entre une séquence et celles déjà annotées (9GB) Limitation : accès disque Moyen : découper les bases de données biologiques sur plusieurs nœuds en local et sur la grille et paralléliser le BLAST Outils existants ? Apport de DataGRID ? Besoin commun de partition avec les physiciens Besoin spécifique de parallélisme
WP 10 : organisation Réunions bimensuelles Collaborations envisagées Lyon, 10/1/01 : état de l’art en bioinformatique Prochaine réunion à Amsterdam le 7 Mars Collaborations envisagées Avec EBI Avec LIFL : FOCALE Draft d’un cahier des charges (N. Jacq)