Rhône-Alpes : Grille pour le Traitement d’Informations Médicales (RAGTIME) Serge Miguet LIRIS — Université Lumière Lyon 2 26 avril 2005 Conseil régional Rhône-Alpes
Plan de la présentation Contexte du projet Bilan de la deuxième année, perspectives pour la troisième année Présentation du Thésard Ragtime : Yonny Cardenas (ADR 2003) Partenariat avec les mathématiques Roland Gillard : cryptologie Jean Della-Dora : calculs cellulaires
Genèse de Ragtime Dans la région En France En Europe Calculs parallèles (1994-1997) : architectures spécialisées Santé et HPC (1997-2000) : grappes SICOM et AdéMo (2000-2003) : systèmes communicants, applications à la santé En France Actions Concertées Incitatives GRID (2002, 2003) Grid 5000 (2004) En Europe Projet IST Datagrid --> EGEE Conférence et association Healthgrid
Objectifs du projet Grilles de calculs mutualisation de ressources informatiques rendues célèbres par SETI@HOME, Napster, le Décrypton Domaines d’applications les plus souvent ciblés Calcul scientifique Physique des hautes énergies Constat dizaines de téra-octets produits chaque année par les hôpitaux sous-exploités puis archivés sous forme traditionnelle (films) Difficulté gérer efficacement ces données respecter les droits des catégories d’ usagers Enjeux Dossier médical réparti Études épidémiologiques / statistiques à grande échelle
Les lots de travail du projet Ragtime
Partenaires académiques LIRIS LIP IBCP CREATIS IN2P3 ID TIMC Applications X Bases de données Accès aux données Ressources de calcul Infrastructure
Partenaires Socio-Économiques CHU de Grenoble Hôpital Neuro-Cardiologique Centre de Lutte contre le Cancer Léon Bérard France Télécom Praxim Sun Microsystems Nextira One
Plan de la présentation Contexte du projet Bilan de la deuxième année, perspectives pour la troisième année Organisation pratique / administrative Résultats à mi-parcours / développements à poursuivre Actions de dissémination Liste des publications Présentation du Thésard Ragtime Partenariat avec les mathématiques
Organisation pratique du projet 5 réunions plénières : 16 septembre 2003 13 février 2004 28 juin 2004 17 janvier 2005 ?? juillet 2005 réunions de tâches, tous les 2 mois environ Site web du projet : http://liris.univ-lyon2.fr/~miguet/ragtime Diffusion d’informations par mail Convention inter-établissements
Lot 1 : Les applications A1 : Atlas statistique A2 : Mammographie (indexation) A3 : Modélisation du myocarde A4 : Simulation IRM A5 : Génomique A6: Fusion SPECT/CT
A1 : Atlas statistiques Objectif: Extraire des formes d’organes de données scanner et construire un modèle statistique Vertèbres, crânes, dents... Collaboration: TIMC: approche analytique LIRIS: approche discrète Comparaison des approches: convention TIMC- LIRIS pour l'accès à un jeu de données commun provenant du CHU de Grenoble Projets: Calcul sur des examens répartis sur plusieurs sites Généralisation de ces processus à n formes
A2. Mammographies Objectifs: Indexer les images, identifiers les régions malignes, aider au diagnostic Besoins: Travail sur un très gros volume de données (base de données DDSM: 450 Go) Passage à l'échelle: archivage et indexation de la DDSM au CC-IN2P3 Gestion des méta-données : utilisation pilote de SRB Projet pour l’année 3 : démonstrateur avec scénario médical FILE: B_3012_1.RIGHT_MLO.OVERLAY TOTAL_ABNORMALITIES 1 ABNORMALITY 1 LESION_TYPE MASS SHAPE IRREGULAR MARGINS SPICULATED ASSESSMENT 4 SUBTETLY 3 PATHOLOGY MALIGNANT TOTAL_OUTLINES 1 BOUNDARY
A3. Modélisation du myocarde Objectifs: Segmentation des ventricules cardiaques dans des IRM, modélisation par éléments finis (a priori de forme) Travail réalisé: Parallélisation “naïve” de l’algorithme de segmentation Tests sur la grappe de PC de CREATIS (~300 images) : 3 min. par instant Impossibilité de prendre en compte les contraintes temporelles Projets: Parallélisation de l’algorithme de résolution par éléments finis Portage sur EGEE Validation du modèle
A4. Simulation IRM Objectifs: Production d'IRM réalistes à partir d'un modèle à des fins d'étude Réalisé en an1: simulateur parallèle Travail réalisé année 2 : Ajout de séquences IRM Opérations de post-traitement d'images Ajout des artéfacts de suceptibilité magnétique et de décalage chimique (voir illustration) Nouveau modèle de parallélisation adapté aux environnements hétérogènes (grille) Projets: Ajout d'un portail pour faciliter l'accès par la communauté médicale
A5. Génomique Objectifs: Recherche de signatures de protéines (alignement de séquences et identification de familles de protéines) Déploiement sur l'infrastructure de grille EGEE: Application PattInProt Bases de données utilisées dans l'application (PROSITE, Swiss-Prot, TrEMBL...) Evaluation de performance (résultats en demi-teinte) Modélisation de PattInProt: pour proposer un shéma d'accès aux données et d'exécution plus efficace Projets: évolution et déploiement de l'application selon le nouveau modèle sur les middleware DIET et EGEE
A6. Fusion SPECT/CT et correction du diffusé Objectifs: Correction du diffusé dans la fusion SPECT/CT (calculs par la méthode de Monte Carlo) Collaboration: TIMC – LPC (IN2P3) Réalisation: Mise en oeuvre de l'algorithme sur la plateforme CiGrid Echantillonnage en tomographie hélicoïdale et en tomographie dynamique
Lot 2 : Constitution des bases de données BD1 : Connexion des bases de données (PACS, dossiers médicaux) à la grille BD2 : Visualisation et navigation dans les données BD3 : Exploitation des données dans des entrepôts de données « virtuels »
BD1 : Connexion des bases de données à la Grille Problématique : intégration dans un même espace de partage de données sensibles stockées « sur les bords » de la grille DSE : architecture logicielle générique de partage de données réparties dans des bases externes DM2 : application aux bases d’images médicales (DICOM) Expérimentation : images cardiaques (application Ragtime-A3) Intégration DM2-microgrid-Sygn (Ragtime-ADS2)
BD2 : Visualisation, recherche et manipulation des données Problématique : recherche orientée patient de données complexes hétérogènes distribuées à large échelle Utilisation des topic maps pour « cartographier » l’espace des données Modélisation et gestion de profils utilisateurs et de workflows de réseaux de soins
BD3 : Entrepôts de données médicales sur la Grille Problématique : répartition et mise à jour des informations entreposées issues de bases de données réparties à grande échelle – traitement de requêtes OLAP Proposition d’un modèle d’entrepôt virtuel partiellement matérialisé : calcul d’éléments élémentaires (« chunks ») de l’entrepôt matérialisés sur la grille et indexés pour faciliter leur recherche et leur mise à jour Méthode originale d’indexation spatiale des chunks Lien établi avec la gestion de cache (Ragtime-ADS1)
Perspectives pour l’année 3 du lot de travail BD : Déploiement d’une plate-forme logicielle d’échange et de partage de données médicales (images et dossiers médicaux) Intégration avec les lots « Applications » et « Accès efficace aux données et Sécurité » Navigation et traitement distribué de requêtes OLAP sur un entrepôt virtuel
Lot 3 : mécanismes d’accès aux données ADS1 : Accès efficace aux bases distantes (présentation de Yonny Cardenas) ADS 2 : Sécurisation des données et des accès (présentation de Roland Gillard)
ADS 2 : Accès sécurisé aux données Authentification, intégrité, non répudiation des accès et calculs sur les données médicales via la grille Problèmes critiques : Accès par un médecin depuis une machine éventuellement non sécurisée: internet ou réseau avec machines non garanties sûres Sécurité et certification des accès et résultats sur la grille
ADS 2 : un sous-groupe actif du projet Ragtime Thèse de L. Seitz (11 juillet 2005). Contrôle d’accès sur les informations médicales : l’architecture Sygn Intégration de Sygn à une grille bio-médicale prototype : µGrid (J. Montagnat, CREATIS) : Sygn+µGrid Intégration avec les travaux de S. Varette et J-L. Roch (ID, Grenoble) Stockage crypté : CryptStore. Publication : Journal Methods of Information in Medicine Idée reprise dans le groupe de recherche JRA-3 sur la sécurité dans le projet européen EGEE Comparaison avec Vigilant (Accueil BAC d’Axel Krings)
Lot 4 : Middleware — gestion des ressources de calculs MW1 - Un middleware à l’échelle de la région? Adoption de Grid 5000 ? Utilisation de gLite ? (évolution du middleware datagrid) MW2 - Nouveaux protocoles réseaux. Accès à délai contrôlé aux bases de données MW3 - services de DIET
Evolutions de DIET DIET: environnement client/serveur de résolution de problèmes (sélection de ressources, ordonnancement, etc.) Ajout d'un module de déploiement automatique sur une grille (GoDIET) Ajout de « plugins » d'ordonnancement: les critères d'ordonnancement peuvent maintenant dépendre des applications Mise en place d'un module gérant la persistance et la réplication des données Validation à grande échelle sur Grid5000
Lot 5 : Infrastructure I1 : Outil de gestion et de supervision de la grille médicale à échelle régionale VizDIET : Outil de monitoring de DIET, intégré à l’infrastructure Grid 5000 Ouverture à l’organisation virtuelle « biomed » de l’infrastricture EGEE (en particulier, les 1308 CPU du CC-IN2P3) I2 : Dissémination et valorisation des résultats du projet. Formation des utilisateurs
VizDIET : copies d’écran
VizDIET : copies d’écran (suite)
I2 : Formation et dissémination Participation au Global Grid Forum Gestion des méta-données sur la grille Gestion de la sécurité Rédaction du « white paper » Healthgrid Chapitre 3 : « Medical imaging and image processing » Animation d’écoles Druide (24 au 28 mai 2004, Port-aux-Rocs, Le Croisic) GridUse (21 au 25 juin 2004, Metz) Organisation de conférences Jobim’2005, du 4 au 8 juilllet 2005 à Lyon
Petites déceptions du mi-parcours Réticence des médecins à systématiser l’accès aux données médicales PACS du Centre Léon Bérard Accès aux données de l’hôpital cardiologique (prototype DM2) Accès aux examens scanner du CHU de Grenoble Une seule bourse de thèse pour 7 (ou 8) partenaires Lourdeur administrative dans la gestion des crédits Implication des partenaires industriels
Intéractions entre partenaires pendant l’année 2 LIRIS LIP IBCP CREATIS IN2P3 ID TIMC Applications X Bases de données Accès aux données Ressources de calcul Infrastructure
Exemples d’actions réalisées grâce à Ragtime Comparaison de deux approches sur des données mises en commun (application A1) Rédaction du « white paper » healthgrid, d’un article dans JGC (4 partenaires Ragtime) Participation au projet national « Grid 5000 » (ID, LIP) et au projet européen « EGEE » (Creatis, IBCP, IN2P3, LIRIS) Réponses aux ACI Grid puis Masses de Données Bourses : 1 ADR, 2 BAC, 1 BIR Poursuite de projets plus anciens : BAC ADeMo F. Boumghar --> PAST ENS : portage sur DIET de l’application A2 BIR ADeMo J. Milles --> collaboration avec Theo Arts de Maastricht : marquage tissulaires dans l’application A3
Liste des publications [1] J. Montagnat, F. Bellet, H. Benoit-Cattin, V. Breton, L. Brunie, H. Duque, Y. Legré, I. E. Magnin, L. Maigne, S. Miguet, J.-M. Pierson, L. Seitz, T. Tweed. Medical images simulation, storage and processing on the European DataGrid testbed. Journal of Grid Computing, to be published by Kluwer Academic. [2] Kinda Hassan, Tiffany Tweed, and Serge Miguet. A multi-resolution approach for a content-based image retrieval on the grid. application to breast cancer detection. A paraître dans Methods of Information in Medicine. (2005). [3] Isameddine Boukhriss, Serge Miguet and Laure Tougne. Two-Dimensional Discrete Morphing. In Combinatorial Image Analysis. IWCIA 2004, Auckland, New Zealand, December 1-3, 2004 Lecture Notes in Computer Science Publisher: Springer-Verlag Heidelberg ISSN: 0302-9743. [4] Hussein Atoui, David Sarrut, and Serge Miguet. Usefulness of image morphing techniques in cancer treatment by conformal radiotherapy. SPIE Medical Imaging, (2004). [5] Rachid Namane, Fatima O. Boumghar, Kadi Bouatouch, and Serge Miguet. Qsplat compression. In AFRIGRAPH’04: Proceedings of the 3rd international conference on Computer graphics, virtual reality, visualisation and interaction in Africa, pages 15-24. ACM Press, 2004. [6] J. Montagnat, Vincent Breton, Isabelle E. Magnin. Partitioning medical image databases for content-based queries on a grid. to appear in Methods of Information in Medicine, Feb. 2005, Schattauer. [7] H. Benoit-Cattin, G. Collwet, B. Belaroussi, H. Saint-Jalmes, and C.Odet. The SIMRI project: A versatile and interactive MRI simulator. journal of Magnetic Resonance, vol 173, pp 97-115, March 2005. [8] T. Glatard, J. Montagnat, I. E. Magnin. Texture based medical image indexing and retrieval: application to cardiac imaging. ACM SIGMM international workshop on Multimedia Information Retrieval (MIR’04), Proceedings of ACM Multimedia 2004, New-York, USA, October 15-16, 2004. [9] Qiu B., Clarysse P., Montagnat J., Janier M., Vray D., Comparison of 3D Deformable Models For in vivo Measurements of Mouse Embryo from 3D Ultrasound Images. IEEE International Ultrasonics Symposium, Montréal (Canada), August 24-27, 2004 [10] J. Milles, P. Clarysse, A. van Susteren, P. Croisille, I. E. Magnin, and T. Arts, Automatic 2D segmentation of the left ventricle in tagged cardiac MRI using motion information. IEEE International Symposium on Biomedical Imaging (ISBI), Arlington, VA, USA, pp. 153-156, 2004 [11] N. Jacq, , C. Blanchet, C. Combet, E. Cornillot, L. Duret, K. Kurata, H. Nakamura, T. Sil-vestre et V. Breton. Grid as a Bioinformatic Tool. Parallel Computing. Special issue: High-performance parallel bio-computing 30, 9-10, pp. 1093-1107 (2004).
Liste des publications (suite) [12] S. Varrette, S. Georget, J.-L. Roch, and F. Leprevost. Authentification Distribuée sur Grille de Grappes basée sur LDAP. To appear in: Proceedings des 16èmes rencontres francophones du parallélisme (RenPar’16), Le Croisic, France, April 6-8 2005. [13] Axel W. Krings, Jean-Louis Roch, Samir Jafar, and Sébastien A Varrette, Probabilistic Approach for Task and Result Certification of Large-scale Distributed Applications in Hostile Environments. In European Grid Conference EGC’2005 , Springer-Verlag LNCS, Amsterdam, (Feb. 2005). [14] Sébastien Varrette, Jean-Louis Roch and Franck Leprévost. FlowCert: Probabilistic Certification for Peer-to-Peer Computations. In 16th Symposium on Computer Architecture and High Performance Computing, IEEE SBAC-PAD 2004 pp. 108--115, (Foz de Iguacu, Brasil, oct. 2004). [15] Sébastien Varrette, Jean-Louis Roch, Yves Denneulin et Franck Leprévost. Secure architectures for clusters and grids. In Proceedings of the 2ème Conférence Internationale sur les Infrastructures Critiques. CRIS 2004 (Grenoble, France, oct. 2004). [16] Samir Jafar, Sébastien Varrette et Jean-Louis Roch. Using data-flow analysis for resilience and result checking in peer-to-peer computations. In IEEE DEXA’2004 - Workshop GLOBE’04: Grid and Peer-to-Peer Computing Impacts on Large Scale Heterogeneous Distributed Database Systems (Zaragoza, Spain, august 2004). [17] Lydia Maigne, David Hill, Pascal Calvat, Vincent Breton, Romain Reuillon, Yannick Legre, Denise Donnarieix. Parallelization Of Monte Carlo Simulations And Submission To A Grid Environment. Parallel Processing Letters, Volume 14, 177-196 (2004). [18] Eddy Caron, Pushpinder-Kaur Chouhan, and Arnaud Legrand. Automatic Deployment for Hierarchical Network Enabled Server. In The 13th Heterogeneous Computing Workshop (HCW 2004), Santa Fe. New Mexico, pages 109b (10 pages), April 2004. [19] Holly Dail and Frédéric Desprez. Experiences with Hierarchical Request Flow Management for Network-Enabled Server Environments. To appear in International Journal of High Performance Computing Applications, 2006. [20] Eddy Caron, Frédéric Desprez, Martin Quinson, and Frédéric Suter. Performance Evaluation of Linear Algebra Routines. International Journal of High Performance Computing Applications, 18(3):373-390, 2004. [21] Eddy Caron, Frédéric Desprez, Bruno Del-Fabbro, and Antoine Vernois. Gestion de données dans les NES. In DistRibUtIon de Données à grande Echelle. DRUIDE 2004, Domaine du Port-aux-Rocs, Le Croisic. France, pages 23-32, mai 24-38 2004. IRISA. [22] Eddy Caron and Frédéric Desprez. DIET, tour d'horizon. In Ecole thématique sur la Globalisation des Ressources Informatiques et des Données : Utilisation et Services. GridUSe 2004, Metz. France, pages 61-81, 21-25 # jun 2004. Supélec.
Liste des publications (suite) [23] Eddy Caron and Holly Dail. GoDIET: a tool for managing distributed hierarchies of DIET agents and servers. Research report 2005-06, Laboratoire de l'Informatique du Parallilisme (LIP), January 2005. [24] L. Seitz, J. Montagnat, JM Pierson, D. Oriol and D. Lingrand. Authentication an authorisation prototype on the mgrid for medical data management. Third International Conference on health grids (Healthgrid’2005), Oxford, U.K, april 2005 [25] Y. Cardenas, Service de cache pour grilles de calcul, Premier atelier sur Extraction et Gestion Parallèles Distribuées de Connaissances (dans le cadre de EGC’2005), 18 Janvier 2005, Paris, France. [26] L. Seitz, JM Pierson and L. Brunie. Encrypted Storage of Medical Data on a Grid. Methods of Information in Medicine (special issue), extended version of article presented at Healthgrid’2004 ; N°2 (2005). [27] J.M. Pierson, L. Seitz, J. Montagnat and H. Duque. Metadata Management for Efficient, Secure and Extensible Access to Data in a Medical Grid. Workshop Globe’04, held in conjunction with 15th International Workshop on Database and EXpert systems Applications DEXA’04, Saragossa, Spain, aug 31 – sept 2, IEEE Press. [28] L. Seitz, JM Pierson and L. Brunie. Encrypted Storage of Medical Data on a Grid, Second International Conference on health grids (HealthGrid’04), Clermont-Ferrand, France, 22-24 january 2004. [29] JM. Pierson, L. Seitz, J. Montagnat and H. Duque. Metadata Management for Efficient, Secure and Extensible Access to Data in a Medical Grid. Workshop Globe’04, held in conjunction with 15th International Workshop on Database and EXpert systems Applications DEXA’04, Saragossa, Spain, aug 31 – sept 2, IEEE Press. [30] J. Gossa, JM Pierson and L. Brunie. (Dé)placement de Réplicas dans un Environnement Pervasif, Conférence Francophone "Ubiquité et Mobilité 2004" (UbiMob’04), Nice, 1-3 juin 2004, ACM Digital Library publications. [31] M. Ouziri, C. Verdier, A. Flory, Data integration and user modelling: An approach based on Topic Maps and Description Logics, ICEIS 2005, 6th Int. Conf. on Enterprise Information Systems, supported by ACM, Miami, USA, May 24-28, 2005 [32] P. Wehrle, M. Miquel, A. Tchounikine. Entrepôts de données sur grilles de calcul, Premier atelier sur Extraction et Gestion Parallèles Distribuées de Connaissances, dans le cadre de EGC’2005, 18 Janvier 2005, Paris, France [33] L. Desbat, S. Roux, P. Grangeat, and A. Koenig. Sampling conditions of 3D Parallel and Fan-Beam X-ray CT with application to helical tomography. Phys. Med. Biol., 49(11), 2377-2390, 2004.
Liste des publications (suite) [34] S. Roux, L. Desbat, A. Koenig, and P. Grangeat. Exact reconstruction in 2D dynamic CT: compensation of time-dependent affine deformations. Phys. Med. Biol., 49(11):2169-82, 2004. [35] L. Desbat Sampling conditions and efficient schemes in helical tomography, In Abstracts of papers presented to the AMS, Vol. 26(1) Issue 139, 1003-65-1512, pages 172, 2005. [36] F. Chatelain, L. Desbat, J.-F. Moreira, C. Amblard, V. Breton. SPECT/CT Registration with the DCC and MC Simulations for SPECT Imaging, In IEEE, MIC conference proceedings, M9- 223, 2004 [37] A. Bilgot, V. Perrier, L. Desbat. Wavelets, Local Tomography and Interventional X-Ray Imaging, In IEEE, MIC conference proceedings, paper M9-183, 2004 [38] V. Perrier, O. Le-Cadet, A .Bilgot, L. Desbat. Ondelettes et Imagerie Médicale, In Canum 04, pages 32-41, 2004. [39] L. Desbat, S. Roux, P. Grangeat and A. Koennig. Echantillonnage de la transformée en rayons-X 3D, applications à la géométrie hélicoïdale. In CANUM 04, page 138, 2004. [40] A. Bilgot, V. Perrier and L. Desbat. Inversion locale de la transformée de Radon par ondelettes. In CANUM 04, page 114, 2004. [41] S. Roux, L. Desbat, A Koenig and P. Grangeat. Méthodes analytiques de compensation des déformations en tomographie dynamique. In CANUM 04, page 195, 2004. [42] P. Grangeat, A. Koenig, S. Bonnet, P.Hugonnard, S. Roux, J. Kimdon and L. Desbat. La compensation du mouvement en tomographie X dynamique. In CANUM 04, pages 62-63, 2004.
Partenariat avec les mathématiques Roland Gillard — Institut Fourier (prend la suite de Franck Leprévost) : Applications cryptologiques du projet RAGTIME: démarré en 2004 seulement ! Jean Della-Dora, Aude Maignan — LMC-IMAG Calcul cellulaire (CALCEL) : retenu en 2003
Merci de votre attention ... Et pour la suite : Présentation de Yonny cardenas