La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Une base de données de mammographies Omar Boussaïd Riadh Ben Messaoud Laboratoire ERIC – Université de Lyon 2 5, avenue Pierre Mendès–France 69676, Bron.

Présentations similaires


Présentation au sujet: "Une base de données de mammographies Omar Boussaïd Riadh Ben Messaoud Laboratoire ERIC – Université de Lyon 2 5, avenue Pierre Mendès–France 69676, Bron."— Transcription de la présentation:

1 Une base de données de mammographies Omar Boussaïd Riadh Ben Messaoud Laboratoire ERIC – Université de Lyon 2 5, avenue Pierre Mendès–France 69676, Bron Cedex – France

2 Présentation DDSM : Digital Database for Screening Mammography Un projet supporté par «the Breast Cancer Research Program of the U.S. Army Medical Research and Materiel Command» Partenaires : Massachusetts General Hospital University of South Florida Sandia National Laboratories Washington University School of Medicine Wake Forest University School of Medicine

3 Objectifs Mettre des données de mammographies à la disposition de la communauté scientifique. Contribuer au développement dalgorithmes daide à la décision et dapprentissage dans le domaine médical. diagnostique et détection automatique de cas cancéreux La base est disponible à ladresse :

4 Description La base contient dossiers de patients. Un dossier est composé de : 1 fichier.ics décrivant en format ASCII, les informations générales dun dossier de patient. 4 fichiers images.LJPEG (LOSSLESS JPEG) des radios numérisées. Chaque radio présente une angle de vue du sein : Left_CC, Left_MLO, Right_CC, Right_MLO (CC: Cranio-Caudal ; MLO: Medio-Latral Oblique). Pour chaque radio présentant une ou des zones anormales, est associé un fichier.OVERLAY en format ASCII, décrivant une anomalie du sein. 1 fichier image.16_PGM regroupant les 4 radios et présentant un aperçu rapide pour la visualisation dun dossier de patient.

5 Description Le fichier.ics (Exemple : B ics) ics_version 1.0 filename B DATE_OF_STUDY PATIENT_AGE 42 FILM FILM_TYPE REGULAR DENSITY 4 DATE_DIGITIZED DIGITIZER LUMISYS SELECTED LEFT_CC LINES 4696 PIXELS_PER_LINE 3024 BITS_PER_PIXEL 12 RESOLUTION 50 NON-OVERLAY LEFT_MLO LINES 4688 PIXELS_PER_LINE 3048 BITS_PER_PIXEL 12 RESOLUTION 50 OVERLAY RIGHT_CC LINES 4624 PIXELS_PER_LINE 3056 BITS_PER_PIXEL 12 RESOLUTION 50 NON-OVERLAY RIGHT_MLO LINES 4664 PIXELS_PER_LINE 3120 BITS_PER_PIXEL 12 RESOLUTION 50 OVERLAY Anomalie détectée dans la radio B_3024_1.RIGHT_MLO.LJPEG B_3024_1.RIGHT_MLO.OVERLAY

6 Description Le fichier B_3024_1.RIGHT_MLO.LJPEG

7 Description Le fichier B_3024_1.RIGHT_MLO.OVERLAY Chain code value X Coordinate01110 Y coordinate TOTAL_ABNORMALITIES 1 ABNORMALITY 1 LESION_TYPE MASS SHAPE OVAL MARGINS ILL_DEFINED ASSESSMENT 4 SUBTLETY 3 PATHOLOGY MALIGNANTTOTAL_OUTLINES 1 BOUNDARY # X Y701 6X2 543

8 Description Les dossiers sont disponibles sur un compte FTP Les dossiers de patients sont classés selon 4 volumes Normal Cancer Benign Benign without callback Bilan quantitatif et volumétrie : 43 volumes fichiers.ics fichiers.16_PGM fichiers images.LJPEG fichiers.OVERLAY 230,9 Go Volume total des données : 230,9 Go

9 Extraction des données Applicatif de mise à disposition des données de la base DDSM Récupération des données sous forme : Base relationnelle (MySql) Structurée : Base relationnelle (MySql) Documents XML Semi-structurée : Documents XML SQL Script : SQL /

10 Parseur PHP Entrées : Volumes des dossiers à extraire Format des données de sortie (MySQL, XML, SQL)

11 Parseur PHP Étape 1 : Connexion au compte FTP ftp://figment.csee.usf.edu/pub/DDSM/cases/ Ouverture des fichiers.ics et.OVERLAY dans les volumes sélectionnés

12 ics_version 1.0 filename B DATE_OF_STUDY PATIENT_AGE 42 FILM FILM_TYPE REGULAR DENSITY 4 DATE_DIGITIZED DIGITIZER LUMISYS SELECTED LEFT_CC LINES 4696 PIXELS_PER_LINE 3024 BITS_PER_PIXEL 12 RESOLUTION 50 NON-OVERLAY LEFT_MLO LINES 4688 PIXELS_PER_LINE 3048 BITS_PER_PIXEL 12 RESOLUTION 50 OVERLAY RIGHT_CC LINES 4624 PIXELS_PER_LINE 3056 BITS_PER_PIXEL 12 RESOLUTION 50 NON-OVERLAY RIGHT_MLO LINES 4664 PIXELS_PER_LINE 3120 BITS_PER_PIXEL 12 RESOLUTION 50 OVERLAY Parseur PHP Étape 2 : Lecture des fichier.ics et.OVERLAY Extraction des données selon des fonctions de reconnaissance de caractères

13 Parseur PHP Étape 3 : Écriture des données extraites dans le format de données sélectionné (MySQL, XML, SQL) FTP MySQL XML SQL Parseur PHP

14 Structure de la base MySQL 2604 enregistrements 490 Ko enregistrements 1,67 Mo 4636 enregistrements 972 Ko 4647 enregistrements 14 Mo Taille totale de la base : 17,2 Mo

15 Extraction des données FTP MySQL XML SQL Parseur PHP

16 Structure du fichier XML 1 benign 1.0 A ics … sequence … … … …

17 Extraction des données FTP MySQL XML SQL Parseur PHP

18 Structure du fichier SQL Création dune table : CREATE TABLE IF NOT EXISTS table_mammo ( case_id int(10) NOT NULL AUTO_INCREMENT, case_type varchar(25), ics_version char(3), ics_file_name varchar(50),... PRIMARY KEY (case_id)); Insertion des données dans la table : INSERT INTO table_mammo VALUES ('', 'benign', '1.0', 'C ics',... ); INSERT INTO table_mammo VALUES ('', 'benign', '1.0', 'C ics',... );

19 Démonstration

20 Conclusion DDSM : une base de données complexes dossiers de patients Un volume total de 230,9 Go Applicatif de mise à disposition des données sur les mammographies : Sélectionner les données à récupérer pour des analyses ciblées

21 Nouvelle adresse du site du GT FDC


Télécharger ppt "Une base de données de mammographies Omar Boussaïd Riadh Ben Messaoud Laboratoire ERIC – Université de Lyon 2 5, avenue Pierre Mendès–France 69676, Bron."

Présentations similaires


Annonces Google