Couplage BASE/Outils de Data Mining Pierre LAURENCE
Plan Introduction MIAME Base de données BASE Intégration d’outils de Data mining Conclusions
Introduction Le volume des données pour l’étude du transcriptome est de plus en plus important : Pour une expérience ‘classique’ d’une puce à 7500 points, plus de 300 000 valeurs associées aux données brutes Volonté d’intégrer aux analyses des informations supplémentaires Besoin de stocker d’une façon organisée les informations qui circulent dans un laboratoire de puces à ADN
MIAME (1/2) Minimal Information About a Microarray Experiment Spécifier la nature de l’information qui doit être fournie pour l’étude sur micro-puce pour faciliter La vérification La comparaison L’interprétation La reproduction Motivation La création d’espaces publiques d’échanges de résultats de micro-puces
MIAME (2/2) 4 groupes d’informations : Le design de la lame : disposition des spots, contrôles qualités, protocoles de spotting … Le matériel biologique : les échantillons utilisés, la préparation de l’extraction, le marquage et l’hybridation. Les mesures et quantifications : données brutes sorties des logiciels d’analyse d’images (Imagene, Genepix…) L’expérience : objectif(s) et méthodes d’analyses (normalisations, tests statistiques, …)
BASE (BioArray Software Environment) (1/7) BASE DE DONNEES SERVEUR WEB distant ou local CLIENTS : Laboratoires de transcriptomique Université de Lund (Suède)
BASE (2/7) Design de lame : Array LIMS ( Laboratory Information Management System ) Matériel biologique : Biomaterial Mesures et quantifications Expérience : Experiment / Analyse Data
BASE : accueil (3/7)
BASE : reporters (4/7)
BASE : raw data sets (5/7)
BASE : analysis steps (6/7)
BASE : plugins (7/7)
Intégration d’outils de DM (1/2) Système de plugins intégré Existence d’API (C++, JAVA, R) Gestionnaire de jobs évolué BASE Données export data API Plugin DM GRID
Intégration d’outils de DM (2/2) En cours de développement, plugin « Régles d’Associations » (à partir du travail de M. Khabzaoui) Tests «biologiques» grâce aux plateformes transcriptomiques de la Génopole de Lille Par la suite, mise à disposition pour la communauté BASE
Avantages pour le développement Conclusions Avantages pour le développement Interface Gestion de plugins Jobs manager API Avantages pour les biologistes Aucun changement d’habitude Les données restent confidentielles Des nouveaux outils innovants Une éventuelle grille serait transparente
GRID DM Interface WEB BASE Puces GO