La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 Cartographie des connaissances biologiques Une application à lanalyse de données dexpression de puces ADN Fabien Jalabert, Michel Crampes, Sylvie Ranwez,

Présentations similaires


Présentation au sujet: "1 Cartographie des connaissances biologiques Une application à lanalyse de données dexpression de puces ADN Fabien Jalabert, Michel Crampes, Sylvie Ranwez,"— Transcription de la présentation:

1 1 Cartographie des connaissances biologiques Une application à lanalyse de données dexpression de puces ADN Fabien Jalabert, Michel Crampes, Sylvie Ranwez, Vincent Derozier Centre de Recherche LGI2P – Ecole des Mines dAlès

2 2 Contexte : cartographie des connaissances Problématique Résultat de la visualisation et évaluation Cartographie des connaissances biologiques

3 3 Contexte Projet GEM-BIO / Collaboration Institut Pasteur : Analyse de puces à ADN / Plasmodium Falciparum Rappel : ADN ARNm Protéine Données dexpression : On mesure la quantité dARN transcrite dans la cellule à un instant donné (expression du gène) Puces à ADN : technique permettant une analyse haut-débit (densité > gènes sur 1 cm²). Plasmodium Falciparum 5300 gènes

4 4 Cartographie des connaissances

5 5 K. Map

6 6 Cartographie des connaissances Intégrer des données hétérogènes : –Biologiques, –Bibliographiques, –Ontologiques Les visualiser Un modèle de graphe (typé, valué) : souple et extensible.

7 7 Approches existantes Fréquemment, les biologistes emploient un (bi)clustering hiérarchique visualisé sous forme de dendrogrammes.

8 8 Problématique Associer un élément à plusieurs classes : Un gène (généralement chez les bactéries) peut être associés à plusieurs fonctions ( groupes) (épissage alternatif, polyvalence dune protéine, fonction différentes dans différents milieux). Laisser lexpert décider face à une ambiguïté : les approches courantes imposent lappartenance à une classe et une seule. Regroupement flou : un gène est associé à un (ou plusieurs) groupe(s) avec un degré dappartenance.

9 9 Problématique Comparer des regroupements : Evaluer cette approche = comparer le regroupement flou avec celui produit par Bozdech sur ses propres données dexpression. [Bozdech et al., 2003] 1 mesure par heure pendant 48h dont nous avons sélectionné 370 gènes Représenter lexpression dun génome dans le temps en fonction de plusieurs conditions expérimentales. Décomposer lespace multidimensionnel et danalyser séparément chaque partition de lespace

10 10 Problématique Besoin dune vision ensembliste Diagrammes dEuler

11 11 Visualisation Regroupements (carte des connaissances) –Modèle physique (forces) : robuste, souple, dymamique –Implémentation : Java, librairie Prefuse. –Fonctionnalités : vue densemble, zoom/pan, distorsions logiques, infobulles, menus contextuels, etc. Données dexpression (temporelles) –Coordonnées parallèles synchronisées à la carte : aspect temporel, possibilité de lire entre les lignes (expression + variation de lexpression). –Implémentation : librairie Parvis –Fonctionnalités : zoom, filtrage et brushing (degré dappartenance, angle, etc.)

12 12

13 13

14 14 Evaluation Le biologiste nest pas familiarisé avec ce type de visualisation Si cette visualisation est souple, dynamique et adaptable, le biologiste doit le comprendre pour bien la maîtriser; ceci demande un apprentissage. Lutilisateur recherche systématiquement une sémantique biologique dans les 2D Besoin de traçabilité Le biologiste a été plus exigent avec loutil quavec les outils les plus classiques. La vue densemble est très appréciée, lapprentissage des interactions est rapide. Si lévaluation mise en œuvre na pas été dans le contexte dune expérimentation biologique complète, lenvironnement permet rapidement de croiser des informations, et a permis rapidement de mettre en évidence rapidement des anomalies dannotations dans différentes bases.

15 15 Cartographie des connaissances biologiques Une application à lanalyse de données dexpression de puces ADN Fabien Jalabert, Michel Crampes, Sylvie Ranwez, Vincent Derozier Centre de Recherche LGI2P – Ecole des Mines dAlès Parc Scientifique Georges Besse, F – Nîmes Cedex 1 Merci

16 16 Problématique

17 17 Architecture générale Données pré-filtrées Saisie de mots-clés, données expérimentales, etc. Filtrage pour le domaine étudié Données hétérogènes PubMed UMLS GO EntrezGene etc. Analyses lexicale et statistique pour l'extraction des termes candidats et leur mise en relation Extraction d'une sous-carte adaptée au contexte applicatif Données filtrées mises en forme Environnement de visualisation Interaction Carte personnalisée

18 18 Contexte Puces ADN Spotting des sondes sur le support Mise en présence dun échantillon marqué au fluorochrome Rinçage Mise en œuvre de la fluorescence scannée Hybridation des gènes exprimés avec les sondes qui leur sont spécifiques

19 19 Contexte Puces ADN Analyse dimage Prétraitements (normalisation, etc.) Regroupement automatique Analyse par lexpert : croisement avec les connaissances du domaine


Télécharger ppt "1 Cartographie des connaissances biologiques Une application à lanalyse de données dexpression de puces ADN Fabien Jalabert, Michel Crampes, Sylvie Ranwez,"

Présentations similaires


Annonces Google