Cartographie des connaissances biologiques

Slides:



Advertisements
Présentations similaires
Applications N-Tiers Rappels: architecture et méthodologie
Advertisements

1ère partie : vision à 10 ans
Génie Logiciel 2 Julie Dugdale
© Copyright 2007 Arumtec. All rights reserved. Présentation Etude déligibilité
Un aperçu de la bioinformatique moléculaire
Introduction aux classes empiétantes François Brucker Brest (Breizh)
Réflexivité et réseaux d’ information
1 Un outil de visualisation bi-focal pour les formalismes Eric Barboni, Xavier Lacaze, Philippe Palanque, Marco Winckler LIIHS-IRIT Université Toulouse.
Département Informatique Responsable :M. Huchard Responsables adjoints : A. Jean-Marie, F. Koriche, P. Séébold.
Reconnaissance de la parole
19 septembre 2006 Tendances Logicielles IBM Rational Data Architect Un outil complet de modélisation et de conception pour SGBD Isabelle Claverie-Berge.
Excel 2007 et les services Excel. Pourquoi Excel ? Outil privilégié danalyse des données issues des bases multidimensionnelles Ergonomie connue des outils.
Systèmes en temps réel Modélisation du comportement en temps réel avec UML.
Projet n°4 : Objecteering
XML - Henry Boccon-Gibod 1 XML, Langage de description La question du choix de formalismes Les entités et leur représentations modalités de modèles et.
Recherche-Action-Formation Quelles questions se poser ? Bernadette Charlier BIE 14 juin
Ecran 1 de 14 Techniques de collaboration et de plaidoyer Techniques pour améliorer le travail en collaboration Objectifs dapprentissage Comprendre les.
DEME - La méthode d’enquête – introduction
Mise en œuvre d’une démarche et d’un outil de gestion de « connaissances métier » basés sur la collaboration. Cyril BEYLIER
Eric BONJOUR, Maryvonne DULMET
Master Génie Biologique et Informatique, première année
Interfaces homme-machine Deux aspects Tableau augmente Interfaces nomades Spécificités matérielles PDAs : petit écran tactile, pas de clavier tableau :
Génération interactive dimages projectives : Application à la Radiothérapie Pierre BLUNIER Du 01/12/2002 au 28/03/2003 Centre Léon Bérard.
Indicateurs de position
En Mathématiques et Sciences Physiques et Chimiques
R. Saint-Paul, G. Raschia and N. Mouaddib IRIN, Nantes (France)
Gestion de la persistance des objets
Modélisation et commande hybrides d’un onduleur multiniveaux monophasé
TICE’2000 lundi 27 mars 2017 Méthode de conception et de suivi d’actions de formation multimédia en milieu industriel Laurent DUQUESNOY Jean-Luc BERGER.
Safae LAQRICHI, Didier Gourc, François Marmier {safae
Sélection automatique d’index et de vues matérialisées
Estella Annoni, Franck Ravat, Olivier Teste, Gilles Zurfluh
PARTIE 3 : Le SYSTEME D’INFORMATION FUTUR
Université Mouloud Mammeri de Tizi-Ouzou
GIDEM : Gestion intégrée
Coupe de France de Robotique 2007 Candidat n°4 – Steven LY BTS IRIS – PROMOTION
Page 1 Introduction à ATEasy 3.0 Page 2 Quest ce quATEasy 3.0? n Ensemble de développement très simple demploi n Conçu pour développer des bancs de test.
Bantos S, Allenbach M., Mancel C., Pour une intégration optimale des sociétés locales dans la gestion adaptative du domaine littoral face à la montée du.
ETUDE SCIENTITFIQUE ET TECHNIQUE
Formation au module Structure de ZENTO
INTELLIGENCE COLLECTIVE : RENCONTRES 2006Nîmes mai 2006 CENTRE DE RECHERCHE LGI2P 1- Doctorante Ecole des mines de Paris, 2- Maitre de Conférences.
Les Cas d’utilisation.
Tice (logiciels) et aide personnalisée.
Vuibert Systèmes dinformation et management des organisations 6 e édition R. Reix – B. Fallery – M. Kalika – F. Rowe Chapitre 2 : Les applications fonctionnelles.
COPIL SINP 28/03/2014 PRÉSENTATION DES APPLICATIONS OGAM (WEB ET NOMADE)
Evaluation et traçabililé en ingenierie système
Recherche Documentaire et traitement de l’information
TP 5 Du génome au protéome
Département de génie logiciel et des TI Université du Québec École de technologie supérieure Systèmes dinformation dans les entreprises Systèmes dinformation.
SCIENCES DE L ’INGENIEUR
Livret de Compétences Formatif
Traitement de l'information chez les organismes vivants
Présentation du mémoire
Expression du Génome Le transcriptome.
Universté de la Manouba
Ecaterina Giacomini Pacurar
Conception des Réalisé par : Nassim TIGUENITINE.
1 Couplage dun langage de contrôle de formatage avec un système de formatage existant DEA ISC : 1 avril 2003 Fateh Boulmaiz
Démarche de développement
Processus d'un projet F.Pfister
Sensibilisation a la modelisation
1Philippe Bardou – Séminaire GA/GAP – Transcriptôme et Statistiques associées – 12 juin 2008 Gestion des données - BASE.
Base de Données.
Séminaire 10 Juin 2008 Pervasive Learning Network : P-LearNet Institut TELECOM.
Historique 1953 Découverte de la structure de l’ADN
Tirer le meilleur parti d’Office /10/ Vincent Bippus IT/OIS 07 octobre 2014.
Détection de type de défauts sur la surface d’une poutre métallique
TEXT MINING Fouille de textes
Projet IRIS : Impact des Radiations IonisanteS sur l’évolution des bactéries E.coli LPC, UMR 6533 CNRS- IN2P3, Université Blaise Pascal Marianne Coulon,
Transcription de la présentation:

Cartographie des connaissances biologiques Une application à l’analyse de données d’expression de puces ADN Fabien Jalabert, Michel Crampes, Sylvie Ranwez, Vincent Derozier {prenom.nom}@ema.fr Centre de Recherche LGI2P – Ecole des Mines d’Alès

Cartographie des connaissances biologiques Contexte : cartographie des connaissances Problématique Résultat de la visualisation et évaluation

Contexte Projet GEM-BIO / Collaboration Institut Pasteur : Analyse de puces à ADN / Plasmodium Falciparum Rappel : ADN  ARNm  Protéine Données d’expression : On mesure la quantité d’ARN transcrite dans la cellule à un instant donné (expression du gène) Puces à ADN : technique permettant une analyse haut-débit (densité > 47 000 gènes sur 1 cm²). Plasmodium Falciparum ≈ 5300 gènes

Cartographie des connaissances

Cartographie des connaissances K. Map

Cartographie des connaissances Intégrer des données hétérogènes : Biologiques, Bibliographiques, Ontologiques Les visualiser  Un modèle de graphe (typé, valué) : souple et extensible.

Approches existantes Fréquemment, les biologistes emploient un (bi)clustering hiérarchique visualisé sous forme de dendrogrammes.

Problématique Associer un élément à plusieurs classes : Un gène (généralement chez les bactéries) peut être associés à plusieurs fonctions ( groupes) (épissage alternatif, polyvalence d’une protéine, fonction différentes dans différents milieux). Laisser l’expert décider face à une ambiguïté : les approches courantes imposent l’appartenance à une classe et une seule. Regroupement flou : un gène est associé à un (ou plusieurs) groupe(s) avec un degré d’appartenance.

Problématique Comparer des regroupements : Evaluer cette approche = comparer le regroupement flou avec celui produit par Bozdech sur ses propres données d’expression. [Bozdech et al., 2003]  1 mesure par heure pendant 48h dont nous avons sélectionné ≈ 370 gènes Représenter l’expression d’un génome dans le temps en fonction de plusieurs conditions expérimentales. Décomposer l’espace multidimensionnel et d’analyser séparément chaque partition de l’espace

Besoin d’une vision ensembliste Problématique Besoin d’une vision ensembliste  Diagrammes d’Euler

Visualisation Regroupements (carte des connaissances) Modèle physique (forces) : robuste, souple, dymamique Implémentation : Java, librairie Prefuse. Fonctionnalités : vue d’ensemble, zoom/pan, distorsions logiques, infobulles, menus contextuels, etc. Données d’expression (temporelles) Coordonnées parallèles synchronisées à la carte : aspect temporel, possibilité de lire entre les lignes (expression + variation de l’expression). Implémentation : librairie Parvis Fonctionnalités : zoom, filtrage et brushing (degré d’appartenance, angle, etc.)

Evaluation Le biologiste n’est pas familiarisé avec ce type de visualisation Si cette visualisation est souple, dynamique et adaptable, le biologiste doit le comprendre pour bien la maîtriser; ceci demande un apprentissage. L’utilisateur recherche systématiquement une sémantique biologique dans les 2D Besoin de traçabilité Le biologiste a été plus exigent avec l’outil qu’avec les outils les plus classiques. La vue d’ensemble est très appréciée, l’apprentissage des interactions est rapide. Si l’évaluation mise en œuvre n’a pas été dans le contexte d’une expérimentation biologique complète, l’environnement permet rapidement de croiser des informations, et a permis rapidement de mettre en évidence rapidement des anomalies d’annotations dans différentes bases.

Merci Cartographie des connaissances biologiques Une application à l’analyse de données d’expression de puces ADN Fabien Jalabert, Michel Crampes, Sylvie Ranwez, Vincent Derozier {prenom.nom}@ema.fr Centre de Recherche LGI2P – Ecole des Mines d’Alès Parc Scientifique Georges Besse, F 30 035 – Nîmes Cedex 1

Problématique

Architecture générale Saisie de mots-clés, données expérimentales, etc. Données hétérogènes PubMed UMLS GO EntrezGene etc. Analyses lexicale et statistique pour l'extraction des termes candidats et leur mise en relation Données pré-filtrées Filtrage pour le domaine étudié Extraction d'une sous-carte adaptée au contexte applicatif Interaction Environnement de visualisation Données filtrées mises en forme Carte personnalisée

Contexte Puces ADN Spotting des sondes sur le support Mise en présence d’un échantillon marqué au fluorochrome  Hybridation des gènes exprimés avec les sondes qui leur sont spécifiques Rinçage Mise en œuvre de la fluorescence scannée

Regroupement automatique Contexte Puces ADN Analyse d’image Prétraitements (normalisation, etc.) Regroupement automatique Analyse par l’expert : croisement avec les connaissances du domaine