La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

REICHSTADT Matthieu UMRH 03/10/2013 Bases de données phénotypique et ontologie JAS PHASE 03/10/2013.

Présentations similaires


Présentation au sujet: "REICHSTADT Matthieu UMRH 03/10/2013 Bases de données phénotypique et ontologie JAS PHASE 03/10/2013."— Transcription de la présentation:

1 REICHSTADT Matthieu UMRH 03/10/2013 Bases de données phénotypique et ontologie JAS PHASE 03/10/2013

2 2 Les bases de données phénotypiques • Phénotype: état de caractères observables chez un organisme vivant. • Il est considéré soit : – pour un seul caractère, à l'échelle moléculaire, cellulaire, ou macroscopique (ex : morphologie des cellules) – comme l'ensemble des états des caractères observables d'un individu (phénome) (ex : phénotype Salers versus Bretonne pie noire) • Le phénotype est la résultante de l’expression du génotype et de l’influence de son environnement – (P = G + E)

3 3 Phénotypage haut-débit • Méthode de détermination de phénotypes mesurables de façon répétable, automatisable et rapide de sorte que le processus de mesure génère un grand nombre de données. • 2 composantes : – Le Phénotypage horizontal, systématique – Le Phénotypage vertical ou ciblé

4 4 Types de phénotypages • Horizontal – Grand nombre d’animaux / peu de variables – Ex: poids des animaux dans une expérience • Vertical – Peu d’individus / beaucoup de variables – Ex: génomique, métabolomique

5 5 Les bases de données phénotypiques • De toutes sortes • Exemple: – BIF-Beef: base de données phénotypique de l’UMRH • Mesures carcasse (Horizontal) • Mesures biologiques (Vertical) – Aladin: SI ruminant • Gestion des troupeaux • Gestion de l’Alimentation • Gestion des expériences

6 6 Les bases de données phénotypiques • A quoi ressemble une « bonne » base? InformationMéthode Conditions Mesure

7 7 Les bases de données phénotypiques • Problème: format des données / accès aux données  Nécessité pour une base d’avoir un format fixe et compatible avec d’autres bases Comment assurer ceci?  Utilisation des ontologies

8 8 Les ontologies • Définition: – Représentation formelle d'un ensemble de phénotypes, et des relations entre ces phénotypes • Les concepts et les relations dans une ontologie sont clairement définis • Les concepts sont organisés de manière structurée (souvent une structure hiérarchique) • Le sens d'un terme est utilisé de façon univoque • Les termes utilisés doivent être lisibles par des machines (permettant l’automatisation de la mesure ou de l’utilisation de l’information)

9 9 Les ontologies • Ontologies utilisées à l’INRA: – ATOL (Animal Trait Ontology for Livestock) – EOL (Environment Ontology for Livestock) • Site web du projet: – • Visualisation des ontologies • Téléchargement des ontologies (versioning)

10 10 Les ontologies • But du projet ATOL: – Disposer d’une ontologie de référence pour le phénotypage des animaux d’élevage et partagée par la communauté scientifique et enseignante internationale – Disposer d’un langage utilisable par les programmes informatiques (gestion des bases de données, analyse sémantique, modélisation…) – Avoir des caractères les plus génériques possibles pour les vertébrés d’élevage – Rendre l’ontologie la plus opérationnelle possible et proche des techniques de mesure – Structurer la base à des fins de production animale

11 11 Comment relier les 2 concepts • Chaque projet/structure a son propre modèle de données + Système applicatif • Les projets doivent suivre les règles définies par les ontologies • Plusieurs approches: – A posteriori: la conception du MCD précède la recherche ou la conception de l’ontologie partagée – A priori: l’ontologie est supposée existante lorsque la base de données est conçue – Directes: la structure de l’ontologie définit directement la structure de la base de données

12 12 Les bases de données à base ontologique (BDBO) • Ontologies et données sont stockées dans la BdD • Mêmes principes de traitement (insertion mises à jour, requêtes, …) • Association données – concept de l’ontologie  Ensemble multi-parties: BdD, ontologie, méta- schéma  permet de rendre générique le traitement sur les ontologies Exemple: OntoDB

13 13 Le sparql endpoint • La BdD est considérée comme un graphe RDF (Resource Description Framework ou « sujet – prédicat – objet »), à travers lequel on accède au contenu de la base  Entrepôt « virtuel »  vue sémantique de la base • Langage SPARQL: Simple Protocol and RDF Query language permet de consulter les données  Possibilité de rechercher des informations en partant de l’ontologie

14 14 Les entrepôts de données • Définition: – Ensemble de données historisées variant dans le temps, organisé par sujets, consolidé dans une base de données unique, géré dans un environnement de stockage particulier, aidant à la prise de décision • 3 fonctions essentielles – collecte de données de bases existantes et chargement – gestion des données dans l’entrepôt – analyse de données pour la prise de décision

15 15 Les entrepôts de données

16 16 Les entrepôts de données • Associés à la prise en compte des ontologies, ils permettent de rapprocher des bases au contenu et au format différents • Exemple concret possible – SI existants à l’UMRH différents • Bases de données différentes • Contenu différent • Interface différente  Similarités associables à un DWH

17 17 Travail à effectuer + BdD ontologie BDBO Les infos référentielles des bases de données sont indexées sur l’ontologie

18 18 Travail à effectuer BDBO Passage dans un entrepôt de données BDBO + DWH

19 19 Travail à effectuer + La base est transformée en shéma RDF, pour le web sémantique DWH R2D

20 20 Travail à effectuer + Le schéma RDF est analysé en utilisant un langage de requête approprié (SPARQL) R2D

21 21 Merci de votre attention


Télécharger ppt "REICHSTADT Matthieu UMRH 03/10/2013 Bases de données phénotypique et ontologie JAS PHASE 03/10/2013."

Présentations similaires


Annonces Google