La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Construction dune ontologie de descripteurs en astronomie à partir de tables de données Alexandre RICHARD DEA Informatique Équipe ORPAILLEUR – LORIA Encadrant.

Présentations similaires


Présentation au sujet: "Construction dune ontologie de descripteurs en astronomie à partir de tables de données Alexandre RICHARD DEA Informatique Équipe ORPAILLEUR – LORIA Encadrant."— Transcription de la présentation:

1 Construction dune ontologie de descripteurs en astronomie à partir de tables de données Alexandre RICHARD DEA Informatique Équipe ORPAILLEUR – LORIA Encadrant : Amedeo Napoli Co-encadrant : Emmanuel Nauer 27 juin 2005

2 Alexandre RICHARD2 Sommaire Quelques repères en astronomie Le projet « Masse de données en astronomie » Les UCD (Unified Content Descritptors) Domaine de lontologie Construction de lontologie Éléments de lontologie Construction de lontologie Attribution dun UCD à une description textuelle Traitement des colonnes Units et Explanations Traitement de la colonne Label Bilan Apports et perspectives

3 27 juin 2005Alexandre RICHARD3 Projet « Masse de données en astronomie » Acteurs incluent entre autres: Centre de Données en astronomie de Strasbourg (CDS) Équipe ORPAILLEUR du Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA) Travaux sur des descripteurs en astronomie: les UCD (Unified Content Descriptors) Descripteurs standardisés et universels Absence de sémantique formelle Utilisation de méthodes de fouille de texte pour faire émerger –Lutilisation correcte des UCD –De nouveaux UCD Création dune structure permettant de représenter les UCD et les manipuler dans un raisonnement : une ontologie des UCD

4 27 juin 2005Alexandre RICHARD4 Contenu de publications en astronomie Table de données ReadMe

5 27 juin 2005Alexandre RICHARD5 Les UCD UnitsLabelExplanationsUCD ---MacsDesignationmeta.code hRAhRight Ascension J2000, Epoch (hours)pos.eq.ra minRAmRight Ascension J2000 (minutes)pos.eq.ra sRAsRight Ascension J2000 (seconds)pos.eq.ra degDEdDeclination J2000, Epoch (degrees)pos.eq.dec arcminDEmDeclination J2000 (minutes)pos.eq.dec arcsecDEsDeclination J2000 (seconds)pos.eq.dec ---NposNumber of positions usedmeta.number;pos magMag?=99.00 Instrumental Magnitudephot.mag;instr

6 27 juin 2005Alexandre RICHARD6 Domaine de lontologie (1/2) Domaine : UCD incluant au moins un mot pos Une catégorie pos des mots dUCD –Décrivent : Des mesures de position Des informations sur des positions –58 mots sur les 427 mots dUCD valides –Exemples : pos position pos.eq coordonnées équatoriales pos.eq.ra ascension droite

7 27 juin 2005Alexandre RICHARD7 Domaine de lontologie (2/2) Problèmes pour la représentation des UCD incluant au moins un mot pos : –Pas de liste exhaustive –Plus de 10 6 écritures potentielles Représentation des mots pos Exemple dexploitation : associer un UCD à une ligne de ReadMe Exemple : pos.eq.ra

8 27 juin 2005Alexandre RICHARD8 Éléments de lontologie (1/2) Ontologie : Une ontologie est la spécification explicite dune conceptualisation [Gruber 1993] Ontologie des mots pos –Formalisme : logiques de descriptions –Trois types dentités : Concept : classe dindividus ayant les mêmes propriétés. –Exemple : Conceptreprésente AngleUnitLes unités dangle pos.eq.raLes descriptions dascensions droites

9 27 juin 2005Alexandre RICHARD9 Éléments de lontologie (2/2) Rôle : représente une relation binaire entre 2 concepts –Exemple : la relation hasAngleUnit Individu : instance dun concept –Exemple : description textuelle dune ascension droite (instance du concept pos.eq.ra) pos.eq.raAngleUnit hasAngleUnit domaineco-domaine

10 27 juin 2005Alexandre RICHARD10 Construction de lontologie (1/3) Hypothèse : un co-domaine unique et différent pour chaque rôle Processus de construction 1.Identification des concepts Concepts correspondant aux mots pos Exemple : Mot pos Correspond au concept de pos Position pos.eq Coordonnées équatoriales pos.eq.ra ascension droite

11 27 juin 2005Alexandre RICHARD11 Construction de lontologie (2/3) 2.Écriture des définitions de concepts –Ensemble de rôles –Condition nécessaire et suffisante dappartenance à lextension du concept Exemple :

12 27 juin 2005Alexandre RICHARD12 3.Hiérarchisation des concepts et des rôles par la relation de subsomption Concepts Rôles Construction de lontologie (3/3) MeasureUnit hasUnit pos.eq.raAngleUnit hasAngleUnit co-domainedomaine

13 27 juin 2005Alexandre RICHARD13 Hiérarchie de concepts

14 27 juin 2005Alexandre RICHARD14 Attribution dun UCD à une ligne de ReadMe Cas considéré : UCD composé dun seul mot pos En entrée : ligne de ReadMe En sortie : tableau trié de concepts de lontologie Classement selon le degré de correspondance entre le concept et la ligne de ReadMe. Traitement en deux phases : –Traitement des colonnes Units et Explanations –Traitement de la colonne Label

15 27 juin 2005Alexandre RICHARD15 Traitement des colonnes Units et Explanations Ligne de ReadMe Extract(Units) = {contenu de la colonne Units} Extract(Explanations) = {contenu de la colonne Explanations} Classement des concepts de lontologie Extraction du contenu des colonnes Units et Explanations Extraction des co-domaines sur Units et Explanations Codom(Extract(Units), Extract(Explanations)) = ensemble de co-domaines Classification par rapport aux concepts de lontologie

16 27 juin 2005Alexandre RICHARD16 Extraction du contenu des colonnes Units et Explanations Obtention en sortie des ensembles : Extract(Units) = {s} Extract(Explanations) = {right|ascension|J2000|seconds)}

17 27 juin 2005Alexandre RICHARD17 Traitement des colonnes Units et Explanations Ligne de ReadMe Extract(Units) = {contenu de la colonne Units} Extract(Explanations) = {contenu de la colonne Explanations} Codom(Extract(Units), Extract(Explanations)) = ensemble de co-domaines Classement des concepts de lontologie Extraction du contenu des colonnes Units et Explanations Extraction des co-domaines sur Units et Explanations Classification par rapport aux concepts de lontologie

18 27 juin 2005Alexandre RICHARD18 Extraction des co-domaines sur Units et Explanations (1/2) Objectif : obtention dun ensemble de co-domaines Moyens utilisés : –Deux hypothèses : Un co-domaine unique et différent pour chaque rôle Le co-domaine identifie le rôle de manière non-ambiguë

19 27 juin 2005Alexandre RICHARD19 –Des fichiers intermédiaires (fichiers de méta-données) Construction : –Lexpert fait lassociation : contenu de colonne – rôles exemple : s – hasAngleUnit, hasOneValue –Le programme construit le fichier Méta(étiquette) = {(contenu de colonne, co-domaines)} exemple : Méta(Units) = {(s, AngleUnit | Value),...} En entrée : Extract(Units) = { s } Extract(Explanations) = { right | ascension | J2000 | seconds)} Lecture des fichiers de méta-données : Méta(Units) = {( s, AngleUnit | Value),... } Méta(Explanations) = {( right, CcOriginEqRa | Value), ( ascension, Value),... } En sortie : Codom( Extract(Units), Extract(Explanations) ) = { AngleUnit | CcOriginEqRa | Value } Extraction des co-domaines sur Units et Explanations (2/2)

20 27 juin 2005Alexandre RICHARD20 Traitement des colonnes Units et Explanations Ligne de ReadMe Extract(Units) = {contenu de la colonne Units} Extract(Explanations) = {contenu de la colonne Explanations} Classement des concepts de lontologie Extraction du contenu des colonnes Units et Explanations Extraction des co-domaines sur Units et Explanations Codom(Extract(Units), Extract(Explanations)) = ensemble de co-domaines Classification par rapport aux concepts de lontologie

21 27 juin 2005Alexandre RICHARD21 Classification par rapport aux concepts de lontologie Recherche des concepts de lontologie possédant les rôles de Codom( Extract(Units), Extract(Explanations) ), tri selon nombre de rôles partagés Codom( Extract(Units), Extract(Explanations) ) = { AngleUnit | CcOriginEqRa | Value } co-domaines des rôles : {hasAngleUnit, hasCcOriginEqRa, hasOneValue} CONCEPTROLESN pos.eq.rahasAngleUnit, hasOneValue, hasCcOriginEqRa, hasFrameTypeEq 3 pos.angDistancehasAngleUnit, hasOneValue2 pos.az.althasAngleUnit, hasOneValue, hasCcOriginAzAlt, hasFrameTypeAz 2 pos.eq.dechasAngleUnit, hasOneValue, hasCcOriginEqDec, hasFrameTypeEq 2 pos.eq.spdhasAngleUnit, hasOneValue, hasCcOriginEqSpd, hasFrameTypeEq 2 pos.parallaxhasAngleUnit, hasOneValue, hasPlxMethod 2...

22 27 juin 2005Alexandre RICHARD22 Traitement de la colonne Label (1/3) Ligne de ReadMe Extract(Label) = {contenu de la colonne Label} Classement des concepts de lontologie Extraction du contenu de la colonnes Label Extraction des co-domaines sur Label Codom(Extract(Label)) = ensemble de co-domaines Classification par rapport aux concepts de lontologie

23 27 juin 2005Alexandre RICHARD23 Traitement de la colonne Label (2/3) Étape 1 : Extract(Label) = { RAs } Étape 2 : Méta(Label) = {( RAs, AngleUnit | CcOriginEqRa | Value | FrameTypeEq),...} Codom( Extract(Label) ) = { AngleUnit | CcOriginEqRa | Value | FrameTypeEq } Étape 3 : rôles : {hasAngleUnit, hasCcOriginEqRa, hasOneValue, hasFrameTypeEq} CONCEPTROLESN pos.eq.rahasAngleUnit, hasCcOriginEqRa, hasOneValue, hasFrameTypeEq 4 pos.eq.dechasAngleUnit, hasCcOriginEqDec, hasOneValue, hasFrameTypeEq 3 pos.eq.spdhasAngleUnit, hasCcOriginEqSpd, hasOneValue, hasFrameTypeEq 3 pos.angDistancehasAngleUnit, hasOneValue 2 pos.az.althasAngleUnit, hasOneValue, hasCcOriginAzAlt, hasFrameTypeAz 2...

24 27 juin 2005Alexandre RICHARD24 Traitement de la colonne Label (3/3) Sil y a toujours égalité au premier rang, cest à lexpert de choisir parmi les concepts de meilleur rang Travail sur la colonne Label séparé –Labels porteurs de beaucoup dinformation –Labels souvent ambigus alpha : angle de phase dune orbite dun corps céleste alpha : ascension droite dun corps céleste –Absence de liste des labels ou de règles de construction –Difficulté de construction du fichier Méta(Label)

25 27 juin 2005Alexandre RICHARD25 Bilan Test sur 75 lignes de ReadMe 4 lignes attribuées avant le traitement de la colonne Label + 42 lignes attribuées après le traitement de la colonne Label + 26 lignes attribués par lexpert 3 échecs Compatibilité avec loutil lexico-syntaxique existant au CDS Indépendance du processus didentification Aux langues utilisées dans les ReadMe Aux évolutions des UCD

26 27 juin 2005Alexandre RICHARD26 Apports et Perspectives Application fondée sur une méthode de classification partielle Emploi de fichiers intermédiaires pour faire le lien instance – concept Travaux futurs : –Prise en compte des UCD composés de plus dun mot –Application aux 11 autres catégories de mots dUCD

27 Construction dune ontologie de descripteurs en astronomie à partir de tables de données Alexandre RICHARD DEA Informatique Équipe ORPAILLEUR – LORIA Encadrant : Amedeo Napoli Co-encadrant : Emmanuel Nauer 27 juin 2005


Télécharger ppt "Construction dune ontologie de descripteurs en astronomie à partir de tables de données Alexandre RICHARD DEA Informatique Équipe ORPAILLEUR – LORIA Encadrant."

Présentations similaires


Annonces Google