Construction dune ontologie de descripteurs en astronomie à partir de tables de données Alexandre RICHARD DEA Informatique Équipe ORPAILLEUR – LORIA Encadrant.

Slides:



Advertisements
Présentations similaires
Les matrices.
Advertisements

La Gestion de la Configuration
Treuil IRD Abdelwahed FSSM-Marrakech
Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.
Classification et prédiction
Classification et prédiction
CH-II. LA GESTION DES DONNEES TECHNIQUES
Serveur jeu Le serveur fait partie d'un logiciel de jeu en ligne multi joueur en architecture client serveur. Il répond à des demandes.
Travaux Dirigés d'Urbanisation de Système d'information
XML - Henry Boccon-Gibod 1 XML, Langage de description La question du choix de formalismes Les entités et leur représentations modalités de modèles et.
Urbanisation de Système d'Information
Urbanisation de Systèmes d'Information
Entre construction théorique et mise en œuvre opérationnelle
UML - Présentation.
Le modèle logique des données relationnel MLD
Cours n°2M2. IST-IE (S. Sidhom) UE 303 Promo. M2 IST-IE 2005/06 Conception dun système d'information multimédia Architecture trois-tiers : PHP/MySQL &
Représentation formelle des ontologies
Understanding, building and using ontologies. Understanding Ontologie : la définition des concepts utilisés dans un langage donné Première approche (Gruber)
Introduction : Compilation et Traduction
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
Chapitre 4 : la gestion électronique des documents
Structuration & Organisation de Données Complexes Workshop « Fouille de données complexes » Clermont-ferrand, 20 Janvier 2004 O. Boussaid, F. Masseglia.
Vuibert Systèmes dinformation et management des organisations 6 e édition R. Reix – B. Fallery – M. Kalika – F. Rowe Chapitre 1 : La notion de système.
Aide à la décision multicritères
Algorithmique et Programmation
Analyse lexicale Généralités Expressions rationnelles Automates finis
Initiation à la conception de systèmes d'information
IMD Achats Logiciel de gestion des Achats
Introduction à la conception de Bases de Données Relationnelles
LES OUTILS POUR LA GOUVERNANCE DES DONNÉES LA PRÉCISION DES RÉSULTATS
SÉMINAIRE DE LANCEMENT DES COURS EN LIGNE
Bases de données lexicales
Algorithmique et Programmation
RDF(S)
Structures de données IFT-2000
MOT Éditeur de modèles de connaissances par objets typés
Présentation du mémoire
Cours de Base de Données & Langage SQL
Chapitre 9 Les sous-programmes.
Chapitre 3 Syntaxe et sémantique.
Informatique appliquée UQAC (Dim) DIAPORAMA Informatique appliquée UQAC (Dim)
Leçon 1 : notion dobjet IUP Génie Informatique Besançon Méthode et Outils pour la Programmation Françoise Greffier Université de Franche-Comté.
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill /
Les logiques de descriptions
ANALYSE METHODE & OUTILS
METISSE Méthodes Et Théories pour une Ingénierie des Systèmes Socio- Environnementaux.
LRI-INRIA Saclay LRI- UMR CNRS Univ Paris-Sud et UR-INRIA Saclay 12 Equipes au LRI - 7 projets INRIA Equipe IASI-GEMO (IA et BD) « Gestion de données et.
Paradigmes des Langages de Programmation
GNU Free Documentation License
Institut Supérieur des Sciences Appliquées et de Technologie Sousse
Objectifs A la fin de ce chapitre, vous pourrez : présenter l'utilisation d'opérations de chargement de données par chemin direct décrire l'utilisation.
Algorithmes et Programmation
1 Alain Casali Christian Ernst Extraction de Règles de Corrélation Décisionnelles 29 Janvier 2009.
DÉFINITIONS modules programmes chaînes de programmes
Dominique LAURENT Patrick SEGUELA
Olivier Leclair, Université Laval Un algorithme de fouille dans une représentation des données par objets: une application médicale SIMON, Arnaud.
Introduction et Généralités sur l’Algorithmique
Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC – Equipe ISLanD Apport d’outils d’informatique documentaire à l’analyse de forums de.
Le Traitement Automatique des Langues (TAL)
1 Structure en MC Principes Stockage des données dans la mémoire volatile d’un ordinateur Problèmes Stockage temporaire «Petits» volumes de données Langages.
BASES ET BANQUES DE DONNEES Objectifs de l’enseignement
Les Ontologies S. Garlatti.
Une situation nouvelle
LES TEXTES ET LES SHADOKS (Docs d’application et d’accompagnement)
Raison d'être de la structure de fichiers : Les premiers travaux : Début des années 1960 : En 1963 : Près de 10 ans plus tard... (à peu près 1973) : Durant.
GUIDE DIVERSITE 2016 Commission emploi de la COPEC
Les bases de données Séance 4 Construction du Modèle Physique (la BDD)
RÉNOVATION BTS Comptabilité et Gestion 2015 Atelier situations professionnelles & PGI Autour du P2 et du cas FRANCOBOIS P. PARISOT G. DUBAIL.
ARIANE : Interopérabilité sémantique et accès aux sources d'information sur Internet Sylvain Aymard, Michel Joubert, Dominique Fieschi, Marius Fieschi.
Transcription de la présentation:

Construction dune ontologie de descripteurs en astronomie à partir de tables de données Alexandre RICHARD DEA Informatique Équipe ORPAILLEUR – LORIA Encadrant : Amedeo Napoli Co-encadrant : Emmanuel Nauer 27 juin 2005

Alexandre RICHARD2 Sommaire Quelques repères en astronomie Le projet « Masse de données en astronomie » Les UCD (Unified Content Descritptors) Domaine de lontologie Construction de lontologie Éléments de lontologie Construction de lontologie Attribution dun UCD à une description textuelle Traitement des colonnes Units et Explanations Traitement de la colonne Label Bilan Apports et perspectives

27 juin 2005Alexandre RICHARD3 Projet « Masse de données en astronomie » Acteurs incluent entre autres: Centre de Données en astronomie de Strasbourg (CDS) Équipe ORPAILLEUR du Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA) Travaux sur des descripteurs en astronomie: les UCD (Unified Content Descriptors) Descripteurs standardisés et universels Absence de sémantique formelle Utilisation de méthodes de fouille de texte pour faire émerger –Lutilisation correcte des UCD –De nouveaux UCD Création dune structure permettant de représenter les UCD et les manipuler dans un raisonnement : une ontologie des UCD

27 juin 2005Alexandre RICHARD4 Contenu de publications en astronomie Table de données ReadMe

27 juin 2005Alexandre RICHARD5 Les UCD UnitsLabelExplanationsUCD ---MacsDesignationmeta.code hRAhRight Ascension J2000, Epoch (hours)pos.eq.ra minRAmRight Ascension J2000 (minutes)pos.eq.ra sRAsRight Ascension J2000 (seconds)pos.eq.ra degDEdDeclination J2000, Epoch (degrees)pos.eq.dec arcminDEmDeclination J2000 (minutes)pos.eq.dec arcsecDEsDeclination J2000 (seconds)pos.eq.dec ---NposNumber of positions usedmeta.number;pos magMag?=99.00 Instrumental Magnitudephot.mag;instr

27 juin 2005Alexandre RICHARD6 Domaine de lontologie (1/2) Domaine : UCD incluant au moins un mot pos Une catégorie pos des mots dUCD –Décrivent : Des mesures de position Des informations sur des positions –58 mots sur les 427 mots dUCD valides –Exemples : pos position pos.eq coordonnées équatoriales pos.eq.ra ascension droite

27 juin 2005Alexandre RICHARD7 Domaine de lontologie (2/2) Problèmes pour la représentation des UCD incluant au moins un mot pos : –Pas de liste exhaustive –Plus de 10 6 écritures potentielles Représentation des mots pos Exemple dexploitation : associer un UCD à une ligne de ReadMe Exemple : pos.eq.ra

27 juin 2005Alexandre RICHARD8 Éléments de lontologie (1/2) Ontologie : Une ontologie est la spécification explicite dune conceptualisation [Gruber 1993] Ontologie des mots pos –Formalisme : logiques de descriptions –Trois types dentités : Concept : classe dindividus ayant les mêmes propriétés. –Exemple : Conceptreprésente AngleUnitLes unités dangle pos.eq.raLes descriptions dascensions droites

27 juin 2005Alexandre RICHARD9 Éléments de lontologie (2/2) Rôle : représente une relation binaire entre 2 concepts –Exemple : la relation hasAngleUnit Individu : instance dun concept –Exemple : description textuelle dune ascension droite (instance du concept pos.eq.ra) pos.eq.raAngleUnit hasAngleUnit domaineco-domaine

27 juin 2005Alexandre RICHARD10 Construction de lontologie (1/3) Hypothèse : un co-domaine unique et différent pour chaque rôle Processus de construction 1.Identification des concepts Concepts correspondant aux mots pos Exemple : Mot pos Correspond au concept de pos Position pos.eq Coordonnées équatoriales pos.eq.ra ascension droite

27 juin 2005Alexandre RICHARD11 Construction de lontologie (2/3) 2.Écriture des définitions de concepts –Ensemble de rôles –Condition nécessaire et suffisante dappartenance à lextension du concept Exemple :

27 juin 2005Alexandre RICHARD12 3.Hiérarchisation des concepts et des rôles par la relation de subsomption Concepts Rôles Construction de lontologie (3/3) MeasureUnit hasUnit pos.eq.raAngleUnit hasAngleUnit co-domainedomaine

27 juin 2005Alexandre RICHARD13 Hiérarchie de concepts

27 juin 2005Alexandre RICHARD14 Attribution dun UCD à une ligne de ReadMe Cas considéré : UCD composé dun seul mot pos En entrée : ligne de ReadMe En sortie : tableau trié de concepts de lontologie Classement selon le degré de correspondance entre le concept et la ligne de ReadMe. Traitement en deux phases : –Traitement des colonnes Units et Explanations –Traitement de la colonne Label

27 juin 2005Alexandre RICHARD15 Traitement des colonnes Units et Explanations Ligne de ReadMe Extract(Units) = {contenu de la colonne Units} Extract(Explanations) = {contenu de la colonne Explanations} Classement des concepts de lontologie Extraction du contenu des colonnes Units et Explanations Extraction des co-domaines sur Units et Explanations Codom(Extract(Units), Extract(Explanations)) = ensemble de co-domaines Classification par rapport aux concepts de lontologie

27 juin 2005Alexandre RICHARD16 Extraction du contenu des colonnes Units et Explanations Obtention en sortie des ensembles : Extract(Units) = {s} Extract(Explanations) = {right|ascension|J2000|seconds)}

27 juin 2005Alexandre RICHARD17 Traitement des colonnes Units et Explanations Ligne de ReadMe Extract(Units) = {contenu de la colonne Units} Extract(Explanations) = {contenu de la colonne Explanations} Codom(Extract(Units), Extract(Explanations)) = ensemble de co-domaines Classement des concepts de lontologie Extraction du contenu des colonnes Units et Explanations Extraction des co-domaines sur Units et Explanations Classification par rapport aux concepts de lontologie

27 juin 2005Alexandre RICHARD18 Extraction des co-domaines sur Units et Explanations (1/2) Objectif : obtention dun ensemble de co-domaines Moyens utilisés : –Deux hypothèses : Un co-domaine unique et différent pour chaque rôle Le co-domaine identifie le rôle de manière non-ambiguë

27 juin 2005Alexandre RICHARD19 –Des fichiers intermédiaires (fichiers de méta-données) Construction : –Lexpert fait lassociation : contenu de colonne – rôles exemple : s – hasAngleUnit, hasOneValue –Le programme construit le fichier Méta(étiquette) = {(contenu de colonne, co-domaines)} exemple : Méta(Units) = {(s, AngleUnit | Value),...} En entrée : Extract(Units) = { s } Extract(Explanations) = { right | ascension | J2000 | seconds)} Lecture des fichiers de méta-données : Méta(Units) = {( s, AngleUnit | Value),... } Méta(Explanations) = {( right, CcOriginEqRa | Value), ( ascension, Value),... } En sortie : Codom( Extract(Units), Extract(Explanations) ) = { AngleUnit | CcOriginEqRa | Value } Extraction des co-domaines sur Units et Explanations (2/2)

27 juin 2005Alexandre RICHARD20 Traitement des colonnes Units et Explanations Ligne de ReadMe Extract(Units) = {contenu de la colonne Units} Extract(Explanations) = {contenu de la colonne Explanations} Classement des concepts de lontologie Extraction du contenu des colonnes Units et Explanations Extraction des co-domaines sur Units et Explanations Codom(Extract(Units), Extract(Explanations)) = ensemble de co-domaines Classification par rapport aux concepts de lontologie

27 juin 2005Alexandre RICHARD21 Classification par rapport aux concepts de lontologie Recherche des concepts de lontologie possédant les rôles de Codom( Extract(Units), Extract(Explanations) ), tri selon nombre de rôles partagés Codom( Extract(Units), Extract(Explanations) ) = { AngleUnit | CcOriginEqRa | Value } co-domaines des rôles : {hasAngleUnit, hasCcOriginEqRa, hasOneValue} CONCEPTROLESN pos.eq.rahasAngleUnit, hasOneValue, hasCcOriginEqRa, hasFrameTypeEq 3 pos.angDistancehasAngleUnit, hasOneValue2 pos.az.althasAngleUnit, hasOneValue, hasCcOriginAzAlt, hasFrameTypeAz 2 pos.eq.dechasAngleUnit, hasOneValue, hasCcOriginEqDec, hasFrameTypeEq 2 pos.eq.spdhasAngleUnit, hasOneValue, hasCcOriginEqSpd, hasFrameTypeEq 2 pos.parallaxhasAngleUnit, hasOneValue, hasPlxMethod 2...

27 juin 2005Alexandre RICHARD22 Traitement de la colonne Label (1/3) Ligne de ReadMe Extract(Label) = {contenu de la colonne Label} Classement des concepts de lontologie Extraction du contenu de la colonnes Label Extraction des co-domaines sur Label Codom(Extract(Label)) = ensemble de co-domaines Classification par rapport aux concepts de lontologie

27 juin 2005Alexandre RICHARD23 Traitement de la colonne Label (2/3) Étape 1 : Extract(Label) = { RAs } Étape 2 : Méta(Label) = {( RAs, AngleUnit | CcOriginEqRa | Value | FrameTypeEq),...} Codom( Extract(Label) ) = { AngleUnit | CcOriginEqRa | Value | FrameTypeEq } Étape 3 : rôles : {hasAngleUnit, hasCcOriginEqRa, hasOneValue, hasFrameTypeEq} CONCEPTROLESN pos.eq.rahasAngleUnit, hasCcOriginEqRa, hasOneValue, hasFrameTypeEq 4 pos.eq.dechasAngleUnit, hasCcOriginEqDec, hasOneValue, hasFrameTypeEq 3 pos.eq.spdhasAngleUnit, hasCcOriginEqSpd, hasOneValue, hasFrameTypeEq 3 pos.angDistancehasAngleUnit, hasOneValue 2 pos.az.althasAngleUnit, hasOneValue, hasCcOriginAzAlt, hasFrameTypeAz 2...

27 juin 2005Alexandre RICHARD24 Traitement de la colonne Label (3/3) Sil y a toujours égalité au premier rang, cest à lexpert de choisir parmi les concepts de meilleur rang Travail sur la colonne Label séparé –Labels porteurs de beaucoup dinformation –Labels souvent ambigus alpha : angle de phase dune orbite dun corps céleste alpha : ascension droite dun corps céleste –Absence de liste des labels ou de règles de construction –Difficulté de construction du fichier Méta(Label)

27 juin 2005Alexandre RICHARD25 Bilan Test sur 75 lignes de ReadMe 4 lignes attribuées avant le traitement de la colonne Label + 42 lignes attribuées après le traitement de la colonne Label + 26 lignes attribués par lexpert 3 échecs Compatibilité avec loutil lexico-syntaxique existant au CDS Indépendance du processus didentification Aux langues utilisées dans les ReadMe Aux évolutions des UCD

27 juin 2005Alexandre RICHARD26 Apports et Perspectives Application fondée sur une méthode de classification partielle Emploi de fichiers intermédiaires pour faire le lien instance – concept Travaux futurs : –Prise en compte des UCD composés de plus dun mot –Application aux 11 autres catégories de mots dUCD

Construction dune ontologie de descripteurs en astronomie à partir de tables de données Alexandre RICHARD DEA Informatique Équipe ORPAILLEUR – LORIA Encadrant : Amedeo Napoli Co-encadrant : Emmanuel Nauer 27 juin 2005