Vers une ontologie du domaine de l’astronomie

Slides:



Advertisements
Présentations similaires
ASSTICCOT, RTP-DOC, Paris
Advertisements

Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.
5 décembre 2002TIA - prise en compte de l'application - Assises I31 Prise en compte de lapplication dans la constitution de produits terminologiques Groupe.
Spécification et qualité du logiciel
Image et apprentissage
Thésaurus juridique, catégorisation de textes
Découverte automatique de mappings fondée sur les requêtes dans un environnement P2P Présenté Par: Lyes LIMAM Encadré Par: Mohand-Said Hacid.
Web sémantique Where are we ? Jorge Cardoso
Yann Chevaleyre et Jean-Daniel Zucker
EN CHAUDRONNERIE INDUSTRIELLE
Sources secondaires virtuelles
1 DISIC Option Systèmes Intelligents / Données, Documents et Connaissances DISIC Option Systèmes Intelligents / Données, Documents et Connaissances.
Les méthodes formelles en ingénierie des connaissances Damien Lhomme-Desages Jérémie Barlet.
Équipe TexMex, IRISA, Rennes
Base de Données "Titres" Projet "Visu" Réalisée dans le cadre de la maîtrise IL.
l'approche ergonomique
METHODOLOGIE.
Reconnaissance de la parole
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
Un système de médiation basé sur les ontologies
Points de vue On distingue 3 points de vue de description d’un système automatisé selon les informations dont on dispose sur ce système ou selon les éléments.
Cartes Conceptuelles Daniel Peraya
Université Paris I – Panthéon Sorbonne
INTELLIGENCE COLLECTIVE : RENCONTRES 2006Nîmes mai 2006 CENTRE DE RECHERCHE LGI2P 1- Doctorante Ecole des mines de Paris, 2- Maitre de Conférences.
La recherche documentaire à l’aide d’un Thésaurus dans le logiciel documentaire BCDI3 Après l’exemple du Minitel.
Progression des apprentissages en écriture au primaire
Programmation logique Logique des prédicats du premier ordre
Vers une ontologie du domaine de lastronomie IRIT J. Mothe, N. Hernandez, E. LeMoing.
Annotations sémantiques pour le domaine des biopuces
Programmation logique Démonstrateur automatique
Chapitre 10: Les systèmes de particules
Techniques de test Boulanger Jean-Louis.
Reconnaissance Vocale
IGL301 - Spécification et vérification des exgiences 1 Chapitre 2 Le processus dingénierie des exigences (ref : Bray chapitre 2)
La méthodologie expérimentale Fondements et bases d’application
CSI 4506: Introduction à l’intelligence artificielle
La méthodologie expérimentale Fondements et bases d’application
Démonstrateur Lingway
Le Sémiographe Outil générique pour effectuer des opérations texte sens texte ou texte sens actions
Yasmina ABBAS EDF - Division Recherche et Développement (Division R&D)
Systeme Question-Reponse SQR
Forum des Industries de la Langue, 17 mars 2010
Partie II Sémantique.
Finance organisationnelle : un essai de représentation Stéphane TREBUCQ, Université de Bordeaux (JADT 2004) Recherche : synthèse d’un corpus théorique.
DEPARTEMENT DE BIBLIOTHECONOMIE
Programmation non procédurale Le projet ECOLE 2000
Ontologies pour l’astronomie
Vers une génération automatique du mapping de sources biomédicales
NORMALISATION DES LANGAGES DE PROGRAMMATION des Automates Programmables Industriels CEI
UN THESAURUS Pourquoi ? Pour qui ? Comment ?
LRI-INRIA Saclay LRI- UMR CNRS Univ Paris-Sud et UR-INRIA Saclay 12 Equipes au LRI - 7 projets INRIA Equipe IASI-GEMO (IA et BD) « Gestion de données et.
Ontologies et description du contenu de documents AV : Une expérimentation dans le domaine médical Mardi 31 mai 2005 Raphaël Troncy 1 & Antoine Isaac 2.
Séminaire 10 Juin 2008 Pervasive Learning Network : P-LearNet Institut TELECOM.
Réunion de lancement du 18 janvier constitution, alignement, comparaison et exploitation d’ontologies géographiques hétérogènes Réunion de lancement.
Institut Supérieur des Sciences Appliquées et de Technologie Sousse
CoRRecT : Démarche coopérative pour l’évaluation de systèmes de reconnaissance de termes Chantal Enguehard IRIN – Université de Nantes 2 rue de la Houssinière.
Sylwia Ozdowska1, Vincent Claveau2
Dominique LAURENT Patrick SEGUELA
23 Nov. 2005Colloque Médiathèques1 Nouvelles méthodes d’accès assisté à l’information Approches sémantiques Documents textuels et multimédia Patrice Enjalbert.
  Comment calculer ce signal analytique ?
UVSQ EDF R&D Procédés de réutilisation pour les lignes de produits logiciels Yuanyuan XU, Bruno TRAVERSON - INFORSID Mai 2008.
Hôpital Bidule Le patient Donald Duck, né le 22/5/2064 souffre d’un œdème de Quincke, type II. CONCEPTION ET UTILISATION D’ONTOLOGIES MÉDICALES : APPLICATION.
Traitement de l’article :
TEXT MINING Fouille de textes
1 Construction de ressources terminologiques à partir de textes : études de cas Nathalie AUSSENAC-GILLES (CNRS, Toulouse) Didier BOURIGAULT (CNRS, Toulouse)
Une méthode pour la construction d’ontologies à partir de textes
CARTE CONCEPTUELLE.
1 Résolution d’ambiguïtés de rattachement prépositionnel : intégration de ressources exogènes dans un analyseur syntaxique de corpus endogène Cécile Frérot,
Modélisation du signal de télédétection
Introduction à la Recherche
Transcription de la présentation:

Vers une ontologie du domaine de l’astronomie IRIT J. Mothe, N. Hernandez, E. LeMoing MDA, 15 octobre 2004

Objectifs Évaluer la réutilisabilité de la connaissance du thesaurus IAU Détection de concepts Analyse des relations RT (est lié à) Enrichir cette connaissance Détection de nouveaux termes Détection de nouvelles relations MDA, 15 octobre 2004

Connaissance extraite Nouvelle connaissance extraites des corpus Connaissance extraite de IAU Détection de concepts Relations U (utilisé) et UF (utilisé pour) du thesaurus Exemple : hubble sandage variable stars UF h s variable stars Regroupement automatique des termes sous même concepts (label principal = terme recommandé à utiliser) Exemple: concept : hubble sandage variable stars label 2 : h s variable stars MDA, 15 octobre 2004

Connaissance extraite Nouvelle connaissance extraites des corpus Connaissance extraite de IAU Détection de concepts 2959 termes dans le thesaurus 2547 concepts ayant entre 1 et 6 labels À valider MDA, 15 octobre 2004

Analyses des relations RT Nouvelle connaissance extraites des corpus Connaissance extraite de IAU Analyses des relations RT Analyse syntaxique Analyse des mots communs de deux syntagmes reliés par RT Analyse par le logiciel Syntex Analyse du contexte dans lequel apparaissent deux syntagmes reliés par RT, dans un corpus MDA, 15 octobre 2004

Analyses des relations RT Nouvelle connaissance extraites des corpus Connaissance extraite de IAU Analyses des relations RT 5975 relations RT 287 liant syntagmes différant d’un seul mot Exemple : infrared radiation RT infrared 1286 liant syntagmes comportant mot commun Exemple : absorption spectra RT energy spectra Autres ? À partir des corpus (Syntex) Exemple : agb RT hr diagram : A&A95 agb star, hr diagram of star MDA, 15 octobre 2004

Termes différant d’un seul mot Nouvelle connaissance extraites des corpus Connaissance extraite de IAU Termes différant d’un seul mot Deux patrons syntaxiques : m1s1 RT m1s2 m2s2, (Patron A) où m1s2 est une forme adjectivale du mot m1s1 Exemple : infrared RT infrared radiation 234 relations m1s1 RT m1s2 m2s2 (Patron B) où m1s1=m2s2 Exemple : dipole RT electric dipole 53 relations MDA, 15 octobre 2004

Termes différant d’un seul mot (2) Nouvelle connaissance extraites des corpus Connaissance extraite de IAU Termes différant d’un seul mot (2) Relations sémantiques déduites : Patron A : m1s1 RT m1s2 m2s2 - s1 «  est un phénomène lié a » s2 Exemple : infrared radiation «  est un phénomène lié a » infrared - s1 « est une caractéristique de » s2 Exemple : pulse width « est une caractéristique » de pulse - s1 « est une partie de » s2 Exemple : supernova envelope « est une partie de » supernova MDA, 15 octobre 2004

Termes différant d’un seul mot (3) Nouvelle connaissance extraites des corpus Connaissance extraite de IAU Termes différant d’un seul mot (3) Patron B : m1s1 RT m1s2 m2s2 - s1 « est un » s2 (généricité/spécificité) Exemple : dwarf cepheid « est un » cepheid MDA, 15 octobre 2004

Termes ayant un mot commun Nouvelle connaissance extraites des corpus Connaissance extraite de IAU Termes ayant un mot commun Deux patrons syntaxiques: m1s1 m2s1 …mns1 RT m1s2 m2s2… m2sn où m1s1 = m1s2 (patron C) Exemple : planck black body formula RT planck constant 590 relations m1s1 ... mns1 RT m1s2.. mns2 (patron D) où mns1=mns2 Exemple : absorption spectra RT energy spectra 510 relations MDA, 15 octobre 2004

Termes ayant un mot commun (2) Nouvelle connaissance extraites des corpus Connaissance extraite de IAU Termes ayant un mot commun (2) Relations sémantiques déduites : Patron C : m1s1 m2s1 …mns1 RT m1s1 m2s2… m2sn - s1 et s2 sont des phénomènes liés entre eux Exemple : signal analysi RT signal detection - s1 et s2 sont des caractéristiques liées entre elle Exemple : circumstellar envelope RT circumstellar shell MDA, 15 octobre 2004

Termes ayant un mot commun (3) Nouvelle connaissance extraites des corpus Connaissance extraite de IAU Termes ayant un mot commun (3) Patron D m1s1 ... mns1 RT m1s2.. mns2 s1 et s2 sont deux sous-concepts du concept mns1 Exemple : absorption spectra et energy spectra sont des sous-concepts de spectra MDA, 15 octobre 2004

Syntex : analyseur syntaxique de corpus Nouvelle connaissance extraites des corpus Connaissance extraite de IAU Syntex : analyseur syntaxique de corpus Intérêt : extraire syntaxiquement les expressions d’une collection documentaire [Bourigault & Fabre, 2000] Deux phases Pré-traitement par un étiqueteur Analyse syntaxique Analyse distributionnelle Originalité : apprentissage endogène [Bourigault & Lame, 2002] MDA, 15 octobre 2004

Connaissance extraite Nouvelle connaissance extraites des corpus Connaissance extraite de IAU Syntex Intérêt : analyse syntagmes reliés par RT sans mot commun à partir de contextes d ’apparition dans le corpus Syntagmes reliés par RT avec contexte commun, détermination de la relation sémantique à partir des patrons A,B,C,D Exemple : surface photometry RT surface brightness : Contexte commun galaxy : ( A&A 95 : galaxy surface photometry, surface brightness of galaxy),  patron C : surface photometry et surface brightness sont des caractéristiques de galaxy MDA, 15 octobre 2004

Connaissance extraite Nouvelle connaissance extraites des corpus Connaissance extraite de IAU Syntex Syntagmes reliés par RT dont un des mots apparaît dans le contexte de l’autre syntagme, détermination de la relation sémantique à partir des patrons A,B,C,D Exemple : rotation RT angular velocity : Contexte de rotation velocity : ( A&A 95 : rotation velocity),  patron B : rotation et angular velocity sont deux types de velocity MDA, 15 octobre 2004

Connaissance extraite Nouvelle connaissance extraites des corpus Connaissance extraite de IAU Bilan Proposition de patrons syntaxiques dans le but de déterminer les relations sémantique entre syntagmes Validation nécessaire Utilisation des patrons pour déduire de nouvelles relations entre concepts à partir des contextes donnés par Syntex MDA, 15 octobre 2004

Nouvelle connaissance extraite des corpus Connaissance extraite de IAU Détection de nouveaux termes du domaine Termes apparaissant souvent dans le corpus Termes avec fort tf.idf  Analyse en cours MDA, 15 octobre 2004

Nouvelle connaissance extraite des corpus Connaissance extraite de IAU Détection de nouvelles relations Entre termes de l’ontologie Entre termes proposés précédemment  À partir des patrons syntaxiques et contextes des termes donnés par syntex MDA, 15 octobre 2004

Conclusion Construction d’une ontologie à partir du thesaurus IAU Extraction de nouvelles connaissances à partir de corpus Apprentissage des relations syntaxiques  Validation pour semi-automatiser le procédé MDA, 15 octobre 2004