La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

MDA, 15 octobre 2004 Vers une ontologie du domaine de lastronomie IRIT J. Mothe, N. Hernandez, E. LeMoing.

Présentations similaires


Présentation au sujet: "MDA, 15 octobre 2004 Vers une ontologie du domaine de lastronomie IRIT J. Mothe, N. Hernandez, E. LeMoing."— Transcription de la présentation:

1 MDA, 15 octobre 2004 Vers une ontologie du domaine de lastronomie IRIT J. Mothe, N. Hernandez, E. LeMoing

2 MDA, 15 octobre 2004 Objectifs Évaluer la réutilisabilité de la connaissance du thesaurus IAU –Détection de concepts –Analyse des relations RT (est lié à) Enrichir cette connaissance –Détection de nouveaux termes –Détection de nouvelles relations

3 MDA, 15 octobre 2004 Détection de concepts Relations U (utilisé) et UF (utilisé pour) du thesaurus Exemple : hubble sandage variable stars UF h s variable stars Regroupement automatique des termes sous même concepts (label principal = terme recommandé à utiliser) Exemple: concept : hubble sandage variable stars label 2 : h s variable stars Nouvelle connaissance extraites des corpus Connaissance extraite de IAU

4 MDA, 15 octobre termes dans le thesaurus 2547 concepts ayant entre 1 et 6 labels À valider Détection de concepts Nouvelle connaissance extraites des corpus Connaissance extraite de IAU

5 MDA, 15 octobre 2004 Analyses des relations RT Analyse syntaxique Analyse des mots communs de deux syntagmes reliés par RT Analyse par le logiciel Syntex Analyse du contexte dans lequel apparaissent deux syntagmes reliés par RT, dans un corpus Nouvelle connaissance extraites des corpus Connaissance extraite de IAU

6 MDA, 15 octobre 2004 Analyses des relations RT 5975 relations RT 287 liant syntagmes différant dun seul mot Exemple : infrared radiation RT infrared 1286 liant syntagmes comportant mot commun Exemple : absorption spectra RT energy spectra Autres ? À partir des corpus (Syntex) Exemple : agb RT hr diagram : A&A95 agb star, hr diagram of star Nouvelle connaissance extraites des corpus Connaissance extraite de IAU

7 MDA, 15 octobre 2004 Termes différant dun seul mot Deux patrons syntaxiques : –m1 s1 RT m1 s2 m2 s2, (Patron A) où m1 s2 est une forme adjectivale du mot m1 s1 Exemple : infrared RT infrared radiation 234 relations –m1 s1 RT m1 s2 m2 s2 (Patron B) où m1 s1 =m2 s2 Exemple : dipole RT electric dipole 53 relations Nouvelle connaissance extraites des corpus Connaissance extraite de IAU

8 MDA, 15 octobre 2004 Termes différant dun seul mot (2) Relations sémantiques déduites : Patron A : m1 s1 RT m1 s2 m2 s2 - s1 « est un phénomène lié a » s2 Exemple : infrared radiation « est un phénomène lié a » infrared - s1 « est une caractéristique de » s2 Exemple : pulse width « est une caractéristique » de pulse - s1 « est une partie de » s2 Exemple : supernova envelope « est une partie de » supernova Nouvelle connaissance extraites des corpus Connaissance extraite de IAU

9 MDA, 15 octobre 2004 Termes différant dun seul mot (3) Patron B : m1 s1 RT m1 s2 m2 s2 - s1 « est un » s2 (généricité/spécificité) Exemple : dwarf cepheid « est un » cepheid Nouvelle connaissance extraites des corpus Connaissance extraite de IAU

10 MDA, 15 octobre 2004 Termes ayant un mot commun Deux patrons syntaxiques: –m1 s1 m2 s1 …mn s1 RT m1 s2 m2 s2… m2 sn où m1 s1 = m1 s2 (patron C) Exemple : planck black body formula RT planck constant 590 relations –m1 s1... mn s1 RT m1 s2.. mn s2 (patron D) où mn s1 =mn s2 Exemple : absorption spectra RT energy spectra 510 relations Nouvelle connaissance extraites des corpus Connaissance extraite de IAU

11 MDA, 15 octobre 2004 Termes ayant un mot commun (2) Relations sémantiques déduites : Patron C : m1 s1 m2 s1 …mn s1 RT m1 s1 m2 s2… m2 sn - s1 et s2 sont des phénomènes liés entre eux Exemple : signal analysi RT signal detection - s1 et s2 sont des caractéristiques liées entre elle Exemple : circumstellar envelope RT circumstellar shell Nouvelle connaissance extraites des corpus Connaissance extraite de IAU

12 MDA, 15 octobre 2004 Termes ayant un mot commun (3) Patron D m1 s1... mn s1 RT m1 s2.. mn s2 –s1 et s2 sont deux sous-concepts du concept mn s1 Exemple : absorption spectra et energy spectra sont des sous- concepts de spectra Nouvelle connaissance extraites des corpus Connaissance extraite de IAU

13 MDA, 15 octobre 2004 Syntex : analyseur syntaxique de corpus Intérêt : extraire syntaxiquement les expressions dune collection documentaire [Bourigault & Fabre, 2000] Deux phases –Pré-traitement par un étiqueteur –Analyse syntaxique –Analyse distributionnelle Originalité : apprentissage endogène [Bourigault & Lame, 2002] Nouvelle connaissance extraites des corpus Connaissance extraite de IAU

14 MDA, 15 octobre 2004 Syntex Intérêt : analyse syntagmes reliés par RT sans mot commun à partir de contextes d apparition dans le corpus Syntagmes reliés par RT avec contexte commun, détermination de la relation sémantique à partir des patrons A,B,C,D Exemple : surface photometry RT surface brightness : Contexte commun galaxy : ( A&A 95 : galaxy surface photometry, surface brightness of galaxy ), patron C : surface photometry et surface brightness sont des caractéristiques de galaxy Nouvelle connaissance extraites des corpus Connaissance extraite de IAU

15 MDA, 15 octobre 2004 Syntex Syntagmes reliés par RT dont un des mots apparaît dans le contexte de lautre syntagme, détermination de la relation sémantique à partir des patrons A,B,C,D Exemple : rotation RT angular velocity : Contexte de rotation velocity : ( A&A 95 : rotation velocity), patron B : rotation et angular velocity sont deux types de velocity Nouvelle connaissance extraites des corpus Connaissance extraite de IAU

16 MDA, 15 octobre 2004 Bilan Proposition de patrons syntaxiques dans le but de déterminer les relations sémantique entre syntagmes Validation nécessaire Utilisation des patrons pour déduire de nouvelles relations entre concepts à partir des contextes donnés par Syntex Nouvelle connaissance extraites des corpus Connaissance extraite de IAU

17 MDA, 15 octobre 2004 Détection de nouveaux termes du domaine –Termes apparaissant souvent dans le corpus –Termes avec fort tf.idf Analyse en cours Nouvelle connaissance extraite des corpus Connaissance extraite de IAU

18 MDA, 15 octobre 2004 Détection de nouvelles relations –Entre termes de lontologie –Entre termes proposés précédemment À partir des patrons syntaxiques et contextes des termes donnés par syntex Nouvelle connaissance extraite des corpus Connaissance extraite de IAU

19 MDA, 15 octobre 2004 Conclusion Construction dune ontologie à partir du thesaurus IAU Extraction de nouvelles connaissances à partir de corpus Apprentissage des relations syntaxiques Validation pour semi-automatiser le procédé


Télécharger ppt "MDA, 15 octobre 2004 Vers une ontologie du domaine de lastronomie IRIT J. Mothe, N. Hernandez, E. LeMoing."

Présentations similaires


Annonces Google