Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parSolange Babin Modifié depuis plus de 9 années
1
Maxime Lefrançois, Fabien Gandon, Alain Giboin
TOTh’2014, 12/06/2014 Méthodologie d’ingénierie des connaissances pour la représentation des définitions lexicographiques dans le cadre de la théorie Sens-Texte Maxime Lefrançois, Fabien Gandon, Alain Giboin Inria
2
Richesse de description
Pourquoi étudier la Théorie Sens-Texte ? Approches en sémantique lexicale 1. Sémantique décompositionnelle 2. Sémantique componentielle 3. Sémantique relationnelle Richesse de description Besoin de formalisation Besoin de plus de couverture Besoin pour le TALN TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
3
Le Dictionnaire Explicatif et Combinatoire (DEC)
Postulats de base préciser qu’on en parlera du DEC - Différents niveaux de représentation - Des règles de transformation entre les niveaux Le lexique tient une place centrale Le Dictionnaire Explicatif et Combinatoire (DEC) TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
4
Informatisation du DEC et DEC informatisé
ex: éditeur DECID (Sérasset, 1997) TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
5
Informatisation du DEC et DEC informatisé
recherche intelligente d’information mise à jour et vérification automatique déduction logique paraphrasage déduction du premier ordre Ingénierie des connaissances représenter, manipuler, échanger, interroger, raisonner avec les connaissances,... TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
6
Question de recherche et méthodologie
Quel formalisme de représentation des connaissances serait adapté à la représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte ? « Formalisation de la conceptualisation d’un domaine » 1. La conceptualisation est-elle adaptée à une formalisation ? précise plus les étapes l’objet frontières 2. Quel formalisme est adapté à cette conceptualisation ? 3. Comment peut-on opérationnaliser ce formalisme ? TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
7
Plan de la présentation
1. La conceptualisation est-elle adaptée à une formalisation ? 1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités pour le pdf 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
8
1.a. 1. La conceptualisation est-elle adaptée à une formalisation ?
1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
9
Exemple d’extension de conceptualisation
Langage : Types d’ (instances d’) Unités linguistiques & Usage : TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
10
Introduction au DEC zone phonologique zone morphologique
zone sémantique zone de combinatoire zone de stylistique, zone d’exemple, zone phraséologique, zone de nota bene 4 volumes papier = environ 500 entrées seulement principal sujet d’étude des linguistes de la Théorie Sens-Texte TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
11
Zone sémantique du DEC > les définitions lexicographiques
Travaux de conceptualisation existant choix des composantes selon les catégories d’unités lexicales (ex: sentiments) la structuration est importante pour le TAL (Wanner, MTT’ 2003) composantes suggérées par des étiquettes sémantiques symboles de PosASém choisies dans un petit ensemble (à la FrameNet) structuration en XML (projet Definiens) TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
12
Zone sémantique du DEC > les définitions lexicographiques
Conceptualisation espérée (dans la littérature): Degré de formalisation non atteint aujourd’hui TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
13
Prédicats linguistiques
Type d’unité lexicale Structure actancielle sémantique Type d’unité sémantique Positions actancielles TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
14
Prédicats linguistiques
Type d’unité lexicale Structure actancielle sémantique Type d’unité sémantique Positions actancielles TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
15
Prédicats linguistiques
Type d’unité lexicale Structure actancielle sémantique Type d’unité sémantique Structure actancielle = Extension de la conceptualisation TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
16
Prédicats linguistiques
Type d’unité lexicale Structure actancielle sémantique Type d’unité sémantique Structure actancielle = Positions actantielles sémantiques: = Les participants de la situation linguistique dénotée par L qui ont une position privilégiées auprès de L dans les phrases + critères linguistiques ! TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
17
Prédicats linguistiques
Type d’unité lexicale Structure actancielle sémantique Type d’unité sémantique Structure actancielle = TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
18
des structures actancielles ?
Héritage du sens et spécialisation des structures actancielles ? TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
19
des structures actancielles ?
Héritage du sens et spécialisation des structures actancielles ? contre-exemple 1. (outil) PosA 1 – personne qui utilise l’outil PosA 2 – une activité ou une profession (ciseaux) PosA 2 – l’objet à couper TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
20
des structures actancielles ?
Héritage du sens et spécialisation des structures actancielles ? contre-exemple 2. (ustensile) PosA 1 – personne qui utilise l’ustensile PosA 2 – une activité (bouilloire) PosA 1 – personne qui utilise l’outil PosA 2 TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
21
Le niveau Sémantique Profond
préciser qu’on en parlera du DEC TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
22
Le niveau Sémantique Profond
introduction d’une notation /outil\ définition de la structure actancielle sémantique profonde choix des Symboles d’Actants: des rôles sémantiques lexicalisés introduction des positions actancielles interdites SémP SémS Héritage du sens et spécialisation des structures actancielles TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
23
1.b. 1. La conceptualisation est-elle adaptée à une formalisation ?
1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
24
Définitions lexicographiques
Application au projet RELIEF (Lux-Pogodalla et Polguère, WoLeR’2009) ? TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
25
Repositionnement > 1. au niveau sémantique profond
diapo pour animation TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
26
Repositionnement > 2. au niveau du dictionnaire
diapo pour animation TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
27
Prototype d’éditeur de définitions lexicographiques avec la conceptualisation étendue
TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
28
Prototype d’éditeur de définitions lexicographiques avec la conceptualisation étendue
TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
29
Prototype d’éditeur de définitions lexicographiques avec la conceptualisation étendue
TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
30
Prototype d’éditeur de définitions lexicographiques avec la conceptualisation étendue
Offre une première base de discussion essentielle Confirme les attentes des lexicographes pour un tel outil Permet d’identifier des directions d’amélioration possible TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
31
2.a. 1. La conceptualisation est-elle adaptée à une formalisation ?
1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
32
Formalismes candidats
Grammaires de dépendance Théorie Linguistique Sens-Texte 65 Graphes Conceptuels Web Sémantique & Logiques de description Critères de choix de (Gruber, 1995) clarté cohérence extensibilité minimalité de la déformation d’encodage minimalité de l’engagement ontologique Clarté - La dénition d'un concept doit faire passer le sens voulu du terme, de manière aussi objective que possible (indépendante du contexte). Une dénition doit de plus être complète (c'est-à-dire dénie par des conditions à la fois nécessaires et susantes). Cohérence ok hierarchie -- Rien qui ne puisse être inféré de l'ontologie ne doit entrer en contradiction avec les dénitions des concepts (y compris celles qui sont exprimées en langage naturel). Extensibilité. monotonie -- Les extensions qui pourront être ajoutées à l'ontologie doivent être anticipées. Il doit être possible d'ajouter de nouveaux concepts sans avoir à toucher aux fondations de l'ontologie. Une déformation d'encodage a lieu lorsque la spécication inue sur la conceptualisation engagement ontologique - expressivité et complexité TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
33
Le Formalisme des Graphes d’Unités
un formalisme à base de graphes inspiré des Graphes Conceptuels construit pour la théorie Sens-Texte TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
34
2.b. 1. La conceptualisation est-elle adaptée à une formalisation ?
1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
35
Hiérarchie des types d’unités > Objectif
Un type d’unité hérite la structure actancielle de ses parents et peut la spécialiser PosA optionnelle obligatoire PosA optionnelle interdite spécialisation des signatures TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
36
Hiérarchie des types d’unités > Solution: types primitifs d’unités
Pour un symbole d’actant s le radix de s introduit une PosA s l’obligat de s rend la PosA s obligatoire le prohibet de s rend la PosA s interdite hiérarchie des types primitifs = superposition intriquée de telles structures TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
37
Graphes d’Unités TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
38
Règles de graphes d’unités
une hypothèse une conclusion des nœuds frontière TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
39
Définitions de types d’unités = deux règles contraposées
TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
40
3.a. 1. La conceptualisation est-elle adaptée à une formalisation ?
1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
41
Objectifs du raisonnement
Critères de choix de (Gruber, 1995) clarté cohérence extensibilité minimalité de la déformation d’encodage minimalité de l’engagement ontologique ? Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST TOTh'2014
42
Théorie des modèles & Algèbre relationnelle
Sémantique logique Théorie des modèles & Algèbre relationnelle G implique H = pour tout modèle M qui satisfait G, il existe un modèle qui satisfait H Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST TOTh'2014
43
H peut être projeté sur un graphe d’unité dérivé de G
Déduction logique Règles d’inférence & Dérivation logique H peut être déduit de G = H peut être projeté sur un graphe d’unité dérivé de G Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST TOTh'2014
44
Décidabilité de la déduction logique
Condition suffisante: Expansion finie des conditions d’acyclicité sur la hiérarchie des types d’unités sur les définitions lexicographiques Les lexicographes de la Théorie Sens-Texte s’imposaient déjà ces conditions par intuition Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST TOTh'2014
45
3.b. 1. La conceptualisation est-elle adaptée à une formalisation ?
1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
46
Standards du web sémantique
Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST TOTh'2014
47
Modèle: OWL 2 RL, deux modèles différents, mais interopérables
Alignement avec ontolex Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST TOTh'2014
48
Conclusions Théorie Sens-Texte Ingénierie des connaissances
représenter, manipuler, échanger, interroger, raisonner avec les connaissances,... TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
49
Conclusions Conceptualisation Représentation Opérationnalisation t
TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
50
Perspectives Choisir le formalisme Le Peupler L’Appliquer t
Conceptualisation Représentation Opérationnalisation t TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.