Maxime Lefrançois, Fabien Gandon, Alain Giboin

Slides:



Advertisements
Présentations similaires
Mais vous comprenez qu’il s’agit d’une « tromperie ».
Advertisements

Le Nom L’adjectif Le verbe Objectif: Orthogram
ORTHOGRAM PM 3 ou 4 Ecrire: « a » ou « à » Référentiel page 6
LES NOMBRES PREMIERS ET COMPOSÉS
Ma surprise du Zoo.
[number 1-100].
Qualité du Premier Billot. 2 3 Défauts reliés à labattage.
1. Résumé 2 Présentation du créateur 3 Présentation du projet 4.
Vocabulaire 6.2 Français II Bon voyage ! 1.
Licence pro MPCQ : Cours
Additions soustractions
Distance inter-locuteur
1. ami 2. compagnon 3. amant 4. frère 5. père 6. maître 7. éducateur 8
Les Européens et la Crise IV 07 Octobre Méthodologie.
Classe : …………… Nom : …………………………………… Date : ………………..
Les numéros
Les identités remarquables
Sirop de Liège « industriel »
LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.
2 1. Vos droits en tant quusagers 3 1. Vos droits en tant quusagers (suite) 4.
1 7 Langues niveaux débutant à avancé. 2 Allemand.
PARTENARIAT ÉDUCATIF GRUNDTVIG PARTENARIAT ÉDUCATIF GRUNDTVIG REPERES COHESION CULTURELLE ET EXPANSION DES IDEES SUR LE TERRITOIRE EUROPEEN.
ORTH 1 CE2 Je sais écrire sans erreur les pluriels des noms se terminant par s, x, z.
Mr: Lamloum Med LES NOMBRES PREMIERS ET COMPOSÉS Mr: Lamloum Med.
-17 Anticipations économiques en Europe Septembre 2013 Indicateur > +20 Indicateur 0 a +20 Indicateur 0 a -20 Indicateur < -20 Union européenne total:
Interagir avec un objet mixte Propriétés physiques et numériques Céline Coutrix, Laurence Nigay Équipe Ingénierie de lInteraction Homme-Machine (IIHM)
1 Cours numéro 3 Graphes et informatique Définitions Exemple de modélisation Utilisation de ce document strictement réservée aux étudiants de l IFSIC.
Le soccer & les turbans Sondage mené par lAssociation détudes canadiennes 14 juin 2013.
1 Guide de lenseignant-concepteur Vincent Riff 27 mai 2003.
GRAM 1 CE2 Je sais transformer une phrase affirmative en phrase négative.
PM18 MONTAGE DU BLINDAGE AUTOUR DE LA QRL F. DELSAUX - 25 JAN 2005
Le Concours de Conaissance Francais I novembre 2012.
TALN-RECITAL’13, 20 juin 2013, Sables d’Olonne
Titre : Implémentation des éléments finis sous Matlab
1 Journée de regroupement des correspondants "Egalité et genre" - 21 novembre 2011 Rectorat de Rouen - SAIO - CD-HD Résultats scolaires, appréciations.
Projet poker 1/56. Introduction Présentation de léquipe Cadre du projet Enjeux Choix du sujet 2.
LES NOMBRES PREMIERS ET COMPOSÉS
VOC 1 CE2 Je sais utiliser des mots de la vie quotidienne.
Comment rendre une femme heureuse…
1 INETOP
1 Délégation FSA 2008: Cycle de formations prédépart __ Quest-ce que la mondialisation ?
RACINES CARREES Définition Développer avec la distributivité Produit 1
Représentation des systèmes dynamiques dans l’espace d’état
Systèmes mécaniques et électriques
Représentation des systèmes dynamiques dans l’espace d’état
Représentation des systèmes dynamiques dans l’espace d’état
DUMP GAUCHE INTERFERENCES AVEC BOITIERS IFS D.G. – Le – 1/56.
1 Licence dinformatique Algorithmique des graphes Problèmes dordonnancement. Utilisation de ce document strictement réservée aux étudiants de l IFSIC dans.
Tournoi de Flyball Bouin-Plumoison 2008 Tournoi de Flyball
Notre calendrier français MARS 2014
Année universitaire Réalisé par: Dr. Aymen Ayari Cours Réseaux étendus LATRI 3 1.
Titre : Implémentation des éléments finis en Matlab
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
1 INETOP
Équipe 2626 Octobre 2011 Jean Lavoie ing. M.Sc.A.
P.A. MARQUES S.A.S Z.I. de la Moussière F DROUE Tél.: + 33 (0) Fax + 33 (0)
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
Traitement de différentes préoccupations Le 28 octobre et 4 novembre 2010.
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
1/65 微距摄影 美丽的微距摄影 Encore une belle leçon de Macrophotographies venant du Soleil Levant Louis.
* Source : Étude sur la consommation de la Commission européenne, indicateur de GfK Anticipations.
Nom:____________ Prénom: ___________
CALENDRIER-PLAYBOY 2020.
Exercice de vérification 1 p
Commission paritaire de suivi des opérations de reclassement repositionnement dans le cadre du droit d’option Statistiques novembre 2010.
Les Chiffres Prêts?
Elles avaient envahi le jardin, mais derrière... 1.
Les parties du corps By Haru Mehra Le Frehindi 1Haru Mehra, DELF, DALF,CFP.
Transcription de la présentation:

Maxime Lefrançois, Fabien Gandon, Alain Giboin TOTh’2014, 12/06/2014 Méthodologie d’ingénierie des connaissances pour la représentation des définitions lexicographiques dans le cadre de la théorie Sens-Texte Maxime Lefrançois, Fabien Gandon, Alain Giboin Inria

Richesse de description Pourquoi étudier la Théorie Sens-Texte ? Approches en sémantique lexicale 1. Sémantique décompositionnelle 2. Sémantique componentielle 3. Sémantique relationnelle Richesse de description Besoin de formalisation Besoin de plus de couverture Besoin pour le TALN TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Le Dictionnaire Explicatif et Combinatoire (DEC) Postulats de base préciser qu’on en parlera du DEC - Différents niveaux de représentation - Des règles de transformation entre les niveaux Le lexique tient une place centrale Le Dictionnaire Explicatif et Combinatoire (DEC) TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Informatisation du DEC et DEC informatisé ex: éditeur DECID (Sérasset, 1997) TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Informatisation du DEC et DEC informatisé recherche intelligente d’information mise à jour et vérification automatique déduction logique paraphrasage déduction du premier ordre Ingénierie des connaissances représenter, manipuler, échanger, interroger, raisonner avec les connaissances,... TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Question de recherche et méthodologie Quel formalisme de représentation des connaissances serait adapté à la représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte ? « Formalisation de la conceptualisation d’un domaine » 1. La conceptualisation est-elle adaptée à une formalisation ? précise plus les étapes l’objet frontières 2. Quel formalisme est adapté à cette conceptualisation ? 3. Comment peut-on opérationnaliser ce formalisme ? TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Plan de la présentation 1. La conceptualisation est-elle adaptée à une formalisation ? 1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités pour le pdf 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

1.a. 1. La conceptualisation est-elle adaptée à une formalisation ? 1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Exemple d’extension de conceptualisation Langage : Types d’ (instances d’) Unités linguistiques & Usage : TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Introduction au DEC zone phonologique zone morphologique zone sémantique zone de combinatoire zone de stylistique, zone d’exemple, zone phraséologique, zone de nota bene 4 volumes papier = environ 500 entrées seulement principal sujet d’étude des linguistes de la Théorie Sens-Texte TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Zone sémantique du DEC > les définitions lexicographiques Travaux de conceptualisation existant choix des composantes selon les catégories d’unités lexicales (ex: sentiments) la structuration est importante pour le TAL (Wanner, MTT’ 2003) composantes suggérées par des étiquettes sémantiques symboles de PosASém choisies dans un petit ensemble (à la FrameNet) structuration en XML (projet Definiens) TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Zone sémantique du DEC > les définitions lexicographiques Conceptualisation espérée (dans la littérature): Degré de formalisation non atteint aujourd’hui TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Prédicats linguistiques Type d’unité lexicale Structure actancielle sémantique Type d’unité sémantique Positions actancielles TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Prédicats linguistiques Type d’unité lexicale Structure actancielle sémantique Type d’unité sémantique Positions actancielles TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Prédicats linguistiques Type d’unité lexicale Structure actancielle sémantique Type d’unité sémantique Structure actancielle = Extension de la conceptualisation TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Prédicats linguistiques Type d’unité lexicale Structure actancielle sémantique Type d’unité sémantique Structure actancielle = Positions actantielles sémantiques: = Les participants de la situation linguistique dénotée par L qui ont une position privilégiées auprès de L dans les phrases + critères linguistiques ! TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Prédicats linguistiques Type d’unité lexicale Structure actancielle sémantique Type d’unité sémantique Structure actancielle = TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

des structures actancielles ? Héritage du sens et spécialisation des structures actancielles ? TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

des structures actancielles ? Héritage du sens et spécialisation des structures actancielles ? contre-exemple 1. (outil) PosA 1 – personne qui utilise l’outil PosA 2 – une activité ou une profession (ciseaux) PosA 2 – l’objet à couper TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

des structures actancielles ? Héritage du sens et spécialisation des structures actancielles ? contre-exemple 2. (ustensile) PosA 1 – personne qui utilise l’ustensile PosA 2 – une activité (bouilloire) PosA 1 – personne qui utilise l’outil PosA 2 TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Le niveau Sémantique Profond préciser qu’on en parlera du DEC TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Le niveau Sémantique Profond introduction d’une notation /outil\ définition de la structure actancielle sémantique profonde choix des Symboles d’Actants: des rôles sémantiques lexicalisés introduction des positions actancielles interdites SémP SémS Héritage du sens et spécialisation des structures actancielles TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

1.b. 1. La conceptualisation est-elle adaptée à une formalisation ? 1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Définitions lexicographiques Application au projet RELIEF (Lux-Pogodalla et Polguère, WoLeR’2009) ? TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Repositionnement > 1. au niveau sémantique profond diapo pour animation TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Repositionnement > 2. au niveau du dictionnaire diapo pour animation TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Prototype d’éditeur de définitions lexicographiques avec la conceptualisation étendue TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Prototype d’éditeur de définitions lexicographiques avec la conceptualisation étendue TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Prototype d’éditeur de définitions lexicographiques avec la conceptualisation étendue TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Prototype d’éditeur de définitions lexicographiques avec la conceptualisation étendue Offre une première base de discussion essentielle Confirme les attentes des lexicographes pour un tel outil Permet d’identifier des directions d’amélioration possible TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

2.a. 1. La conceptualisation est-elle adaptée à une formalisation ? 1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Formalismes candidats Grammaires de dépendance Théorie Linguistique Sens-Texte 65 Graphes Conceptuels Web Sémantique & Logiques de description Critères de choix de (Gruber, 1995) clarté cohérence extensibilité minimalité de la déformation d’encodage minimalité de l’engagement ontologique Clarté - La dénition d'un concept doit faire passer le sens voulu du terme, de manière aussi objective que possible (indépendante du contexte). Une dénition doit de plus être complète (c'est-à-dire dénie par des conditions à la fois nécessaires et susantes). Cohérence ok hierarchie -- Rien qui ne puisse être inféré de l'ontologie ne doit entrer en contradiction avec les dénitions des concepts (y compris celles qui sont exprimées en langage naturel). Extensibilité.  monotonie -- Les extensions qui pourront être ajoutées à l'ontologie doivent être anticipées. Il doit être possible d'ajouter de nouveaux concepts sans avoir à toucher aux fondations de l'ontologie. Une déformation d'encodage a lieu lorsque la spécication inue sur la conceptualisation engagement ontologique - expressivité et complexité TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Le Formalisme des Graphes d’Unités un formalisme à base de graphes inspiré des Graphes Conceptuels construit pour la théorie Sens-Texte TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

2.b. 1. La conceptualisation est-elle adaptée à une formalisation ? 1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Hiérarchie des types d’unités > Objectif Un type d’unité hérite la structure actancielle de ses parents et peut la spécialiser PosA optionnelle  obligatoire PosA optionnelle  interdite spécialisation des signatures TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Hiérarchie des types d’unités > Solution: types primitifs d’unités Pour un symbole d’actant s le radix de s introduit une PosA s l’obligat de s rend la PosA s obligatoire le prohibet de s rend la PosA s interdite hiérarchie des types primitifs = superposition intriquée de telles structures TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Graphes d’Unités TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Règles de graphes d’unités une hypothèse une conclusion des nœuds frontière TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Définitions de types d’unités = deux règles contraposées TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

3.a. 1. La conceptualisation est-elle adaptée à une formalisation ? 1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Objectifs du raisonnement Critères de choix de (Gruber, 1995) clarté cohérence extensibilité minimalité de la déformation d’encodage minimalité de l’engagement ontologique ? Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST TOTh'2014

Théorie des modèles & Algèbre relationnelle Sémantique logique Théorie des modèles & Algèbre relationnelle G implique H = pour tout modèle M qui satisfait G, il existe un modèle qui satisfait H Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST TOTh'2014

H peut être projeté sur un graphe d’unité dérivé de G Déduction logique Règles d’inférence & Dérivation logique H peut être déduit de G = H peut être projeté sur un graphe d’unité dérivé de G Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST TOTh'2014

Décidabilité de la déduction logique Condition suffisante: Expansion finie des conditions d’acyclicité sur la hiérarchie des types d’unités sur les définitions lexicographiques Les lexicographes de la Théorie Sens-Texte s’imposaient déjà ces conditions par intuition Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST TOTh'2014

3.b. 1. La conceptualisation est-elle adaptée à une formalisation ? 1.a. Conceptualisation des prédicats linguistiques 1.b. Conceptualisation des représentations linguistiques et des définitions lexicographiques 2. Quel formalisme est adapté à cette conceptualisation ? 2.a. Formalismes existants 2.b. Construction du formalisme des Graphes d’Unités 3. Comment peut-on opérationnaliser ce formalisme ? 3.a. Etude du raisonnement logique 3.b. Opérationnalisation sur le web des données t TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Standards du web sémantique Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST TOTh'2014

Modèle: OWL 2 RL, deux modèles différents, mais interopérables Alignement avec ontolex Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST TOTh'2014

Conclusions Théorie Sens-Texte Ingénierie des connaissances représenter, manipuler, échanger, interroger, raisonner avec les connaissances,... TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Conclusions Conceptualisation Représentation Opérationnalisation t TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST

Perspectives Choisir le formalisme Le Peupler L’Appliquer t Conceptualisation Représentation Opérationnalisation t TOTh'2014 Lefrançois, Gandon, Giboin – Méthodologie d’ingénierie des connaissances pour la TST