Les ressources lexicales équipe ILPL IRIT: contenu et portabilité en syntaxe et sémantique Analyse, même partielle, génération (incrémentale), lexicalisation.

Slides:



Advertisements
Présentations similaires
MOT Éditeur de modèles de connaissances par objets typés
Advertisements

Les présentateurs doivent souvent transmettre des informations techniques à des auditeurs qui connaissent moins bien le sujet et le vocabulaire spécifique.
22 mai 2007 Clauvice Kenfack – Équipe MODEME
Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.
De linformation à la gestion des connaissances Introduction J. LINK-PEZET Dess SIAD Janvier 2001.
Sciences et technologies de gestion
Urbanisation de Systèmes d'Information
Compétences transversales : Résistances et leviers du travail en équipe Amael André Laboratoire CIVIIC.
UML - Présentation.
Exemple : Itinéraire de lecture.
Ontologie, Méta-données, Sémiotiques
Les méthodes formelles en ingénierie des connaissances Damien Lhomme-Desages Jérémie Barlet.
Understanding, building and using ontologies. Understanding Ontologie : la définition des concepts utilisés dans un langage donné Première approche (Gruber)
Technologie Collège Document d’accompagnement du programme de
Gestion de la persistance des objets
"Recherche de scénarios redoutés à partir d'un modèle réseau de Petri"
1 B Système Enjeux et principes Cours DESS Nantes 04 Décembre 2002 Didier ESSAME.
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
L’observation réfléchie de la langue au cycle 3
Initiation au système d’information et aux bases de données
1 ARCHITECTURE DACCÈS la méthode générale modèle de données définitions module daccès / modules métiers construction des modèles les modules daccès, les.
Le logiciel CMAP Tools : ce qu’il est, ses fonctionnalités
Monique THONNAT et Nathanaël ROTA Projet ORION
1- Accueil et introduction Cours MGP Accueil et introduction Gilles Corriveau Maîtrise en Gestion de Projet UQTR Automne 1998.
INTELLIGENCE COLLECTIVE : RENCONTRES 2006Nîmes mai 2006 CENTRE DE RECHERCHE LGI2P 1- Doctorante Ecole des mines de Paris, 2- Maitre de Conférences.
Pour un système formel de description linguistique
1 NEGOCIATION DUN ACCORD COLLECTIF NATIONAL SUR LA CLASSIFICATION DES POSTES ET SUR LES BAREMES DES REMUNERATIONS DE BASE Réunion du 3 octobre 2007.
La question de l’évaluation en économie - droit
Questions/problèmes Contraintes de départ… ressources, plateforme… utilisation de matériel existant –Pas de temps du prof pour préparer des exemples… concrets…
Algorithmique et Programmation
Initiation à la conception de systèmes d'information
Modélisation E/R des Données
Introduction à la conception de Bases de Données Relationnelles
TALN-RECITAL’13, 20 juin 2013, Sables d’Olonne
RDF(S)
SYSTEMES D’INFORMATION
LA COMPREHENSION EN LECTURE
LES FICHES POUR METTRE EN OEUVRE DES DISPOSITIFS D'AIDE ET DE SOUTIEN
Nouveaux programmes Éducation Musicale BO spécial août 2008
MOT Éditeur de modèles de connaissances par objets typés
Web sémantique : Web de demain
Management of Information Technology - e-business
Chapitre 3 Syntaxe et sémantique.
La trahison des images, René Magritte, 1929
Initiation à la conception des systèmes d'informations
Patrons de conceptions de créations
UN THESAURUS Pourquoi ? Pour qui ? Comment ?
L’ÉPREUVE COMPOSÉE.
Travaux Pratiques Représentation des connaissances
LRI-INRIA Saclay LRI- UMR CNRS Univ Paris-Sud et UR-INRIA Saclay 12 Equipes au LRI - 7 projets INRIA Equipe IASI-GEMO (IA et BD) « Gestion de données et.
Paradigmes des Langages de Programmation
Comment rédiger une proposition gagnante
Une pédagogie de l’activité pour développer des compétences transversales Claire Herviou Alain Taurisson Juin 2003.
Le formalisme utilisé pour Lexical Functional Grammar Lionel Clément Signes - Labri Mosaïque 1er décembre 2006.
Sémantique lexicale: quelques points de perspective. P. Saint-Dizier, CNRS - IRIT -Approche en sémantique lexicale: notions de sens, polysémie, représentation.
Institut Supérieur des Sciences Appliquées et de Technologie Sousse
Approches Formelles en Systèmes d'information
Algorithmes et Programmation
ÉPREUVES ÉCRITES D'ADMISSIBILITÉ bonne maîtrise des savoirs scientifiques, du programme du concours compréhension synthétique et cohérente des concepts.
François CARCENAC,Frédéric BONIOL ONERA-DTIM Zoubir MAMMERI IRIT
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
Du discours aux modèles… Une tentative d’articulation
Nouvelles Technologies Internet & Mobile
les compétences des élèves dans le domaine du vocabulaire
But : avoir un regard réflexif sur le métier d’enseignant
Progression/Programmation – Français (1/3)
Synthèse Thème 1 Enseignement des sciences, démarche expérimentale SESAMESMaths, ECCEMaths, Résolution collaborative, EXPRIME.
Les bases de données Séance 3 Construction du Modèle Conceptuel de Données.
Année Universitaire : 2013/2014 Réalisée par: Rahma DAIKHI Encadrants : M. Jean-Yves TIGLI M. Stéphane LAVIROTTE Au sein de : Laboratoire I3S, Equipe RAINBOW.
UQÀM DDL-8430 didactique de la grammaire Analyse de matériel didactique Nouvelle grammaire pratique : 2ème année du 1 er cycle du secondaire Myriam Laporte.
Transcription de la présentation:

Les ressources lexicales équipe ILPL IRIT: contenu et portabilité en syntaxe et sémantique Analyse, même partielle, génération (incrémentale), lexicalisation : toute la complexité du langage demeure: ambiguïtés, polysémie, conjonctions, référents, etc. Ressources prédicatives: complexité de leur syntaxe et de leur combinatoire avec des arguments: modèles pour la sous-détermination, la compositionalité. Représentation du sens avec granularité adéquate : niveau assez élaboré, emploi dun langage à base de primitives (LCS): pb des primitives, mais quelles alternatives ? LCS: information prédicative, à coupler avec dautres systèmes: traits, relations, séries (paradigmatique), etc.

La réutilisation Réutilisation: – grande difficulté à réutiliser des ressources (WN) ou des recommandations (EAGLES) existantes, –aléas de lacquisition automatique pour les verbes et les prépositions, –Une analyse de la notion de sens peut permettre de positionner différemment la notion de réutilisation des ressources, trop souvent de nature lexicographique..

Les ressources syntaxiques Introduction, pour le français, dun système dalternances comparable à celui de Beth Levin. Structures de base et 51 alternances, 1700 verbes usuels décrits. BD disponible. Alternances traitées au niveau lexical, comme des s/cats, mais possible de les ré-interpréter dans un autre cadre. Formes lexicalement induites, à différencier des mouvements grammaticaux. Famille dalternances: passifs, effacements, réfléchis, inversions objets + prépositions, formes supports, semi-aux faire, inchoatifs, incorporation, conatif, changement de perspective, etc… Normalisation avec Espagnol et Catalan. Contraintes dapplication, définition du sémantisme de ces constructions.

Structures thématiques Structure de sous-catégorisation + type de préposition pour les SP, Grille thématique définie à partir des 21 rôles définis dans léquipe. Rôles structurés: agents, thèmes, localisations, quantités, accompagnement, etc. La grille comprend plusieurs rôles par position argumentale, expression a priori, pouvant évoluer dans une proposition réelle. Contient, en plus, une classification WordNet. Réalisé aussi pour les prépositions du français.

Exemple verbe([aborder],2,[[ae],[pos]],[], [15],[50,140,141,162], [[9,2],[9,3,1],[9,4,3],[9,5,2],[9,8]]). Polysémie: verbe([abandonner],3,[[ae,src],[tg],[dest]], [a],[23],[50,51,61,102,162],[[13,2,1]]). verbe([abandonner],3,[[ae],[ti/th],[pos]], [type-loc],[24],[50,51,61,102,190], [[9,3,1],[9,8]]).

LCS et Sous-spécification Recevoir: sens direct: [event CAUSE([thing I ], [event GO+poss ([thing J ], [path FROM+poss ([thing I ], TO+poss ([thing K ])])] traitement des dérivés métaphoriques (psy, epist, …): D, [event CAUSE([thing I ], [event GO+D ([thing J ], [path FROM+D ([thing I ], TO+D ([thing K ])])] Aller: P: [path ] [event CAUSE([thing I ], [event GO+loc([thing I ], P ] Composition: rept verbe (rept PP)

Couper: A X I J [event CAUSE([thing I ] [event GO+A(X, [path FROM+A ([state Continuous ] TO+A ([state Discontinuous ] ) [manner ……. ])])] ) J = objet physique, A = loc, X = [thing J ] Choix par défaut J = communication, A = + comm, X = [thing FLOW-OF([thing J ]) ] J = ressource, A = +char+ident, X = [thing Availability-Of([thing J ])]

Introduction de données du lexique génératif Bon: nom A de type et de Qualia: [ …. Telic: T ….. ] Y :, fi T, [state BE+char+ident ([thing I ], [propertyAbility-to([Fi(Y, _ )] = high ])]) - Bien identifier la dénotation des champs sous-spécifiés. - en mesurer la complexité et lutilité. - définir lunification et la subsomption de ce type de structures pour le calcul.

Notion de sens Compromis entre la vision locale de la lexicographie et luniversalisme de lIA, Compromis entre précision, efficacité et pouvoir explicatif, Privilégier des systèmes à base de règles (simples) qui organisent la connaissance lexicale plutôt que des listes dusages, Pouvoir rendre compte des usages de base dun lexème, à travers une typologie de sens et des usages dérivés, au sein dun même sens, Déterminer un niveau de granularité qui puisse autoriser un niveau raisonnable dexpansion générative lexicale. Organisation des sens, hiérarchisée, via une observation directe et une connaissance du monde, Représentation formelle : attributs-valeurs, LCS, relations, etc. Généralisation sur classes de verbes et sous classes.

Prise en compte de préférences: indispensable en génération mais le début des difficultés Concepts lexicaux définis: - pas seulement par des critères mais par des info conceptuelles structurées par familles de ressemblances, - par des notions de protypicalité ou dimportance. Les mots polysémiques sont des catégories de sens reliés par des notions de ressemblance, largement métaphoriques (Lakoff, Nunberg, …) Liens entre sens: - relations de dérivation de sens claire entre les sens, principes généraux: métaphores, métonymies, généralisation, spécialisation (facettes), transformations imagées, - liés étymologiquement, ontogénétiquement de sens germes - stables sur une catégorie syntaxique.

Sémantique des prépositions, ex.: Contre 1. Localisation X [ place NEXT_TO +loc, +/-c ([ place/thing X])] Dans lespace (proximité / contact) Pousser le lit contre le mur. 2. Opposition X [ manner AGAINST +loc ([ event/thing X])] Nager contre le courant. 3. But - Protection / défense Un sirop contre la toux. X [event FOR +comm ([ event/thing X] 4. Echange X, Y [ path EXCH +poss ([ thing/event X]), ([ thing/event Y])] Jéchange mon entrée contre ton dessert. 5. Proportion / rapport 9 voix contre 12. X [ amount AGAINST +comm ([amount X])]

Quelques difficultés Influence des arguments sur la sémantique du prédicat: fragilité et variabilité de certains sens, Ambiguïtés des certains usages entre sens. Partager: -diviser, partager : gâteaux, ressources financières, etc. causalité marquée; mais: logement, ressources (entre programmes) -Avoir en commun: des responsabilités, des idées, des principes, pas de causalité marquée; mais ce qui est partagé lest plus ou moins. Totalement ambigu: partager un repas.

Restrictions de sélection sur les usages Pousser, sens2 = stimuler : sujet: elt. Psycho./attitude activité économique Humaincollectif humain objet psychologique institution Objet1attitude Humainprocédureobj. Physique objet financier fonction Partie de développe instance génère Crée, suit Gère, produit

Ontologies, Grammaires et Restrictions Organiser lontologie dun domaine, manuellement + qq outils, en général env. 100 à 250 termes, Tenter de les accrocher à une ontologie plus générique (EWN, …) Pour les termes complexes ou ayant plusieurs fonctions: facettes. Associer aux nœuds de catégories de lontologie des fragments de grammaires analysant ou générant des formes liées à cette catégorie dans un texte. Lontologie structure le domaine et en organise la grammaire..

Quelques notes…. Associer ontologies, grammaires, bases lexicales et représentation des connaissances du monde, dans un formalisme homogène Associer représentations et syntaxe, en analyse et en génération de LN Emploi dun langage (logique) avancé pour permettre le raisonnement et une certaine normalisation des représentations. Mise à disposition et intégration: -ouvert pour formalisation, si approprié en LD, -mise en forme pour les TAGs des alternances