Cours sur le traitement automatique des langues La sémantique (II) Violaine Prince Université de Montpellier 2 LIRMM-CNRS
Plan de l’exposé Les Graphes Conceptuels Les limites imposées par la langue les problèmes lexicaux les problèmes syntagmatiques les problèmes phrastiques
Graphes conceptuels (Sowa 1984) 1. Introduction 2. Formalisme 3. Opérations sur les graphes conceptuels
Introduction La notion de cas sémantique (Fillmore 1968) identifier un ensemble restreint de cas sémantiques mettre en évidence les relations de sens entre les groupes nominaux et le verbe d'une phrase analogie entre cas syntaxique et cas sémantique représentation profonde de la phrase
Exemples (I) Jean ferme la porte. sujet syntaxique : Jean Jean : instigateur de l'action Le vent ferme la porte. sujet syntaxique : le vent le vent : instrument de l'action
Classification de Fillmore (71) AGENT : instigateur animé d'un événement CONTRE-AGENT : la force contre laquelle l'action est exécutée OBJET : l'entité qui bouge, change ou dont la position ou l'existence est en question PATIENT : l'entité qui reçoit, accepte ou subit les effets d'une action
Classification de Fillmore (71) (suite) RESULTAT: l'entité créée par l'action en question INSTRUMENT : le stimulus ou la cause physique de l'événement SOURCE : lieu de départ de quelque chose qui bouge BUT : lieu d'arrivée de quelque chose qui bouge
Formalisme des graphes conceptuels Définition : un graphe conceptuel deux types de nœuds concepts relations fini : un nombre fini de relations et de concepts dans un cerveau humain ou dans une mémoire d'ordinateur connexe : toute relation conceptuelle a un ou plusieurs arcs reliés à un concept un concept peut former à lui seul un graphe conceptuel
Exemple Le père de Paul lui achète un bureau métallique. Il l'a payé 3000F
Un réseau sémantique Un treillis de types le type universel T, supérieur à tous les autres types le type absurde , inférieur à tous les autres types une relation d'ordre partiel pour deux types un plus petit sur-type commun un plus grand sous-type commun
Un concept est un couple (type, référent). symbole référent : objet symbolique type: objet du treillis objet référé: objet du monde monde BC triangle aristotélicien simplifié Un concept est un couple (type, référent).
Exemple de treillis de types extrait de Sowa 1985
Les concepts(1) Les concepts génériques Les concepts individuels [CHAT] ou [CHAT : *] un chat Les concepts individuels [CHAT : #178] le chat, ce chat Les noms propres [CHAT : Félix] Félix Un ensemble générique [CHAT : {*} ] plusieurs chats
Les concepts(2) Un ensemble de cardinal spécifié Les mesures [CHAT : {*}@5 ] cinq chats Les mesures [LONGUEUR : @2 m] une longueur de 2 m Un ensemble défini en extension [CHAT : {Félix, Minou, Roxane}] Félix, Minou et Roxane Un ensemble partiellement spécifié [CHAT : {Félix, *}] Félix et d'autres
Les concepts(3) Les ensembles distributifs [HOMME : Dist {*} @ 3] Trois hommes Le reste du graphe doit être appliqué à chaque élément de l'ensemble. ex : Trois hommes lisent chacun deux livres.
Les concepts(4) Les ensembles respectifs [CHAT : Resp {Félix, Minou, Roxane}] Félix, Minou et Roxane Chaque élément de l'ensemble entretient une relation avec un élément d'un autre ensemble ordonné. ex : Félix, Minou et Roxane appartiennent respectivement à Paul, Pierre et Jacques.
Les bases de connaissances Le lexique Le treillis des types Les relations conceptuelles Les graphes canoniques
Le lexique Mise en relation mots-concepts un : article indéfini, pas de concept être : verbe ,pas de concept livre: nom commun, masc. sing.,LIVRE donner: verbe transitif , DONNER chaud : adjectif, masc., sing., CHAUD à : préposition, pas de concept
Les relations conceptuelles(1) agent (AGNT) relie [ACTION] à [ANIME] où le concept ANIME représente l'acteur de l'ACTION. « experienceur » (EXPR) relie [ETAT] à [ANIME] qui ressent cet état. exemple : Paul a froid.
Les relations conceptuelles(2) instrument (INST) relie [ENTITE] à [ACTION] dans laquelle l'entité est impliquée de manière causale. exemple : la clé ouvre la porte. clé = instrument objet (OBJ) relie [ACTION] à [ENTITE] sur laquelle porte l'action. exemple : le chat avale le canari.canari = objet)
Les graphes canoniques « Les graphes canoniques définissent des conditions d'emploi des concepts ou des possibilités de combinaisons de concepts. Ce sont les unités de sens qui définissent le contexte environnant des concepts. Les autres graphes seront dérivés à partir des graphes canoniques.
Exemples « DONNER < ACTION [DONNER]- (AGNT) -> [ANIME] (RCPT) -> [ANIME] (recipient =destinataire) (OBJ) -> [ENTITE] DIFFICILE < MANIERE [DIFFICILE]- (EXPR) -> [ANIME] (MANR) <- [ACTION] (manner = manière)
Exemples SAVOIR < ETAT [SAVOIR] - (EXPR) -> [ANIME] (STAT) -> [PROPOSITION] (stat = statement) ENSEIGNER < ACTION [ENSEIGNER] - (AGNT) -> [ANIME] (RCPT) -> [ANIME] (OBJ) -> [SUJET]
Exemples ENSEIGNANT < PERSONNE [ENSEIGNANT]- (AGNT) <- [ENSEIGNER]- (RCPT) -> [ANIME] (OBJ) -> [SUJET] .
Connaissances nécessaires pour traiter la phrase : « Les internes jugent important d’avoir la sympathie de la population. » Dictionnaire interne : n.c. , masc. INTERNE sympathie: n.c., fém. SYMPATHIE juger: verbe JUGER population: n.c., fém. POPULATION avoir: verbe aux pas de concept
Graphes canoniques avoir: verbe POSSEDER important: adj. IMPORTANT de: prep. pas de concept le, la: art. déf. pas de concept Graphes canoniques INTERNE < MEDECIN, ETUDIANT [INTERNE]- (AGNT) <- [PRATIQUER] - - (OBJ) -> [MEDECINE] - (LIEU) -> [HOPITAL]
JUGER < PENSER [JUGER] -. (AGNT) -> [PERSONNE] JUGER < PENSER [JUGER] - (AGNT) -> [PERSONNE] (OBJ) -> [PROPOSITION] SYMPATHIE < ETAT [SYMPATHIE] - (EXPR)-> [PERSONNE] (OBJ) -> [PERSONNE] IMPORTANT< CARACTERISTIQUE [IMPORTANT]<- (ATTR) <- [PROPOSITION]
Méthode rechercher les connaissances afférantes recomposer le sens : graphe résultat => graphe des connaissances de la phrase énoncée.
Connaissances afférentes La population a de la sympathie pour les internes [SYMPATHIE] - (EXPR) -> [POPULATION] (OBJ) -> [INTERNE] Les internes pratiquent la médecine à l'hôpital. [PRATIQUER] - (AGNT) -> [INTERNE] (OBJ) -> [MEDECINE] (LIEU) -> [HOPITAL]
Les internes jugent important une proposition. [JUGER] - Les internes jugent important une proposition. [JUGER] - (AGNT) -> [INTERNE] (OBJ) -> [PROPOSITION]- (ATTR) -> [IMPORTANT]
forme graphique recomposée
forme textuelle [JUGER] - (AGNT) -> [INTERNE] - (AGNT) <- [PRATIQUER] - (OBJ) -> [MEDECINE] (LIEU) -> [HOPITAL] (OBJ) -> [PROPOSITION : [ [SYMPATHIE] - (EXPR) -> [POPULATION] (OBJ) -> [INTERNE]] - (ATTR) -> [IMPORTANT]
Opérations sur les graphes conceptuels Copie Restriction Simplification Jointure jointure maximale jointure dirigée
Restriction Restreindre un concept d'un graphe restriction de type remplacer le type d'un concept par un sous-type [PERSONNE : Jules ] remplacé par [ENFANT : Jules] à condition que Jules soit un enfant. restriction de référence individualiser un concept générique [PERSONNE] remplacé par [PERSONNE : Jules]
Simplification Cette opération permet de simplifier les informations redondantes du graphe (utile éventuellement suite à une autre opération)
Jointure On part de deux graphes possédant un concept commun (même type et même référent). idée : joindre les deux graphes en partant de ce concept commun.
Jointure sur [FEMME : Marie]
Jointure maximale Restriction en cherchant pour chaque couple de concepts le plus grand sous-type commun Joindre sur un concept commun Simplifier les relations dupliquées
Connaissances et méthode :exemple Marie achète une robe en solde dans un grand magasin. Connaissances afférentes : Marie achète une robe dans un grand magasin. Marie achète des choses en solde. Recherche des graphes canoniques Opération de jointure maximale
Jointure maximale : exemple C1 C2
1ère étape: Restriction
2ème étape : Jointure sur [acheter]
3ème étape : Simplification
Difficultés Plusieurs graphes résultant de la jointure maximale Il peut produire des boucles.
un lion devient cannibale alors que le texte aurait pu être : le lion mange un animal.
Jointure dirigée On joint deux graphes G1 et G2 suivant la directive X+Y = Z. rechercher le concept C1 de G1 qui a l'étiquette X, rechercher le concept C2 de G2 qui a l'étiquette Y, vérifier que C1 < C2 sinon échec joindre G1 et G2 à partir de C1 attacher à C1 l'étiquette Z
Exemple Directive %X + %Y = %X
Exemple La jointure dirigée correspond bien à : le lion mange un animal.
Jointure dirigée Des analyseurs sémantiques dirigés par la syntaxe Directives pour passer d'un constituant à un constituant de rang supérieur.
Conclusion sur les graphes conceptuels Représentation des connaissances multi-modèle : treillis des types, treillis des relations, graphes canoniques, graphes résultants sémantique compositionnelle dénote la logique du premier ordre formalisme rigoureux Analyse sémantique dirigée par la syntaxe
Les limites imposées sur la langue Les problèmes lexicaux Les tropes Les tropes sont des figures de style. Le principal trope lexical est la métonymie La métonymie est une figure « économique » où l ’on désigne la partie pour le tout, l ’instrument pour l ’agent, le lieu pour l ’entité, etc. Exemple de trope : si on allait boire un verre Paris a téléphoné.
En terme de graphes conceptuels, la métonymie viole les contraintes sémantiques. Ex: Paris : [LIEU] [TELEPHONER] (AGNT) -> [PERSONNE] (OBJ)->[PERSONNE] (INST)->[TELEPHONE] (LIEU)->[LIEU] Paris n ’est pas une sorte de personne.
Problèmes lexicaux (suite) La polysémie La polysémie est la capacité d ’un même mot à avoir plusieurs sens. On distingue cependant la polysémie de l ’homographie : deux mots s ’écrivant de la même manière exemple : ferme (bâtiment) ferme (adjectif) l ’homophonie : deux mots qui se prononcent de la même manière exemple : la voie et la voix
La polysémie Il existe des homographes homophones que l ’on hésite à appeler polysèmes, parce qu ’ils n ’ont rien à voir sémantiquement entre eux avocat (homme) et avocat (fruit) charme (arbre) et charme (enchantement) on appellera polysèmes, des mots ayant plusieurs sens, mais tels que ces sens sont liés entre eux, même de façon lointaine.
La polysémie Il existe plusieurs types de polysémie. La polysémie fonctionnelle les sens diffèrent par la fonction attribuée, ou le cas sémantique considéré exemple : l ’élection du président aura lieu demain (processus électif) l ’élection du président américain a été controversée (résultat du processus électif) La polysémie d ’acception le mot désigne des champs sémantiques différents, mais pouvant avoir été reliés dans le monde
maison famille bâtiment entreprise Exemple : la maison des Habsbourg a longtemps régné sur l ’Autriche (famille) la maison de Pierre est près de la gare (bâtiment) C ’est une très bonne maison de couture (entreprise) maison famille bâtiment entreprise
En terme de graphes conceptuels, la polysémie introduit : la multiplication des graphes la multiplication des concepts élection-1 : processus élection-2 : résultat maison-1: bâtiment etc. mais aussi la violation de certaines contraintes syntaxiques sur lesquelles l ’analyse par GC est fondée
Exemple : c ’est un gâteau maison. une solution pour résoudre le problème est de remplacer le mot par un autre mot, très différent, ayant les bonnes contraintes ou par une expression complète. nom commun en position adjectif
Système GLACE (Prince 1991, 1997) polysémie d ’acception ne pas multiplier les graphes et les concepts mais remplacer par un candidat ayant les bonnes propriétés: C ’est une très bonne maison de couture C ’est une très bonne entreprise de couture une expression restituant l ’intégrité du graphe C ’est un gâteau maison C ’est un gâteau fait à la maison critère discriminant [SAVOIR_FAIRE]
Pompe : faste chaussures appareil lieu extension par lien métonymique polysémie fonctionnelle extension par lien de spécialisation polysémie fonctionnelle station d ’essence exercice physique schéma : STATION + ESSENCE
Les limites imposées sur la langue (suite) Les problèmes syntagmatiques un syntagme est un ensemble de mots qui : a une fonction grammaticale donnée syntagme verbal syntagme nominal Exemple : le petit chat <syntagme nominal, groupe sujet> lape <syntagme verbal> son lait <syntagme nominal, groupe objet>
les problèmes Les syntagmes N de N peuvent être des expressions figées moulin à prières pomme de terre Les prédicats verbaux peuvent ne jamais être complètement argumentés Je mange. Je mange des pommes de terre. Je mange des pommes de terre frites. Je mange une barquette de pommes de terre frites, dans ma cuisine, sur la table sale.
les problèmes (suite) Les verbes peuvent être éludés. Jean mange une pomme et Paul une mandarine. Les verbes peuvent avoir comme argument un autre verbe. je voudrais grandir. ou quelque chose qui a un statut d ’adjectif je mange biologique
Les problèmes phrastiques les graphes conceptuels reconnaissent un principe de compositionalité. Expression figées il tourne autour du pot Métaphores centrées sur le verbe il a dévoré le rayon de littérature russe Métaphores phrastiques (analogiques) la technologie est à la science ce que l ’écume est à la vague.
Les problèmes phrastiques (suite) Et ils relèvent d ’une dénotation de la logique des prédicats du premier ordre les verbes de la langue font figure de prédicat. Quid de phrases telles que il faut pouvoir prendre son temps je veux me faire refaire le nez je ne cesse de devoir dire et recommencer à dire la même chose.
Conclusion (provisoire) le modèle des GC est peut-être un des modèles, relevant du paradigme logique, les plus descriptifs Il reste cependant très en-dessous des subtilités de la langue comme il fait appel à un principe de compositionalité au niveau de la phrase, il élude malheureusement de nombreuses figures de style la langue est de toutes façon d ’ordre supérieur