Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la- Vallée
Sommaire Règles de priorité entre analyses Dépendances entre analyses Règles-exceptions Dépendances entre règles Chevauchements Indépendance double : le système Elag
Rappel : indépendance double Comment assurer que la construction de la grammaire peut être monotone ? Indépendance des analyses et des règles LAL ((a i ) 1 i m, (r j ) 1 j n ) = 1 j n 1 i m LAL (a i, r j ) a LAL ((a i ) 1 i m, (r j ) 1 j n ) j [1, n] a LAL (a, r j )
Indépendance double Réalisation par le système Elag : - chaque règle = un automate qui représente l'ensemble des séquences conformes à la règle - grammaire = intersection des règles - LAL(T, G) = T G Interface utilisateur : - format utilisateur lisible - format compilé prêt pour intersection
Format utilisateur de grammaires Elag (1/6) Pour chaque règle Format utilisateur Lisible pour la construction et la maintenance manuelles Format compilé Un automate qui représente l'ensemble des séquences conformes à la règle, prêt pour intersection
Format utilisateur de grammaires Elag (2/6) l'un comme maître, l'autre comme domestique un,.A:msLa République est une Supprimer l'analyse après
Format utilisateur de grammaires Elag (3/6) Supprimer toutes les analyses qui comportent une partie s 1 suivie d'une partie s 2 s1s1 s2s2
Format utilisateur de grammaires Elag (4/6) Dans les règles de ce type, - les parties s 1 et s 2 peuvent être aussi complexes que nécessaire - peu importe où on place la séparation entre s 1 et s 2 - les marqueurs ne servent à rien s1s1 s2s2
Format utilisateur de grammaires Elag (5/6) le Reform club de Londres de,.DET+Dind:mp:fpDe grands arbres entourent le parc Cette analyse seulement devant s1s1 s2s2 a1a1 a2a2
Format utilisateur de grammaires Elag (6/6) Supprimer les analyses dans lesquelles un s 1 n'est pas suivi d'un a 2 Les marqueurs et servent à identifier et délimiter s 1 et a 2 s1s1 s2s2 a1a1 a2a2
Format général (1/2) Les marqueurs et servent à identifier et délimiter s 1, s 2, a 1 et a 2 Si une analyse contient un s 1 immédiatement suivi d'un s 2, le point de séparation entre s 1 et s 2 doit aussi être précédé d'un a 1 et suivi d'un a 2, sinon elle est supprimée s1s1 s2s2 a1a1 a2a2
Format général (2/2) Les marqueurs et servent à identifier et délimiter s 1, s 2, a 1 et a 2, etc. Si une analyse contient un s 1 immédiatement suivi d'un s 2, le point de séparation entre s 1 et s 2 doit aussi être précédé d'un a 1 et suivi d'un a 2 (ou précédé d'un b 1 et suivi d'un b 2, etc.), sinon elle est supprimée s1s1 s2s2 a1a1 a2a2
Exemple avec 3 parties non vides l'un des membres les plus singuliers plus,plaire.V:J1s:J2sJe lui plus dès le premier regard Supprimer l'analyse après, sauf... s1s1 s2s2 a1a1 a2a2
Quelques précautions (1/3) le Reform club de Londres de,.DET+Dind:mp:fpDe grands arbres entourent le parc Cette analyse seulement devant s1s1 s2s2
Quelques précautions (2/3) Attention au positionnement de la séparation entre s 1 et s 2 : si plusieurs variantes, la règle peut s'appliquer plusieurs fois au même endroit s1s1 s2s2
Quelques précautions (3/3) Ajouter des variantes de s 1 et s 2 augmente le nombre d'applications de la règle (donc la précision) Ajouter des variantes de a 1 et a 2 augmente le nombre d'analyses acceptées (la règle devient moins stricte)