Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la- Vallée.

Slides:



Advertisements
Présentations similaires
Commission locale de l'eau Réunion du 11 juillet 2011 "Bon état quantitatif" des eaux souterraines Proposition de définition formulée par le groupe d'experts.
Advertisements

Déductions logiques et calcul de représentations sémantiques Alain Lecomte UMR SFL Séminaire « Logique, Sémantique, Dialogue » - partie I.
Programme mercredi Modélisation ou comparatif des règlements par rapport a FEV 98 Eléments de sécurité essentiels des embarcations à mettre en évidence.
?...1…-13…( )…+…-… …-(-2)…-(5-7)…-2+6…? Boîte à outils :
Dans l'ouvrage PHONO qui vise le développement des compétences phonologiques des élèves de GS et CP, GOIGOUX - CEBE - PAOUR ont mis en oeuvre les principes.
Usage de la ponctuation
Classification et prédiction
DTD Sylvain Salvati
Tutoriel XSLT F. Sajous ERSS – 01/04/2005.
ACS et Séquences Comportementales en environnements non-markoviens
Chap 1 Grammaires et dérivations.
Les TABLEAUX Retour au menu principal.
Demandes de certificats en ligne Procédure de saisie en ligne simplifiée.
12 novembre 2012 Grégory Petit
Représentation fonctionnelle
(graphe fonctionnel de commande des étapes et transitions)
Initiation à la conception des systèmes d'informations
Éric Laporte Université Paris-Est Marne-la-Vallée
La Matériovigilance Des matériaux utilisés en cabinet dentaire (gestion du stock) Des matériaux prothétiques Des dispositifs médicaux De la stérilisation.
CONSTRUCTION MECANIQUE LES REGLES DE LA COTATION
Indices prosodiques caractérisant un style d'élocution et ses variantes individuelles MIDL nov 2004 Paris Jean-Sylvain Liénard Martine Adda-Decker.
Arbre Rouge Noir.
Programmation logique Démonstrateur automatique
Rénovation du baccalauréat professionnel Environnement Nucléaire Rapport détape.
28 novembre 2012 Grégory Petit
Bases de données lexicales
Algorithmique et Programmation
L’heure est venue, Donne un signe ! L’avenir transforme Le présent ! Défilement automatique.
Vers des composants TAL réutilisables
IFT313 Introduction aux langages formels Froduald Kabanza Département dinformatique Université de Sherbrooke Grammaires attribuées.
LIN 1720 DGD 10 Traits et règles phonologiques
Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la- Vallée.
Cours 7 Grammaires algébriques Constituants syntaxiques.
Les applications évoluées (traduction automatique) nécessitent beaucoup d'informations lexicales : délimitation des mots composés, lemmes... Cela fait.
OUTILEX Présentation des résultats
Outils pour le traitement des textes Commandes Unix pour traiter les ressources linguistiques Éric Laporte Université Paris-Est Marne-la- Vallée.
Outils pour le traitement des textes Commandes Unix pour traiter les ressources linguistiques Éric Laporte Université Paris-Est Marne-la- Vallée.
Réunion des SPOC SITRAN 23 février 2010
Chapitre 3 Syntaxe et sémantique.
Partie II Sémantique.
Sous-espaces vectoriels engendrés
Création et notation « questions ouvertes Licence 66 »
DOUBLE ALLUMAGE Objectifs :
Kampala, Uganda, June 2014 Documents d’Edition et de Révision Hiroshi Ota and Vijay Mauree ITU/TSB Forum de normalisation pour l'Afrique (Kampala,
Marc Bouissou, Guillaume Torrente, EDF
DUT dans l’espace européen Arrêté du 3 août 2005
Arbitrer c’est: Le code de jeu Les violations Règlement du ballon hors jeu Les appuis Règle du dribble Les règles des secondes Le retour en zone.
Regroupement du 20 janvier 2014 Syntaxe Wiki
Fabienne BUSSAC CALCUL LITTÉRAL – INITIATION AU TABLEUR 1. DÉFINITION
Travaux Pratiques de Physique
Le GRAFCET.
Introduction à l’informatique en gestion 1 Plan de la leçon Compagnon office Sections et Mise en page En-têtes et pieds de page Notes de bas.
AIMER c’est se donner corps et âme.
Algorithmes et Programmation
Activités mentales séquence 1 prêt. Question 1 En utilisant ( a + b) 2 = a 2 +2 x a x b + b 2 développez ( x + 3) 2 =
Activités mentales séquence 2 prêt. Question 1 En utilisant ( a + b) 2 = a 2 +2 x a x b + b 2 développez ( 5 + x) 2 =
Introduction Formalisation de GUST basée sur GUP (GUST = Grammaire d’Unification Sens-Texte, Kahane 2001) (GUP = Grammaire d’Unification Polarisée, Kahane.
Calcul littéral ( suite )
ISO 9001:2000 DOCUMENTATION DU SYSTEME QUALITE
Structures de données avancées : LH (Hachage linéaire) D. E ZEGOUR Institut National d ’Informatique.
Cours 12 Retour sur l ’examen L ’enseignement dans le cadre du travail de responsable au soutien pédagogique Mise en situation et application concrètes.
Module : Langage XML (21h)
Modélisation des documents: DTD et Schéma
Présentation du Guide du Maître
AFFI JC RAOUL Paris 19 Novembre CERTIFICATION.
SIT Disponibilités OT MASSIF DU SANCY MOD OP 000 – 216 REV 00 – MAJ le 01/09/2014.
24 octobre 2012 Grégory Petit
LOGIQUE ET PROGRAMMATION LOGIQUE
Séance 3 Le cahier des charges Le contenu du CdC Le cahier des charges doit comprendre : Une description globale de l’application attendue, La définition.
Contribution. Accueil Vous êtes actuellement connecté à votre espace de contribution de la médiathèque de l'Université Paris Descartes. Dans cette espace.
Transcription de la présentation:

Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la- Vallée

Sommaire Règles de priorité entre analyses Dépendances entre analyses Règles-exceptions Dépendances entre règles Chevauchements Indépendance double : le système Elag

Rappel : indépendance double Comment assurer que la construction de la grammaire peut être monotone ? Indépendance des analyses et des règles LAL ((a i ) 1 i m, (r j ) 1 j n ) = 1 j n 1 i m LAL (a i, r j ) a LAL ((a i ) 1 i m, (r j ) 1 j n ) j [1, n] a LAL (a, r j )

Indépendance double Réalisation par le système Elag : - chaque règle = un automate qui représente l'ensemble des séquences conformes à la règle - grammaire = intersection des règles - LAL(T, G) = T G Interface utilisateur : - format utilisateur lisible - format compilé prêt pour intersection

Format utilisateur de grammaires Elag (1/6) Pour chaque règle Format utilisateur Lisible pour la construction et la maintenance manuelles Format compilé Un automate qui représente l'ensemble des séquences conformes à la règle, prêt pour intersection

Format utilisateur de grammaires Elag (2/6) l'un comme maître, l'autre comme domestique un,.A:msLa République est une Supprimer l'analyse après

Format utilisateur de grammaires Elag (3/6) Supprimer toutes les analyses qui comportent une partie s 1 suivie d'une partie s 2 s1s1 s2s2

Format utilisateur de grammaires Elag (4/6) Dans les règles de ce type, - les parties s 1 et s 2 peuvent être aussi complexes que nécessaire - peu importe où on place la séparation entre s 1 et s 2 - les marqueurs ne servent à rien s1s1 s2s2

Format utilisateur de grammaires Elag (5/6) le Reform club de Londres de,.DET+Dind:mp:fpDe grands arbres entourent le parc Cette analyse seulement devant s1s1 s2s2 a1a1 a2a2

Format utilisateur de grammaires Elag (6/6) Supprimer les analyses dans lesquelles un s 1 n'est pas suivi d'un a 2 Les marqueurs et servent à identifier et délimiter s 1 et a 2 s1s1 s2s2 a1a1 a2a2

Format général (1/2) Les marqueurs et servent à identifier et délimiter s 1, s 2, a 1 et a 2 Si une analyse contient un s 1 immédiatement suivi d'un s 2, le point de séparation entre s 1 et s 2 doit aussi être précédé d'un a 1 et suivi d'un a 2, sinon elle est supprimée s1s1 s2s2 a1a1 a2a2

Format général (2/2) Les marqueurs et servent à identifier et délimiter s 1, s 2, a 1 et a 2, etc. Si une analyse contient un s 1 immédiatement suivi d'un s 2, le point de séparation entre s 1 et s 2 doit aussi être précédé d'un a 1 et suivi d'un a 2 (ou précédé d'un b 1 et suivi d'un b 2, etc.), sinon elle est supprimée s1s1 s2s2 a1a1 a2a2

Exemple avec 3 parties non vides l'un des membres les plus singuliers plus,plaire.V:J1s:J2sJe lui plus dès le premier regard Supprimer l'analyse après, sauf... s1s1 s2s2 a1a1 a2a2

Quelques précautions (1/3) le Reform club de Londres de,.DET+Dind:mp:fpDe grands arbres entourent le parc Cette analyse seulement devant s1s1 s2s2

Quelques précautions (2/3) Attention au positionnement de la séparation entre s 1 et s 2 : si plusieurs variantes, la règle peut s'appliquer plusieurs fois au même endroit s1s1 s2s2

Quelques précautions (3/3) Ajouter des variantes de s 1 et s 2 augmente le nombre d'applications de la règle (donc la précision) Ajouter des variantes de a 1 et a 2 augmente le nombre d'analyses acceptées (la règle devient moins stricte)