La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Les applications évoluées (traduction automatique) nécessitent beaucoup d'informations lexicales : délimitation des mots composés, lemmes... Cela fait.

Présentations similaires


Présentation au sujet: "Les applications évoluées (traduction automatique) nécessitent beaucoup d'informations lexicales : délimitation des mots composés, lemmes... Cela fait."— Transcription de la présentation:

1 Les applications évoluées (traduction automatique) nécessitent beaucoup d'informations lexicales : délimitation des mots composés, lemmes... Cela fait augmenter la quantité d'ambiguïté lexicale Jeu de 15 étiquettes (catégories grammaticales) : 1,6 étiquette par mot simple Jeu de 1000 étiquettes (catégories grammaticales, traits flexionnels, délimitation des mots composés, lemmes) : 2,0 étiquettes par mot simple Systèmes de levée d'ambiguïté lexicale Levée d'ambiguïtés

2 Systèmes de levée d'ambiguïtés lexicales Etiquetage d'un texte par dictionnaire, puis application d'une grammaire de levée d'ambiguïtés lexicales Grammaire n règles Texte étiqueté m analyses Texte m' analyses Système de levée d'ambiguïtés lexicales

3 Systèmes de levée d'ambiguïtés lexicales Grammaire de levée d'ambiguïtés : n règles Texte : ensemble de m analyses ambResol(gramm, texte) texte Rappel : nb d'analyses retenues parmi les analyses correctes Précision : nb d'analyses correctes parmi les analyses retenues

4 Construction et maintenance manuelles Lisibilité règles simples, lisibles et compréhensibles Cumulativité impossibilité de perturber le fonctionnement des règles existantes quand on ajoute de nouvelles règles

5 Dépendances entre règles (1/2) Exemples non linguistiques pour commencer Exemple avec hiérarchie entre règles Les dépendances entre règles compliquent linterprétation et la mise à jour du système r 1 : supprimer les analyses qui comportent la séquence a b r 2 : ne pas supprimer les analyses qui comportent la séquence a b c Si r 2 sapplique, r 1 ne sapplique pas

6 Dépendances entre règles (2/2) Exemple avec chevauchement Une règle peut ainsi perturber son propre fonctionnement r 1 : supprimer les analyses qui comportent la séquence a b r 2 : supprimer les analyses qui comportent la séquence b c Si deux règles sont applicables à la même analyse avec une partie commune, seule la plus à gauche sapplique

7 Indépendance des règles (1/2) ambResol ((r i ) 1 i n, texte) = 1 i n ambResol (r i, texte) a ambResol ((r i ) 1 i n, texte) i [1, n] a ambResol (r i, texte) Les résultats ne peuvent pas dépendre de l'ordre d'application des règles Chaque règle sapplique au texte représenté avec toutes ses ambiguïtés Avantages - l'introduction de nouvelles règles ne modifie pas le fonctionnement des anciennes - si toutes les règles ont un rappel de 100 %, alors la grammaire aussi

8 Exemple linguistique r 1 : Tout mot immédiatement à gauche de -t-il, -t- elle ou -t-on est un verbe r 2 : voilà, revoilà peuvent apparaître immédiatement à gauche de -t-il Si r 2 sapplique, r 1 ne sapplique pas r 1 : Tout mot immédiatement à gauche de -t-elle ou -t-on est un verbe r 2 : Tout mot immédiatement à gauche de -t-il est soit un verbe, soit voilà ou revoilà On peut reformuler en deux règles indépendantes :

9 Dépendances entre analyses (1/4) Exemple avec priorité entre analyses 1a31a3 2b4 (autres trans.)(autres trans.) Synchronisation (pointillés verticaux) : états correspondant à un même point du texte

10 Dépendances entre analyses (2/4) Exemple avec condition portant sur une ambiguïté 1a31a3 4c6 2b52b5 (autres trans.)(autres trans.)

11 Dépendances entre analyses (3/4) Exemple avec condition portant sur une non-ambiguïté 1b2 qarqar (autres trans.)(autres tr.) Toute transition entrant dans un état r synchronisé avec 1 est étiquetée a

12 Dépendances entre analyses (4/4) Dans les exemples précédents, les conditions portent sur un ensemble danalyses, non sur une seule analyse Les règles ne sont pas utilisables pour d'autres types d'ambiguïtés (ex. : phonétiques), car les ensembles danalyses seraient différents Exemple : La chaîne freine la roue chaîne - chêne -... freine - frêne -... roue - roux -...

13 Indépendance des analyses (4/5) ambResol (gramm, (a j ) 1 j m ) = 1 j m ambResol (gramm, a j ) a ambResol (gramm, (a j ) 1 j m ) a ambResol (gramm, a) La propriété d'indépendance des analyses est une propriété du système de levée d'ambiguïtés (formalisme et règles), non une propriété des analyses

14 Exemple linguistique Dans toute séquence, toutes les ambiguïtés lexicales sont résolues en faveur du verbe avoir et du participe passé On peut reformuler en règles qui ont la propriété dindépendance des analyses, mais il faut partir des structures grammaticales qu'on veut éliminer : Nous les avions révisés immédiatement Les avions révisés repartent aussitôt Les avions lui font peur

15 Exemple avec ordre dapplication des règles (1/2) r 1 : b2b2 1a1a 3 r 2 : 4c4c d6d6 5 b r 1 puis r 2 : abd 1ad 2 c r 2 puis r 1 : acd

16 Exemple avec ordre dapplication des règles (2/2) Dans un système qui permet cet exemple, il y a nécessairement 1) des dépendances entre règles Quand on crée une nouvelle règle, si elle doit sappliquer avant les règles existantes, leur fonctionnement peut être perturbé 2) des dépendances entre analyses Chacune des deux règles définit une priorité entre analyses

17 Indépendance double ambResol ((r i ) 1 i n, (a j ) 1 j m ) = 1 i n 1 j m ambResol (r i, a j ) a ambResol ((r i ) 1 i n, (a j ) 1 j m ) i [1, n] a ambResol (r i, a) Réalisation par le système Elag : - chaque règle = un automate - grammaire = intersection des règles - ambResol(gramm, texte) = gramm texte Interface utilisateur : - format utilisateur lisible - format compilé prêt pour intersection

18 Exemples linguistiques Pronoms préverbaux et postverbaux en français (Ppv) Soit à gauche d'un verbe : Soit à droite (graphe analogue : Fais-le, Le fait-il ?)

19 Ambiguïtés avec d'autres pronoms elle,.PRO+PpvIL+z1:3fs elle,.PRO+Ton+z1:3f etc. Ambiguïtés avec d'autres catégories en,.PREP+z1 en,.PRO+PpvPR+z1 j,j.N:mp:ms je,.PRO+PpvIL+z1:1ms:1fs je,je.N:mp:ms la,.N+[Mus]+z1:ms:mp la,le.DET+Ddef+z1:fs la,le.PRO+PpvLE+z1:3fs leur,.DET+Dposs3p+z1:ms:fs leur,.PRO+Pposs3p+z1:ms:fs leur,.PRO+PpvLUI+z1:3mp:3fp etc.

20 On le véhicule d'ici à la place principale 1. Les règles ci-dessous ont-elles la propriété dindépendance des analyses ? 1.1. si un Ppv est ambigu avec un autre pronom et suivi d'un mot qui ne peut être quun verbe, ses ambiguïtés sont résolues en faveur du Ppv 1.2. si un Ppv est ambigu avec un autre pronom et précédé d'un mot qui ne peut être quun verbe et d'un trait d'union, ses ambiguïtés sont résolues en faveur du Ppv 1.3. si un mot qui peut être un Ppv est suivi d'un mot qui peut être un verbe, ses ambiguïtés sont résolues en faveur du Ppv 1.4. si un mot qui peut être un Ppv est précédé d'un mot qui peut être un verbe et d'un trait d'union, ses ambiguïtés sont résolues en faveur du Ppv

21 1.5. si lui est précédé de ne, les ambiguïtés lexicales de lui sont résolues en faveur du Ppv (la réponse à la question dépend de la formulation précise de la règle) 1.6. dans les analyses où leur est précédé de, les ambiguïtés lexicales de leur sont résolues en faveur du Ppv 1.7. dans les analyses où leur est précédé d'un trait d'union et de, les ambiguïtés lexicales de leur sont résolues en faveur du Ppv 2. En supposant que les règles ci-dessus sont indépendantes des autres règles de la grammaire ou qu'elles sont utilisées seules, ont-elles un rappel de 100 % ?


Télécharger ppt "Les applications évoluées (traduction automatique) nécessitent beaucoup d'informations lexicales : délimitation des mots composés, lemmes... Cela fait."

Présentations similaires


Annonces Google