La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Journée Atala 1er Décembre 20071 Caroline Lavecchia, Kamel Smaïli et David Langlois LORIA / Groupe Parole, Vandoeuvre-Lès-Nancy, France Les Triggers inter-langues.

Présentations similaires


Présentation au sujet: "Journée Atala 1er Décembre 20071 Caroline Lavecchia, Kamel Smaïli et David Langlois LORIA / Groupe Parole, Vandoeuvre-Lès-Nancy, France Les Triggers inter-langues."— Transcription de la présentation:

1 Journée Atala 1er Décembre Caroline Lavecchia, Kamel Smaïli et David Langlois LORIA / Groupe Parole, Vandoeuvre-Lès-Nancy, France Les Triggers inter-langues pour la Traduction Automatique

2 Journée Atala 1er Décembre Plan Positionnement en Traduction Automatique Nouvelle approche : les triggers inter-langues Mise en œuvre des triggers inter-langues : Construction et évaluation dun dictionnaire bilingue Français-Anglais Construction et évaluation dune table de Traduction dédiée à la traduction automatique Conclusion et Perspectives

3 Journée Atala 1er Décembre Signal de Parole Système de Reconnaissance de la Parole Système de Synthèse de la Parole Signal de Parole Module de Traduction Automatique Langue source Langue cible Phrase Source Phrase Cible Description dun système de traduction Parole-Parole La traduction automatique statistique Les modèles dIBM Positionnement en Traduction Automatique Un système de traduction Parole-Parole :

4 Journée Atala 1er Décembre t* = argmax t P(t|s) t* = argmax t P(t) * P(s|t) Approche du canal bruité Trouver la meilleure phrase cible t* sachant la phrase source s Modèle de Langage Modèle de Traduction Description dun système de traduction Parole-Parole La traduction automatique statistique Les modèles dIBM Positionnement en Traduction Automatique But de la traduction automatique statistique :

5 Journée Atala 1er Décembre Corpus parallèles alignés Apprentissage du modèle de traduction Table de Traduction Décodeur Modèle de Langage « Phrase Source »« Phrase Cible » P(s i /t j ) s i,t j Є Vocabulaires Description dun système de traduction Parole-Parole La traduction automatique statistique Les modèles dIBM Positionnement en Traduction Automatique Procédé :

6 Journée Atala 1er Décembre Le chat est gris Je vous en prie entrez Never ever take your eye off the ball Encore du poisson pour le dîner The cat is grey Please come in Jamais tu ne quittes la balle des yeux Fish for supper again Corpus SourceCorpus Cible Exemple de corpus parallèles alignés : Description dun système de traduction Parole-Parole La traduction automatique statistique Les modèles dIBM Positionnement en Traduction Automatique

7 Journée Atala 1er Décembre Les modèles d IBM (Brown et al, 1993) P(s|t) = a P(s, a|t) Avec a, un alignement possible entre la phrase source s et la phrase cible t Modèle 1 : tous les alignements sont équiprobables Modèle 2 : introduction de probabilités dalignement Nombre conséquent de paramètres à estimer Modèles complexes et coûteux EGYPT(Al-Onaizan, 1999 ), GIZA++ (Och, 2003) Apprentissage des modèles de traduction : Description dun système de traduction Parole-Parole La traduction automatique statistique Les modèles dIBM Positionnement en Traduction Automatique

8 Journée Atala 1er Décembre Boris Kasparov is a chess champion Triggers classiques intra-langues calculés à partir de l Information Mutuelle (Kim et Khudanpur, 2004) Rappel sur les triggers : Le concept de triggers inter-langues Construction dun dictionnaire bilingue Construction dune table de traduction Nouvelle approche: les triggers inter-langues Combinaison avec des modèles n-grammes en modélisation du langage

9 Journée Atala 1er Décembre Le concept de triggers inter-langues Construction dun dictionnaire bilingue Construction dune table de traduction Nouvelle approche: les triggers inter-langues Les triggers inter-langues : Pour chaque couple de mots (mot_source, mot_cible) et chaque paire k du corpus parallèle, calcul dune IM partielle : Pour chaque couple de mots (mot_source, mot_cible), calcul dune IM globale sur toutes les S paires du corpus :

10 Journée Atala 1er Décembre Boris Kasparov is a chess champion | Boris Kasparov est un champion déchecs Les triggers inter-langues : Pour chaque mot source, nous gardons comme triggers inter-langues, les n meilleurs mots cibles suivant la valeur de lIM globale. Le concept de triggers inter-langues Construction dun dictionnaire bilingue Construction dune table de traduction Nouvelle approche: les triggers inter-langues Triggers intra-langues Triggers inter-langues

11 Journée Atala 1er Décembre Trigger(e i ) : lensemble des mots déclenchés par e i Trigger(f j ) : lensemble des mots déclenchés par f j Si f j Є Trigger(e i ) et si e i Є Trigger(f j ) alors ajout de lentrée f j : e i dans le dictionnaire A chaque mot sont associées ses p meilleures traductions possibles suivant l IM Le concept de triggers inter-langues Construction dun dictionnaire bilingue Construction dune table de traduction Nouvelle approche: les triggers inter-langues Méthode de construction du dictionnaire bilingue : f j : échecs e i : chess Échecs : chess Dictionnaire f j Є Trigger(e i ) e i Є Trigger(f j ) f j : e i

12 Journée Atala 1er Décembre Les données Extrait des actes du Parlement Européen (Koehn, 2005) paires de phrases Français-Anglais Vocabulaires : –19588 mots anglais les plus fréquents –26811 mots français les plus fréquents – e i, f j Є Vocabulaires, génération des 10 meilleurs triggers anglais et des 10 meilleurs triggers français selon l IM Apprentissage : Le concept de triggers inter-langues Construction dun dictionnaire bilingue Construction dune table de traduction Nouvelle approche: les triggers inter-langues

13 Journée Atala 1er Décembre Exemples de triggers générés : Mots anglaisMots français déclenchésIM globale Cooperation Coopération38 Collaboration7 Développement6 Difficulty Difficulté1.5 Difficultés0.9 Problème0.5 Disciplines 0.22 Règles0.07 investissements0.06 Mots françaisMots anglais déclenchésIM globale Coopération Cooperation38 Development7 countries6 Difficulté Difficulty1.5 Difficulties0.9 Difficult0.5 Disciplines 0.22 New0.07 Different0.06 Le concept de triggers inter-langues Construction dun dictionnaire bilingue Construction dune table de traduction Nouvelle approche: les triggers inter-langues Triggers inter-langues Ang-Fr Triggers inter-langues Fr-Ang

14 Journée Atala 1er Décembre Dictionnaire Anglais/Français Dictionnaire Français/Anglais Extraits des dictionnaires bilingues obtenus : Mots anglaisTraductions possibles FishPêchePêcheursPoissons FishermanPêcheurPêcheursPêche FlagPavillonDrapeauNavires Flexible SoupleTravail FoodsAlimentairesAlimentaireProduits GenderFemmesHommesGenre HenceforthDésormaisDorénavantDès Mots françaisTraductions possibles HumideWetlandWetRainforest Humble OpinionModest MécaniquementAutomaticallySystematicallyNecessarily MéconnaissanceIgnoranceLackKnwoledge Royal FamilyNavy SonnetteAlarmSoundBells UrgenceUrgentUrgencyemergency Le concept de triggers inter-langues Construction dun dictionnaire bilingue Construction dune table de traduction Nouvelle approche: les triggers inter-langues Dictionnaire inter-langues Ang-Fr Dictionnaire inter-langues Fr-Ang

15 Journée Atala 1er Décembre Comparaison de notre dictionnaire automatique Français-Anglais TrigDic avec deux dictionnaires existants : –Un dictionnaire distribué par ELRA de entrées françaises ( dont se retrouvent dans notre vocabulaire français) –Un dictionnaire du projet XDXF de entrées (dont se retrouvent dans notre vocabulaire français) Évaluation du dictionnaire Français-Anglais : Le concept de triggers inter-langues Construction dun dictionnaire bilingue Construction dune table de traduction Nouvelle approche: les triggers inter-langues

16 Journée Atala 1er Décembre Test ATest B ELRA53%68% XDXF41%49% Le concept de triggers inter-langues Construction dun dictionnaire bilingue Construction dune table de traduction Nouvelle approche: les triggers inter-langues Résultats en terme de Rappel : Rappel = Nombre de mots français correctement traduits dans TrigDic Nombre de mots français en commun avec ELRA ou XDXF Pour chaque entrée française de notre dictionnaire automatique: Test A : seule la meilleure traduction possible est prise en compte Test B : ses 5 meilleures traductions possibles sont prises en compte

17 Journée Atala 1er Décembre Mot FrançaisTraduction proposée par ELRATraductions à partir des triggers ChevauxHorsefleshorses, animals, horse ChimèreBubbleillusion, fantasy, dream, fancy DéléguéeDeputydelegated, united, delegate Analyse et perspectives : Analyse : Seulement 5 traductions possibles par mot Certaines traductions possibles dans TrigDic sont pertinentes mais napparaissent pas dans le dictionnaire ELRA Les traductions proposées par le dictionnaire ELRA ne sont pas toujours très courantes Perspectives : Augmenter le nombre de traductions possibles dans TrigDic Comparer TrigDic à un dictionnaire construit manuellement Le concept de triggers inter-langues Construction dun dictionnaire bilingue Construction dune table de traduction Nouvelle approche: les triggers inter-langues

18 Journée Atala 1er Décembre Le concept de triggers inter-langues Construction dun dictionnaire bilingue Construction dune table de traduction Nouvelle approche: les triggers inter-langues Du dictionnaire bilingue à la table de traduction : Dictionnaire TrigDic f Є Vocabulaire, f : e 1 (IM G (f,e 1 )), … e p (IM G (f,e p )) Table de traduction TrigDic f Є Vocabulaire, P(e 1 |f) =, …, P(e p |f) = efIM G (f,e)P(e/f) CooperationCoopération DevelopmentCoopération60.11 CountriesCoopération50.10 AgreementCoopération30.06 IM G (f, e 1 ) IM G (f, e i ) j=1 …p IM G (f, e p ) IM G (f, e i ) j=1 …p

19 Journée Atala 1er Décembre Le concept de triggers inter-langues Construction dun dictionnaire bilingue Construction dune table de traduction Nouvelle approche: les triggers inter-langues Évaluation de la table de traduction TrigDic : Intégration dans un module de traduction automatique Anglais vers Français Table de Traduction Décodeur Modèle de Langage Français phrases Anglaises Table de traduction TrigDic Table de traduction générée à laide de Giza traductions candidates Modèle trigramme BLEU Pharaoh (Koehn, 2004)

20 Journée Atala 1er Décembre Le concept de triggers inter-langues Construction dun dictionnaire bilingue Construction dune table de traduction Nouvelle approche: les triggers inter-langues Évaluation de la table de traduction TrigDic : Comparaison en terme de score BLEU ( Papineni, 2002) Entre les traductions références et les traductions produites par Pharaoh avec la table de traduction TrigDic Entre les traductions références et les traductions produites par Pharaoh avec la table de traduction générée par loutil Giza++ avec le modèle 2 dIBM (G) T 1 : 10 meilleurs triggers Fr-Ang, 10 meilleurs triggers Ang-Fr, 5 meilleures traductions probables pour chaque mot f du Vocabulaire Traductions CandidatesBleu T1T G0.24

21 Journée Atala 1er Décembre Le concept de triggers inter-langues Construction dun dictionnaire bilingue Construction dune table de traduction Nouvelle approche: les triggers inter-langues Améliorations apportées : T 2 : 50 meilleurs triggers Fr-Ang, 50 meilleurs triggers Ang-Fr, 10 traductions probables pour chaque mot Français f du vocabulaire T 3 : T 2 + ajout dune probabilité P(null | f) pour chaque mot Français f du vocabulaire Traductions CandidatesBleu T1T T2T T3T G0.24

22 Journée Atala 1er Décembre Comparaison des tables de traduction pour le mot Français Coopération Le concept de triggers inter-langues Construction dun dictionnaire bilingue Construction dune table de traduction Nouvelle approche: les triggers inter-langues Comparaison TrigDic-Giza++ : eP(e/f) Cooperation0.73 Development0.11 Countries0.10 Agreement0.06 eP(e/f) Cooperation0.87 Co-operation0.04 Collaboration0.008 Together0.008 Cooperate0.012 eP(e/f) Cooperation0,59 Development0,10 Countries0,08 Agreement0,05 International0,04 Area0.03 Co-operation0.03 Regional0.03 Framework0.03 Through0.03 Modèle 2 dIBM T1T1 T2T2 654 traductions probables pour Coopération avec le modèle 2 dIBM

23 Journée Atala 1er Décembre Conclusion et perspectivesConclusion Conclusion : Résultats encourageants Les triggers inter-langues permettent de construire une table de traduction appropriée pour la traduction automatique Résultats en terme de BLEU proches de ceux des méthodes classiquement utilisées Modèles dIBM : complexes, calculs itératifs longs Triggers inter-langues : simple (une seule itération) et rapide à mettre en œuvre Travaux sur des corpus de sous-titres Meilleures performances que le modèle 3 dIBM

24 Journée Atala 1er Décembre Conclusion et perspectivesConclusion Perspectives : Traduction automatique basée sur les séquences Triggers de séquences (plusieurs mots déclenchent plusieurs mots) Mise en place de triggers de traits Singulier déclenche Singulier Adj-Nom en Anglais déclenche Nom-Adj en Français Will en Anglais déclenche verbe futur en Français Etc … Mise en place dun décodeur dédié aux triggers (en cours de test)


Télécharger ppt "Journée Atala 1er Décembre 20071 Caroline Lavecchia, Kamel Smaïli et David Langlois LORIA / Groupe Parole, Vandoeuvre-Lès-Nancy, France Les Triggers inter-langues."

Présentations similaires


Annonces Google