Formalisation de la temporalité en vietnamien pour la traduction automatique Nicolas Boffo Nicolas Boffo Directeurs de thèse : Jacques BRES (PRAXILING)

Slides:



Advertisements
Présentations similaires
Qu’est-ce que LingPro ? LingPro est la branche ingénierie linguistique de i-KM La collaboration i-KM / LingPro est le résultat d’un partenariat sous forme.
Advertisements

Constituer l’équipe HACCP (Etape 1)
Treuil IRD Abdelwahed FSSM-Marrakech
Sandrine Peraldi (ISIT) Jean-Philippe KOTOWICZ (INSA Rouen)
Olivier Kraif, Agnès Tutin LIDILEM
Introduction Pour concrétiser l’enseignement assisté par ordinateur
Urbanisation de Systèmes d'Information
TRAITEMENT AUTOMATIQUE DES LANGUES : LES PRINCIPAUX PROGRAMMES
SYSTRAN Un outil du TAL Victoria AUPERT Marjorie LORSUNG.
Par Aline Mahot et Charlyne Routier
Apprendre à lire.
Exemples de structures syntaxiques
ETAPES DE LA RECHERCHE DOCUMENTAIRE
1 7 Langues niveaux débutant à avancé. 2 Allemand.
La compréhension en lecture, J. Giasson
                                        République Algérienne Démocratique et Populaire Ministère de l’Enseignement Supérieur et de la Recherche Scientifique.
Structuration & Organisation de Données Complexes Workshop « Fouille de données complexes » Clermont-ferrand, 20 Janvier 2004 O. Boussaid, F. Masseglia.
Le développement & La conclusion
Aspects algorithmiques et procéduraux de l’élicitation des préférence pour l'aide multicritère à la décision Doctorant: Jun ZHENG Directeur de thèse: Prof.
La conjugaison Les Verbes.
De la lecture à la production et le retour à la lecture pour la compréhension du texte.
Bases de données lexicales
Introduction Développement Conclusion Autres éléments
Maîtriser Ariane 2.0 Module 5 Déroulement : Souhaiter la bienvenue
MODULE 19 INTRODUCTION AU DOMAINE CONSTITUTION DES GROUPES.
Discours explicatif.
Les applications évoluées (traduction automatique) nécessitent beaucoup d'informations lexicales : délimitation des mots composés, lemmes... Cela fait.
Date / references Systèmes Terre et Interarmées Projet OUTILEX Rapport détude final Octobre 2006.
Le Sémiographe Outil générique pour effectuer des opérations texte sens texte ou texte sens actions
Forum des Industries de la Langue, 17 mars 2010
Activité 6 : Les étapes d’une démarche de recherche efficace
Structure discriminante (analyse discriminante)
COLLÈGE BOURGET         Titre du laboratoire souligné         Par: Nom 1 Nom 2 Nom 3 20_         Travail présenté à: Mme Bussières Sciences et technologies.
Méthodologie pour la structuration semi- automatique d’un corpus lexicographique bilingue : le cas du dictionnaire français-kabyle Mahfoud MAHTOUT Université.
EXIGE Un avenir dans le web....
Implantation de Metalib : par où commencer? Les principales étapes de l’implantation à l’université de Montréal Marie-Josée Leboeuf 8 septembre 2006.
T . P . E Travaux Personnels Encadrés
Titre du document - 1 Votre projet (l’acronyme et un sous-titre définissant le projet en quelques mots) activités, logos des partenaires selon la chaîne.
1 Utilisez cette présentation PowerPoint dans le cadre d’un apprentissage autonome ou en guise d’intro- duction à la thématique d’un exposé. Introduction.
Le verbe Le verbe est un mot très important dans une phrase.
Human Knowledge La nouvelle génération de moteurs sémantiques.
Test d'hypothèse pour des proportions:
L’utilisation d’outils de traitement automatique de la langue naturelle dans le domaine de la terminologie: une voie d’optimisation de ressources 1.
Une structure à bien maîtriser.... Il faut TOUJOURS penser que l’on écrit pour un lecteur 1. Une introduction pour préparer et orienter le lecteur dans.
Discours/Présentation
Comment aborder la tâche?
Dominique LAURENT Patrick SEGUELA
Recherche d’information
T . P . E Travaux Personnels Encadrés
Cours MIAGE « Architectures Orientées Services »Henry Boccon-GibodCours MIAGE « Architectures Orientées Services »Henry Boccon-Gibod 1 Architectures Orientées.
La concordance des temps dans le passé FSF 4U. Les temps dans le passé Pour exprimer une action au passé, on peut utiliser : Le passé composé L’imparfait.
Services en Text Mining. Introduction : Qui est Mentis ? Mentis a été fondée en 2005 comme une société spin-off du Laboratoire d'I ntelligence Artificielle.
Poly Defense Soutenance de Projet de programmation oriEntee objet
JDD 2005 Utilisation et Constitution de Ressources Sémantiques pour la Recherche d'Informations Précises. Vincent Barbier, groupe LIR Langues, Information.
La recherche par sujet dans les bases de données Conception: Tatiana Usova Bibliothèque Saint-Jean Automne 2011 EDU F 235 – École et société: les enjeux.
Se repérer et organiser sa veille dans la recherche en éducation Module 2 « Maîtriser l’accès aux ressources scientifiques en éducation » Introduction.
Le Traitement Automatique des Langues (TAL)
Video.
Classification automatique des messages électroniques
M2204 – Gestion Projets Informatique
BIENVENUE TOUT LE MONDE au Module :
Progressivité de l’enseignement grammatical A partir d’un document rédigé par : - Claudine GARCIA-DEBANC - Véronique PAOLICCI - Nicole RAMIREZ - Pierre.
1.2 Le Management Stratégique Module 1: Introduction à la Stratégie d’Entreprise 1.2 Le Management Stratégique Il ne concerne pas seulement les DECISIONS.
Créer votre propre site Internet
Mémoire de fin d’études
Formation.
Moodle : usages pédagogiques (nov. 2014). Présentations ▪
1 4th International Conference on Arabic Language Processing, May 2–3, 2012, Rabat, Morocco Titre Mohamed El Amine ABDERRAHIM Mohamed Alaedine ABDERRAHIM.
1 Mise en correspondance des données Sandre et Covadis avec les thèmes d’Inspire A.FATIHI GIGE Vincennes, le 04/06/2013.
Situation d’apprentissage Suggestions d’achats pour la bibliothèque Langue et culture – FRA-P106-4 Document de l’élève Centre Louis-Jolliet 1201, rue de.
Transcription de la présentation:

Formalisation de la temporalité en vietnamien pour la traduction automatique Nicolas Boffo Nicolas Boffo Directeurs de thèse : Jacques BRES (PRAXILING) - Eric CASTELLI (MICA) Sujet de thèse Création d’un dictionnaire vietnamien/français des marqueurs temporels (MT) 1.Recherche des marqueurs Recherche sur l’ensemble de la bibliographie linguistique vietnamienne et française. Recherche avec le système de traduction automatique (utilisation de « phrase-table » et des scores de probabilités obtenus). Recherche d’équivalences à partir des marqueurs temporels français. Recherche à partir des dictionnaires vietnamien/français, français/vietnamien, vietnamien/vietnamien. 2.Traduction des marqueurs temporels vietnamiens Pour 1 entrée nous proposons différentes traductions en français de ces marqueurs. Ex: {bao_giờ} 3.Classification par catégories lexicales Première classification effectuée avec l’aide de la linguiste Trần Kim Phượng. Travaux de la première année Travaux de la première année PRAXILING PRAXILING  Mise a jour du dictionnaire des marqueurs temporels vietnamien/français.  Poursuite de l’étiquetage Aspectuo-temporel.  Traitement de la temporalité en vietnamien: SdT de Gosselin et/ou S-Langages de Schwer? ( avec utilisation du VnTagger et Vntokenizer de Lê Hồng Phương ) + création de règles de temporalité.  Développement d’un module « traitement de temporalité » (entités nommées temporelles) pour NOOJ en vietnamien. Travaux en cours Dictionnaire disponible à la rubrique « documents » sur : Notre projet de recherche concerne la formalisation du temps et de l’aspect en vietnamien avec une mise en place d’étapes (lexico-syntaxique, sémantique, formalisation du temps et de l’aspect : étape pragmatique/praxématique) dans le traitement automatique de la temporalité en vue de la traduction automatique. Le traitement automatique de la temporalité en vietnamien en est à ses débuts. De ce fait, notre tâche s’avère complexe puisque les outils de TAL sont rares et peu performants, et les ressources lexicales et sémantiques manquent de précision. Par contre nous avons une bibliographie linguistique assez complète qui traite de la temporalité en vietnamien. Pour surmonter les difficultés du traitement temporel et avancer dans notre tâche nous avons été amenés à développer certaines étapes du traitement simultanément. Enfin nous envisageons de créer un outil de calcul et de traduction automatique des relations temporelles qui aura une importance décisive pour le traitement automatique de la langue vietnamienne (TA, TAO, résumé automatique, compréhension automatique, recherche d’entités nommées,…). Mots clés: Formalisation, temporalité, temps et aspect, annotation temporelle, Traitement Automatique des Langues, traduction automatique, langue vietnamienne. MICA Classification disponible à la rubrique « documents » sur : Etiquetage des marqueurs temporels 1. Etiquetage en valeur de Temps et d’Aspect Exemple: Hôm qua đangxemreo Hôm qua khi tôi đang xem phim thì điên thoại reo. Etiquetage avec le vnTagger de Lê Hồng Phương : Hôm qua khi tôi đang xem phim thì điên thoại reo. Introduction d’étiquettes temporelles: Hôm qua... đang … Etiquettes: temps Passé aspect Inaccompli et Continue reolocalisés dans le passé circonstant temporel Hôm qua Les procès xem et reo sont localisés dans le passé par le circonstant temporel Hôm qua à valeur temporelle « passé ». đang en train de se dérouler Le marqueur d’aspect đang exprime que que xem est en train de se dérouler lorsque le procés reo survient. Règle: Si MT + MT Alors le verbe qui suit sera à l’imparfait Travaux en cours Travaux en cours