Vers un système de traduction automatique du langage texto Centre de recherche en linguistique et traitement automatique des langues Lucien Tesnière Université

Slides:



Advertisements
Présentations similaires
Expression orale et écrite
Advertisements

Comment annoter un texte
Ébauche et travail de session : retour général 1. Forme.
Site "Autoformation et multimédia"
Prof. Assist. Dr Penphan THIPKONG
.EU EST-IL EUROPÉEN .EU EST-IL EUROPÉEN ?.
UNIVERSITÉ PARIS 3 ─ SORBONNE NOUVELLE
1 Modernisation des achats : « les voies du succès » La carte dachat public Philippe Vandel Directeur e-services Guilbert Office DEPOT.
CONVERGENCES ENTRE LES LANGUES VIVANTES ET LA LANGUE DE SCOLARISATION CONVERGENCES ENTRE LES LANGUES VIVANTES ET LA LANGUE DE SCOLARISATIONBulgarie.
TRAITEMENT AUTOMATIQUE DES LANGUES : LES PRINCIPAUX PROGRAMMES
SYSTRAN Un outil du TAL Victoria AUPERT Marjorie LORSUNG.
Girard Pia & Laffont Caroline
Les outils du TAL Par RIGAUD Anaïs RALLIER Armelle SANTIAGO Gwendoline
Des outils : 1- Le langage oral en maternelle 2- Lire au CP
Bienvenue À propos de moi… Faire apprendre Un tour de classe Matériel scolaire Test Bla bla important Communication Questions.
Enseignement de la Culture Générale
Le cahier de sciences Lieu des écrits pour soi
Projet Alerte SMS.
Préparer la vente Une vente est la cession d’un bien ou d'un service en échange d'une somme d’argent convenue entre le vendeur, celui qui cède le bien.
Plan du travail: 1- Introduction. 2- Définition du langage SMS.
ASA Algerian scientific Abstracts المستخلصات العلمية الجزائرية
ECRIRE pour apprendre à LIRE
Le pluriel des jours de la semaine.
UE : 3.4. S4 Initiation à la démarche de recherche
Optimisez votre recherche d’informations sur Internet!
Envoyer un texto On va apprendre les bases pour envoyer des texto avec votre portable/ natel.
D1 - 19/05/2014 Le présent document contient des informations qui sont la propriété de France Télécom. L'acceptation de ce document par son destinataire.
Quelques exemples de modules pédagogiques à lusage des classes prépa Colloque E prep Sophia Antipolis 6-7 mai 2002.
Université de Nice Sophia-Antipolis Stefanie Brandt
Passage à l’écrit en sciences
COFOR 1 Période 1 COFOR 1 Période 1 Activité en télé(présence) Une approche des relations entre les unités dinformation dans les publications électroniques.
Que sont les TICE ? A quoi servent-elles Une introduction au cours Daniel Peraya Choi Jenni TECFA Universit é de Gen è ve
Que sont les TICE ? A quoi servent-elles Une introduction au cours Daniel Peraya Choi Jenni TECFA Universit é de Gen è ve
Livres numériques accessibles : de Word à Daisy Cité des Sciences et de lIndustrie Le 23 juin 2008 Dolphin EasyConverter : Permettre déditer facilement.
‘The Voice Company’ Du texte à la Parole
Forum des Industries de la Langue, 17 mars 2010
Introduction à lutilisation des corpus 1. Quest-ce quun corpus? Alexandra VOLANSCHI
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
TAL (Traitement automatique des langues)
XYLODATING - MONT-DE-MARSAN - JEUDI 28 MARS Prénom NOM SOCIETE TITRE DE VOTRE INTERVENTION Sous titre éventuel.
Qu'est ce que savoir lire ?
Programmation non procédurale Le projet ECOLE 2000
Passage à l’écrit en sciences
PRÉPARER LES ÉLÈVES À TRAVAILLER SUR LE KF Julia Gaudreault-Perron, Université Laval.
Jacques Cartier, enseignant à l’Université de Franche-Comté Unité de Formation et de Recherche - Sciences du Langage, de l’Homme et de la Société Besançon.
Présenté par : Attia Hamza Merzouk Abdelkrim 2003/2004
Méthodologie pour la structuration semi- automatique d’un corpus lexicographique bilingue : le cas du dictionnaire français-kabyle Mahfoud MAHTOUT Université.
Journée de préparation à l’examen 31 août 2013
Atelier de recherche en gestion internationale
Jacques Cartier, enseignant à l’Université de Franche-Comté Unité de Formation et de Recherche - Sciences du Langage, de l’Homme et de la Société Besançon.
Les Ecrits en sciences Le classeur de sciences
Human Knowledge La nouvelle génération de moteurs sémantiques.
La réussite scolaire Collège Béliveau.
1  Courriel :  Site "Autoformation et multimédia"  Revue en ligne Alsic.
Diaporama réalisé par Damienne PIN, Documentaliste Collège Barbara Hendricks 226 Rue du Limousin Orange LE PROBLEME DE LA QUALITE DE L ’INFORMATION.
QRA, partie II: gestion des données Trousse de formation 2: le suivi de l'abus des drogues: politiques et pratiques.
Organisation administrative
1 Management des unités commerciales Management des unités commerciales LANGUE VIVANTE ÉTRANGÈRE I - coefficient 3 L’usage d’un dictionnaire bilingue est.
Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC – Equipe ISLanD Apport d’outils d’informatique documentaire à l’analyse de forums de.
Évaluation STRATÉGIE DE LECTURE. Évaluation  L’Évaluation aide les lecteurs a former des opinions, porter les jugements et développer les nouveau idées.
La semaine 27 Français IV H
Thibault ROY & Olivier SAGIT Exposé du mercredi 17 décembre 2003 Apprentissage Interactif Apprentissage avec SpamAssassin UFR de Sciences Département d’Informatique.
Le Traitement Automatique des Langues (TAL)
1 - Une école qui s’adapte aux jeunes enfants :
Thème du projet: Noël franco-hispano-germanique Faire ensemble: Niveau : 5èmes – 4èmes.
Projet de fin d’étude Développement d’une application de gestion d’un parc informatique et de Help Desk Bonjour tout le monde, Avant de commencer je voudrais.
Sciences du langage et de la communication Responsable du pilier : Corinne Rossari Professeure de linguistique française Présentation : Tobias von Waldkirch.
Introduction à la rédaction Scientifique
Préparation d’un mémoire
Exemple de questionnement
Transcription de la présentation:

Vers un système de traduction automatique du langage texto Centre de recherche en linguistique et traitement automatique des langues Lucien Tesnière Université de Franche-Comté – Besançon - FRANCE Journée détude de lATALA – Paris - 5 juin 2004 Ciprian MELIAN Séverine VIENNEY

Sommaire Problématique : – Le langage texto – La traduction automatique Notre système Résultats et Démonstration Conclusions et Perspectives Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 Journée détude de lATALA – Paris - 5 juin 2004

Sommaire Problématique : – Le langage texto – La traduction automatique Notre système Résultats et Démonstration Conclusions et Perspectives Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 Journée détude de lATALA – Paris - 5 juin 2004

Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 Apparition du langage texto avec le développement des nouvelles formes de communication écrite : – Sur internet : chat, forum de discussion, courrier électronique ( ) – Sur téléphone portable : sms ( En 2003 : 8 milliards de SMS envoyés [Que choisir, déc. 2003] ) Le langage texto Journée détude de lATALA – Paris - 5 juin 2004

Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 simplification de la langue : phénomène de troncations, absence des flexions, phonétisation, pictogrammes... une situation de communication particulière nécessitant une certaine précision de langage et une rapidité de réponse – objectifs : retrouver une « cadence orale » être concis et compris Le langage texto : caractéristiques Journée détude de lATALA – Paris - 5 juin 2004

Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 être concis et compris – Exemple : Elle est allée au restaurant Le langage texto : correction automatique / traduction automatique ? Journée détude de lATALA – Paris - 5 juin 2004

Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 être concis et compris – Exemple : Elle est allée au restaurant A priori, besoin d'un correcteur automatique – Elle est allé au restaurant Journée détude de lATALA – Paris - 5 juin 2004 Le langage texto : correction automatique / traduction automatique ?

Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 être concis et compris – Exemple : Elle est allée au restaurant A priori, besoin d'un correcteur automatique – Elle est allé au restaurant En réalité, besoin d'un traducteur automatique – L et alé au resto- L è alé o resto – L E alé O resto Journée détude de lATALA – Paris - 5 juin 2004 Le langage texto : correction automatique / traduction automatique ?

Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 Utilité d'un tel système : – Langage contrôlé mais contrôlé par qui ? Plusieurs niveaux d'utilisateurs : novice, expert. (sur les 8 milliards de SMS envoyés en 2003, 75% lont été par les ans. Les utilisateurs qui en envoient le plus sont les ans : 55 textos par mois et par personne. [Que choisir, déc. 2003] ) Connaître les nouvelles tendances de troncation, de symboles utilisés. Si on ne connait pas la norme alors difficile de lire le texto : gain de temps à écrire perte de temps à déchiffrer Le langage texto : traduction automatique Journée détude de lATALA – Paris - 5 juin 2004

Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 perte de temps à déchiffrer Intérêt d'un traducteur automatique – C T ki ? Journée détude de lATALA – Paris - 5 juin 2004 Le langage texto : traduction automatique

Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 perte de temps à déchiffrer Intérêt d'un traducteur automatique – C T ki ? --> c'était qui ? Journée détude de lATALA – Paris - 5 juin 2004 Le langage texto : traduction automatique

Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 perte de temps à déchiffrer Intérêt d'un traducteur automatique – C T ki ? --> c'était qui ? – kestufé ? --> Journée détude de lATALA – Paris - 5 juin 2004 Le langage texto : traduction automatique

Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 perte de temps à déchiffrer Intérêt d'un traducteur automatique – C T ki ? --> c'était qui ? – kestufé ? --> qu'est-ce que tu fais ? Publicité pour Nokia, 2002 : Journée détude de lATALA – Paris - 5 juin 2004 Le langage texto : traduction automatique

Sommaire Problématique : – Le langage texto – La traduction automatique Notre système Résultats et Démonstration Conclusions et Perspectives Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 Journée détude de lATALA – Paris - 5 juin 2004

Bi-directionnel : français-texto / texto-français Architecture générale – Trois étapes : 1 : lecture du texte source 2 : langage pivot 3 : génération du texte cible Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 Notre système Journée détude de lATALA – Paris - 5 juin 2004

Etape 1 : Lecture du texte source Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 L'utilisateur entre son texte : – Soit sous forme texto : HT du p1 E D poiro (acheter du pain et des poireaux) Journée détude de lATALA – Paris - 5 juin 2004

Etape 1 : Lecture du texte source Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 L'utilisateur entre son texte : – Soit sous forme texto : HT du p1 E D poiro (acheter du pain et des poireaux) – Soit en français : J'ai une bonne idée (G 1 bon ID) Journée détude de lATALA – Paris - 5 juin 2004

Etape 2 : Langage pivot Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 Transcription à l'aide d'un système de règles Utilisation d'un langage pivot adéquat Journée détude de lATALA – Paris - 5 juin 2004

Etape 3 : Génération du texte cible Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 A partir du langage pivot : – Système de règles pour générer le texte – Système de validation des formes produites Pour sms-français : désambiguïsation lexico-syntaxique et sémantique Pour français-sms : plusieurs productions sont possibles (ce qui correspond à la réalité) Journée détude de lATALA – Paris - 5 juin 2004

Sommaire Problématique : – Le langage texto – La traduction automatique Notre système Résultats et Démonstration Conclusions et Perspectives Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 Journée détude de lATALA – Paris - 5 juin 2004

Résultats Phrase de départ : G 1 ID Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 Journée détude de lATALA – Paris - 5 juin 2004

Résultats Phrase de départ : G 1 ID Langage pivot : – G –> Ze – 1 –> U~/ yn – ID –> ide Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 Journée détude de lATALA – Paris - 5 juin 2004

Résultats Génération du Français : – Ze –> jé, jet, jei, jai, jais, jay, j'é, j'ai... – U~/ –> un, ein, ain, in... – yn –> une, hune... – –> une, hune... – Ide –> idé, idée, idai... Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 Journée détude de lATALA – Paris - 5 juin 2004

Résultats Validation lexicale : – J'ai un/une idée(s) – Jet un/une idée(s) – Geai un/une idée(s) – Jais un/une idée(s) Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 Journée détude de lATALA – Paris - 5 juin 2004

Résultats Analyses morpho-syntaxiques et sémantiques : – J'ai un/une idée(s) – Jet un/une idée(s) – Geai un/une idée(s) – Jais un/une idée(s) Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 Journée détude de lATALA – Paris - 5 juin 2004

Résultats Phrase de départ : – G 1 ID Phrase après analyses : - J'ai une idée Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 Journée détude de lATALA – Paris - 5 juin 2004

Sommaire Problématique : – Le langage texto – La traduction automatique Notre système Résultats et Démonstration Conclusions et Perspectives Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 Journée détude de lATALA – Paris - 5 juin 2004

Sommaire Problématique : – Le langage texto – La traduction automatique Notre système Résultats et Démonstration Conclusions et Perspectives Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 Journée détude de lATALA – Paris - 5 juin 2004

Conclusions Journées linguistiques vdu Centre L. Tesnière – 05 et 06 mars 2004 Nouvelles formes de communication écrite nouvelles façons d'écrire nouveaux outils TAL Premiers travaux dans ce domaine. Peu de chercheurs se sont penchés sur ce problème. Premiers résultats (après seulement quelques mois de recherches) sont encourageants Journée détude de lATALA – Paris - 5 juin 2004

Perspectives Premier prototype à développer Applicable à d'autres langues Au niveau industriel : – téléphone mobile-traducteur – traducteur : , forum, chat... – modules en première étape de toute correction automatique Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 Journée détude de lATALA – Paris - 5 juin 2004

Merci de votre attention... des questions ? Centre de recherche en linguistique et traitement automatique des languesLucien Tesnière Université de Franche-Comté – Besançon - FRANCE Journées linguistiques du Centre L. Tesnière – 05 et 06 mars 2004 Ciprian MELIAN Séverine VIENNEY Journée détude de lATALA – Paris - 5 juin 2004