Le sous-titrage automatique : une nouveauté technologique exploitable

Slides:



Advertisements
Présentations similaires
E-learning Evolutif Albarelli Corinne Behem Patrice Guillot Jérôme
Advertisements

1Er Partie Intervenants : Nuno Barata Alain Joly Thierry Belvigne
2002 Exploratoire ASTRÉE : Analyse Statique de logiciels Temps-RÉel Embarqués 1)Le problème considéré est de démontrer statiquement (à la compilation)
QUEL(LE) AND LEQUEL (LAQUELLE)
Time with minutes French II Le 30 Octobre.
Le livre de français – pg 107 David: Jen ai marre! Jai une heure de chimie le lundi, deux heures de physique le mardi et deux heures de biologie le samedi.
SYSTRAN Un outil du TAL Victoria AUPERT Marjorie LORSUNG.
Vers un système de traduction automatique du langage texto Centre de recherche en linguistique et traitement automatique des langues Lucien Tesnière Université
Le Jour J Par: Bronwyn et Ceilidh. June 6, 1944 My darling Maisie: Well, dearest, the above date will certainly go down in history. Some day our children.
VIDEO-ADAPT Post-production & Adaptation
Tutoriel Quizlet Outil en ligne d’aide à la mémorisation du lexique
Appel doffres DAFPEN
Pour plus d’informations, vous pouvez contacter:
Licence 1 Sappuyer sur des connaissances antérieurs Consolider Avancer Préparer les années suivantes Préparer lexamen.
© Nuance Communications, Inc. Tous droits réservés. Page 1 OmniPage Ultimate mai 2013.
Mes vacances To be able to talk about your holidays using 2 tenses (past and future)
Livres numériques accessibles : de Word à Daisy Cité des Sciences et de lIndustrie Le 23 juin 2008 Dolphin EasyConverter : Permettre déditer facilement.
Forum des Industries de la Langue, 17 mars 2010
Nom du pays de votre choix
Objectif de la présentation Présenter les capacités et les limites des formulaires électroniques en PDF dynamique Formulaires en format PDF.
Plus de cinquante réalisations depuis Secteurs de la santé, services municipaux, services publics et accès aux citoyens… De nombreuses récompenses.
Vous pouvez maintenant fortement réduire le temps de frappe et améliorer votre productivité … Innovation Secteurs médical, juridique,… Vos comptes-rendus.
Slides before 1st Section Divider Lapport des Tice Le programme officiel Unused Section Space 2 Unused Section Space 1 Unused Section Space 3 Unused Section.
La chenille qui fait des trous.
Passive Voice French 3. Types of Voice There are three types of voice in French. – Active – Passive – Pronominal You already know how to do active and.
Alexandre Guigue La dimension culturelle du langage juridique : un défi pour le traducteur et le comparatiste. 1. Pourquoi réunir le traducteur et le comparatiste.
AS A MAN THINKETH an interactive listen, read and repeat book for learning American English A NEW EDITION OF JAMES ALLEN’S CLASSIC edited by Robert Silber.
Méthodologie pour la structuration semi- automatique d’un corpus lexicographique bilingue : le cas du dictionnaire français-kabyle Mahfoud MAHTOUT Université.
Tirer le meilleur parti d’Office /10/ Vincent Bippus IT/OIS 07 octobre 2014.
Perfect tense with ÊTRE. When do you use the perfect tense with être?  The perfect tense with être is also used to describe an action in the past which.
Révision en rédaction. 1 Nolwenn Kerzreho 2008 Révision en rédaction Pourquoi ? Un problème (quel problème) ? Intervention des professionnels Conclusion.
Transition Unit Personal Information Lesson 1
C’est combien ? Les euros
Évaluez votre système de production documentaire en 7 minutes.
Song 3 Spring Term Module 3 2 Au clair de la lune Au clair de la lune, Mon ami Pierrot, Prête-moi ta plume Pour écrire un mot. Ma chandelle est morte,
La Famille McNamara Par Mme. McNamara.
WALT: To talk about the internet in French.
The Big Picture Fr>Eng translation workshop on voice-over texts Chris Durban Translate in the Townships / August 2012 © Chris Durban.
Tel : +33 (0) Création L&M : 2002 Capital : € Lauréat OSEO-ANVAR 2001 et er Prix LangTech.
- M.A. (linguistique appliquée) - DipTESL - d’origine néo- zélandaise « Créer un site Internet en cours de langue orale : pourquoi se donner tant de peine.
Reveal-This Ou comment générer des métadonnées utiles automatiquement.
A. Le comparatif p.234 Comparative constructions are used to compare people or things. Cet hôtel est aussi moderne que l’autre. This hotel is as modern.
Bientôt, tu vas aller vivre une expérience unique à l’étranger.
Depuis Describing how long one has been doing something.
WALT: Recognise and use phrases in the past tense with opinions of leisure activities. WILF: To be able to use opinions in the past tense. You must be.
Journal – le 12 février 1.Quels sont les symptômes de la grippe? 2.Quels sont les symptômes d’un rhume?
Year 10. Bon appetit unit. Introducing ‘en’. ‘en’ – ‘some of it’ or ‘some of them’ ‘En’ is a small but important word in French that is commonly used.
International Language Week Pâté Paella Couscous Kebab Moussaka Sushi Burritos Green curry Pasta Morocco Mexico Japan Spain Thailand France Italian Greece.
FRENCH GCSE. REMEMBER: L.O.T.S Linking words Opinions Tenses variety Stunning structures.
Je peux traduire le français au l’anglais!
Le Traitement Automatique des Langues (TAL)
Object pronouns How to say “him”, “her”, “it”, “them”
Le travail de cloche, niveau I, le 6/7 avril (#1)
Bonjour! C’est l’automne
Pps Automatique "Amy's dragon" L’ami Dragon Texte de Dallas P. Bush Traduit par Papesquall.
SORTIR Leçon 8: Tu es sorti? to go out to get out je sors nous sortons
1. Est-ce que Est-ce que, literally translated "is it that," can be placed at the beginning of any affirmative sentence to turn it into a question: Je.
J’ai une question! Objectifs: 1) Poser une question de 3 manières différentes 2) Parler de votre famille.
14/NOVEMBRE/2014 GROUPE 18: CONVERSION ET RETRANSCRIPTION D'UNE VIDEO/CODAGE ET ANALYSE D'UN TEXTE 1 THEME : CONVERSION ET RETRANSCRIPTION D’UNE VIDEO/CODAGE.
J’ai une question! Objectifs: 1) Poser une question de 3 manières différentes 2) Parler de vos vacances.
In France, until 1564 the first of April used to be New Year’s Day. Then, the King Charles IX decided to change the calendar and put the beginning of.
On va se présenter… Name Age Where do you live?
Au Collège Starter Activities.
1 Congrès du GERAS 2002 Modèles Ecole Normale Supérieure Lettres et Sciences Humaines - Lyon mars 2002 Des figures imposées aux figures libres. Jean-Jacques.
ETAT DE DEVELOPPEMENT DES SOLDES DES COMPTES
Bellwork avril. Bellwork – AY 20 avril Listez au moins que cinq mots interrogatifs.
ever for This presentation requires PowerPoint XP or later.
LES PRONOMS D’OBJET DIRECT. WHAT IS A SUBJECT? In a sentence, the person or thing that performs the action of the verb is called the SUBJECT.
« Revisiter la dictée : regarder le passé de la traduction professionnelle pour en éclairer le futur » JULIAN ZAPATA ROJAS, B.A., M.A. École de traduction.
Moi Tituba, sorcière, written by Maryse Condé of Guadaloupe, is a novel imagining the life of a slave who was executed as a witch in Salem in 1692.
Transcription de la présentation:

Le sous-titrage automatique : une nouveauté technologique exploitable Sabrina Baldo-de Brébisson MCF et ancienne traductrice spécialisée En collaboration avec Sylvain Thébault Adaptateur indépendant Le sous-titrage automatique : une nouveauté technologique exploitable pour les adaptateurs professionnels ? OPTIMALE Symposium - Université Rennes 2 - 6 juin 2013

Logiciels Fonctions Site Jubler Création de fichiers de sous-titres http://jubler.org/ Modification de fichiers de sous-titres Time Adjuster Synchronisation des sous-titres avec les images http://www.ireksoftware.com/ta Subtitle Workshop http://www.urusoft.net/products.php?cat=sw Sublight Recherche de fichiers de sous-titres existant sur Internet http://www.sublight.si/ Aegisub http://www.aegisub.org/ Traduction automatique de sous-titres Kijio http://kijio.org/guide/ Subtitle Translation Wizard http://www.upredsun.com/subtitle-translation/ Extraction des fichiers de sous-titres à partir d'une vidéo Visualisation des sous-titres sur la vidéo Handbrake Incrustation de sous-titres "en dur" dans une vidéo http://handbrake.fr/ Any Video Converter http://www.any-video-converter.com/fr/

Sous-titrage automatique Deux domaines appliqués Deux outils appliqués La reconnaissance vocale La traduction automatique Google Voice Google Translate

1

2

3

4

5

6

7

8

Processus Humain traditionnel « Tout automatisé » Semi-automatisé Adaptation en langue cible sur la base d’une transcription source Humaine Sous-titrage automatique en langue source par reconnaissance vocale Importation de la transcription humaine en langue source dans la vidéo, synchronisation et création des sous-titres en langue source automatiques Simulation (Révision) des sous-titres en langue cible Modification des sous-titres en langue source Traduction automatique des sous-titres en langue cible Révision humaine des sous-titres en langue cible

1ère PROBLÉMATIQUE : TRAITEMENT Multiples contraintes : Découpage de la vidéo pour lancer la reconnaissance vocale quand elle commence par un silence Obligation d’apporter une correction pour récupérer une nouvelle piste de reconnaissance vocale pour pouvoir demander la traduction automatique Apparition immédiate du sous-titrage automatique vs apparition aléatoire et tardive de la piste (version exploitable et révisable) Temps de traitement impossible à évaluer Outil pas fiable pour un professionnel

2ème PROBLÉMATIQUE : QUALITÉ De la reconnaissance vocale (transcription automatique) De la T.A. à partir de la transcription automatique (reconnaissance vocale) De la T.A. à partir de la transcription humaine (script source)

Supports : Fichier vidéo en anglais sur « One day. A novel becomes a movie », David Nicholls Fichier avec la transcription en anglais Fichier avec les sous-titres humains en français

Reconnaissance vocale Piste source quasiment fausse de moitié Taux d’erreurs : 43% (227 mots reconnus sur 392) Meilleur résultat (12 mots consécutifs) : over a period of time seeing them change in tiny degrees year-by-year Exemple : We realized that what we couldn’t do was divide a hundred minutes into twenty five minute chunks. We realize that will be couldn't it was defiant hundred minutes into twenty five minute chocs.

Google Voice + Google Translation : « Soyons fous ! » Exemple : I put a lot of care and thought into this book. Care and gordon's this book Entretien et Gordon ce livre

Traduction automatique d’une retranscription par reconnaissance vocale Catégories d'erreurs Nombre %age Non sens 33 82,5% Non idiomatique 3 7,5% Faux sens 2 5,0% Grammaire 1 2,5% Calque Typographie et ponctuation 0,0% Lexique Syntaxe Maladresse Inexact TOTAL 40 100,0% 33 non sens sur 391 mots = 8,5 % du texte !

« Beaucoup de traducteurs professionnels trouvent les textes générés par les logiciels de traduction automatique tellement biscornus qu’ils estiment plus rapide de repartir à zéro » P. 12, Traduction. Faire les bons choix. Dans Petit guide de l’acheteur de traductions. Syndicat national des traducteurs professionnels.

Google Translation sans Google Voice : Une folie douce Exemple : Source : I put a lot of care and thought into this book. It took a lot longer than my other books. TA : J'ai mis beaucoup de soin et de réflexion dans ce livre. Il a fallu beaucoup plus de temps que mes autres livres. Adaptation : J’ai consacré du temps à ce livre, plus qu’aux précédents.

Traduction automatique d’une retranscription humaine Catégories d'erreurs Nombre %age Grammaire 14 18,9% Non sens 13 17,6% Typographie et ponctuation 9 12,2% Lexique Calque 8 10,8% Non idiomatique 6 8,1% Syntaxe 5 6,8% Maladresse Faux sens 4 5,4% Inexact 1 1,4% TOTAL 74 100,0% 74 erreurs sur 465 mots = 20% du texte !

BILAN « Optimiser le défi technologique pour faire face à la place de l’humain en traduction » Reconnaissance vocale : Pourquoi faire simple quand on peut faire compliqué ?  Traduction automatique avec ou sans reconnaissance vocale : Pour les fansubbers ?  

Adaptation incompatible par essence avec la Traduction Automatique Traduction littérale Traduction linéaire Traduction oblique, libre, infidèle Traduction spatiotemporelle Techniques créatives de l’adaptation : non répétition, omission, sous-traduction, hyperonymie, hyponymie, modulation…

MERCI TRUGAREZ