Dominique Vaufreydaz, ESSLLI 2002 1 ASR and scalability Dominique Vaufreydaz ESSLLI02.

Slides:



Advertisements
Présentations similaires
Direct and Indirect Object Pronouns in French
Advertisements

2. 2 Linterrogation 1.The simplest and most common way to ask a question in French is by using intonation, that is, by simply raising ones voice at the.
Table des matières En famille Part 1 Ma famille Subject pronouns
Département fédéral de lintérieur DFI Office fédéral de la statistique OFS Implementing the economic classification revision (NACE / ISIC) in the Business.
Échanger connaissances et techniques sur les routes et le transport routier 1 The PIARC Website.
Gérard CHOLLET Fusion Gérard CHOLLET GET-ENST/CNRS-LTCI 46 rue Barrault PARIS cedex 13
Reconnaissance de la parole
16/05/2003Reunion Bayestic / Murat Deviren1 Reunion Bayestic Excuse moi! Murat Deviren.
2 Linterrogation La norme: Communication 1.2 –Understanding the spoken and written language Les questions essentielles: -How many ways are there to ask.
Talking about yourself
Tout All you need to know. Weve learned possessive adjectives My in french is __________? Your in french is ___________? His/her/its in french is ________?
les fournitures scolaires masculin! féminin! un crayon un stylo
A Le verbe être et les pronoms sujets p. 84 Être (to be) is the most frequently used verb in French. Note the forms of être in the chart below. être to.
Les verbes en -er. chanter – to singtelephoner – to call danser – to dancetravailler – to work diner – to have dinnervoyager –to travel ecouter – to listen.
Mercredi le 28 novembre. Warm-up Ask in 3 different ways the following statements: John et Sophie sont à lécole.
interaction in the .LRN platform
Le livre de français – pg 107 David: Jen ai marre! Jai une heure de chimie le lundi, deux heures de physique le mardi et deux heures de biologie le samedi.
1.Est-ce que tu as un portable? __________________________________________________________ 2. Est-ce que tu as une voiture? __________________________________________________________.
Formal/Theory Phenomenology/Ex periments chaos break-up, giant-resonances, fusion interdisciplinarity (clusters, bose) mean-field (as a general theory)
Minimisation Techniques 1 Assimilation Algorithms: Minimisation Techniques Yannick Trémolet ECMWF Data Assimilation Training Course March 2006.
Université Des Sciences Et De La Technologie DOran Mohamed Boudiaf USTO République Algérienne Démocratique et Populaire Département de linformatique Projet.
Comparison Unite 6: Partie 1
Second part Album Keet.
I want to achieve … Level 5 Writing. Level 5 is considered the gold standard at the end of Key Stage 3 … if you can get a Level 5 you are in a strong.
Leçon 9-Bleu. Kim Kardashian Lil Wayne Lady Gaga Justin Bieber.
L ES ADJECTIFS SPÉCIAUX - BAGS Français 1 In French, most adjectives follow the noun that they modify. Par exemple – Elle est une élève intelligente.
and a justification for level 4
Get the best grade you can in GCSE French speaking Anglia Ruskin University Monday 21 January 2013.
Une Amie Un Ami Français I.
Quelle heure est-il? Le But: Je peux dire l’heure
European Program C OMENIUS Survey – Questionnaire Survey – Questionnaire Renewable energy in its regional context, ways out of the energy crisis Energie.
How to solve biological problems with math Mars 2012.
Seasons and Preferences Project French 1. Choose your favorite pass-time Je mappelle Madame Mac et Jaime apprendre les langues!
28th Conference of Directors of Paying agencies Namur, 27 to 29 October 2010 The Belgian Presidency of the Council of the European Union Workshop 2 : Control.
Indefinite articles, plural of nouns
Mardi 20 Novembre 2012 Recap I can
Rethinking language education, a challenge to tradition Repenser l'éducation aux langues, un défi à la tradition H. G. Widdowson University of Vienna -
Job Interview. Francais 3 Regulier (1 Oral Formative Assessment, 1 Written Formative Assessment, 1 Vocab Quiz Formative Assessment.
Les choses que j aime Learning Objective: To know how to use j aime to talk about things I like to do.
Laboratoire de Bioinformatique des Génomes et des Réseaux Université Libre de Bruxelles, Belgique Introduction Statistics.
Follow the directions on each slide. If you finish early you may work on an assignment for another class.
Cest mercredi le neuf octobre Le plan! 1.Révisions 2.Vocabulaire 3.Jouer 4.Ecouter 5.Parler Il fait beau! Le but! Les couleurs!
Un chat deux chats deux chiens Un chien deux chevaux Un cheval
Vendredi le 10 mai. May 6 th -10 th French Plans Mon. 5/6 Normal bells Tues. 5/7 1 st, 2 nd, 5 th, 7 th Wed. 5/8 4 th, 3 rd, 5 th, 6 th Thurs. 5/9 7th,6th,5th,4th.
Jeudi le 7 novembre. F 3 DUE: Virtual tour in LMS by 7:30 for the 70! DUE: Flashcards also for the 70 today (50 Friday) 1. Poem practice Le dormeur du.
QU’EST-CE QUE TU FAIS?.
Chez moi! In this unit you will learn:
Marketing électronique Cours 5 La personnalisation.
Thematic Alignment of Static Documents with Meeting Dialogs Dalila Mekhaldi Diva Group Department of Computer Science University of Fribourg.
Donnez l’heure “Time”… it’s a ticking!.
OHT 44 Starter 5, page 79 House vocabulary eée e a o auii e eueau aaàae esc. aaeeais a ae aoue acae eaae aa eeeu eai.
LEÇON 102. Écrivez vos devoirs: 1.Continuer de préparer lexamen final. 2.Check your Pinnacle, turn in any/all make-ups, missing assignments, re-takes,
LEÇON 101. Écrivez vos devoirs: Continuez de préparer lexamen final. Tout de suite: Sortez vos 1.iPads 2.notes on Marie Antoinette 3.any/all of the sentences.
How many of these flags do you recognise? Work with your partner to see if you know many – write them down - some will crop up shortly!
Français I. Une fille française Gabrielle est française. Elle est blonde. Elle est belle. Elle est de Paris.
INDICATOR DEFINITION An indicator describes the manifestation of a process of change resulting from the pursuit of an action. Un indicateur décrit la manifestation.
French Past Tenses L’imparfait vs. Le Passé composé.
Différencier: NOMBRE PREMIER vs. NOMBRE COMPOSÉ
Branche Développement Le présent document contient des informations qui sont la propriété de France Télécom. L'acceptation de ce document par son destinataire.
Leçon 4: L’heure Mlle Muhr French 1. The Hour There are 60 minutes in every hour. Each hour can be divided into 4 parts: 15/60 or 1/
Leçon 12: L’imparfait FREN 120. A few quick notes about material from the chapter before getting started…
Study & revise the numbers carefully.
Quelle heure est-il? What time is it ?.
Formatting of Game © Candace R. Black, Al rights reserved. Révisions!
Ministère de l’Éducation, du Loisir et du Sport Responsables des programmes FLS et ELA: Diane Alain et Michele Luchs Animateurs: Diane Alain et Michael.
Information Theory and Radar Waveform Design Mark R. bell September 1993 Sofia FENNI.
Laboratoire des outils informatiques pour la conception et la production en mécanique (LICP) ÉCOLE POLYTECHNIQUE FÉDÉRALE DE LAUSANNE 1 Petri nets for.
Welcome to the world of adjectives! To be an expert in French, you need to master the art of adjectives. These are words which are used to describe nouns.
Transcription de la présentation:

Dominique Vaufreydaz, ESSLLI ASR and scalability Dominique Vaufreydaz ESSLLI02

Dominique Vaufreydaz, ESSLLI ASR and scalability State-of-the-art speech recognition –general overview –acoustic modelling –language modelling Web-trained language models –scalability of Web data ? –Nespole! example –results State-of-the-art speech recognition –general overview –acoustic modelling –language modelling Web-trained language models –scalability of Web data ? –Nespole! example –results

Dominique Vaufreydaz, ESSLLI Automatic speech recognition SpeechAcoustic parameters Phonetically labelled signals Training Recognition Language model(s) Acoustic models Decoding Training Text corpus Acoustic parameters used: - Mel-scaled Frequency Cepstral Coefficients (MFCC) - Energy - Zero crossing - Linear Predictive Coding (LPC) - Perceptual Linear Predictive (PLP) et Rasta-PLP - etc. and of these parameters State-of-the-art speech recognition - general overview

Dominique Vaufreydaz, ESSLLI Hidden Markov Models Two different stochastic processes –X: a first order hidden Markov chain for temporal variability –Y: an observable process, for spectral variability HMM can be described with = (A, B, ): –Matrix A: transition probabilities from one state to another a i,j p(X t = j | X t-1 = i) –Matrix B: distribution probabilities of observations b i,j (y) p(Y t = y | X t-1 = i, X t = j) In continuous speech recognition, these probabilities are multigaussian mixtures defined with: the mean vector the covariance matrix the weights of each gaussian –Matrix : probabilities to reach a state from the initial state i p(X 0 = i) State-of-the-art speech recognition - acoustic modelling

Dominique Vaufreydaz, ESSLLI Acoustic units Different kinds of system –context independent systems: phonemes (or other units) –context dependent systems: allophones, i.e. units in context. More robust but use more memory and CPU. The availability of enough training data determines the choice between context dependent/independent models and the number of different allophones. HMM topology for each unit –usually, a bakis model (left/rigth first order model) with a i,j = 0 if j < i S1S1 S2S2 S3S3 a 11 a 22 a 33 a 12 a 23 a 13 State-of-the-art speech recognition - acoustic modelling

Dominique Vaufreydaz, ESSLLI Train acoustic models Estimation and iterative reestimation of the model parameters –need an acoustic corpus: matching the future recognition condition (speech quality, noise environment, etc.) annotated in acoustic units, i.e. a sequence of acoustic observations O. –use Baum-Welch or Expectation-Modification (EM) algorithms find = (A, B, ) to maximise P(O| ) State-of-the-art speech recognition - acoustic modelling

Dominique Vaufreydaz, ESSLLI Acoustic Model Adaptation Having enough training data for these new acoustic condition –train a new model with these data –train a multicondition model with all your data Having a numerical way to simulate new condition (from clean speech to G723 speech for example) –transcode your data and train a new or multicondition model Having only few adaptation data –use adaptation algorithms like: Maximum Likelihood Linear Regression (MLLR) Maximum A Posteriori (MAP) Bayesian Predictive Adaptation (BPA) etc. State-of-the-art speech recognition - acoustic modelling

Dominique Vaufreydaz, ESSLLI Statistical language models –more robust than grammar for large vocabulary and dialog systems –not only a yes/no answer n-gram models: considering n-1 words as context –mostly n is 3: need text corpora to compute these probabilities State-of-the-art speech recognition - language modelling

Dominique Vaufreydaz, ESSLLI Compute a language model 1 – « Wizard of Oz » experiments délissasses 1 croquantes 42 emmènerais 9 emmènerait 26 badgé 19 badge 3439 faillirent 52 pentateuque 309 tabloïde 17 tabloïds 117 attendriraient 5 agatisé 1 portiques 1165 accusais 18 accusait 662 bioclimats 4 circonscriras 2 Transcriptions 2 – train a language model délissasses 1 croquantes 42 emmènerais 9 emmènerait 26 badgé 19 badge 3439 faillirent 52 Pentat euque 309 tabloïde 17 tabloïds 117 attendriraient 5 agatisé 1 portiques 1165 accusais 18 accusait 662 bioclimats 4 circonscriras 2 Language model LM tools délissasses 1 croquantes 42 emmènerais 9 emmènerait 26 badgé 19 badge 3439 faillirent 52 pentateuque 309 tabloïde 17 tabloïds 117 attendriraient 5 agatisé 1 portiques 1165 accusais 18 accusait 662 bioclimats 4 circonscriras 2 language model Adaptation tools State-of-the-art speech recognition - language modelling A third way using all the available data on the Web ???

Dominique Vaufreydaz, ESSLLI ASR and scalability State-of-the-art speech recognition –general overview –acoustic modelling –language modelling Web-trained language models –scalability of Web data ? –Nespole! example –results

Dominique Vaufreydaz, ESSLLI Scalability using the Web ? Huge amount a data on many topics –~ different French lexical forms –different kinds of text well-written text in professional pages for example pseudo dialog forms in personal Web pages « Euh... bonjour, euh... c'est l'Institut Macareux... euh... c'est pour un sondage (anonyme, quoi... hein) ! » Size of the training set is steadily increasing with the vocabulary size Web-trained language models - scalability of Web data ?

Dominique Vaufreydaz, ESSLLI Specific vocabulary definition Recording real dialogs in real condition (see « Data Collection in Nespole! ») –5 different scenarios recorded through NetMeeting –191 dialogs in 4 languages including 31 French ones manually transcribed extracted French vocabulary contains 2056 words Add CStar-II vocabulary –a specific tourist vocabulary was previously defined for the CStar-II project vocabulary grows up to 2500 words Web-trained language models - Nespole! example

Dominique Vaufreydaz, ESSLLI Increase vocabulary coverage - lexical OOV - WebFr4 délissasses 1 croquantes 42 emmènerais 9 emmènerait 26 badgé 19 badge 3439 faillirent 52 pentateuque 309 tabloïde 17 tabloïds 117 attendriraient 5 agatisé 1 portiques 1165 accusais 18 accusait 662 bioclimats 4 circonscriras 2 ABU délissasses 1 croquantes 42 emmènerais 9 emmènerait 26 badgé 19 badge 3439 faillirent 52 pentateuque 309 tabloïde 17 tabloïds 117 attendriraient 5 agatisé 1 portiques 1165 accusais 18 accusait 662 bioclimats 4 circonscriras 2 BDLex délissasses 1 croquantes 42 emmènerais 9 emmènerait 26 badgé 19 badge 3439 faillirent 52 pentateuque 309 tabloïde 17 tabloïds 117 attendriraient 5 agatisé 1 portiques 1165 accusais 18 accusait 662 bioclimats 4 circonscriras 2 Specific vocabulary délissasses 1 croquantes 42 emmènerais 9 emmènerait 26 badgé 19 badge 3439 faillirent 52 pentateuque 309 tabloïde 17 tabloïds 117 attendriraient 5 agatisé 1 portiques 1165 accusais 18 accusait 662 bioclimats 4 circonscriras 2 Words frequency délissasses 1 croquantes 42 emmènerais 9 emmènerait 26 badgé 19 badge 3439 faillirent 52 pentateuque 309 tabloïde 17 tabloïds 117 attendriraient 5 agatisé 1 portiques 1165 accusais 18 accusait 662 bioclimats 4 circonscriras 2 20K vocabulary compute words counts 2 – add most frequent words Web-trained language models - Nespole! example

Dominique Vaufreydaz, ESSLLI WebFr4 délissasses 1 croquantes 42 emmènerais 9 emmènerait 26 badgé 19 badge 3439 faillirent 52 pentateuque 309 tabloïde 17 tabloïds 117 attendriraient 5 agatisé 1 portiques 1165 accusais 18 accusait 662 bioclimats 4 circonscriras 2 Multi-words délissasses 1 croquantes 42 emmènerais 9 emmènerait 26 badgé 19 badge 3439 faillirent 52 pentateuque 309 tabloïde 17 tabloïds 117 attendriraient 5 agatisé 1 portiques 1165 accusais 18 accusait 662 bioclimats 4 circonscriras 2 20K vocabulary compute 5-gram on short words 5 – add most frequent multi-words délissasses 1 croquantes 42 emmènerais 9 emmènerait 26 badgé 19 badge 3439 faillirent 52 pentateuque 309 tabloïde 17 tabloïds 117 attendriraient 5 agatisé 1 portiques 1165 accusais 18 accusait 662 bioclimats 4 circonscriras 2 20K vocabulary délissasses 1 croquantes 42 emmènerais 9 emmènerait 26 badgé 19 badge 3439 faillirent 52 pentateuque 309 tabloïde 17 tabloïds 117 attendriraient 5 agatisé 1 portiques 1165 accusais 18 accusait 662 bioclimats 4 circonscriras 2 Final vocabulary (5 letters and 3 phonemes maximum) Increase vocabulary coverage - short words - Web-trained language models - Nespole! example

Dominique Vaufreydaz, ESSLLI Trigram language model WebFr4 5 - compute 3-gram Language Models délissasses 1 croquantes 42 emmènerais 9 emmènerait 26 badgé 19 badge 3439 faillirent 52 pentateuque 309 tabloïde 17 tabloïds 117 attendriraient 5 agatisé 1 portiques 1165 accusais 18 accusait 662 bioclimats 4 circonscriras 2 Final vocabulary (20,540 words) Minimal block length filter (length=5) Il mordait en ce moment de fort bon appétit dans un morceau de pain. Il en arracha un peu de mie pour faire une boulette. Il la lança railleusement par le vasistas d'une fenêtre sur laquelle il s'appuyait. Bien dirigée, la boulette rebondit presque à la hauteur de la croisée. Cet inconnu traversait la cour d'une maison située rue Vivienne, où. Cette exclamation échappait à un clerc appartenant au genre de ceu. Il mordait en ce moment de fort bon appétit dans un morceau de pain. Il en arracha un peu de mie pour faire une boulette. Il la lança railleusement par le vasistas d'une fenêtre sur laquelle il s'appuyait. Il en arracha un peu de mie pour faire une boulette. Il la lança railleusement par le vasistas d'une fenêtre sur laquelle il s'appuyait. Bien dirigée, la boulette rebondit presque à la hauteur de la croisée, Cet inconnu traversait la cour d'une maison. 1,587,142,200 words corpus Adapted LM tools délissasses 1 croquantes 42 emmènerais 9 emmènerait 26 badgé 19 badge 3439 faillirent 52 pentateuque 309 tabloïde 17 tabloïds 117 attendriraient 5 agatisé 1 portiques 1165 accusais 18 accusait 662 bioclimats 4 circonscriras 2 Final LM 1,960,813 bigrams 6,413,376 trigrams Web-trained language models - Nespole! example

Dominique Vaufreydaz, ESSLLI Results Web-trained language models - results On the CStar-II task (~3000 words) On the Nespole! Task (20524 words)

Dominique Vaufreydaz, ESSLLI Laboratoire CLIPS CLIPS Communication Langagière et Interaction Personne Système Fédération IMAG […]

Dominique Vaufreydaz, ESSLLI rue de la bibliothèque b est un laboratoire de grenoble le centre national de la un laboratoire et un centre vous pouvez également faire des de mots sur tout le nous avons aussi un peu si vous ne trouvez pas ce que vous cherchez ici également la liste de nos organisée par le laboratoire clips est de plus en plus important mais aussi à toute personne tout savoir sur le programme la sélection de la semaine sur le site web de la sur le site de la pour profiter de ce site il est sinon vous pouvez visiter une de haut niveau dans les domaines chaque année un programme est pour accéder directement au programme et la chimie de la matière juillet à grenoble saint martin semaine de juillet à grenoble saint martin