Reconnaissance de la parole

Slides:



Advertisements
Présentations similaires
LES NOMBRES PREMIERS ET COMPOSÉS
Advertisements

[number 1-100].
Le moteur
Qualité du Premier Billot. 2 3 Défauts reliés à labattage.
1. Résumé 2 Présentation du créateur 3 Présentation du projet 4.
Distance inter-locuteur
Mon carnet De comportement
Classification des signaux exemples de signaux réels
Classe : …………… Nom : …………………………………… Date : ………………..
Le traitement automatique de la parole Comment reproduire les processus physiologiques et cognitifs humains? Ivan Magrin-Chagnolleau, CNRS Laboratoire.
Codage de la parole Ivan Magrin-Chagnolleau, CNRS
Reconnaissance Automatique de la Parole
Reconnaissance Automatique de la Parole
Les numéros
ACTIVITES Les fractions (10).
Est Ouest Sud 11 1 Nord 1 Individuel 20 joueurs 15 rondes - 30 étuis (arc-en-ciel) Laval Du Breuil Adstock, Québec I-20-15ACBLScore S0515 RondeNE
Est Ouest Sud 11 1 Nord 1 Laval Du Breuil, Adstock, Québec I-17-17ACBLScore S0417 Allez à 1 Est Allez à 4 Sud Allez à 3 Est Allez à 2 Ouest RndNE
Est Ouest Sud 11 1 Nord 1 RondeNE SO
Est Ouest Sud 11 1 Nord 1 Individuel 15 ou 16 joueurs 15 rondes - 30 étuis Laval Du Breuil Adstock, Québec I-16-15ACBLScore S0415 RndNE
Sud Ouest Est Nord Individuel 36 joueurs
Les Prepositions.
Les 3 dimensio ns de la morale et de léthique (activité)
Architecture de réseaux
A abstraction b assembleur c nombre binaire d bit e cache f UC g puce h compilateur i famille dordinateurs j contrôle k chemin de données l défaut m dé
La diapo suivante pour faire des algorithmes (colorier les ampoules …à varier pour éviter le « copiage ») et dénombrer (Entoure dans la bande numérique.
Reconnaissance de la parole
28 La maison.
CALENDRIER PLAYBOY 2020 Cliquez pour avancer.
Congé Férié Journée Pédagogique Rencontre avec les athlètes 13hrs-14hrs Hors Glace 14hrs-15hrs 30 Glace Arena Vaudreuil-Dorion 14hrs-15hrs Glace 15hrs-16hrs.
LUNDI – MARDI – MERCREDI – JEUDI – VENDREDI – SAMEDI – DIMANCHE
Les verbes auxiliaires Avoir ou être ?? Choisissez! Cest un verbe Dr Mrs Vandertrampp? Cest un verbe réfléchi?
Décodage des informations
1 SERVICE PUBLIC DE LEMPLOI REGION ILE DE France Tableau de bord Juillet- Août 2007.
LUNDI – MARDI – MERCREDI – JEUDI – VENDREDI – SAMEDI – DIMANCHE
Le cahier de charge d'un système de RAP
LES NOMBRES PREMIERS ET COMPOSÉS
La Saint-Valentin Par Matt Maxwell.
Reconnaissance Vocale
Louis la grenouille Paroles et musique: Matt Maxwell.
Notre calendrier français MARS 2014
3ème partie: les filtres
C'est pour bientôt.....
CHARAL Calendrier 2007 Dit is wat mannen boeit!.
Veuillez trouver ci-joint
Les Nombres! de 0 à 20.
F L T R Université catholique de Louvain-la-Neuve Faculté de philosophie et lettres FLTR Faculté de Philosophie et Lettres Présentation décembre 2002 Réalisation:
SUJET D’ENTRAINEMENT n°4
LUNDI – MARDI – MERCREDI – JEUDI – VENDREDI – SAMEDI – DIMANCHE
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
Traitement de différentes préoccupations Le 28 octobre et 4 novembre 2010.
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
1 Modèle pédagogique d’un système d’apprentissage (SA)
* Source : Étude sur la consommation de la Commission européenne, indicateur de GfK Anticipations.
10 paires -. 9 séries de 3 étuis ( n° 1 à 27 ) 9 positions à jouer 5 tables Réalisé par M..Chardon.
CALENDRIER-PLAYBOY 2020.
USAM BRIDGE H O W E L L -CLASSIQUE
6 Nombres et Heures 20 vingt 30 trente 40 quarante.
9 paires séries de 3 étuis ( n° 1 à 27 )
Quel est l’intérêt d’utiliser le diagramme de Gantt dans la démarche de projet A partir d’un exemple concret, nous allons pouvoir exploiter plusieurs parties.
1 Nestlé – Optifibre Zones administrables via le back-office.
Les Chiffres Prêts?
Médiathèque de Chauffailles du 3 au 28 mars 2009.
Relevez le numéro de votre logo préféré et adressez-le à : En cas d’hésitation, vous pouvez choisir jusqu’à 3 logos. Seront pris.
Tolérance de parallélisme
Traitement de la parole : Synthèse et reconnaissance
Transcription de la présentation:

Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Objectifs Transformer un signal de parole en : Texte (dictée vocale, transcription) Action (commande vocale, systèmes de dialogue) Information indexée (annotation, indexation) LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Les sources de variabilité LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Les facteurs intra-locuteurs : co-articulation, variation dans la prononciation, etc. Les facteurs inter-locuteurs : physiologie, age, sexe, psychologie, familiarité avec l’application, etc. L’environnement : bruit, micro, canal de transmission, présence d’autres locuteurs, etc. LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Variabilité intra- et inter-locuteur LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Variabilité intra-locuteur LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Typologie des systèmes LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Type de parole Taille du vocabulaire Niveau de dépendance par rapport aux locuteurs Environnement d’utilisation Profil des utilisateurs potentiels LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Type de parole Mots isolés Mots connectés Détection de mots clés Parole contrainte Parole continue Parole spontanée LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Taille du vocabulaire Quelques mots (5 – 50) Petit vocabulaire (50 – 500) Vocabulaire moyen (500 – 5000) Grand vocabulaire (5000 – 50000) Très grand vocabulaire (> 50000) LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Dépendance au locuteur LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Dépendant du locuteur : le système fonctionne correctement avec un utilisateur particulier Adaptation au locuteur = utilise quelques données spécifiques d’un locuteur pour adapter le système à une nouvelle voix Indépendant du locuteur : le système fonctionne avec n’importe quel utilisateur LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Environnement d’utilisation LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Parole large-bande (ordinateur, etc.) Parole bande-étroite avec distorsion (téléphone, etc.) Environnement calme (bureau + micro-casque) Bruit de fond LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Profil des utilisateurs potentiels Utilisation professionnelle par des spécialistes Grand public Entraîné / naïf Fréquent / occasionnel Utilité Coopération LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Deux exemples Dictée vocale Parole continue Grand vocabulaire Adaptation au locuteur Bureau+micro-casque Utilisateurs d’ordinateurs Service téléphonique Détection de mots clés Quelques mots Indépendant du locuteur Parole téléphonique Grand public LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Système de reconnaissance de mots LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Programmation dynamique (DTW) Mot 1 Mot 2 Mot n Mot inconnu Y Mot X meilleur chemin LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Contraintes locales LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Contraintes locales : exemple LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Modèle de Markov caché : principe LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Modèles de Markov cachés (HMM) Mot inconnu Y Mot X Mot 1 Mot 2 Mot n meilleur chemin LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Viterbi : exemple LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Algorithme de Viterbi : exercice LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Le modèle hiérarchique LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Le modèle hiérarchique : exemple LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Modèles phonétiques (1) LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Modèles phonétiques (2) LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Le mot « américain » LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Modèles contextuels LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Modèles de langage A un instant donné, tous les mots n’ont pas la même probabilité de présence : Le petit chat boit du … Grammaires probabilistes : toutes les phrases sont possibles mais avec des probabilités différentes Grammaires à états finis : partition binaire des séquences de mots en « séquences possibles » et « séquences impossibles » LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Modèle acoustique + Modèle de langage LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Les n meilleures phrases LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Treillis de mots / Graphe de mots LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Graphe de mots (2) LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Performances LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Recherche actuelle LE TRAITEMENT AUTOMATIQUE DE LA PAROLE