La reconnaissance vocale

Slides:



Advertisements
Présentations similaires
Les présentateurs doivent souvent transmettre des informations techniques à des auditeurs qui connaissent moins bien le sujet et le vocabulaire spécifique.
Advertisements

APPRENDRE A LIRE Présentation par : Marie-Christine Ratez CPC Chauny Roselyne Cail CPC Guise.
La reconnaissance vocale
Les outils pour améliorer la dictée vocale
Reconnaissance de la parole
Reconnaissance Automatique de la Parole
1 plan Besoins État de lart Assistant électronique unique pour la personne indépendante dans la maison intelligente Reconnaissance par unités segmentales.
Codage de la parole à très bas débit avec des unités ALISP
Le MAJORDOME de la Maison Intelligente
Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales.
Université Paris 3 La Dictée vocale SLFD Johanna Deron.
Savoir faire ED 268 I.L.P.G.A. PRAAT exercices.
TRAITEMENT AUTOMATIQUE DES LANGUES : LES PRINCIPAUX PROGRAMMES
Girard Pia & Laffont Caroline
l'approche ergonomique
LES TRANSMISSIONS DE DONNEES DANS LE SECTEUR INDUSTRIEL. ZOBRIST Julien TS1 ETA.
Apprendre à lire.
Automatique 2 Parties : - Systèmes Continus - Systèmes Échantillonnés
Assistance à distance Parfois on se sent bien seul face à un problème informatique surtout si on n’est qu’un simple utilisateur. Lorsqu'un problème survient.
Reconnaissance de la parole
Traitement Automatique de la Langue:
Animé au CRIF par Stéphane Lavoie Le 6 décembre 2011
Procédure dinstallation Windows Xp pro. Dans cette procédure nous verrons comment installer Windows xp pro sur un disque dur Vierge. Dans un premier temps,
Informatique Quelques notions de base Guy Kerckhoven.
La réalité augmentée M. Jamal BOUSFIHA Master 2 Informatique PLS
Initiation au système d’information et aux bases de données
Description du fonctionnement du téléphone
Manon,Corentin,Juliette,Bradley,Amandine et Morgann.
Que puis-je faire avec WordQ ?
Démarche de résolution de problèmes
TAL (Traitement automatique du langage)
Initiation à la conception de systèmes d'information
Reconnaissance de mots isolés Et Reconnaissance de mots connectés.
Bourse aux vêtements: Mode opératoire pour remplir les pré-listes
Indices prosodiques caractérisant un style d'élocution et ses variantes individuelles MIDL nov 2004 Paris Jean-Sylvain Liénard Martine Adda-Decker.
Ergonomie et facteurs humains
Le cahier de charge d'un système de RAP
Les relations clients - serveurs
Introduction à la sociolinguistique
Représentations des objectifs à atteindre dans l’apprentissage des langues: processus qualifiant et compétences plurilingues Patrick Chardenet Maître de.
Reconnaissance Vocale
L’Expression Orale Quelques repères.
En-tête: Ne pas modifier le style !
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires - Démonstration : quel imitateur êtes vous ? Plateau Traitement du son.
DISPOSITIF DÉVALUATION CE1 Version 2007 Ref.: circulaire n° du ; BO n°30 du
LANGUE ET COMMUNICATION
Traitement automatique de la langue
Master 1 – Sciences du Langage –
Traitement de la parole : Synthèse et reconnaissance
Bourse aux vêtements: Mode opératoire pour remplir les pré-listes
Arkhênum Patrimoine du Futur. Répartitions par types d’erreurs mineures.
TBI les tableaux blancs interactifs
Juillet 2001  Les organes Cavité nasale Cavité buccale Langue Épiglotte et cordes vocales Trachée Voile du palais.
Généralités sur le traitement du signal Les techniques de traitement du signal ont été, initialement proposées et utilisées dans le but: 1.D’améliorer.
LA DYSLEXIE Présentation de Madame Véronique HAY
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Synthèse de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage
Informatique Quelques notions de base Guy Kerckhoven.
TRAITEMENT DE LA PAROLE
Module 1 : Généralités sur les systèmes informatiques
Le Traitement Automatique des Langues (TAL)
Antoine Tarault Directeur : Patrick Bourdot
Applications Internet Cours 3 21 janvier 2010 Cours 3 21 janvier 2010.
Video.
All rights reserved © 2007, AlphaBot Spécialiste dans le domaine de la robotisation, nous vous proposons de mettre notre expertise à votre service.
Pierre Malenfant Technologie 9 École du Carrefour
développeur informatique
Introduction aux Interfaces Homme-Machine
Simon Ménager/ Marion Burre-Espagnou.  Logiciel libre pour la manipulation de données audio numériques.  Enregistrer du son numérique par le biais des.
dans toutes ses dimensions
Transcription de la présentation:

La reconnaissance vocale BOUCHER Julie Sciences du langage DEUG 1 La reconnaissance vocale ILPGA, « Sorbonne Nouvelle », Paris 3 Td Informatique Le 10/05/04

Sommaire L’historique de la reconnaissance vocale Les principes de fonctionnement Application de la reconnaissance vocale

A quoi ressemble la reconnaissance vocale : « Parlez à votre ordinateur et il retranscrit vos paroles à l’écran » La reconnaissance vocale sert à retranscrire les mots prononcés par un locuteur lors de traitement de textes. Cette fonction permet à l’utilisateur un gain de temps considérable. Nous pouvons établir un lien avec ce que nous sommes entrain d’étudier c’est-à-dire le TAL, qui recouvre de nombreuses activités liées à l’analyse de la parole, à son codage, sa transmission…

L’historique de la reconnaissance vocale Les dates clés : 1952 : reconnaissance des 10 chiffres, par un dispositif câblé. 1965 : reconnaissance de phonèmes en parole continue. 1968 : reconnaissance de mots isolés (jusqu’à 500 mots). 1969 : utilisation d’informations linguistiques. 1971 : lancement de projets aux USA pour tester la fiabilité de la compréhension automatique de la parole continue avec du bruit de fond. 1972 : premier appareil commercialisé de reconnaissance de mots. 1988 :apparition de la première machine à dicter par mots isolés. 1994 : IBM lance son premier système de reconnaissance vocale sur PC. 1997 : lancement de la dictée vocale en continue par IBM.

Les principes de fonctionnement ANALYSE DU SIGNAL DE LA PAROLE Analyse acoustique Décodeur Parole émise dans un casque Transcription orthographique écran

Description du schéma Le locuteur émet une phrase, une fois le son émis, il est capté par un microphone. Le signal vocal est ensuite numérisé à l’aide d’un convertisseur analogique-numérique. Le paramétrage du signal permet d’avoir une empreinte. Le décodage consiste à décrire le signal acoustique en termes d’unités linguistiques. Il a pour but de segmenter le signal, l’identification des différents segments se fait en fonction des contraintes phonétiques et linguistiques. Lorsque tout cela est effectué la reconnaissance en elle-même peut commencer.

LES MOTS ISOLES « Tout les mots prononcés sont séparés par des silences de durée supérieures à quelques dixièmes de seconde ». La phase d’apprentissage : Le locuteur prononce l’ensemble du vocabulaire souvent plusieurs fois afin de créer un dictionnaire de référence. La phase de reconnaissance : Le locuteur un mot énoncé auparavant. Pour reconnaître les mots émis par le locuteur il y a trois parties : Le CAPTEUR permettant d’appréhender le phonème physique considéré, nous dans notre cas c’est le microphone.Un signal est émis au microphone lorsque le locuteur parle. La PARAMETRISATION des formes qui nous donne une empreinte c’est-à-dire la caractéristique du son (Temps/Fréquence/Intensité). Et enfin l’IDENTIFICATION des formes.

La parole continue : « C’est un discours de phrases où les mots s’enchaînent sans moyen de se séparer, contrairement aux mots isolés ». 1ère approche : ASCENCANTE Reconstruction de la phrase à partir du signal. On se contente de le décrypter, cette approche est souvent utilisée pour un vocabulaire très restreint. 2ème approche : DESCENDANTE Une sorte de prédiction du mot qu’il va falloir reconnaître. Cette approche permet à ne pas avoir à tester tout le dictionnaire de la machine.

Application de la reconnaissance vocale : Je vais vous monter quelques unes des applications de la reconnaissance vocale. Tout d’abord il ne faut pas encore se dire que la commande vocale va remplacer le clavier, mais plutôt la considérer comme un moyen complémentaire d’interaction entre l’homme et la machine. Chaque application a ses propres caractéristiques et ses performances : Débit du flux de la parole. Pause entre les mots (mots isolés) ou non (parole continue). Taille du vocabulaire reconnu. Acceptation du bruit de fond.

La reconnaissance ailleurs que dans l’ordinateur : Avionique / Automobile : Dans les avions il y a un domaine d’application important en ce qui concerne les commandes vocales. Tout cela pour permettre aux pilotes de commander par la voix diverses commandes (radar, radio…) En ce qui concerne les automobiles, il y a le GPS, qui permet au conducteur d’avoir à sa disposition la connaissance du trajet, ainsi que l’évolution de la circulation, tout ceci marqué par des messages vocaux. Télécommunication : Reconnaissance du nom sur les téléphones après avoir été mémorisé. Les répertoires vocaux représentent aujourd’hui 50% du marché mondiale des services à commandes vocales.

Les serveurs IBM et Dragon Naturally Speaking : IMB : Avec un taux de reconnaissance à 97%, la dictée d’IBM est assez performante avec pour cadence 70 à 100 mots par minute. Par contre ce logiciel est incapable de retrouver le découpage des mots par leur sens comme pourrait le faire le cerveau humain. Dragon Naturally Speaking : Ce logiciel est à la pointe de la technologie qui est marquée par une avancée très significative. Il permet une diction la plus naturelle possible, sans avoir à marquer de pauses entre les mots avec une cadence d’environ 130 mots par minute et même voir plus. Il possède un dictionnaire très varié (240000 mots) qui recouvre un vocabulaire accessible à tous. Et surtout, il peut accueillir plusieurs locuteurs.