La reconnaissance vocale

Slides:

Advertisements

Présentations similaires

Les présentateurs doivent souvent transmettre des informations techniques à des auditeurs qui connaissent moins bien le sujet et le vocabulaire spécifique.

Advertisements

APPRENDRE A LIRE Présentation par : Marie-Christine Ratez CPC Chauny Roselyne Cail CPC Guise.

La reconnaissance vocale

Les outils pour améliorer la dictée vocale

Reconnaissance de la parole

Reconnaissance Automatique de la Parole

1 plan Besoins État de lart Assistant électronique unique pour la personne indépendante dans la maison intelligente Reconnaissance par unités segmentales.

Codage de la parole à très bas débit avec des unités ALISP

Le MAJORDOME de la Maison Intelligente

Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales.

Université Paris 3 La Dictée vocale SLFD Johanna Deron.

Savoir faire ED 268 I.L.P.G.A. PRAAT exercices.

TRAITEMENT AUTOMATIQUE DES LANGUES : LES PRINCIPAUX PROGRAMMES

Girard Pia & Laffont Caroline

l'approche ergonomique

LES TRANSMISSIONS DE DONNEES DANS LE SECTEUR INDUSTRIEL. ZOBRIST Julien TS1 ETA.

Apprendre à lire.

Automatique 2 Parties : - Systèmes Continus - Systèmes Échantillonnés

Assistance à distance Parfois on se sent bien seul face à un problème informatique surtout si on n’est qu’un simple utilisateur. Lorsqu'un problème survient.

Reconnaissance de la parole

Traitement Automatique de la Langue:

Animé au CRIF par Stéphane Lavoie Le 6 décembre 2011

Procédure dinstallation Windows Xp pro. Dans cette procédure nous verrons comment installer Windows xp pro sur un disque dur Vierge. Dans un premier temps,

Informatique Quelques notions de base Guy Kerckhoven.

La réalité augmentée M. Jamal BOUSFIHA Master 2 Informatique PLS

Initiation au système d’information et aux bases de données

Description du fonctionnement du téléphone

Manon,Corentin,Juliette,Bradley,Amandine et Morgann.

Que puis-je faire avec WordQ ?

Démarche de résolution de problèmes

TAL (Traitement automatique du langage)

Initiation à la conception de systèmes d'information

Reconnaissance de mots isolés Et Reconnaissance de mots connectés.

Bourse aux vêtements: Mode opératoire pour remplir les pré-listes

Indices prosodiques caractérisant un style d'élocution et ses variantes individuelles MIDL nov 2004 Paris Jean-Sylvain Liénard Martine Adda-Decker.

Ergonomie et facteurs humains

Le cahier de charge d'un système de RAP

Les relations clients - serveurs

Introduction à la sociolinguistique

Représentations des objectifs à atteindre dans l’apprentissage des langues: processus qualifiant et compétences plurilingues Patrick Chardenet Maître de.

Reconnaissance Vocale

L’Expression Orale Quelques repères.

En-tête: Ne pas modifier le style !

IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires - Démonstration : quel imitateur êtes vous ? Plateau Traitement du son.

DISPOSITIF DÉVALUATION CE1 Version 2007 Ref.: circulaire n° du ; BO n°30 du

LANGUE ET COMMUNICATION

Traitement automatique de la langue

Master 1 – Sciences du Langage –

Traitement de la parole : Synthèse et reconnaissance

Bourse aux vêtements: Mode opératoire pour remplir les pré-listes

Arkhênum Patrimoine du Futur. Répartitions par types d’erreurs mineures.

TBI les tableaux blancs interactifs

Juillet 2001  Les organes Cavité nasale Cavité buccale Langue Épiglotte et cordes vocales Trachée Voile du palais.

Généralités sur le traitement du signal Les techniques de traitement du signal ont été, initialement proposées et utilisées dans le but: 1.D’améliorer.

LA DYSLEXIE Présentation de Madame Véronique HAY

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Synthèse de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage

Informatique Quelques notions de base Guy Kerckhoven.

TRAITEMENT DE LA PAROLE

Module 1 : Généralités sur les systèmes informatiques

Le Traitement Automatique des Langues (TAL)

Antoine Tarault Directeur : Patrick Bourdot

Applications Internet Cours 3 21 janvier 2010 Cours 3 21 janvier 2010.

All rights reserved © 2007, AlphaBot Spécialiste dans le domaine de la robotisation, nous vous proposons de mettre notre expertise à votre service.

Pierre Malenfant Technologie 9 École du Carrefour

développeur informatique

Introduction aux Interfaces Homme-Machine

Simon Ménager/ Marion Burre-Espagnou.  Logiciel libre pour la manipulation de données audio numériques.  Enregistrer du son numérique par le biais des.

dans toutes ses dimensions

Transcription de la présentation:

La reconnaissance vocale BOUCHER Julie Sciences du langage DEUG 1 La reconnaissance vocale ILPGA, « Sorbonne Nouvelle », Paris 3 Td Informatique Le 10/05/04

Sommaire L’historique de la reconnaissance vocale Les principes de fonctionnement Application de la reconnaissance vocale

A quoi ressemble la reconnaissance vocale : « Parlez à votre ordinateur et il retranscrit vos paroles à l’écran » La reconnaissance vocale sert à retranscrire les mots prononcés par un locuteur lors de traitement de textes. Cette fonction permet à l’utilisateur un gain de temps considérable. Nous pouvons établir un lien avec ce que nous sommes entrain d’étudier c’est-à-dire le TAL, qui recouvre de nombreuses activités liées à l’analyse de la parole, à son codage, sa transmission…

L’historique de la reconnaissance vocale Les dates clés : 1952 : reconnaissance des 10 chiffres, par un dispositif câblé. 1965 : reconnaissance de phonèmes en parole continue. 1968 : reconnaissance de mots isolés (jusqu’à 500 mots). 1969 : utilisation d’informations linguistiques. 1971 : lancement de projets aux USA pour tester la fiabilité de la compréhension automatique de la parole continue avec du bruit de fond. 1972 : premier appareil commercialisé de reconnaissance de mots. 1988 :apparition de la première machine à dicter par mots isolés. 1994 : IBM lance son premier système de reconnaissance vocale sur PC. 1997 : lancement de la dictée vocale en continue par IBM.

Les principes de fonctionnement ANALYSE DU SIGNAL DE LA PAROLE Analyse acoustique Décodeur Parole émise dans un casque Transcription orthographique écran

Description du schéma Le locuteur émet une phrase, une fois le son émis, il est capté par un microphone. Le signal vocal est ensuite numérisé à l’aide d’un convertisseur analogique-numérique. Le paramétrage du signal permet d’avoir une empreinte. Le décodage consiste à décrire le signal acoustique en termes d’unités linguistiques. Il a pour but de segmenter le signal, l’identification des différents segments se fait en fonction des contraintes phonétiques et linguistiques. Lorsque tout cela est effectué la reconnaissance en elle-même peut commencer.

LES MOTS ISOLES « Tout les mots prononcés sont séparés par des silences de durée supérieures à quelques dixièmes de seconde ». La phase d’apprentissage : Le locuteur prononce l’ensemble du vocabulaire souvent plusieurs fois afin de créer un dictionnaire de référence. La phase de reconnaissance : Le locuteur un mot énoncé auparavant. Pour reconnaître les mots émis par le locuteur il y a trois parties : Le CAPTEUR permettant d’appréhender le phonème physique considéré, nous dans notre cas c’est le microphone.Un signal est émis au microphone lorsque le locuteur parle. La PARAMETRISATION des formes qui nous donne une empreinte c’est-à-dire la caractéristique du son (Temps/Fréquence/Intensité). Et enfin l’IDENTIFICATION des formes.

La parole continue : « C’est un discours de phrases où les mots s’enchaînent sans moyen de se séparer, contrairement aux mots isolés ». 1ère approche : ASCENCANTE Reconstruction de la phrase à partir du signal. On se contente de le décrypter, cette approche est souvent utilisée pour un vocabulaire très restreint. 2ème approche : DESCENDANTE Une sorte de prédiction du mot qu’il va falloir reconnaître. Cette approche permet à ne pas avoir à tester tout le dictionnaire de la machine.

Application de la reconnaissance vocale : Je vais vous monter quelques unes des applications de la reconnaissance vocale. Tout d’abord il ne faut pas encore se dire que la commande vocale va remplacer le clavier, mais plutôt la considérer comme un moyen complémentaire d’interaction entre l’homme et la machine. Chaque application a ses propres caractéristiques et ses performances : Débit du flux de la parole. Pause entre les mots (mots isolés) ou non (parole continue). Taille du vocabulaire reconnu. Acceptation du bruit de fond.

La reconnaissance ailleurs que dans l’ordinateur : Avionique / Automobile : Dans les avions il y a un domaine d’application important en ce qui concerne les commandes vocales. Tout cela pour permettre aux pilotes de commander par la voix diverses commandes (radar, radio…) En ce qui concerne les automobiles, il y a le GPS, qui permet au conducteur d’avoir à sa disposition la connaissance du trajet, ainsi que l’évolution de la circulation, tout ceci marqué par des messages vocaux. Télécommunication : Reconnaissance du nom sur les téléphones après avoir été mémorisé. Les répertoires vocaux représentent aujourd’hui 50% du marché mondiale des services à commandes vocales.

Les serveurs IBM et Dragon Naturally Speaking : IMB : Avec un taux de reconnaissance à 97%, la dictée d’IBM est assez performante avec pour cadence 70 à 100 mots par minute. Par contre ce logiciel est incapable de retrouver le découpage des mots par leur sens comme pourrait le faire le cerveau humain. Dragon Naturally Speaking : Ce logiciel est à la pointe de la technologie qui est marquée par une avancée très significative. Il permet une diction la plus naturelle possible, sans avoir à marquer de pauses entre les mots avec une cadence d’environ 130 mots par minute et même voir plus. Il possède un dictionnaire très varié (240000 mots) qui recouvre un vocabulaire accessible à tous. Et surtout, il peut accueillir plusieurs locuteurs.