La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

La reconnaissance vocale ILPGA, « Sorbonne Nouvelle », Paris 3 BOUCHER Julie Sciences du langage DEUG 1 Td InformatiqueLe 10/05/04.

Présentations similaires


Présentation au sujet: "La reconnaissance vocale ILPGA, « Sorbonne Nouvelle », Paris 3 BOUCHER Julie Sciences du langage DEUG 1 Td InformatiqueLe 10/05/04."— Transcription de la présentation:

1 La reconnaissance vocale ILPGA, « Sorbonne Nouvelle », Paris 3 BOUCHER Julie Sciences du langage DEUG 1 Td InformatiqueLe 10/05/04

2 Sommaire Application de la reconnaissance vocale Lhistorique de la reconnaissance vocale Les principes de fonctionnement

3 A quoi ressemble la reconnaissance vocale : « Parlez à votre ordinateur et il retranscrit vos paroles à lécran » La reconnaissance vocale sert à retranscrire les mots prononcés par un locuteur lors de traitement de textes. Cette fonction permet à lutilisateur un gain de temps considérable. Nous pouvons établir un lien avec ce que nous sommes entrain détudier cest-à-dire le TAL, qui recouvre de nombreuses activités liées à lanalyse de la parole, à son codage, sa transmission…

4 Lhistorique de la reconnaissance vocale Les dates clés : 1952 : reconnaissance des 10 chiffres, par un dispositif câblé : reconnaissance de phonèmes en parole continue : reconnaissance de mots isolés (jusquà 500 mots) : utilisation dinformations linguistiques : lancement de projets aux USA pour tester la fiabilité de la compréhension automatique de la parole continue avec du bruit de fond : premier appareil commercialisé de reconnaissance de mots :apparition de la première machine à dicter par mots isolés : IBM lance son premier système de reconnaissance vocale sur PC : lancement de la dictée vocale en continue par IBM.

5 Les principes de fonctionnement ANALYSE DU SIGNAL DE LA PAROLE Parole émise dans un casque Analyse acoustique Décodeur Transcription orthographique écran

6 Description du schéma 1.Le locuteur émet une phrase, une fois le son émis, il est capté par un microphone. 2.Le signal vocal est ensuite numérisé à laide dun convertisseur analogique-numérique. Le paramétrage du signal permet davoir une empreinte. 3.Le décodage consiste à décrire le signal acoustique en termes dunités linguistiques. Il a pour but de segmenter le signal, lidentification des différents segments se fait en fonction des contraintes phonétiques et linguistiques. Lorsque tout cela est effectué la reconnaissance en elle-même peut commencer.

7 LES MOTS ISOLES « Tout les mots prononcés sont séparés par des silences de durée supérieures à quelques dixièmes de seconde ». La phase dapprentissage : Le locuteur prononce lensemble du vocabulaire souvent plusieurs fois afin de créer un dictionnaire de référence. La phase de reconnaissance : Le locuteur un mot énoncé auparavant. Pour reconnaître les mots émis par le locuteur il y a trois parties : Le CAPTEUR permettant dappréhender le phonème physique considéré, nous dans notre cas cest le microphone.Un signal est émis au microphone lorsque le locuteur parle. La PARAMETRISATION des formes qui nous donne une empreinte cest-à-dire la caractéristique du son (Temps/Fréquence/Intensité). Et enfin lIDENTIFICATION des formes.

8 La parole continue : Reconstruction de la phrase à partir du signal. On se contente de le décrypter, cette approche est souvent utilisée pour un vocabulaire très restreint. « Cest un discours de phrases où les mots senchaînent sans moyen de se séparer, contrairement aux mots isolés ». 1ère approche : ASCENCANTE Une sorte de prédiction du mot quil va falloir reconnaître. Cette approche permet à ne pas avoir à tester tout le dictionnaire de la machine. 2ème approche : DESCENDANTE

9 Application de la reconnaissance vocale : Je vais vous monter quelques unes des applications de la reconnaissance vocale. Tout dabord il ne faut pas encore se dire que la commande vocale va remplacer le clavier, mais plutôt la considérer comme un moyen complémentaire dinteraction entre lhomme et la machine. Chaque application a ses propres caractéristiques et ses performances : Débit du flux de la parole. Pause entre les mots (mots isolés) ou non (parole continue). Taille du vocabulaire reconnu. Acceptation du bruit de fond.

10 La reconnaissance ailleurs que dans lordinateur : Avionique / Automobile : Dans les avions il y a un domaine dapplication important en ce qui concerne les commandes vocales. Tout cela pour permettre aux pilotes de commander par la voix diverses commandes (radar, radio…) En ce qui concerne les automobiles, il y a le GPS, qui permet au conducteur davoir à sa disposition la connaissance du trajet, ainsi que lévolution de la circulation, tout ceci marqué par des messages vocaux. Télécommunication : Reconnaissance du nom sur les téléphones après avoir été mémorisé. Les répertoires vocaux représentent aujourdhui 50% du marché mondiale des services à commandes vocales.

11 Les serveurs IBM et Dragon Naturally Speaking : IMB : Dragon Naturally Speaking : Avec un taux de reconnaissance à 97%, la dictée dIBM est assez performante avec pour cadence 70 à 100 mots par minute. Par contre ce logiciel est incapable de retrouver le découpage des mots par leur sens comme pourrait le faire le cerveau humain. Ce logiciel est à la pointe de la technologie qui est marquée par une avancée très significative. Il permet une diction la plus naturelle possible, sans avoir à marquer de pauses entre les mots avec une cadence denviron 130 mots par minute et même voir plus. Il possède un dictionnaire très varié ( mots) qui recouvre un vocabulaire accessible à tous. Et surtout, il peut accueillir plusieurs locuteurs.


Télécharger ppt "La reconnaissance vocale ILPGA, « Sorbonne Nouvelle », Paris 3 BOUCHER Julie Sciences du langage DEUG 1 Td InformatiqueLe 10/05/04."

Présentations similaires


Annonces Google