La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

PFE – SCIA 2008 Julien Assémat David Landais. Présentation générale Historique & réflexions Historique, méthodes utilisées, techniques… Démarche retenue.

Présentations similaires


Présentation au sujet: "PFE – SCIA 2008 Julien Assémat David Landais. Présentation générale Historique & réflexions Historique, méthodes utilisées, techniques… Démarche retenue."— Transcription de la présentation:

1 PFE – SCIA 2008 Julien Assémat David Landais

2 Présentation générale Historique & réflexions Historique, méthodes utilisées, techniques… Démarche retenue Structures HMM, algorithme N-grams… Avancement Conclusion

3 Nature du projet : Programme de reconnaissance vocale Vocabulaire de grande taille Orienté retranscription de fichiers audio Technologies et notions utilisées : Langage C++ HMM N-grammes Transformée de Fourier

4 Applications envisagées Commandes vocales Retranscription de fichiers audio Conversations Extraits radiophoniques Objectifs Capacité de reconnaissance dun signal continue de parole Vocabulaire de grande taille Taux de reconnaissance correct En faire une application concrête

5 Premiers pas de la reconnaissance vocale 1950 : reconnaissance de chiffres et voyelles Vocabulaire limité 1968 : reconnaissance de mots isolés Modèle de langage statistique 1980 : N-grams

6 Commandes vocales 1983 : domaine militaire (France) Reconnaissance de parole continue 1996 : première machine à dictée vocale (IBM)

7 Deux méthodes principalement utilisées Méthode explicite Méthode basée sur lutilisation de connaissances explicites Méthode implicite Méthode basée sur une approche statistique

8 Méthode explicite Première approche de la reconnaissance vocale Basée sur lutilisation de connaissances explicites : Comparaison à des formes de référence (spectres…) Utilisant des techniques dIA pure Systèmes multi-agents Blackboards (Hearsay II) Systèmes experts Méthode peu performante en létat actuel des choses

9 Méthode implicite Approche orientée statistique du problème à 2 niveaux Niveau acoustique (modèle acoustique) Niveau linguistique (modèle de langue) Nécessite un apprentissage sur des corpus conséquents Techniques utilisées : Hidden Markov Models (HMM) Algorithme N-grams Réseaux de neurones Méthode la plus performante à lheure actuelle

10 Pour notre projet : Méthode implicite est retenue Méthode implicite comprend : Modèle acoustique Modèle linguistique

11 Donne la probabilité de correspondance à un phonème Découpage du signal en tranches de 10 à 20 ms Extraction dun vecteur de caractéristiques Coefficients MFCC Utilisation des HMM pour déterminer le phonème

12 Hidden Markov Models Automates Un HMM par phonème Etats = caractéristiques du vecteur extrait Un HMM par mot Etats = phonèmes Calculer la probabilité dune séquence de phonèmes

13 Travail sur la syntaxe et la sémantique propre à la langue Probabilité quune suite de mots existe dans la langue Introduction de la notion dapproximation avec N-grams Algorithme N-grams Agrégation en 2 ou 3 mots avec une probabilité associée Approximation de probabilités de séquences plus longues Calcul des probabilités sur ces séquences plutôt que sur des mots Proche des HMM (algorithme de Viterbi) Viterbi : trouver la séquence détats la plus probable connaissant la sortie

14

15 Gestion des entrées Fichiers Wave : Parser de fichiers Wave (échantillonnage, mono / stéréo…) Extraction du spectre damplitude

16 Application de la transformée de Fourier Structure du spectre en terme de fréquence

17 Découpage en tranches Application de Fourier sur chaque tranche Extraction de coefficients caractéristiques Pour ensuite associer la tranche à un phonème

18 Nombreuses démarches possibles Idées directrices précises Phase de réflexion terminée Retard dans nos prévisions Modèle acoustique presque terminé Projet à concrétiser avec un système dindexation automatique de messages audio


Télécharger ppt "PFE – SCIA 2008 Julien Assémat David Landais. Présentation générale Historique & réflexions Historique, méthodes utilisées, techniques… Démarche retenue."

Présentations similaires


Annonces Google