Reconnaissance de Yes/No à l’aide du HTK Adapté d’un tutoriel du HTK par Nicolas Moreau.

Slides:



Advertisements
Présentations similaires
Etudes de cas A vous de faire Bases de données DRES – B. TALON.
Advertisements

Support.ebsco.com Guide dUtilisation Création dune collection locale.
Module 5 : Implémentation de l'impression
UTILISER JADE POUR LA CREATION DE GROUPES DE BESOIN.
Master Professionnelle Sciences et Techniques 2 juillet
© Copyright 2007 Arumtec. All rights reserved. Présentation Etude déligibilité
Abes agence bibliographique de l’enseignement supérieur Les scripts.
DTD Sylvain Salvati
Algorithme de Viterbi pour la reconnaissance de la parole
Diffusion Nationale TOULOUSE -Mai 2006 STSWEB Gestion des indemnités Indemnités Chef de travaux.
Affectation en 6 ème Année ETAPE 1 Constitution et validation de la liste des élèves susceptibles dentrer en sixième 1.
EVALUATION DU SYSTEME DE CONTROLE INTERNE :
COMMENT CRÉER UNE ENQUÊTE AVEC SPHINX ?
MENU DE L’AIDE Cliquer ici pour aide RESEAUX DE CONTACTS
Systèmes d’exploitation
1. Choisir son type de client 2. Champs obligatoires 3. Informations clients 4. Chercher un client Créer un client II Créer un client.
Les requêtes La Requête est une méthode pour afficher les enregistrements qui répondent à des conditions spécifiques. La requête est donc un filtre.
Page 1 Introduction à ATEasy 3.0 Page 2 Quest ce quATEasy 3.0? n Ensemble de développement très simple demploi n Conçu pour développer des bancs de test.
Traitement de texte ++.
Algorithmique et Programmation
Création d'un diaporama Création d'un diaporama
Publispostage Menu Outils / Lettres et publipostage
Reconnaissance de Yes/No à l’aide du HTK
Créer une interface graphique avec Photoshop.
EFICN SW METHODOLOGIE Ouvrir un nouvel assemblage
REPRISE DES DONNEES DE BASE
Des outils pour le développement logiciel
Module 4 : Création et gestion de comptes d'utilisateur
Création et gestion de comptes d'utilisateur
Formation Python Modules (d'après "Learning Python", de Mark Lutz)
Reconnaissance Vocale
Elaborer des mots croisés avec JCross: Les différentes étapes
Module 3 : Création d'un domaine Windows 2000
Présenter par : Mounir GRARI RAPPORT DE PROJET SOUS HTK
Mise en oeuvre des MMCs L'utilisation des MMCs en reconnaissance des formes s'effectue en trois étapes : définition de la topologie de la chaîne de Markov,
Conception des Réalisé par : Nassim TIGUENITINE.
CRÉATION D’UN MODÈLE DE CONCEPTION AVEC LE LOGICIEL POWERPOINT
Patrons de conceptions de créations
Mise en oeuvre et exploitation
Supports de formation au SQ Unifié
Partie 2 : Acquisition de données avec une carte Daqmx
Objectifs A la fin de ce chapitre, vous pourrez : présenter l'utilisation d'opérations de chargement de données par chemin direct décrire l'utilisation.
Traitement de son Chapitre 2 : Exploitation de logiciels Leçon1:
Diffusion Nationale TOULOUSE – Décembre 2008 STSWEB Gestion des indemnités Indemnités Chef de travaux.
MonACCÈS-Enseignant Guide n° 2 Le carnet de notes Primaire.
Résumé des concepts liés aux objets C. Petitpierre, EPFL.
Programmation Création d’une mire 1 afficher une image
Présentation RFIA janvier 2002
Management de la qualité
Module 3 : Création d'un domaine Windows 2000
Hiver 2004SEG2501 Chapître 41 Chapître 4 SDL – structure d’un système et son comportement.
BASE ELEVES PREMIER DEGRE Module de formation sur les admissions définitives bloquées Cette présentation animée et sonorisée nécessite soit : l’application.
Création d’un projet (10) Cadepa 6-12 pour API TSX-37
Classification automatique des messages électroniques
1 Logiciel d'Assistance des Responsables d'Audits.
Microsoft Project UNIVERSITÉ HASSAN II – Mohammedia.
Gestion et traitement des demandes de service
LOGICIEL PL7 MICRO PROGRAMMATION MISE AU POINT Consignes?
Guide d’utilisation du Site Microsoft Platform Ready (MPR)
© Copyright-CNP-EFII-Paris-1998
L. Gurret – M. Herve – P. Mignon – J. Prarioz. Introduction  Dernière étape d’analyse  Cahier des charges, spécifications et conception orientée objet.
La conception détaillée. Objectifs Décrire la solution opérationnelle - étude détaillée des phases informatiques du MOT (écrans, états, algorithmes, …),
Tutoriel V_Stage Cliquez pour continuer.
Vous présente en quelques réalisations un réel savoir-faire, le fruit de longues années d’expériences, aujourd’hui à votre service. Toutes les fonctionnalités.
Scénario Les scénarios permettent de modifier la position, taille … des calques au cours du temps. Son fonctionnement est très proche de celui de Macromedia.
Padmanaathan Gaayathrie
Algorithmes sur Open Office. 1. Ouvrir Visual Basic de Open Office.
Abes agence bibliographique de l’enseignement supérieur Les scripts.
© SQLI GROUP – 2012 AUDIT DRUPAL USINE À SITES WEB ÆGIR.
Formation SGA Module Saisie des Demandes d’achat Durée : 0,5 jour.
Transcription de la présentation:

Reconnaissance de Yes/No à l’aide du HTK Adapté d’un tutoriel du HTK par Nicolas Moreau

Étapes de la réalisation 1.Création de l’ensemble d’apprentissage : Chaque élément du vocabulaire est enregistré plusieurs fois, et étiqueté avec le mot correspondant 2.Analyse acoustique : Les signaux enregisrés sont convertis en une séries de vecteurs de traits. 3.Définition des modèles HMM : Un prototype de HMM est construit pour chaque élément du vocabulaire de la tâche de reconnaissance. 4.Entraînement des modèles : Chaque HMM est initialisé et entraîné avec l’ensemble d’apprentissage correspondant. 5.Définition de la tâche de reconnaissance : La grammaire à suivre est définie. 6.Reconnaissance et évaluation de la performance sur un corpus de test.

Organisation d’un espace de travail  On crée la hiérarchie de répertoires suivante :  data/ : emmagasine les données d’apprentissage et de test (signaux acoustiques, étiquettes, etc.) suivant deux sous-répertoires data/train/ et data/test/.  analysis/ : emmagasine les donnés de l’etape d’analyse acoustique.  training/ : emmagasine les fichiers concernant l’initialisation et l’apprentissage.  model/ : Emmagasine les modèles (HMMs).  def/ : emmagasine les fichier de définition de la tâche de reconnaisance.  test/ : emmagasine les fichier ayant trait à la validation (test).

Création du corpus d’apprentissage L’enregistrement et l’étiquetage sont accomplis à l’aide de l’outil à interface graphique HSLab (boutons rec, stop, mark et labelas) : HSLab any_name.sig Après l’etiquetage, on obtient un fichier texte.lab de la forme sil yes sil On recommence le processus avec des noms de fichiers différents pour chaque enregistrement (e.g. yes01.sig, yes01.lab, yes02.sig, yes02.lab, etc.)

Analyse acoustique Est effectuée à l’aide de l’outil HCopy : –HCopy -A -D -C analysis.conf -S targetlist.txt Où analysis.conf est un fichier de configuration pour l’extraction de coefficients acoustiques et targetlist.txt spécifie les noms et locations de chaque signal à traiter et du fichier de coefficients correspondant à générer.

MFCC_0_D_A = 12 MFCC + DC + 13 Delta + 13 Acceleration =39 coeff.

Définition structurelle des HMM Il faut définir le nombre d’états, les fonctions d’observation et les probabilité de transition entre états : pas évident ! Il faut définir 3 prototypes de HMM avec les options ~h "yes", ~h "no" and ~h "sil " dans les fichiers de description (hmm_yes, hmm_no, hmm_sil, )

Entraînement des HMM  Elle comprend une phase d’initialisation et une phase d’entraînement  HInit -A -D –T 1 -S trainlist.txt -M model/hmm0 \ -H model/proto/hmmfile -l label -L label_dir nameofhmm  nameofhmm : le nom du HMM à initialiser  hmmfile : fichier descriptif contenant le prototype du HMM  trainlist.txt : liste complète des dichiers.mfcc constituant le corpus d’apprentissage  label_dir : Répertoire des fichiers d’étiquetage (.lab) correspondant au corpus d’apprentissage  label : indique quel segment étiqueté doit être utilisé sans l’ensemble d’apprentissage (yes,no, ou sil, puisqu’on a utilisé ces noms pour étiqueter les HMMs)  model/hmm0 : Répertoire de sortie (doit exister) pour la description de HMM résultante.  La procédure doit être répétée pour chaque modèle (hmm_yes, hmm_no, hmm_sil).