Analyse de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Objectifs de l’analyse de parole Extraire des paramètres du signal de parole afin de : Retirer l’information non pertinente Réduire la redondance Obtenir une représentation plus compacte Atteindre un niveau d’abstraction plus élevé Définir des mesures de ressemblance simples LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Principes Prétraitement Découpage en trames Taille des trames Décalage entre trames Fenêtrage Extraction de paramètres acoustiques LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Principe d’une analyse acoustique LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Paramètres acoustiques non spectraux Energie Fréquence fondamentale Taux de passage par zéro du signal Taux de passage par zéro de la dérivée du signal LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
L’enveloppe spectrale Les approches conventionnelles visent à extraire des caractéristiques de l’enveloppe spectrale. Analyse par banc de filtres Analyse par prédiction linéaire Coefficients cepstraux LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Analyse par banc de filtres (1) LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Analyse par banc de filtres (2) LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Analyse par banc de filtres (3) LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Analyse par prédiction linéaire (1) Modélisation de la parole sous forme d’un filtre de prédiction linéaire Filtre de prédiction linéaire e(t) s(t) LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Analyse par prédiction linéaire (2) LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Coefficients cepstraux On applique une transformée de Fourier inverse sur le module du spectre logarithmique. Les premiers coefficients caractérisent l’enveloppe spectrale. LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
L’information dynamique On représente l’information dynamique par la dérivée première (vitesse) et la dérivée seconde (accélération) des paramètres cepstraux → paramètres deltas et deltas-deltas LE TRAITEMENT AUTOMATIQUE DE LA PAROLE