CLASSIFICATION DES SONS, “COMMENT CA MARCHE ?” Slim ESSID Journée GSAM/SFA – Juin 2005 E-mail : slim.essid@enst.fr Page web : http://www.tsi.enst.fr/~essid
Contenu Visualisation 3D des descripteurs MFCC & ASF pour hautbois, trompette et violon. Calcul des descripteurs Utilisation de la PCA (Analyse en Composantes Principales) Visualisations Classification par SVM (Machines à Vecteurs Supports) Principe des SVM Visualisations 3D des surfaces de décision dans classification hautbois/trompette.
Mel Freq. Cepstral Coef. (MFCC) Son (Fenêtre de 32ms, recouvrement 50%, 32kHz) FFT Spectre FFT Banc de filtres triangulaires en échelle Mel Log DCT Vecteur de 33 coefficients dt dt²
Amplitude Spectral Flatness (ASF) [MPEG7] Partitionnement du spectre d’amplitude ( ) en 23 sous-bandes (en échelle logarithmique) Dans chaque sous-bande Spectre plat : ASF , 0 < ASF < 1
Principal Component Analysis (PCA) But : Réduire la dimension des vecteurs d’attributs (descripteurs) Etape 1 : Décomposition en Valeurs Singulières de la matrice de covariance des observations Etape 2 : Transformer les vecteurs d’attributs Etape 3 : « Retenir les directions correspondant aux d plus grandes valeurs singulières »
Visualisations
Visualisations (2)
Visualisations (3)
Visualisations (4)
Visualisations (5)
Visualisations (6)
Support Vector Machines (SVM) Classificateur bi-classe Principe : Trouver l’hyperplan séparant les attributs de chaque classe avec la plus grande marge possible Si données non linéairement séparables, considérer , H : espace de dimension supérieure où les données deviennent linéairement séparables Utiliser un noyau (kernel)
SVM (2)
Classification SVM Ob vs Tr
Classification SVM Ob vs Vl
Classification SVM Tr vs Vl