Chapitre Analyse de scènes auditives

Slides:



Advertisements
Présentations similaires
PRINCIPE SIMPLIFIE DE LA COMPRESSION MP3
Advertisements

Détecteur de mélodie sujet proposé par J. Le Roux le détecteur sera fondé sur une analyse double : dune.
Le système auditif thalamo-cortical : anatomie, propriétés neuronales, et plasticité fonctionnelle . Jean-Marc Edeline Neurobiologie de l ’Apprentissage.
Identification automatique des langue
Analyse de la parole Ivan Magrin-Chagnolleau, CNRS
Physique des sons et acoustique.
INTRODUCTION 1. Une représentation du signal où le bruit est isolé
La reconnaissance vocale
WP4: Estimation des mouvements du sol par approche empirique (Nice et Grenoble) WP3: Estimation des mouvements du sol par approche déterministe Réunion.
Corrigé de Spécialité 9 Acoustique 9.1 Fréquences & gamme
SON COMPLEXE - SPECTRE Le son pur est un modèle mathématique (sinusoïde…) Un son complexe peut être décomposé en une sommes de sinusoïdes (Théorème de.
La Compression Philippe LANTIN.
Monique THONNAT et Nathanaël ROTA Projet ORION
Bulles circulantes et Plongée sous-marine Appréciation par le Doppler
SFA - Journée Description automatique et perception de la musique - 23 Juin 2005 Laboratoire dAcoustique Musicale - CNRS, Université Paris 6, Ministère.
PERCEPTION/ATTENTION Sophie Donnadieu
TRAVAIL SUR DOCUMENTS.
Indices prosodiques caractérisant un style d'élocution et ses variantes individuelles MIDL nov 2004 Paris Jean-Sylvain Liénard Martine Adda-Decker.
Chapitre Perception Naturelle et Artificielle de la Parole
Astrophysique et astrochimie
Introduction à l’acoustique
Acoustique musicale Mains dœuvres. Son pur Formule : X = sin ( 2 ft )
Partie 1: Ondes et Particules.
L'audition.
Sylvain Daudé DEA ATIAM
Chapitre 6: la lecture experte
Intensité – Ondes sonores
LA PERCEPTION AUDITIVE
Attention, les intensités sonores sajoutent, mais pas les niveaux sonores.
7 - Son.
Segmentation (1ère partie)
Jean-Sylvain Liénard LIMSI-CNRS ORSAY M2 Recherche Informatique
Chapitre Théories et modèles perceptifs
OBSERVER : Ondes et matières Chapitre 2 : Caractéristiques des ondes
Des théories d'apprentissage
SIG3141 Partie I: Analyse de Fourier ESIEA D Kateb
Propriétés des Ondes.
Gestalt (Psychologie de la Forme)
ONDES SONORES.
Les Ondes Sonores.
Traitement de la parole : Synthèse et reconnaissance
Dans cet article, une nouvelle approche relative à l’indexation de la bande sonore de documents audiovisuels est proposée, son but est de détecter les.
Les processus cognitifs en jeu dans l’acquisition de l’ORAL.
Caractéristiques des sons
1 La norme individuelle : étude pilote sur le lien perception-production Martine Toda LPP et ENST-LTCI (UMR 5141) Crédits : Projet.
L ’apport du son gt/isac_9920_04. Son/image L ’appréhension du phénomène auditif est plus abstrait que le phénomène visuel. Ex : le son d ’un galop de.
Ségrégation de voix concurrentes par des sujets normo et malentendants
Indexation sonore : recherche des composantes Parole et Musique Julien PINQUIER Institut de Recherche en Informatique de Toulouse – Equipe ART.ps 118,
VIE PROFESSIONNELLE POURSUITE D’ETUDES PRESPECTIVES SUR LA FILIERE?
Développement de la lecture chez les enfants trisomiques 21
Présentation RFIA janvier 2002
Fusion de paramètres en classification Parole/Musique Julie Mauclair – Equipe Parole Julien Pinquier – Equipe SAMoVA.
La Compression
L’axe des abscisses est gradué toutes les à 0,5 ms
L’animation en tant que technique de visualisation de l’information Université de Fribourg DIUF, DIVA Jeannette Frey.
Module 1 : Généralités sur les systèmes informatiques
Bianca Vieru-Dimulescu encadrant : Philippe Boula de Mareüil
Jean Lorenceau LENA-CNRS
Chapitre 3 suite Acoustique musicale
Chapitre 6 : Acoustique musicale Les objectifs de connaissance :
Acoustique musicale.
Emetteurs et récepteurs sonores
Utiliser la chanson en upe2a pourquoi? Source: le/view/1211/1838 le/view/1211/1838.
Les ondes.
PSY Psychologie de la perception
Comment mon Iphone peut-il reconnaître mes paroles?
e-Caractéristiques des ondes sonores et ultrasonores
Catégoriser pour comprendre Développement des concepts d'objets chez l'enfant D’après Françoise Bonthoux Laboratoire de Psychologie et Neurocognition (associé.
À la recherche d’indices discriminant des accents ouest- africains en français Philippe Boula de Mareüil LIMSI-CNRS, Orsay.
Instants magiques Automatique.
Transcription de la présentation:

Chapitre 5 -------- Analyse de scènes auditives Jean-Sylvain Liénard LIMSI-CNRS ORSAY M2 Recherche Informatique Filière Sciences Cognitives Module PNPA Déc 04 – Fév 05

Théorie de la Gestalt Réaction à la psychologie associationniste Le tout est plus que la somme des parties Forme forte / Forme faible Figure et fond Insight "Lois de structuration" régularité, symétrie destin commun ….

Structuration gestaltiste au bas niveau Dans le domaine visuel: proximité et ressemblance

Structuration en flux sonores Albert Bregman, Auditory scene analysis, MIT Press, 1990 Structuration ascendante proximité et ressemblance dans l'espace temps-fréquence ---> Stream (flux) Quand les deux sons sont proches en fréquence ils forment un seul flux perceptif, traduit ici par un changement de rythme (Structuration séquentielle)

Structuration en flux sonores Facteurs de structuration séquentielle Exemples de Steve McAdams (Ircam) - Mélodies mélangées Deux mélodies (sons alternés) forment un même flux perceptif quand elles sont dans le même registre. Elles se distinguent quand les registres s'écartent. - Formation de flux à partir de la similarité spectrale Le même instrument jouant toutes les notes provoque un même flux perceptif. Puis deux instruments différents jouent les notes en alternance et cela produit deux flux différents. - Formation de flux à partir de la similarité d'intensité Deux mélodies mélangées jouées en notes alternées forment un même flux quand elles sont dans le même intervalle d'intensité. Elles se distinguent quand elles sont jouées avec deux intensités différentes

Structuration en flux sonores Facteurs de structuration simultanée Exemples de Steve McAdams (Ircam) - Instants d'apparition (onset times) Plusieurs sons simultanés forment un flux quand ils apparaissent au même instant. Ils sont dissociés quand leurs instants d'apparition diffèrent. - Emergence d'un harmonique fluctuant en fréquence Spectre harmonique fixe; l'harmonique fluctuant se dissocie du fond. - Emergence d'une voyelle dans un accord Permutation de 3 voyelle simultanées [a, o, i] émises sur 3 Fo différents. Une modulation cohérente des harmoniques du [a] provoque la perception du flux correspondant

Structuration en flux sonores Structuration descendante - rôle de l'apprentissage: une suite d'états acoustiques sans ressemblance intrinsèque peut être associée à une même source sonore - rôle de l'attention: en cas de flux simultanés, l'attention peut conduire à privilégier un flux plus que les autres. - Parole: selon Bregman, structuration ascendante au bas niveau, structuration descendante aux niveaux supérieurs, selon des "schémas" appris - effet de cocktail party: plusieurs facteurs mélangés - directivité - timbre - prédiction de la suite d'un discours - le problème est aussi celui de la ségrégation figure-fond et des figures ambiguës (cf Gestalt) : un indice minime (bn ou hn) peut faire basculer la formation de flux. Mélange d'une voix à elle-même (8 masquants) Égal niveau (a+m0) M0 -= 8dB (m4)

Computational Auditory Scene Analysis (CASA) De l'ASA à la CASA Psychoacoustique  modélisation informatique La CASA peut-elle résoudre les problèmes rencontrés par la reconnaissance automatique ?  Problèmes posés dans une perspective différente: séparation de sources, modélisation perceptive, identification de flux sonores Articles prélevés dans un symposium récent, voir http://www.ebire.org/speechseparation/attendee.html