1 La norme individuelle : étude pilote sur le lien perception-production Martine Toda LPP et ENST-LTCI (UMR 5141) Crédits : Projet.

Slides:



Advertisements
Présentations similaires
Identifier l ’ambiance sonore de son lieu de travail.
Advertisements

C’est la faute à Benoît Civel !!!!
Unilateral vs. bilateral STN DBS effects on working memory and motor function in Parkinson disease T.Hershey & al. Edouard Lopez Delphine Graeff.
Démarches de modélisation
PRINCIPE SIMPLIFIE DE LA COMPRESSION MP3
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codage de la Parole par indexation indépendant du locuteur Dijana PETROVSKA-DELACRETAZ.
Reconnaissance de la parole
Reconnaissance Automatique de la Parole
Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales.
Codage de la parole à très bas débit: passage du cas dépendant vers le cas indépendant du locuteur 6-ème réunion d'avancement SYMPATEX : ENST, 19 Septembre.
Mesures dans le domaine fréquentiel
Exemple : Itinéraire de lecture.
Technologie des équipements
Psychoacoustique seuils de détection
SON COMPLEXE - SPECTRE Le son pur est un modèle mathématique (sinusoïde…) Un son complexe peut être décomposé en une sommes de sinusoïdes (Théorème de.
Acoustique fondamentale
Entendre avec… un implant cochléaire
Reconnaissance de la parole
Présenté par Martine Toda
Expériences contrôlées Quasi-expériences Études de cas
Chapitre 6 : Restauration d’images
Sons de l’Environnement
Mais l’analyse visuelle des mots est fragile :
Hésitations autonomes en 8 langues :
Indices prosodiques caractérisant un style d'élocution et ses variantes individuelles MIDL nov 2004 Paris Jean-Sylvain Liénard Martine Adda-Decker.
Sonorisation d’un conte
Partie 3 La psychophysique.
Le cahier de charge d'un système de RAP
Reconnaissance de la parole Difficultés Modèles
Les techniques binaurales
sous la co-direction d’Evelyne VEUILLET et de Lionel COLLET
L'audition.
La corrélation et la régression
La corrélation et la régression
Expériences contrôlées Rappel du cours d’IHM
Structure discriminante (analyse discriminante)
Intensité – Ondes sonores
Trouble de la localisation auditive
Les surdités de perception de l’enfant
Sommaire Présentation du projet La mesure FFT/ MLS
Traitement de la parole : Synthèse et reconnaissance
III.1) Analyses spectrales du Moment Angulaire Atmosphérique Motivation Générale Les analyses statistiques occupent une place centrale en climatologie.
Stratégie de Codage Implant.
L ’apport du son gt/isac_9920_04. Son/image L ’appréhension du phénomène auditif est plus abstrait que le phénomène visuel. Ex : le son d ’un galop de.
GTS813: cours #6 Évaluation d’une mesure (Validité, Répétabilité, Fiabilité, précision) Activité. Études de cas #2: Qui pose la question? La question est-elle.
Journées de Rochebrune, 26 janvier 2006, Analyse cognitive de la demande Journées de Rochebrune Journées de Rochebrune Rencontres interdisciplinaires sur.
Reconnaissance automatique de la parole
Juillet 2001  Les organes Cavité nasale Cavité buccale Langue Épiglotte et cordes vocales Trachée Voile du palais.
Présentation RFIA janvier 2002
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codage de la Parole à très bas débit. Maurice CHARBIT, Gérard CHOLLET, Niklas PAULSSON,
Présentation février 2002 Relations Visiblement Meilleures.
La Compression
Introduction de Mme Safra IGEN Conférence du 22 mai 2006.
AVANT 1990 Situation des pays dans le monde, analysée par la Banque Mondiale Classement basé sur le PIB par habitant.
Déroulement : Coop puzzle en équipe, remise des grilles d’analyse, d’oeuvres plastifé, crayons sharpi// connaissances déclaratives, procédurales et conditionnelles.
Études de Marché MBA Hiver 2006 SÉANCE 3: LES DONNÉES PRIMAIRES: MÉTHODES QUALITATIVES.
Échantillonnage (STT-2000) Section 5 Types d’erreur de sondage. Version: 22 août 2003.
Modifications acoustiques de l’espace vocalique jusqu’à l’âge de 7 ans Li-mei Chen Université nationale de Cheng Kung (Taïwan)
Emetteurs et récepteurs sonores c-Caractéristiques et traitement du son.
Acoustique musicale.
Détecter les groupes à hauts risques cardiaques à partir de caractéristiques telles que l’alimentation, le fait de fumer ou pas, les antécédents familiaux.
Audacity DA SILVA Patrick GP02 Printemps 2006 Exposé SI28.
PSY Psychologie de la perception
e-Caractéristiques des ondes sonores et ultrasonores
Fonctionnement et Utilisation
Journées PFC 2008 Une étude de corpus de français de Suisse, Belgique, Alsace, Nord et Sud de la France Cécile Woehrling Philippe Boula de Mareüil Martine.
À la recherche d’indices discriminant des accents ouest- africains en français Philippe Boula de Mareüil LIMSI-CNRS, Orsay.
Transcription de la présentation:

1 La norme individuelle : étude pilote sur le lien perception-production Martine Toda LPP et ENST-LTCI (UMR 5141) Crédits : Projet ASPI (EU 6 th FP )

2 Variation inter-individuelle Un fait : Le bruit de friction des fricatives sibilantes varie selon les individus Hypothèse 1 : cette variation provient de la différence de la forme du conduit vocal (dont l’anatomie structurelle et fonctionnelle) /s/

3 Variation individuelle : existence de facteurs cognitif Hypothèse 2 : La cible phonétique diffère selon les individus – il existe une norme individuelle

4 Modèle phylogénétique du changement phonétique (1) L’enfant construit sa cible phonétique d’après les réalisations auxquelles il est exposé

5 Modèle phylogénétique du changement phonétique (2) À son tour il transmet des indices sur sa cible, au travers de ses réalisations (qui subissent les contraintes des particularités de son conduit vocal)

6 Modèle phylogénétique du changement phonétique (3) Les réalisations phonétiques auxquelles l’enfant est exposé sont potentiellement différente d’un enfant à un autre La cible phonétique des individus est donc potentiellement différente : on suppose l’existence d’une norme individuelle

7 Quelques données Études sur le lien production-perception –Newman (2001) : Temps de réponse plus court lors d’une tâche de discrimination (stimuli naturels) pour les sujets dont les catégories /s/ et / ʃ / sont plus distinctes –Perkell et al. (2004) : les sujets qui sont meilleurs auditeurs et ont une articulation plus distincte entre /s/ et / ʃ / sont aussi de meilleurs locuteurs (produisent des sons plus distincts)

8 Expérience

9 Production et perception sujet par sujet Expérience de perception –Tâche d’ajustement –Tâche d’identification Enregistrement audio de mots lus (3 répétitions) dans le même contexte que les stimuli 11 Sujets de langue maternelle japonaise (monolingues ou langue japonaise dominante)

10 Tâche d’ajustement (Démonstration) Bruits de friction (extrait de fricatives contenues dans un mot) Bruits originaux et filtrés Ajustement du filtre passe-bande (largeur de bande de 1 Bk; espacés de 0,5 Bk) pour que le son filtré « ressemble au mieux » au son original 2 présentation de 18 stimuli produits par des locuteurs japonais

11 Stimuli Spectre du bruit original Bruits filtrés

12 Tâche d’identification Mêmes stimuli Choix forcé : entendez-vous un /s/ ou un /s j / (Démonstration) Seuls les stimuli correctement identifiés sont pris en compte pour l’analyse

13 Enregistrement sonore Mots ‘assari’ et ‘kass j a’; lus trois fois Enregistrement direct sur ordinateur dans une pièce calme Indice de fréquence du bruit de friction : fréquence du pic sur le spectre lissé (lissage LPC avec 2 coefficients pour une fréquence d’échantillonnage de 48 kHz) Spectre lissé Fréquences (Hz) Intensité relative (dB) /s j / Pic

14 Prédictions Lorsqu’il perçoit un son de parole, l’auditeur va chercher un indice acoustique en fonction de sa norme individuelle L’auditeur aura tendance à sélectionner un filtre proche de sa propre cible acoustique (son pic)

15 Prédictions Sujet A: pic plus grave que le stimulus Sujet B: pic plus aigu que le stimulus Stimulus /s j / Le bruit renferme des informations complexes, qui se répartissent sur plusieurs zones de fréquences

16 Résultats

17 Réponse moyenne (fréquence centrale du filtre) et fréquence du pic

18 Réponse moyenne en fonction de la fréquence du pic du sujet Corrélation signigicative mais faible pour /s j / r = 0,38 Deux valeurs extrêmes pour /s/ Production Perception Suggèrent - l’utilisation d’un indice acoustique qui a peu de lien avec la fréquence du pic, - ou une surdité des hautes fréquences ?

19 Étude pilote Corrélation significative mais très faible Les résultats tendent à aller dans le sens de l’hypothèse

20 Amélioration du protocole expérimental Variation inter-répétitions importante (jusqu’à 8 filtres d’écart ; 2,45 filtres d’écart en moyenne – 4 et 1,23 Bk, respectivement) –Nombre de présentation (= 2) insuffisant La fréquence du pic du spectre lissé n’est nécessairement adéquat pour mettre en relation le spectre produit par les auditeurs et leurs réponses à la tâche d’ajustement –Demander aux auditeurs d’ajuster leur propres productions pour pouvoir quantifier leurs production sur la même échelle (mêmes critères) que les réponses

21 Effet mode parole / mode auditive ? Stimuli correctement identifiésToutes les réponses Taux d’identification correcte globale = 34,7 %

22 Taux d’identification correcte en fonction des stimuli Stimuli peu ambigus Stimuli équivoques Seuil du hasard (50%) Stimuli ambigus %

23 Amélioration du protocole expérimental (suite) Entraîner les auditeurs à répondre en mode parole –Faire passer la tâche d’identification en premier ou simultanément Et pour réduire la variation –Augmenter le nombre d’auditeurs –Sélectionner les stimuli « robustes » (les moins ambigus) ou créer des stimuli artificiels répondant à ce critère Vérification de la cible présumée avec une tâche d’ajustement de paramètres d’un bruit synthétique pour faire des fricatives les plus « typiques » pour l’auditeur

24

25 Hertz-Bark conversion (Traunmüller 1990) freq Bk = (26.81 / (1 + (1960 / freq Hz ))) Intervalle utilisé