Traitement des sons de parole (5)

Slides:



Advertisements
Présentations similaires
5. Statistiques.
Advertisements

Approche graphique du nombre dérivé
Dans l'ouvrage PHONO qui vise le développement des compétences phonologiques des élèves de GS et CP, GOIGOUX - CEBE - PAOUR ont mis en oeuvre les principes.
Reconnaissance de la parole
Reconnaissance Automatique de la Parole
Approches comportementales et électroencéphalographiques
Programme de seconde 2009 Géométrie
Raisonnement et logique
Produire des écrits en GS
1 1 Momentum. 2 2 Tout objet en mouvement continuera son mouvement tant que rien nentrave sa progression.
dividende = (quotient × diviseur) + reste
La méthode expérimentale TD 2 - Licence Laure Fernandez
En quoi consiste la modulation d’amplitude ?
De l’oral à l ’écrit Retards et troubles Repérage dépistage prévention
L’apprentissage de la lecture: Le CP
Apprendre à lire.
Perception de la parole
Le parcours individualisé
Problèmes de distribution, problèmes de partage.
LA FORMATION DE LENSEIGNANT LENQUÊTE ECPALE MODULE PEDAGOGIQUE LA CONNAISSANCE ET LE RÔLE DE LENQUÊTE UN SUPPORT POUR COMPRENDRE LACCIDENT.
Tableau de bord. Tableau de bord QCM personnalisés.
Primitives - Intégration
Conférence nationale des coordonnateurs régionaux d’hémovigilance
1 2. A léchelle de létablissement. 2 Des espaces de travail sécurisés: les ENT.
1 La mesure MESURE & QUALITE De la mesure …. La mesure 2 Sommaire 1. Problématique 2. Démarche 3. Zéro défaut 4. Résolution des non-conformités.
Traitement des sons de parole (4)
Fabienne d’Arripe-Longueville
La gestion des contenus d'apprentissage par les compétences
Mise en place d’un dispositif de Blended Learning au CNEPD
3 ème journée nationale du COPAAH Paris, 25 novembre 2011 Quest-ce quun bon thérapeute en addictologie? Jean-Nicolas Despland.
Socle commun et livret personnel de compétences
Ecole de Chirurgie Faculté de Médecine de Nancy
Ensemble de documents organisés autour dun thème donné. Il sélabore à partir dune problématique et doit répondre à des critères préci s. Ensemble de.
07/23/
MRP.
Les traitements à plat Cette partie du cours abordera les traitements élémentaires d’une enquête. Les analyses uni-variées, ou tris à plat, sont en fait.
Etude expérimentale de linfluence des formats de présentation sur le traitement cognitif des animations multimédia Résultats & prolongements Mémoire de.
Epreuve pratique dévaluation des capacités expérimentales Durée : 1 heure : 4 points sur 20 Lévaluation des capacités expérimentales a lieu dans le courant.
Réseaux sociaux Rafik Alligui Laëtitia El Hakim Otakool.com 1.
Interaction Homme Robot Sujet « 16/03/2012 » Réalisé par :
La haute tour sombre 3 Des actions
Mise en œuvre du langage MDX - 1 ère partie- Présentation de lexemple et des outils utilisés -1-
La perception du langage parlé
Apprentissages scolaires
EXERCICES SUR INTERNET
Suzy Plachta et Julie Verbeke Décembre 2010
Reconnaissance de la parole Difficultés Modèles
Conscience phonologique
Effet Pygmalion et Théorie de l’Autodétermination 2 études en EPS
Organiser le vocabulaire FLS 2581/ FLS 3581 Cours dimmersion.
L'audition.
Gilbert TOUT NEST QUE CALCUL Vous vous êtes certainement déjà demandé ce que voulait dire « se donner à 100% » ?
Modélisation et analyse de la variabilité dans une chaîne logistique par Laurence Morlet Promoteur : Philippe Chevalier Lecteurs : Laurence.
Chapitre 6: la lecture experte
The McGraw-Hill Companies, Inc., 1999 INVESTMENTS Fourth Edition Bodie Kane Marcus Irwin/McGraw-Hill 24-1 Evaluation de la Performance Evaluation de la.
« Le mot est ...une sorte de pont jeté entre moi et les autres » Bakhtine « Pour faire un homme, il faut d’autres hommes…Mes gènes me permettent de fabriquer.
Atelier de formation : MAT optimisation II (les graphes).
1 Modèle pédagogique d’un système d’apprentissage (SA)
10 paires -. 9 séries de 3 étuis ( n° 1 à 27 ) 9 positions à jouer 5 tables Réalisé par M..Chardon.
USAM BRIDGE H O W E L L -CLASSIQUE
9 paires séries de 3 étuis ( n° 1 à 27 )
Master 1 – Sciences du Langage –
Médiathèque de Chauffailles du 3 au 28 mars 2009.
La perception de la parole
Traitement de la parole : Synthèse et reconnaissance
1 La norme individuelle : étude pilote sur le lien perception-production Martine Toda LPP et ENST-LTCI (UMR 5141) Crédits : Projet.
Le lexique mental Mme. MEDANE
À la recherche d’indices discriminant des accents ouest- africains en français Philippe Boula de Mareüil LIMSI-CNRS, Orsay.
Le lexique mental Mme. MEDANE
Transcription de la présentation:

Traitement des sons de parole (5) Catégorisation et Accès au lexique

Segmentation du flux acoustique La parole forme un flux sonore continu qu’il est nécessaire de segmenter en phonèmes, en syllabes, en mots

Catégorisation des sons de parole La langue française comporte environ 37 phonèmes (15 voyelles, 19 consonnes et 3 semi-consonnes). La réalisation acoustique de ces phonèmes est très variable d’où la nécessité pour le système auditif de catégoriser, c’est-à-dire de ramener une grande variation de productions vocales à un nombre de classes restreint. On appelle phones ou allophones les réalisations acoustiques des sons de parole (phonétique). Les paramètres acoustiques et phonétiques des sons de paroles sont continus. On appelle phonèmes les catégories distinctives d’une langue (phonologie). Dans le domaine de la phonologie, les sons de paroles constituent des catégories discrètes. Catégoriser c’est donc introduire une discontinuité perceptive dans un continuum physique.

Lieux d’articulation

Développement de la perception des sons de parole Eimas et al. (1971) paradigme d’habituation. Comme celle de l’adulte, la perception des bébés est catégorielle. A 6 mois, les bébés catégorisent correctement un contraste phonétique anglais ou hindi. A 11-13 mois (ou adulte) ils catégorisent correctement le contraste de leur langue. anglais hindi

Parole et apprentissage L'apprentissage du langage par les nourrissons est grandement facilité par leurs remarquables capacités perceptives : par exemple, ils sont capables de distinguer dès la naissance un grand nombre de contrastes phonétiques (comme /ba/ et /pa/), et sont également capables de distinguer.différentes langues, si elles ont des structures rythmiques différentes. Des singes (tamarins) manifestent les mêmes performances discriminatives des sons de parole Language discrimination by human newborns and by cotton-top tamarin monkeys, Franck Ramus, Marc D.Hauser, Cory Miller, Dylan Morris, Jacques Mehler, Science, 2000, 288(5464), 349-351. Cependant, il n’est pas attesté que les discrimination des deux espèces se font sur les mêmes indices acoustiques. Le traitement des sons de parole se spécifie par la familiarisation avec la langue maternelle qui affecte déjà le babillage (de Boysson-Bardies B. (1996) Comment la parole vient aux enfants. Paris, Ed. Odile Jacob.

Le Temps d’Attaque vocal Voice Onset Time = VOT Lorsque on prononce des syllabes (CV) contrastant un son voisé et un son non voisé comme /ba/ vs. /pa/ on peut, avec des sons synthétiques faire varier de manière continue le délai de voisement de la voyelle. "En pil" "En bil" Le VOT est l’intervalle temporel séparant le relâchement de l’air lors de la prononciation de la consonne et le début du voisement de la voyelle http://www.ac.wwu.edu/~mseilo/c573/unit7/VOT.PDF http://www1.ldc.lu.se/logopedi/department/andy/Perturbations/VOT.html ba pa da ta ga ka

Le contraste /ba/ - /pa/ en anglais

/pa/ /ba/ Le VOT peut être négatif, nul ou positif. Il est nul quand le début de la vibration des cordes vocales est synchrone avec l’explosion consonantique Il est positif quand la vibration commence après le relâchement des articulateurs Il est négatif quand la vibration commence avant le relâchement des articulateurs Anglais Français /pa/ /ba/

voyelle

consonne http://www.bsos.umd.edu/hesp/newman/Newman_classes/Newman300/webpages/categperc.htm

Catégorisation dans la langue seconde Comparaison de la catégorisation d’un contraste phonétique existant en catalan et pas en espagnol Ces données indiquent que l'exposition même précoce à une seconde langue n'est pas suffisante pour en maîtriser parfaitement le système phonologique. Elles révèlent que les représentations phonologiques, une fois mises en place, sont peu plastiques même à un très jeune âge. /é/ /è/ Pallier, C., Bosch, L., & Sebastian-Gallés, N. (1997) A limit on behavioral plasticity in speech perception. Cognition, 64(3), B9-B17.

La syllabe Les mots ne sont une somme de phonèmes, ils ont, au moins dans certaines langues comme le français, une structure syllabique. Tâche de détection d’un phonème avec mesure des temps de réaction. Le mot contient-il (oui ou non) le phonème /p/ ? capture caprice Le TR sera plus court dans le cas de capture que dans le cas de caprice car dans le premier cas le phonème cible appartient à la première syllabe et dans le second à la seconde syllabe

Le lexique mental Définition : c’est l’ensemble des mots d’une langue possédé par un individu Plusieurs questions : Format : phonologique, orthographique ? Structure : alphabétique, fréquentielle, multidimensionnel ? Accès : différentes théories Paradigme expérimental : la décision lexicale présentation écrite pour un bon contrôle de la durée de présentation. Elle suppose transcodage graphème-phonème

Décision lexicale chat ctoh chet Des chaînes de caractères sont présentées brièvement sur l’écran. Le sujet doit décider le plus rapidement possible s’il s’agit de mots de sa langue ou de non-mots. Le pourcentage de réponses correctes et le temps de réaction sont mesurés. Les mots sont sélectionnés de manière à tester une hypothèse spécifique, par exemple l’effet de la fréquence de ces mots dans la langue. Les non-mots sont fabriqués selon des règles précises : - tirage au hasard des lettres - respect de la fréquence des digrammes - prononciabilité - etc. chat ctoh chet http://grove.ufl.edu/~tomomi/Intro/Lecture27/sld005.htm

Rôle des non-mots Lettres au hasard : TRmot > TRnon-mot baton - tbonw Non-mot prononçables : TRmot < TRnon-mot baton - badon Pour des présentations auditives, les non-mots sont nécessairement prononçables ! mot non-mot Temps de Réaction (ms) babel.ling.nwu.edu/~lidz/teaching/ cogsci210/processing.ppt

Effet de la fréquence des mots Temps de Réaction (ms) Temps de Réaction « mots » Catégories de fréquences des mots babel.ling.nwu.edu/~lidz/teaching/ cogsci210/processing.ppt

Modèles d’accès au lexique Modèle LAFS de Klatt (1988) lexical access from spectra Modèle de cohorte Marslen-Wilson Modèle de Trace de McClelland et Elman

LAFS Klatt Le lexique mental serait constitué des traces des spectres de fréquence des mots prononcés La procédure de reconnaissance consisterait en un appariement du spectre actuel du mot entendu avec la trace mnésique du spectre Il y aurait accès direct au lexique sans segmentation ni catégorisation « four scores and seven years ago »

Modèle de Cohorte Marslen-Wilson Lexique Mental L'information acoustique et phonétique arrive séquentiellement. Un mot isolé ne peut être identifié qu'à partir du moment où il est seul compatible avec l'information déjà disponible. Les premières syllabes activent la cohorte des mots candidats les comprenant. Plus il y a de syllabes prononcées, plus la cohorte se rétrécit. Le mot peut être reconnu avant qu’il ait fini d’être prononcé. Le point d’identification est la fin de la syllabe qui ne laisse plus qu’un seul candidat. Exemple : le mot « vocabulaire » table chaise chien moineau éléphant vocable vote vocal vocalise volage vocation volant vocabulaire table chaise chien moineau éléphant vocable vote vocal vocalise volage vocation volant vocabulaire table chaise chien moineau éléphant vocable vote vocal vocalise volage vocation volant vocabulaire table chaise chien moineau éléphant vocable vote vocal vocalise volage vocation volant vocabulaire « vo- « vo-ca-bu-laire « vo-ca-bu « vo-ca Point d’identification

Modèle Trace McClelland et Elman (1986) C’est un modèle de type connexionniste qui distingue trois grandes étapes de traitement : les traits (graphiques ou acoustiques), les lettres ou les phonèmes et enfin les mots. Il s’agit d’un modèle interactif, à la fois ascendant et descendant. Exemple avec mot : « MOVE » Etape 1: activation des traits graphiques ou acoustiques contenus dans le stimulus et inhibition des autres Etape 2 : activation des lettres ou des phonèmes contenus dans le mot et inhibition des autres Etape 3 : activation des mots contenant les mêmes lettres ou les mêmes phonèmes et inhibition des autres

Conclusions La perception des sons de parole est un exemple des mécanismes de traitement de l’information. Ceci implique une série d’étapes de traitements: - traitements acoustiques - traitements phonétiques (surtout articulatoires ) - traitements phonémiques - accès au lexique A chaque étape, divers traitements peuvent s’effectuer en parallèle