Journées PFC 2008 Une étude de corpus de français de Suisse, Belgique, Alsace, Nord et Sud de la France Cécile Woehrling Philippe Boula de Mareüil Martine.

Slides:



Advertisements
Présentations similaires
APPRENDRE LES SONS DU FRANÇAIS
Advertisements

Mesures d’intensité de courant
La découverte du code Animation pédagogique – la construction du principe alphabétique – 06/12/2006.
TRAITEMENT AUTOMATIQUE DES LANGUES : LES PRINCIPAUX PROGRAMMES
Apprendre à lire.
Un questionnement nécessaire pour progresser .
Distinguer les sons de la parole
Compétences - tâches réparties par niveaux
Analyse de Corpus Marie-Christine Dubus Claudine Hammelrath
Un exemple d’annotation sur corpus oral transcrit: PFC
AKPOSSAN Johanne Barre d’explosion Bruit de friction Œil nasal 1800
Statistiques Séance 9 – 6 décembre 2005 N. Yamaguchi.
Hésitations autonomes en 8 langues :
Indices prosodiques caractérisant un style d'élocution et ses variantes individuelles MIDL nov 2004 Paris Jean-Sylvain Liénard Martine Adda-Decker.
Iryna Lehka, David Le Gac Laboratoire DYALANG, Université de Rouen
Le cahier de charge d'un système de RAP
Évaluation de la conscience phonologique
SOCLE COMMUN LIRE ET COMPRENDRE
Conscience phonologique
Jeopardy - Révision Final Jeopardy $100 $100 $100 $100 $100 $200 $200
LIN1720 DGD 10 La syllabe.
Jeopardy - Révision Final Jeopardy Phonèmes Traits Règles Syllabe
Dr Hélène Knoerr ILOB Université d’Ottawa
LIN 1720 TP 4: Prosodie. 1. Accent Allez à ladresse suivante: Allez à la page 1, familiarisez-vous.
LIN 1720 DGD 2 Voyelles University of Ottawa.
LIN 1720 DGD 2 Voyelles University of Ottawa.
LIN 1750 DGD 11 Prosodie.
L'audition.
‘The Voice Company’ Du texte à la Parole
Intensité – Ondes sonores
(A. Meurant - UCL )1 Chapitre Quatrième Quelques définitions de base.
Disparités régionales des décès dus aux AVC
Cours de Phonétique Française III
Jean-Sylvain Liénard LIMSI-CNRS ORSAY M2 Recherche Informatique
Qu’est ce que lire? L’apprentissage de la lecture passe par le décodage et l’identification des mots conduisant à leur compréhension. Déchiffrer des mots.
LA PHONÉTIQUE est une science qui a pour objet l’étude du son
Philippe Boula de Mareüil LIMSI-CNRS
Portail de la linguistique
Master 1 – Sciences du Langage –
A. E. ARCHAKIAN Université Linguisitique V. Brioussov Chaire de pédagogie et de méthodolgie de l’enseignement des langues étrangères Erévan 2010.
Voyelles, Consonnes, Accent tonique
La perception de la parole
Traitement de la parole : Synthèse et reconnaissance
Dans cet article, une nouvelle approche relative à l’indexation de la bande sonore de documents audiovisuels est proposée, son but est de détecter les.
Une enquête en pays de Vaud Pascal de Singy, 1996.
1 La norme individuelle : étude pilote sur le lien perception-production Martine Toda LPP et ENST-LTCI (UMR 5141) Crédits : Projet.
La conscience phonologique : « Distinguer les sons de la parole »
La méthodologie verbo-tonale de correction phonétique
Juillet 2001  Les organes Cavité nasale Cavité buccale Langue Épiglotte et cordes vocales Trachée Voile du palais.
Des activités à ritualiser
Evaluation automatique du débit de la parole sur des données multilingues spontanées Jean-Luc Rouas, Jérôme Farinas, François Pellegrino.
Voix, parole, langage, langue
Fusion de paramètres rythmiques et segmentaux pour l’Identification Automatique des Langues Jean-Luc Rouas1, Jérôme Farinas1, François Pellegrino2 & Régine.
Bianca Vieru-Dimulescu encadrant : Philippe Boula de Mareüil
Apprentissage automatique des prononciations à partir de grandes masses de données orales Rena NEMOTO Encadrée par Martine Adda-Decker & Ioana Vasilescu.
Journée Des Doctorants 2004
Enquête sur la justice et l’insécurité en France aujourd’hui.
Progression/Programmation – Français (1/3)
Identification d’accents en français et contribution de la prosodie Philippe Boula de Mareüil LIMSI-CNRS.
Modifications acoustiques de l’espace vocalique jusqu’à l’âge de 7 ans Li-mei Chen Université nationale de Cheng Kung (Taïwan)
La perception de la parole
Le découpage en syllabes est comme suit (les difficultés sont indiquées en vert): exercice 1 N.B. J’ai laissé tomber les e muets là où c’était possible.
Combien d’accents en français ? Focus sur la France, la Belgique et la Suisse Philippe Boula de Mareüil 1, Yves Scherrer 2, Jean-Philippe Goldman 2 1.
Mgr Magdalena Bejm Cours de phonétique PROSODIE (I)
Un début de caractérisation prosodique de deux variétés suisses romandes Sandra Schwab, Jean-Philippe Goldman & Isabelle Racine Ecole de langue et de.
Quelques expériences sur la perception de la variation dans la parole. Nouveaux développements dans le cadre du projet PFC en Afrique Philippe Boula de.
Contribution du traitement automatique de la parole à l’étude de la variation diatopique en français Martine Adda-Decker Philippe Boula de Mareüil LIMSI-CNRS.
À la recherche d’indices discriminant des accents ouest- africains en français Philippe Boula de Mareüil LIMSI-CNRS, Orsay.
Le e final graphique et ses rapports avec la phonie Dominique Nouveau.
Transcription de la présentation:

Journées PFC 2008 Une étude de corpus de français de Suisse, Belgique, Alsace, Nord et Sud de la France Cécile Woehrling Philippe Boula de Mareüil Martine Adda-Decker LIMSI-CNRS

Journées PFC Plan de l’exposé Expérience perceptive Aspects prosodiques Voisement/dévoisement des consonnes

Journées PFC 2008 Expérience perceptive

Journées PFC Locuteurs Dans chacun des 7 points d’enquête, 2 hommes et 2 femmes répartis en 2 tranches d’âge (30-60 ans, 60 ans et plus)

Journées PFC Stimuli Pour chacun des 28 (7×4) locuteurs, 2 échantillons de parole :  une longue phrase lue (25 mots) tirée du milieu du texte PFC  un extrait de parole spontanée, tiré d’entretiens guidés 56 stimuli au total

Journées PFC Auditeurs 25 auditeurs résidant en région parisienne  Langue maternelle française  Âgés en moyenne de 28 ans  Un sur deux se disait capable de reconnaître les accents du Languedoc, d’Alsace, de Belgique et de Suisse  Tous ne pensaient pas pouvoir faire la différence entre les 3 points d’enquête belges

Journées PFC Tâche 2 tâches :  Évaluer le degré d’accent sur une échelle de 0 à 5 0 : pas d’accent 1 : petit accent 2 : accent modéré 3 : assez fort accent 4 : fort accent 5 : très fort accent  Identifier l’origine du locuteur parmi 7 réponses proposées

Journées PFC Résultats : degré d’accent Degré moyen Catégories correspondantes Treize-Vents (Vendée)1,92 : accent modéré Tournai (Belgique)2,02 : accent modéré Gembloux (Belgique)2,73 : assez fort accent Liège (Belgique)3,03 : assez fort accent Nyon (Suisse romande)3,23 : assez fort accent Boersch (Alsace)3,74 : fort accent Douzens (Languedoc)4,85 : très fort accent

Journées PFC Résultats : identification Douzens est remarquablement bien identifié Suivent Treize-Vents, Nyon et Boersch Réponse Origine Treize- Vents Douzens Boersch Nyon Gembloux Liège Tournai Treize-Vents Douzens Boersch Nyon Gembloux Liège Tournai

Journées PFC Résultats : identification Matrice de confusion avec les points d’enquête belges regroupés Réponse Origine Treize- Vents Douzens Boersch Nyon Belgique Treize-Vents Douzens Boersch Nyon Belgique

Journées PFC Échelonnement multidimensionnel Continuum Treize-Vents Nyon Douzens à part

Journées PFC Échelonnement multidimensionnel Fusion avec les résultats de précédentes expériences

Journées PFC 2008 Aspects prosodiques

Journées PFC Quelques études antérieures Belgique :  Allongement des voyelles des syllabes pénultième et finale [Hambye & Simon,2004] Alsace :  Accent tonique « germanique » sur la première syllabe [ Vajta,2002] Suisse :  Résistance au schéma intonatif du français standard [Singy, ]  Accentuation de la première syllabe des mots disyllabiques [Singy, ]  Elévation de la voix sur la syllabe précédant la tonique [Métral,1977]

Journées PFC Faits prosodiques étudiés Accentuation initiale  F 0  Durée  Intensité  Allongement de l’attaque Allongement pénultième voyelles

Journées PFC Corpus Standard 6 points d’enquête : Brécey, Brunoy, Dijon, Lyon-Villeurbanne, Roanne, Treize-vents Belgique 3 points d’enquête : Gembloux, Liège, Tournai Suisse1 point d’enquête : Nyon Alsace1 point d’enquête : Boersch Sud 5 points d’enquête : Biarritz, Douzens, Lacaune, Marseille, Rodez Corpus PFC  ~10 locuteurs / point  + de 150 locuteurs  Des dizaines d’heures de parole Sud non représenté dans les graphiques et tableaux de résultats

Journées PFC Méthode Corpus automatiquement segmenté en phonèmes durée des phonèmes Calcul du débit légèrement plus lent pour les Suisses F 0 et intensité extraites toutes les 10 ms avec P RAAT Moyenne une mesure de F 0 et d’intensité par phonème

Journées PFC Accentuation initiale Suites clitique non-clitique Variations de F 0, intensité et durée entre noyaux vocaliques Durée de l’attaque du non-clitique Monosyllabes parmi les plus fréquents du français (le, la, les, une, de, du, des, en, pour…) Polysyllabes (disyllabes, trisyllabes ou plus) Ex. pour trouver durée de la séquence /t  / différence de F 0, d’intensité et de durée entre les deux /u/

Journées PFC Accentuation initiale : résultats ΔF 0 = F 0 non-clitique - F 0 clitique Tendances identiques pour  trisyllabes et +  parole lue Montée de pitch sur la syllabe initiale en Suisse Suisse : + de ΔF 0 positifs Répartition des ΔF 0 (parole spontanée, polysyllabes) :

Journées PFC Accentuation initiale : résultats Δintensité = intensité non-clitique - intensité clitique polysyllabestrisyllabes et + %>0 dB%>3 dB%>0 dB%>3 dB lecture Standard Alsace Belgique Suisse spontané Standard Alsace Belgique Suisse Alsace et Suisse : augmentation de l’intensité sur la syllabe initiale

Journées PFC Accentuation initiale : résultats Δdurée = durée non-clitique - durée clitique PolysyllabesTrisyllabes et + % Δ > 0ms % Δ > 20ms % Δ > 0ms % Δ > 20ms Texte lu Standard Alsace Belgique Suisse Spontané Standard Alsace Belgique Suisse Plus d’allongements pour les Alsaciens Tendance + marquée pour les mots d’au moins 3 syllabes Allongement de la voyelle de la syllabe initiale pour les Alsaciens

Journées PFC Accentuation initiale : résultats Δdurée = durée non-clitique - durée clitique Répartition des Δdurée (trisyllabes et +, parole spontanée) Alsace : + de Δdurée > seuil donné Allongement de la voyelle de la syllabe initiale pour les Alsaciens Alsace : + de Δdurée > seuil donné

Journées PFC Accentuation initiale : résultats allongement de l’attaque Même tendance si l’on restreint l’analyse aux attaques simples Attaques de polysyllabes plus longues pour les Suisses (non réductibles aux différences de débit) Durée de l’attaque (ms) Polysyllabes Trisyllabes et + Texte lu Standard88105 Alsace92106 Belgique89102 Suisse97114 Spontané Standard9189 Alsace9291 Belgique9087 Suisse9897

Journées PFC Allongement pénultième Deux ou trois dernières syllabes avant une pause (au moins 50 ms) considérées Différence de F 0 (pénultième - finale) : pas de tendance marquée distinguant les régions

Journées PFC Allongement pénultième : résultats Δdurée f = durée pénultième - durée finale PolysyllabesTrisyllabes et + %Δ >0ms Dur pén Dur fin %Δ >0ms Dur pén Dur fin Texte lu Standard Alsace Belgique Suisse Spontané Standard Alsace Belgique Suisse

Journées PFC Allongement pénultième : résultats Belgique : allongement de la pénultième par rapport à la finale, surtout en parole spontanée Suisse : deux dernières syllabes allongées ?

Journées PFC Comportement de l’antépénultième Δdurée = durée pénultième - durée antépénultième Trisyllabe + %Δ >0ms Dur. Ant Texte Standard6670 Alsace5578 Belgique7166 Suisse8165 Spontané Standard6561 Alsace5572 Belgique7062 Suisse6965 Belgique et Suisse : pénultième allongée par rapport à l’antépénultième Suisse : deux dernières syllabes allongées Alsace : antépénultième (le plus souvent initiale) allongée

Journées PFC Bilan Suisse romande :  accentuation initiale (montée mélodique + allongement de l’attaque + augmentation de l’intensité)  allongement des deux dernière syllabes avant une pause Alsace : accentuation initiale (allongement de la voyelle initiale + augmentation de l’intensité) Belgique : allongement de la pénultième syllabe avant une pause

Journées PFC 2008 Voisement/dévoisement des consonnes

Journées PFC Méthode Étude à base de mesures de F 0  F 0 extraite toutes les 10 ms avec P RAAT  Taux de voisement = nombre de mesures de F 0 définies / nombre total Étude à base de variantes d’alignement

Journées PFC Mesures de F 0 : résultats % voisement moyen voyellesC sourdesC sonores //// lecture Standard Alsace Belgique Suisse spontané Standard Alsace Belgique Suisse

Journées PFC Mesures de F 0 : résultats Tendances allant dans le même sens en comptant le pourcentage de consonnes entièrement voisées/dévoisées Alsace : consonnes sonores moins voisées Belgique : /  / moins voisé en parole spontanée

Journées PFC Variantes d’alignement Ajout de variantes de prononciations autorisées dans le dictionnaire de prononciation Ex. Beaulieu /boljø/ → [boljø, poljø] Ex. pour /pu  / → [pu , pu , pux] Quelle prononciation est choisie par le système ?

Journées PFC Variantes d’alignement : résultats % sourdes → sonores (ex. /f/ → [v]) % sonores → sourdes (ex. /b/ → [p]) occlusivesfricativesocclusivesfricatives lecture Standard91399 Alsace Belgique Suisse3888 spontané Standard Alsace Belgique Suisse

Journées PFC Variantes d’alignement : résultats %[  ]%[  ] % [x] lecture Standard Alsace 7512 Belgique Suisse spontané Standard Alsace Belgique Suisse 78913

Journées PFC Conclusion Perception : tendances pas aussi nettes que dans l’imaginaire linguistique des sujets Prosodie :  Accentuation initiale en Alsace et en Suisse avec des corrélat acoustiques différents  Allongement de la pénultième syllabe en Belgique et des deux dernières syllabes en Suisse Voisement/dévoisement  Dévoisement des consonnes sonores en Alsace et du /  / en Belgique

Journées PFC Merci de votre attention ! Travail mené dans le cadre du projet ANR PFC-Cor Merci à Anne-Catherine Simon pour les enregistrements d’Alsace