Contribution du traitement automatique de la parole à l’étude de la variation diatopique en français Martine Adda-Decker Philippe Boula de Mareüil LIMSI-CNRS.

Slides:



Advertisements
Présentations similaires
Un exemple d’annotation sur corpus oral transcrit: PFC
Advertisements

Hésitations autonomes en 8 langues :
Indices prosodiques caractérisant un style d'élocution et ses variantes individuelles MIDL nov 2004 Paris Jean-Sylvain Liénard Martine Adda-Decker.
LA LIAISON.
QUEL ACCENT EN FRANÇAIS ?
Traitement de la parole : Synthèse et reconnaissance
Apprentissage automatique des prononciations à partir de grandes masses de données orales Rena NEMOTO Encadrée par Martine Adda-Decker & Ioana Vasilescu.
Journée Des Doctorants 2004
Révisions ORTHOGRAPHECorrections. QCM 1. La lettre « y » du mot « satyre » joue un rôle : ° de phonogramme, de logogramme et de morphogramme grammatical.
Le CV anonyme Banks, Bruno, Courrege.
LES FRANÇAIS ET L’ONU. © Harris Interactive 2 SOMMAIRE > Méthodologie d’enquêteP.3 > Regard général sur l’ONUP.4 > Perception de l’action de l’ONU et.
M. Bétrancourt et C. Rebetez - Méthodologie expérimentale Diplôme MALTT Année La méthodologie expérimentale Fondements et bases d’application.
Le découpage en syllabes est comme suit (les difficultés sont indiquées en vert): exercice 1 N.B. J’ai laissé tomber les e muets là où c’était possible.
Combien d’accents en français ? Focus sur la France, la Belgique et la Suisse Philippe Boula de Mareüil 1, Yves Scherrer 2, Jean-Philippe Goldman 2 1.
ECRIRE: COMPTETENCES LANGAGIERES ET OPERATIONS COGNITIVES DANS LES DISCIPLINES ( CAS DU FLE AU MAROC)
Scolarisation en français et phonologie du français en Louisiane Tom Klingler Université Tulane Journées PFC 2009, Paris le 12 décebre 2009.
Les dictionnaires (théorie). « Utiliser un dictionnaire » signifie : Rechercher un mot pour en vérifier l’orthographe, en comprendre le sens et pouvoir.
Mgr Magdalena Bejm Cours de phonétique PROSODIE (I)
MSN 21 Représenter des figures planes à l’aide de croquis (triangle, carré, rectangle, cercle) Le croquis est à considérer comme support de réflexion Reconnaître.
1 Initiation aux bases de données et à la programmation événementielle VBA sous ACCESS Cours N° 5 Support de cours rédigé par Bernard COFFIN Université.
BTN4U Gérer vos réservations du bout des doigts. BTN4U Gérer les réservations du bout des doigts Consultable toujours et partout Possibilité de multi-tâches.
1 Les bases de données Séance 7 Les fonctions avancées : Opérateurs ensemblistes, Sous-requêtes et transactions.
Un début de caractérisation prosodique de deux variétés suisses romandes Sandra Schwab, Jean-Philippe Goldman & Isabelle Racine Ecole de langue et de.
Comment écrire un article scientifique Olivier MIMOZ DAR.
Bloodcurdling movies and measures of coagulation: Fear Factor crossover trial BMJ Noël 2015 Article thématique du 26/01/2016 André Gillibert Banne Nemeth.
LCA UFR SMBH (DCEM)1 Analyse critique d ’articles évaluant l ’intérêt de nouveaux tests à visée diagnostique Alain Venot UFR SMBH Campus virtuel SMBH
Journées PFC 2008 Une étude de corpus de français de Suisse, Belgique, Alsace, Nord et Sud de la France Cécile Woehrling Philippe Boula de Mareüil Martine.
rôle que des processus élémentaires et généraux jouent dans l’apprentissage de systèmes d’informations complexes organisés à divers niveaux Apprentissage.
LECON 3 Question d’éducation. Les devoirs: Corrections et questions.
Distinctions subtiles 1) « ouvertes » et « fermées » 2) « équipes » et « professionnels individuels » 3) exceptions à la règle 4) « contexte » et « justification.
UE « Recueil et traitement de données pour RTS » Analyse quantitative ou « Des chiffres pour le dire » 1 Chr. Vandeschrick.
Introduction à la Sociologie Présentation des séances de Travaux Pratiques UNamur, Année académique
Accréditations How Societies Desire Brands Douglas B. Holt Principaux éléments à retenir Olivier Trendel.
La liaison en terre africaine Guri Bordal et Chantal Lyche Université d’Oslo Journées PFC, Paris décembre 2008.
Evaluation CE Une analyse des résultats de la circonscription Arcachon Sud DisciplineChampCompétence Item Fichier de compilation des résultats des.
Les séquences mathématiques en 4 e et 5 e secondaire Selon la note obtenue dans le cours de mathématique de 3 secondaire, l’élève aura accès à trois cours.
1 Journées Scientifiques novembre 2003 MoMaS EDF Electricité de France Multi Domaines Simulation Multi Domaines Laurent Loth - Andra.
1 Présentation du projet: Ecriture accompagnée ou Ecrire pour mieux entrer dans la lecture.
Tourisme 1 x
1 Initiation aux bases de données et à la programmation événementielle VBA sous ACCESS Cours N° 7 Support de cours rédigé par Bernard COFFIN Université.
LARRAS CHAFIKA ENSEIGNANTE CHERCHEUSE Approche systémique.
« Priorité à la syntaxe, qui rend possible l'acquisition du vocabulaire dont la comparaison de mots permet d'aider l'enfant à perfectionner son articulation.
Ressources du web - phonétique. L’alphabet
APPRENDRE A APPRENDRE MEMORISER S. COUSTIER CPAIEN OULLINS – MARS 2016.
Pour quoi RANDONNEUR Rythme d’Analyse de Nouvelle Donner sur l’Objectif des Norme et des Négociation d’Entraide pour Unir la Relation des participants.
Étude des émissions diffuses avec l’expérience H.E.S.S. Tania Garrigoux.
Made in China Oui, c'est un immeuble de 13 étages, étendu sur le sol !
MODELE GRW (Ghirardi Rumini Weber) Approche phénoménologique Extraits du document de synthèse de Gian Carlo Ghirardi : Collapse Théorie Introduction Approche.
Service des programmes et du développement pédagogique, Collège Ahuntsic Des objectifs-standards aux plans de cours.
De la lettre … au mot.
Analyse des données quantitatives ou « Des chiffres pour le dire » 1 Chr. Vandeschrick.
LE PROTOCOLE DE REDACTION A partir du journal de bord, vous allez rédiger le document définitif, le protocole de rédaction, synthèse de tout votre travail.
Observatoire de la Qualité des Services de Communication Électronique Fixes 2015 Réunion Qostic 93 du 31 mai /05/2016AHQ
Modèle de présentation projets/thèses Spécialité TitreDate Nom Titre Nom.
À la recherche d’indices discriminant des accents ouest- africains en français Philippe Boula de Mareüil LIMSI-CNRS, Orsay.
LA PANCREATECTOMIE MEDIANE : a propos de 04 cas E.ABOULFETH, M. TARCHOULI, M-B RATBI, M-S. BELHAMIDI, H. BABA, A. AIT ALI, A. BOUNAIM. Service de chirurgie.
BACCALAUREAT PROFESSIONNEL 3 ANS REPARATION DES CARROSSERIES Quelques points clés.
Apprentissages géométriques
2 Avril 2009 Les fondations au défi de la crise. 2 Baromètre permanent du climat de générosité des français en partenariat avec \QUALICONTACT. Méthodologie.
*Lycée qualifiant Salaheddine al ayoubi-Taourirt 1 L.Q. SalaheddineElAyoubi- Taourirt
La base de données de jurisprudence francophone.  Juricaf est composé de deux parties : - Le menu de gauche avec les différentes fonctions - La partie.
Le e final graphique et ses rapports avec la phonie Dominique Nouveau.
Une étude pour Les entreprises de moins de 20 salariés et le projet de loi Travail, dit « El Khomri » Comment se positionnent notamment les artisans, les.
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
Commerce equitable NORD/NORD.
Evaluations cP.
Des Mots Environnementaux
L’écriture d’un article scientifique

Thème : L’organisation et le management de l ’entreprise Sous-thème : Le management Objectifs généraux : Caractériser les différents types d’animation.
Transcription de la présentation:

Contribution du traitement automatique de la parole à l’étude de la variation diatopique en français Martine Adda-Decker Philippe Boula de Mareüil LIMSI-CNRS

2 Les voyelles moyennes en français standard  Seul le timbre semi-fermé apparaît en syllabe finale ouverte pour les voyelles intermédiaires arrondies (on n’oppose pas pot */p  / à peau /po/).  Seul le timbre semi-ouvert apparaît en syllabe finale fermée pour la voyelle intermédiaire notée conventionnellement /  / (père */pe  / est exclu).  Seul le timbre semi-fermé (resp. semi-ouvert) apparaît avant /z/ (resp. /  /) pour les voyelles intermédiaires arrondies.  La voyelle racine (ex. /o/) tend à être préservée par fidélité morphologique et sémantique à la base, dans des mots tels que fossé.

3 La voyelle /O/ en français standard  Le timbre semi-ouvert /  / est considéré comme la forme sous-jacente du ‘o’ graphique ailleurs qu’en syllabe finale ouverte hormis devant la consonne allongeante /z/, hormis dans certains mots comme fosse ou atome, hormis dans les préfixes aéro-, micro-, psycho-, etc., où le phonème cible est /o/.  Désaccord dans l’aperture de la voyelle finale ferme (ex. synchrone), voire antériorisation de /  / en [  ] (ex. d’accord [dak  ])  Le digramme ‘au’ tend à être semi-fermé (/o/, comme le ‘ô’), hormis devant ‘r’, où l’on a /  /.

4 Problématique  Dans quelle mesure les règles précédentes sont- elles applicables au français méridional ?  Un schibboleth comme rose [  z  ] peut faire basculer la perception.  2 approches utilisant l’alignement en phonèmes : 1. à base de formants, à partir d’un alignement « standard » 2. à base de variantes de prononciation (ex. [o]~[  ]~[œ])

5 Méthode (1) modèles acoustiques Alignement segmentation en phonèmes signal dictionnaire de prononciation transcription orthographique Praat formants Ex. cause [koz, koz  ]

6 Méthode (2) modèles acoustiques Alignement segmentation en phonèmes signal variantes [o]~[  ]~[ œ ] dictionnaire de prononciation transcription orthographique taux de variantes Ex. cause [koz, k  z, kœz, koz , k  z , kœz  …]

7 Corpus  12 points d’enquête PFC (plus d’une centaine de locuteurs, des dizaines d’heures d’enregistrement de lecture et de parole spontanée) 7 compt é s comme « nord » 5 dans le sud de la France  mots différents  9000 occurrences de /o/ sous-jacents

8 Résultats globaux  pas dedifférences marquées F1 /o/ (Hz)NordSud hommes femmes Nord Sud

9 Résultats sur quelques mots particuliers  chose  cause  autre  pauvre  gauche  chaude  paume  côte  gnôle  …   80 mots différents   1300 occurrences F1 /o/ (Hz)NordSud hommes femmes402480

10 Résultats sur quelques mots particuliers  chose  cause (Marseille)  autre  pauvre  gauche  chaude  paume  côte  gnôle  …   80 mots différents   1300 occurrences F1 /o/ (Hz)NordSud hommes femmes402480

11 Résultats sur quelques mots particuliers  chose  cause  autre (Rodez)  pauvre  gauche  chaude  paume  côte  gnôle  …   80 mots différents   1300 occurrences F1 /o/ (Hz)NordSud hommes femmes402480

12 Résultats sur quelques mots particuliers  chose  cause  autre  pauvre  gauche  chaude (Lacaune)  paume  côte  gnôle  …   80 mots différents   1300 occurrences F1 /o/ (Hz)NordSud hommes femmes402480

13 Résultats sur quelques mots particuliers  chose  cause  autre  pauvre  gauche  chaude  paume  côte (Douzens)  gnôle  …   80 mots différents   1300 occurrences F1 /o/ (Hz)NordSud hommes femmes402480

14 Résultats sur quelques mots particuliers  chose  cause  autre  pauvre  gauche  chaude  paume  côte  gnôle (Biarritz)  …   80 mots différents   1300 occurrences F1 /o/ (Hz)NordSud hommes femmes402480

15 Discussion et perspectives  Analyse de corpus  regard fin sur les résultats  Dictionnaire électronique BDLEX   800 entrées telles que autre (37 %) de [o] dans les points d’enquête méridionaux de PFC) chose (51 % de [o] dans les points d’enquête méridionaux de PFC)  On peut considérer un /  / sous-jacent dans le Sud, mais le phénomène peut être lexical.  Effets du style de parole, de l’âge et du sexe des locuteurs  Liens avec la prononciation du schwa final et la prosodie  études nécessaires sur davantage de données