Identification d’accents en français et contribution de la prosodie Philippe Boula de Mareüil LIMSI-CNRS
2 Introduction Accent = terme du vocabulaire courant, mais objet difficile à cerner chacun a sa morphologie, sa façon de parler chacun a son mot à dire sur le langage anecdotes, intérêt et passions Ensemble de traits de prononciation lié à une origine linguistique, géographique ou sociale accent étranger = résultat de la confrontation de 2 systèmes provenant d’une langue maternelle et d’une langue seconde (L2) accent régional communément défini par rapport à une norme accent dit « de banlieue » = des jeunes de cités populaires
3 Questions Avec quel degré de granularité (quelle finesse, quelle précision) peut-on distinguer divers accents ? Quels sont les indices qui permettent de reconnaître tel ou tel accent ? Quelle est en particulier la part de la prosodie ? analyse d’importantes quantités de données, utilisation de la modification/resynthèse de prosodie accent < accentum (ad + cantum) < προσωδία
4 Plan de l’exposé Expérience à grande échelle d’identification d’accents Contribution de la prosodie pour caractériser l’accent « de banlieue » l’accent belge l’accent corse des accents méridionaux des accents ouest-africains comme l’accent sénégalais transferts prosodiques dus au contact de langues (?)
5 Dialectologie perceptive Perception = problématique au cœur des sciences cognitives, abordée en « dialectologie perceptive » sous 3 angles : représentations et cartographie mentale en l’absence d’input linguistique, dans le sillage de Preston [1989] attitudes évaluatives et affectives en réaction à des stimuli linguistiques aptitude à discerner différents accents à partir d’un input phonétique Exemples de travaux antérieurs AnglaisNéerlandaisNorvégien Clopper & PisoniHeeringa van BezooijenGooskens
6 Identification d’accents en français Quiz préparé avec la Cité des sciences et de l’industrie, en grande partie grâce au projet « Phonologie du Français Contemporain » (PFC) [Durand et al., ] À chaque partie, 10 échantillons de parole spontanée (d’une douzaine de secondes) parmi 20 joués aléatoirement, à localiser sur un planisphère Feedback sur les réponses données un millier de participants
7 Quizz
8 Résultats Accents québécois, (parisien) et maghrébin = les mieux discriminés, devant des accents ouest-africains 43 % d’identification correcte Matrice de confusion et échelonnement multidimensionnel
9 Scaling (MDS)
10 Accent de banlieue Particularités de prononciation palatalisation/affrication de /t/ et /d/ devant les voyelles antérieures hautes chute mélodique abrupte (HL) sur la syllabe finale, avant une frontière prosodique Question : est-ce que la présence/absence de ce patron prosodique augmente/diminue l’impression d’accent ? expérience perceptive utilisant la modification et resynthèse de la prosodie Faire la part de la prosodie
11 Accent de banlieue : évaluation perceptive Corpus 11 adolescents de la banlieue rouennaise enregistrés lors d’entretiens semi-directifs pour chacun, séquences de quelques secondes prosodiquement marquées et non-marquées (i.e. présentant des chutes HL ou non), rendues respectivement non-marquées et marquées par synthèse Tâche (soumise à 20 auditeurs d’Île-de-France et 20 auditeurs de Normandie) évaluer le degré d’accent sur une échelle (de 0 à 5) pointer les mots marqués par l’accent de banlieue Résultats pas de différences significatives entre Franciliens et Normands contribution significative de la prosodie
12 Accent de banlieue : évaluation perceptive Corpus 11 adolescents de la banlieue rouennaise enregistrés lors d’entretiens semi-directifs pour chacun, séquences de quelques secondes prosodiquement marquées et non-marquées (i.e. présentant des chutes HL ou non), rendues respectivement non-marquées et marquées par synthèse Tâche (soumise à 20 auditeurs d’Île-de-France et 20 auditeurs de Normandie) évaluer le degré d’accent sur une échelle (de 0 à 5) pointer les mots marqués par l’accent de banlieue Résultats pas de différences significatives entre Franciliens et Normands contribution significative de la prosodie
13 Accent de banlieue : évaluation perceptive Corpus 11 adolescents de la banlieue rouennaise enregistrés lors d’entretiens semi-directifs pour chacun, séquences de quelques secondes prosodiquement marquées et non-marquées (i.e. présentant des chutes HL ou non), rendues respectivement non-marquées et marquées par synthèse Tâche (soumise à 20 auditeurs d’Île-de-France et 20 auditeurs de Normandie) évaluer le degré d’accent sur une échelle (de 0 à 5) pointer les mots marqués par l’accent de banlieue Résultats pas de différences significatives entre Franciliens et Normands contribution significative de la prosodie
14 Accent belge Particularités de prononciation / / prononcé [w] (p. ex. dans huit), / / dans des mots comme sot ou pot, / / tendant vers une sorte de [x] sourd allongement de certaines voyelles (pénultièmes ou finales) Question: comment les allongements vocaliques chez des Belges francophones sont-ils perçus par des auditeurs vivant en Belgique ou en région parisienne ?
15 Accent belge : évaluation perceptive - matériel Corpus 4 points d’enquête PFC en Belgique (Liège, Gembloux, Tournai, Bruxelles) 10 locuteurs sélectionnés (âgés de 55 ans en moyenne) dont la lecture du texte PFC a été soumise à 4 experts (2 Belges, 2 Français) Méthode Ces juges ont annoté les allongements vocaliques qu’ils percevaient comme régionalement marqués. constitution de 15 paires de phrases marquées/non-marquées (de 7 secondes en moyenne), rendues respectivement non- marquées/marquées en raccourcissant/allongeant les voyelles cibles
16 Accent belge : évaluation perceptive - matériel Corpus 4 points d’enquête PFC en Belgique (Liège, Gembloux, Tournai, Bruxelles) 10 locuteurs sélectionnés (âgés de 55 ans en moyenne) dont la lecture du texte PFC a été soumise à 4 experts (2 Belges, 2 Français) Méthode Ces juges ont annoté les allongements vocaliques qu’ils percevaient comme régionalement marqués. constitution de 15 paires de phrases marquées/non-marquées (de 7 secondes en moyenne), rendues respectivement non- marquées/marquées en raccourcissant/allongeant les voyelles cibles
17 Accent belge : évaluation perceptive - matériel Corpus 4 points d’enquête PFC en Belgique (Liège, Gembloux, Tournai, Bruxelles) 10 locuteurs sélectionnés (âgés de 55 ans en moyenne) dont la lecture du texte PFC a été soumise à 4 experts (2 Belges, 2 Français) Méthode Ces juges ont annoté les allongements vocaliques qu’ils percevaient comme régionalement marqués. constitution de 15 paires de phrases marquées/non-marquées (de 7 secondes en moyenne), rendues respectivement non- marquées/marquées en raccourcissant/allongeant les voyelles cibles
18 Accent belge : évaluation perceptive - matériel Corpus 4 points d’enquête PFC en Belgique (Liège, Gembloux, Tournai, Bruxelles) 10 locuteurs sélectionnés (âgés de 55 ans en moyenne) dont la lecture du texte PFC a été soumise à 4 experts (2 Belges, 2 Français) Méthode Ces juges ont annoté les allongements vocaliques qu’ils percevaient comme régionalement marqués. constitution de 15 paires de phrases marquées/non-marquées (de 7 secondes en moyenne), rendues respectivement non- marquées/marquées en raccourcissant/allongeant les voyelles cibles
19 Accent belge : évaluation perceptive - matériel Corpus 4 points d’enquête PFC en Belgique (Liège, Gembloux, Tournai, Bruxelles) 10 locuteurs sélectionnés (âgés de 55 ans en moyenne) dont la lecture du texte PFC a été soumise à 4 experts (2 Belges, 2 Français) Méthode Ces juges ont annoté les allongements vocaliques qu’ils percevaient comme régionalement marqués. constitution de 15 paires de phrases marquées/non-marquées (de 7 secondes en moyenne), rendues respectivement non- marquées/marquées en raccourcissant/allongeant les voyelles cibles
20 Accent belge : évaluation perceptive – protocole Tâche : identique à l’expérience sur l’accent de banlieue (soumise à 25 Belges et à 25 Français résidents de la région parisienne) Résultats : de façon significative les allongements vocaliques participent de l’accent belge.
21 Accent de banlieue et accent belge : discussion Traits prosodiques étudiés = facteurs pertinents en perception, pour l’accent de banlieue comme pour l’accent belge Allongement relatif de la syllabe pénultième parfois cité comme caractéristique de l’accent de banlieue étude de ce trait comme marqueur social Accent de banlieue de plus en plus associé à l’origine ethno-géograhique, notamment du Maghreb prudence nécessaire concernant le rôle de l’arabe interprétation alternative (iconique) : angularité des mouvements mélodiques, suggérant des coups, perçus comme violents
22 Français en contact avec le corse, l’occitan et le catalan Question : y a-t-il des transferts prosodiques de langues comme le corse, l’occitan ou le catalan vers le français ? Corpus : enquêtes de terrain appliquant le protocole de l’Atlas Multimédia Prosodique de l’Espace Roman (AMPER), centrées sur l’intonation des questions, menées auprès de 14 bilingues corse/français 14 bilingues occitan/français 14 bilingues catalan/français FrançaisLa touriste malade trouve la caserne CorseA turista malata trova a caserna OccitanLa torista malauta tròba la caserna CatalanLa turista malalta troba la caserna lisant des phrases transparentes dans ces langues Les questions terminent par une montée de la voix dans la plupart des langues, mais des questions descendantes s’observent en Corse.
23 Accent corse 2 expériences perceptives sur la fonction modale de la prosodie (test de discrimination Q/A) sur la fonction indexicale de la prosodie (text XAB) Questions Comment des questions à intonation descendantes sont-elles distinguées des assertions correspondantes ? Dans quelle mesure des patrons mélodiques en français de Corse peuvent-ils être attribués à un transfert prosodique du corse vers le français ? + Analyses acoustiques
24 Accent corse : test Q/A Protocole tâche : choix forcé question/assertion matériel : 42 questions totales et 42 assertions (en corse, en français de corse et en français parisien) auditeurs : 20 Parisiens et 20 Corses Résultats : en français de Corse, en particulier, questions correctement discriminées des assertions dans moins de 40 % des cas par les auditeurs parisiens dans plus de 80 % des cas par les auditeurs corses
25 Accent corse : test XAB Paradigme = variante du test ABX X : français de Corse (ou français parisien comme groupe contrôle) A/B : corse /français parisien d’autres locuteurs (appariés en âge et en sexe), délexicalisés en hum Tâche : la prosodie de X est-elle plus proche de A ou de B ? Matériel : 7 questions sélectionnées, de 4 bilingues français- corse et de 4 Parisiens (56 stimuli au total) Auditeurs : 20 Parisiens Résultat : La prosodie des questions en français de Corse est jugée plus proche du corse que n’en est la prosodie du français parisien.
26 Accent corse : test XAB Paradigme = variante du test ABX X : français de Corse (ou français parisien comme groupe contrôle) A/B : corse /français parisien d’autres locuteurs (appariés en âge et en sexe), délexicalisés en hum Tâche : la prosodie de X est-elle plus proche de A ou de B ? Matériel : 7 questions sélectionnées, de 4 bilingues français- corse et de 4 Parisiens (56 stimuli au total) Auditeurs : 20 Parisiens Résultat : La prosodie des questions en français de Corse est jugée plus proche du corse que n’en est la prosodie du français parisien.
27 Accents corse et accents méridionaux Ton haut initial (%H) et descente mélodique finale (L%) en corse comme en français en contact avec le corse Patrons intonatifs majoritairement montants-montants (H*H%) en fin de questions terminées par un paroxyton, en occitan comme en français en contact avec l’occitan Patrons intonatifs descendants-montants (L*H%) en fin de questions terminées par un paroxyton en catalan comme en français en contact avec le catalan
28 Accents corse et accents méridionaux Ton haut initial (%H) et descente mélodique finale (L%) en corse comme en français en contact avec le corse Patrons intonatifs majoritairement montants-montants (H*H%) en fin de questions terminées par un paroxyton, en occitan comme en français en contact avec l’occitan Patrons intonatifs descendants-montants (L*H%) en fin de questions terminées par un paroxyton en catalan comme en français en contact avec le catalan
29 Accents corse et accents méridionaux Ton haut initial (%H) et descente mélodique finale (L%) en corse comme en français en contact avec le corse Patrons intonatifs majoritairement montants-montants (H*H%) en fin de questions terminées par un paroxyton, en occitan comme en français en contact avec l’occitan Patrons intonatifs descendants-montants (L*H%) en fin de questions terminées par un paroxyton en catalan comme en français en contact avec le catalan
30 Accents corse et accents méridionaux Ton haut initial (%H) et descente mélodique finale (L%) en corse comme en français en contact avec le corse Patrons intonatifs majoritairement montants-montants (H*H%) en fin de questions terminées par un paroxyton, en occitan comme en français en contact avec l’occitan Patrons intonatifs descendants-montants (L*H%) en fin de questions terminées par un paroxyton en catalan comme en français en contact avec le catalan
31 Accents corse et accents méridionaux Ton haut initial (%H) et descente mélodique finale (L%) en corse comme en français en contact avec le corse Patrons intonatifs majoritairement montants-montants (H*H%) en fin de questions terminées par un paroxyton, en occitan comme en français en contact avec l’occitan Patrons intonatifs descendants-montants (L*H%) en fin de questions terminées par un paroxyton en catalan comme en français en contact avec le catalan
32 Accents corse et accents méridionaux Ton haut initial (%H) et descente mélodique finale (L%) en corse comme en français en contact avec le corse Patrons intonatifs majoritairement montants-montants (H*H%) en fin de questions terminées par un paroxyton, en occitan comme en français en contact avec l’occitan Patrons intonatifs descendants-montants (L*H%) en fin de questions terminées par un paroxyton en catalan comme en français en contact avec le catalan
33 Accents corse et accents méridionaux Ton haut initial (%H) et descente mélodique finale (L%) en corse comme en français en contact avec le corse Patrons intonatifs majoritairement montants-montants (H*H%) en fin de questions terminées par un paroxyton, en occitan comme en français en contact avec l’occitan Patrons intonatifs descendants-montants (L*H%) en fin de questions terminées par un paroxyton en catalan comme en français en contact avec le catalan
34 Français en contact avec l’occitan et le catalan Question : y a-til une fonction épistémique particulière (appelant une réponse en oui/non) de tel ou tel pattron ? Tâche : identification de l’acte de langage réalisé (3 possibilités :demande de confirmation, question incrédule ou demande d’information) Matériel : 2 questions terminées par un paroxyton sélectionnées (en français), parmi 3 locuteurs de Provence (montrant des patrons H*L%) 3 locuteurs du Languedoc (montrant des patrons H*H%) 3 locuteurs du Roussillon (montrant des patrons L*H%) + modifications de prosodie 54 stimuli Auditeurs : 30 Méridionaux
35 Accents méridionaux Résultats H*H% plutôt une demande de confirmation (à 46 %) H*L% plutôt une question incrédule (à 41 %) L*H% demandant une analyse plus détaillée Travail en cours sur la parole spontanée
36 Accent corse et accents méridionaux : discussion Phrases transparentes en corse, occitan, catalan et français différents patrons intonatifs dans la façon de poser les questions En Corse, un ton haut en début d’énoncé, à l’encontre de la tendance observée dans la plupart des langues [Bolinger, 1978] signalant tôt à l’interlocuteur qu’on lui pose une question, peut être avantageux pour obtenir une réponse. Interprétation et comparaisons à poursuivre double force agissant sur le langage (unificatrice et séparatrices) nouveaux enregistrements collectés à Toulouse (en gascon et languedocien), en Rouergue (Aveyron) et en Marche (Creuse)
37 Corpus : 52 locuteurs parlant français enregistrés au Burkina Faso, en Côte d’Ivoire, au Mali et au Sénégal 20 locuteurs sélectionnés pour une expérience perceptive Tâche : identification perceptive du pays de résidence 20 auditeurs ouest-africains Résultats : 63 % d’identification correcte (sans effet majeur du style de parole lu/spontané) locuteurs sénégalais et ivoiriens les mieux identifiés Accents ouest-africains
38 Accents ouest-africains Corpus : 52 locuteurs parlant français enregistrés au Burkina Faso, en Côte d’Ivoire, au Mali et au Sénégal 20 locuteurs sélectionnés pour une expérience perceptive Tâche : identification perceptive du pays de résidence 20 auditeurs ouest-africains Résultats : 63 % d’identification correcte (sans effet majeur du style de parole lu/spontané) locuteurs sénégalais et ivoiriens les mieux identifiés
39 Accents ouest-africains : analyses acoustiques Analyse de la lecture du texte PFC prosodie (patrons mélodiques sur les polysyllabes) réalisation du /R/ (dorsal, apical, labialisé ou élidé) Résultats : indices discriminant les accents sénégalais : patrons mélodiques descendants (HiL) davantage de /R/ dorsaux ivoirien : patrons mélodiques LiH davantage d’élision/labialisation du /R/ Études plus approfondies nécessaires pour trouver des traits caractérisant les accents du Burkina Faso et du Mali sur la parole spontanée
40 Accents ouest-africains : analyses prosodiques Analyse de contours de F 0 (en demi-tons) sur 500 contextes clitique-polysyllabe par point d’enquête contour montant-descendant uniquement au Sénégal
41 Accents ouest-africains : discussion Analyse de la lecture du texte PFC prosodie (patrons mélodiques sur les polysyllabes) réalisation du /R/ (dorsal, apical, labialisé ou élidé) Résultats : indices discriminant les accents sénégalais : patrons mélodiques descendants (HL) davantage de /R/ dorsaux ivoirien : patrons mélodiques LiH davantage d’élision/labialisation du /R/ Études plus approfondies nécessaires pour trouver des traits caractérisant les accents du Burkina Faso et du Mali sur la parole spontanée wolof (langue à accent initial dominante au Sénégal) transfert français en voie d’appropriation en Côte d’Ivoire
42 Conclusion Accents = réalité complexe parfois délaissée pour des raisons théoriques nécessitant de collecter des enregistrements de qualité problème pratique : analyse phonétique exigeante en outillage Étude de variétés de français, à l’aide de la modification/resynthèse de la prosodie modélisation par la machine des accents (et de leur perception) quantification de tendances connues et moins connues transferts prosodiques de langues comme le corse, l’occitan, le catalan ou le wolof vers le français dimension sociale quelque peu négligée
43 Perspectives Application à d’autres accents (notamment sociaux) cerner la notion de prototype Étude approfondie du français en contact Application à la reconnaissance de la parole pour en diminuer le taux d’erreur pour obtenir une transcription automatique enrichie avec l’origine et le degré d’accent des locuteurs
44 Par rapport au projet Restaure Au moins deux types de normes prescriptive : modèle promu comme « correct » statistique : établie par des faits quantifiables Grande variation dans les langues minorées, en l’absence de norme prescriptive acceptée par tous aux niveaux lexical (ex. comment traduire le mot « bise » ?) orthographique (ex. graphie alibertine ou mistralienne en occitan ?) phonétique (ex. comment accentuer un mot comme « bulgara » en corse/catalan roussillonnais ?) … Problèmes pour des recherches dans des textes, le calcul de statistiques lexicales…
45 Comment transcrire de l’occitan, du picard, etc. ? Différentes fonctions de l’orthographe être lu,pour communiquer refléter l’identité de la langue rester un minimum (ou le plus possible ?) fidèle à la prononciation Langues polynomiques (tolérantes vis-à-vis de la variation) → limites d’une graphie phonétique Risque de double diglossie, à vouloir trop standardiser français ↑ construction savante ↓ langue de l’immédiateté, du quotidien, de la famille, de la connivence
46 Remerciements Merci à Christophe Rey pour l’invitation Merci à Albert Rilliard, Martine Adda-Decker, Cécile Woehrling, Iryna Lehka-Lemarchand, Alice Bardiaux, Paolo Mairano, Jean-Pierre Lai, Fanny Ivent et Béatrice Akissi Boutin, pour leur contribution Merci pour votre attention
47 Références bibliographiques N. Armstrong & Z. Boughton, « Identification and evaluation responses to a French accent: some results and issues of methodology », Revue Parole, vol. 5–6, pp. 27–60, N. Binisti & M. Gasquet-Cyrus, « Les accents de Marseille », Cahiers du français contemporain, vol. 8, pp. 107–129, P. Boula de Mareüil, D’où viennent les accents régionaux ?, Le Pommier, Paris, F. Carton, M. Rossi, D. Autesserre, P. Léon, Les accents des Français, Hachette, Paris, A. Falkert (éd.), La perception des accents du français hors de France, Éditions du CIPA, Mons, F. Hauchecorne & R. Ball, « L’accent du Havre : un exemple de mythe linguistique », Langage et société, vol. 82, pp. 5–25, 1997.