La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Lexique-grammaire évolutif de l'acadien avec INTEX

Présentations similaires


Présentation au sujet: "Lexique-grammaire évolutif de l'acadien avec INTEX"— Transcription de la présentation:

1 Lexique-grammaire évolutif de l'acadien avec INTEX
Gisèle Chevalier, Sylvia Kasparian, Laboratoire d’analyse de Données Textuelles (LADT) Université de Moncton Max Silberztein LASELDI, Université de Franche-Comté Journées INTEX, Sophia, mai 2003

2 L’ équipe de recherche Sylvia Kasparian, Département d’études françaises, Université de Moncton, Directrice du Laboratoire d’analyse de données textuelles spécialiste en description informatisée des phénomènes de contacts de langues et de description de l’acadien . Gisèle Chevalier Département d’études françaises, Université de Moncton Directrice du Centre de recherche en linguistique appliquée. Spécialiste de la syntaxe-sémantique des constructions nominales et de phénomènes liés aux procédés de modalisation en acadien (temps du futur, procédés expressifs, marqueurs discursifs). Max Silberztein, LASELDI, Université de Franche Comté. Concepteur du Logiciel INTEX, spécialiste en informatique linguistique et le traitement automatique des langues naturelles. 2/4 assistantes de recherches, étudiantes de 2e/ 3e cycles.

3 L’acadien : les acadiens
Ensemble de variétés de français en usage dans les Provinces atlantiques du Canada :Nouveau-Brunswick, Nouvelle-Écosse, Île-du-Prince-Edouard,Terre-Neuve. Repères historiques: Langue implantée en Amérique du Nord à partir du début du XVIIe; Colons venus principalement du Poitou (Nord-ouest de la France) Première colonie à Port-Royal (Baie Française) en Nouvelle-Écosse Dispersion vers le territoire actuel de Beaubassin (Nouveau-Brunswick), Ile-Saint-Jean (Ile-du-Prince-Edouard), sous la pression des Britanniques qui disputent le territoire aux colons français. Territoire cédé par la France au début du XVIIIe siècle Déportation des Acadiens vers la Nouvelle-Angleterre, l’Angleterre et la France de par le Régime britannique (Général Moncton). Épisode du “ Grand Dérangement ”. Retour autorisé après la reddition du Canada à l’Angleterre (Traité d’Utrecht 1763). Vocation : le pêche et l’agriculture

4 Situation linguistique actuelle des minorités francophones en Atlantique
Situation précaire à Terre-Neuve, Nouvelle-Écosse et Ile-du-Prince-Edouard. Nouveau-Brunswick : province officiellement bilingue (anglais : 65%; français : 35%) Les variétés de français en usage au Nouveau-Brunswick, très distinctives, les unes des autres, sont regroupées habituellement en trois zones géographiques: La région du Nord-Ouest La région du Nord-Est La région du Sud-Est

5 Les 3 régions La région du Nord-Ouest partage une frontière avec le Québec et de l’État américain du Maine. 95% de la population est francophone dans le Madawaska, seulement 64,2% dans le Restigouche, région du centre-nord de la province. Le français du Madawaska est perçu comme très influencé par le français québécois. La région du Nord-Est est bordée par la mer et sa population est majoritairement francophone (84%). Le français qu’on y parle est perçu par les Acadiens, comme le “ meilleur français ” de la province, le “ plus pur ”, le moins influencé par l’anglais. La région du Sud-Est est entourée des régions majoritairement anglophnes et voit sa proportion de francophone réduite à 42,8% dans le Grand Moncton, malgré la forte population acadienne (78,6%) dans le comté rural de Kent. Leur langue est très influençée par l ’anglais. Vernaculaire particulier :le chiac.

6 Quelques particularités du chiac
Langue dont la matrice est française et le lexique généreusement “enrichi” de l’anglais. Emprunte le vocabulaire anglais, même si l’équivalent français existe et reste disponible, grâce à l’instruction française. Touche la langue à tous les niveaux de structuration : lexical, phonologique, morphologique et syntaxique. Degré d’anglicisation de la langue variable selon les sujets et la situation de communication. Décrit par les locuteurs comme “ moitié anglais-moitié français ” ou “ un mot français par ci, un mot anglais par-là ”.

7 Emprunts lexicaux ( Tirés de tous les champs lexicaux et de toutes les catégories grammaticales )
Noms : allowance, babe, babysit, babysitter, bag, basement, bathroom, bike, blast, booze, contest, contract, credit, doctor, expense… Adjectifs : awsome, baggy, bored, boring, bright, funny, fussy, good, great, pissed off… Verbes : assist, barfé, beaté, behavent, joguer, kicker, minder, mover, phoner, stander, watcher Adverbes : alright, anything, anyway, anyways, anywhere, barely, everywhere, everywheres (sic!), exactly..., exactly… Marqueurs discursifs et interjections : well (ben), but (mais), so (ça fait que, alors), whatever , anyway(s), cool, O.K., yeah, wow, who cares Jurons : Oh my god! godame! holy mac; holy sheet; fuck/frigs, shit/shoot, (à l’opposé des jurons québécois tirés de la liturgie)

8 Emprunts intégrés (Prononciation anglaise mais incorporés morphologiquement) 
Dérivations originales FREAK : freakant, freaké, freakée , freaker BORE : bored, boring CHUM : chum, chumer Flexions françaises et acadiennes je mindais, je minderais alle a pas noticé (elle n ’a pas remarqué) ils wonderont (3e pers. pluriel en ‘vieil acadien’)

9 Emprunts intégrés (emplois conformes et originaux)
Adverbe d’instensité right (supplante ‘vraiment’ chez les jeunes) devant un adverbe : right through, right there (emploi canonique en anglais) devant adjectif : right cool; right cher; j’étais right stressée (anglais rétional) devant nom ou SN : j’ai right faim, c’est right la fun (sic!), c’est right pas elle

10 Emprunt incorporé au français : Verbe anglais + flexion française
J’ai jamais watché ça ( watch = regarder) il a fallé in love (fall in love = tomber en amour) on a été gone (go=partir : verbe irrégulier en français emprunté tel quel)

11 j’ai freaké out (freak out ‘avoir peur’)
Restructuration de la structure verbale Verbe anglais + flexion française + particule verbale anglaise j’ai freaké out (freak out ‘avoir peur’) du stuff qui va on dans la vie (go on ‘se passer’) tu peux pas driver up the wall (drive up smth ‘monter en voiture’) mes enfants turnont out comme des bums (turn out ‘devenir’)

12 il a timbé off la cliff fall off ‘tomber (en bas) de la falaise’
Création lexicale Verbe français+ flexion française + particule verbale anglaise il a timbé off la cliff fall off ‘tomber (en bas) de la falaise’ il est revenu back à la maison come back ‘revenir’ il est back revenu à la maison

13 Restructuration du syntagme nominal
Matrice française à la source : le déterminant, maintenu, toujours français. Tête nominale ou modificateur adjectival : en français ou en anglais. des bonnes movies intelligentes des awsome movies de ma whole life mon own château à moi, l’adjectif anglais est antéposé; l’adjectif français conserve sa position normale; le nom emprunté prend la morphologie française ou anglaise : [muvi]/[muviz]

14 Problèmes liés au traitement de l ’oral.
La phrase orale ne correspond pas à la phrase écrite: délimitation de la phrase par les pauses (barres obliques dans les texte) ou par des marqueurs comme ça fait que; pis, quand, de là, après ? Corpus Péronnet-Kasparian : NIC-MO ... fait-que j'ai euh travaillé deux ans à la firme comptable après mon bacc. / pis chuivais ces cours de correspondance-là / quand j'ai vu que ça marchait pas les cours / j'ai euh / appliqué à l'Université Laval pour la licence// j'ai faiT un an là pour euh obtenir ta licence pis là ton coaching de l'été qu(i) est de / juin/ juillet/ août / genre revue de tout c’que/ que t’as vu / euh de là / on fait note/ j'ai fait mon examen de comptable agréé // euhm // après mon / ma licence à Québec / là chuis déménagée à Montréal / pis j'ai travaillé pour une firme

15 Traitement de l ’oral Les transcriptions de productions orales visent à reproduire le plus fidèlement possible les paroles énoncées, y inclus: les hésitations // euhm // les répétitions tout c’ que/ que t’as vu les mots omis (ça-)fait-que les élisions qu(i)est en juin; t(u)as vu; not(r)e les ratées mon / ma licence Les transcriptions visent à reproduire les particularités de prononciation à travers lesquelles les locuteurs reconnaissent leur usage, tout en préservant la lisibilité du texte. pis chuivais je suivais là chuis déménagée je suis

16 Phénomèmes liés à l’oral en français familier
1. Élision du “ e ” de je devant [s] et désonorisation j + s => ‘ch’ chus “je suis” cherais “je serais” ché pas “je sais pas” chavais “je savais” chta habituée “j’étais habituée” hapax : ju “je suis”

17 Phénomèmes liés à l’oral en français familier
2. Métathèse de “ re ” en début de mot : re => er - chus Erevenue à Edmunston revenue - Eretourner sur le marché du travail retourner - des belles choses qui Eressortent de tout ça ressortent

18 Phénomèmes liés à l’oral en français familier
3. Élision de consonnes finales ble => b tre => t st => s ensemb(l)e responsab(l)e formidab(l)e les artic(l)es êt(r)e l’aut(r)e patron mett(r)e sur pied touT les aut(r)es spécialis(t)e Bathurs(t) pos(t)e jus(t)e

19 Élision de consonnes finales

20 Demonstratif: CE et cas particuliers
4. Demonstratifs CE cte,ce.ms cte point là cta,ce.fs cta grille là ctés,ce.mp ctés gens là ctes,ce.mp ctes matins là 5. v =>m : - mas “ j’vas” - chuis menu “ venu” - je voulais m'emenir “ m'en venir”

21 Problèmes liés à la transcription : cas généraux
Absence de normalisation des conventions pour transcrire les particularités régionales ou particularités de registre avoir => aouèr, awèr, awér ici  => icitte, icite, iciT chiac => shiaque, shiac, chiak ces => ctés, ctes, ctès tout ce que tu as vu => tout c(e) que/ que t(u) as vu; touT c’que t’as vu notre => not, note, noT, not(r)e Usage de caractères typographiques réservés au langage d’exploitation: parenthèses, accolades, parenthèses carrées, sensibilité à la case, +, =, -, etc., les annotations entre parenthèses ...

22 Objectif L’objectif de ce projet de recherche est de développer l’outil INTEX pour décrire les parlers acadiens et chiac, en particulier les transferts linguistiques entre le français acadien et l’anglais d’une part, et d’autre part, les transferts entre les variétés acadiennes et les variétés qui lui servent de référence, les français hexagonal et québécois. Notre recherche vise également à faire la synthèse des travaux existants en description de différentes variétés de l’acadien et à consigner les résultats des descriptions anciennes et nouvelles dans INTEX.

23 Objectifs spécifiques
Construire un lexique-grammaire informatisé des parlers acadiens à partir de la recherche existante, de nouveaux corpus non exploités comme la presse et les œuvres littéraires, ainsi que de nouvelles descriptions ; Ce dictionnaire intégré dans INTEX comprendra des dictionnaires lexico-sémantiques, des dictionnaires de graphes morphosyntaxiques, de graphes de désambiguïsation de mots, de graphes orthographiques. Intégrer au dictionnaire les résultats des travaux existants Créer les outils qui permettront une reconnaissance automatique de textes en acadien, notamment pour les phénomènes transcodiques en chiac.

24 Les corpus Des corpus acadiens informatisés (dictionnaires et textes) du Centre d’études acadiennes de l’Université de Moncton, dirigé par Maurice Basque ; Des corpus du sud-est du Nouveau-Brunswick sur le vieil acadien et le chiac déposés au Centre de recherche en linguistique appliquée (Gauvin et Chevalier 1994; Péronnet 1989; Roy 1979) Le corpus sociolinguistique Beaulieu de l’acadien du nord-est du Nouveau-Brunswick ; Le corpus de français standard Péronnet-Kasparian de trois régions linguistiques du Nouveau-Brunswick : Moncton (Sud-Est) , Bathurst (Centre-Nord) et Edmundston (Nord-Ouest) ; Corpus chiac Kasparian H99: Corpus de conversations ou entrevues. Les corpus d’œuvres littéraires acadiennes, de discours officiels et d’enquêtes sociolinguistiques déposés au Laboratoire d’analyse des données textuelles du Département d’études françaises ; Des corpus écrits, des journaux acadiens :

25 Variantes orthographiques
Présence de transcriptions des formes orales non conformes au français écrit standard. Ex:avoir = aouère, awère Ces formes ne seront pas reconnues par INTEX. exemple du verbe aller: « il faut que j’ialle » Les transducteurs finis nous permettent de lui faire reconnaître ces particularités

26 Transducteur des différentes graphies, du subjonctif présent du verbe aller, en acadien.
Que j’aille – que j’ialle Que tu ailles – que tu ialles Qu’ils aillent – qu’ils iallent

27 Transducteur des différentes formes graphiques du verbe aller, en acadien.

28 Application du delaf + delafc au corpus NIC.MO : mots inconnus
alle amagamation assisais astêure aut aute autes bacc Brunswick capabe ch ché cherais chuis chuivais chum coaching comptabes cte dansS décembe Dieppe douxième Dover ej enwèye enwèyes Eregarde Eremarque Eremet Eretourner euhm fédérals Fredericton générals Gérard Halifax hey ieux juse Laval lè LeBlanc Malenfant Moncton Montreal Montréal Nadeau NICOLE Nicole octobe ok ouaye prêe provincials Québec queque queques Riverview Robertson Shediac slash St Stephens ti tite tou touTzfait vesais vesait

29 Dictionnaire de mots complexes : delafcAcadien.dic
nous aut.nous autres.PRO:P3mp,3fp où-ce-que,où est-ce que.INTER quand-ce-que,quand est-ce que.INTER combien-ce-que,combien est-ce que.INTER comment-ce-que,comment est-ce que.INTER ieux-autres,eux.PRO:P3mp,fp nous aut.nous autres.PRO:P3mp,3fp nous-aut.nous autres.PRO comptable agréé,comptable agréé.N:ms,fs ah well,ah well.INT+eng holy mac,holy mac.INT+eng oh my god,oh my god.INT+eng young offernders,young offender.N+eng.Jeune délinquant

30 Morphologie : 3e personne pluriel
appelont,appeler.V+prés.:3p disont,dire.V+prés.:3p écoutont,écouter.V+prés. enlevont,enlever.V+prés. étiont,être.V+prés.:3p habillont,habiller.V+prés.:3p jouont,jouer.V+prés. laisseriont.V+cond.:3p, metteront,mettre.V+fut:3p moquont,moquer.V+prés. prenont,prendre.V+prés.:3p tournont out,tourner out.V+eng.+prés.:3p venont,venir.V+prés. voulont,vouloir.V+prés. voyageont,voyager.V+prés.

31 Dictionnaire de mots anglais indépendant ou intégré au delaf?
Intégrer au dictionnaire Acadien ou constituer un dictionnaire différent? Prendre pour lemme la forme anglaise (kick) ou acadienne (kicker)? allowance.N, allocations alright,alright.ADV, d’accord anyway, anyway.ADV. Peu importe anyways,anyway.ADV.Peu importe beaté,beat.V,battre. behavent,behave.V,se comporter bored,bore.V :K, ennuyé boring,boring.A,ennyuant bouncée,bouncer.V chumais,chum.V chumé,chum.V :K chums,chum.N:mp,fp dozais,doz.V+imp dozée,doz.V :K

32 Dictionnaire des noms propres : NpropresAcadien.dic
Dieppe,.N+Loc+ville+CDN Dover,.N+Loc+ville+CDN Fredericton,.N+Loc+ville+CDN Gérard,.N+prénom:ms Halifax,.N+Loc+ville+CDN Laval,.N+Loc+ville+CDN LeBlanc,.N+pers:s Malenfant,.N+famille:s Moncton,.N+Loc+ville+CDN Montreal,.N+Loc+ville+CDN+eng Montréal,.N+Loc+ville+CDN Nadeau,.N+pers:s Nicole,.N+prénom:fs Québec,.N+Loc+province+CDN:s Riverview,.N+Loc+ville+CDN+eng:s Robertson,.N+pers:s Shediac,.N+Loc+ville+CDN:s

33 Dictionnaire de mots simples acadiens : DelafAcadie.dic
alle,elle.PRO amagamation,amalgamation.N+f assisais,asseoir.V+se+i astêure,asteur.ADV bacc,baccalauréat.N:ms chum,chum.N+eng:ms coaching,.N+eng:ms cte,cette.DET+dem:fs cte,cette.DET+dem:ms enwèye,envoyer.V+t+i+p:P1s enwèyes,envoyer.V+t+i+p:P2s fédérals,fédéral.A:mp générals,général.A:mp hey,hey.INT juse,juste.ADV ok,ok.INT ouaye,oui.INT provincials,provincial.A:mp queque,quelque.DET:ms queques,quelques.DET:mp slash,.N:ms ti,est-ce que.PartInter tite,petite.A:fs vesais,faire.V vesait,faire.V

34

35 Graphe global: trajets avant le verbe
sujet de P la négation ex:  vous n’allez pas me dire que on y met des formes le pronominal ex: Je m’en vas m’émoyer.  chemin direct ex:  Le coffre allait devenir un oratoire  suivi d’un verbe ex: La charrette de la Mort pouvait s’aller embourber dans les marais »

36 Graphe « sujet de P »

37 Transducteur du sous-graphe « Pronoms sujet de P »

38 Transducteurs des sous-graphes inclus dans « Pronoms sujet de P »

39 Graphe global: trajets avant le verbe
chemin direct ex: Allez-vous-en déterrer les squelettes des vaches marine  prépositions ex: et plus fous que obtus pour s'en aller en plein jour éveiller l'ours qui dort « se laisser » ex: Se laisser aller à sa mort, ce n’est pas se tuer 

40 Graphe global: trajets après le verbe
chemin direct ex: Fallait point de laisser le temps de nourrir des pressentiments. Allez !  suivi de GP ex: par rapport que elle va sus ses vingt ans et sus sa vie de femme  suivi d'un infinitif ex:  Bon, ça va faire. 

41 Transducteur du sous-graphe « GP » situé après le verbe

42 Plan de travail Première phase Deuxième phase
la désambiguïsation des lexiques français; la construction de graphes pour résoudre la questions des graphies multiples et de la variation morphologique des formes de conjugaison; l’intégration des éléments lexicaux non reconnus par INTEX aux dictionnaires des mots simples, composés et des expressions figées; le recensement des travaux descriptifs sur l’acadien et l’intégration des données pertinentes. Deuxième phase Intégration des travaux accomplis et de nouvelles descriptions qui ressortent de l’application de nouveaux corpus; des descriptions qui ressortent à l’application de nouveaux corpus comme la description de certaines classes de verbes tels les verbes supports, les verbes pronominaux et les constructions avec particules verbales (back, out, up) en chiac.

43 Plan de travail (suite)
Troisième phase la validation de nos travaux par le traitement de nouveaux corpus de tous genres ; vérifications des entrées linguistiques auprès d’informateurs ; Évaluation des questions de recherche à prioriser.

44 Objectif : Adapter les fonctionalités de l’analyseur linguistique INTEX pour le traitement automatique de corpi écrits et oraux en français régional, les variétés de français acadien parlées dans les provinces Maritimes. Intégrer les descriptions des parlers acadiens disponibles et de décrire les aspects inexplorés.

45 Particularités des textes en français acadien
Langue orale Non standardisée à l’écrit Archaïsmes Emprunts à l’anglais et langues amérindiennes Langue mixte

46 Particularités des textes en français acadien
Phénomènes orthographiques ou phonétiques ex: Tu m'avartiras (avertiras), mon houmme (homme) Phénomènes d’élision, ex: c’te (cette), c'ti-là (celui-là) Aouère, awère (avoir) Phénomènes morphologique Flexions du verbe: J’avions (j’avais), Fallit (fallu), l'amenit (l’amène), Phénomènes syntaxiques Ex: c’était très différent de qu’est-ce que je faisais Variantes lexicales Ex: garrocha (lança), asteur (maintenant), bécosse (back house) Expressions figées:   « aller sur ses 20 ans »

47 Cas particulier du Chiac
État de langue mixte stabilisée avec des règles et une grammaire. « toi t’as des owsome parents » « c’est des cool movies intéressantes que j’ai watché hier» « il est back revenu à la maison » « Je ne veux pas que mes enfants turnont out comme des bums » « Anyways, on a été gone comme cinq semaines » « moi j’étais comme, je minderais pas d’avoir ça dans ma maison »


Télécharger ppt "Lexique-grammaire évolutif de l'acadien avec INTEX"

Présentations similaires


Annonces Google