La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de.

Présentations similaires


Présentation au sujet: "Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de."— Transcription de la présentation:

1 Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de Moncton Max Silberztein LASELDI, Université de Franche-Comté Journées INTEX, Sophia, mai 2003

2 L équipe de recherche zSylvia Kasparian, Département détudes françaises, Université de Moncton, yDirectrice du Laboratoire danalyse de données textuelles yspécialiste en description informatisée des phénomènes de contacts de langues et de description de lacadien. zGisèle Chevalier Département détudes françaises, Université de Moncton yDirectrice du Centre de recherche en linguistique appliquée. ySpécialiste de la syntaxe-sémantique des constructions nominales et de phénomènes liés aux procédés de modalisation en acadien (temps du futur, procédés expressifs, marqueurs discursifs). zMax Silberztein, LASELDI, Université de Franche Comté. yConcepteur du Logiciel INTEX, spécialiste en informatique linguistique et le traitement automatique des langues naturelles. z2/4 assistantes de recherches, étudiantes de 2e/ 3e cycles.

3 Lacadien : les acadiens zEnsemble de variétés de français en usage dans les Provinces atlantiques du Canada :Nouveau-Brunswick, Nouvelle-Écosse, Île- du-Prince-Edouard,Terre-Neuve. zRepères historiques: yLangue implantée en Amérique du Nord à partir du début du XVIIe; yColons venus principalement du Poitou (Nord-ouest de la France) yPremière colonie à Port-Royal (Baie Française) en Nouvelle-Écosse yDispersion vers le territoire actuel de Beaubassin (Nouveau-Brunswick), Ile-Saint-Jean (Ile-du-Prince-Edouard), sous la pression des Britanniques qui disputent le territoire aux colons français. yTerritoire cédé par la France au début du XVIIIe siècle yDéportation des Acadiens vers la Nouvelle-Angleterre, lAngleterre et la France de par le Régime britannique (Général Moncton). Épisode du Grand Dérangement. yRetour autorisé après la reddition du Canada à lAngleterre (Traité dUtrecht 1763). yVocation : le pêche et lagriculture

4 Situation linguistique actuelle des minorités francophones en Atlantique zSituation précaire à Terre-Neuve, Nouvelle-Écosse et Ile-du-Prince- Edouard. zNouveau-Brunswick : province officiellement bilingue (anglais : 65%; français : 35%) zLes variétés de français en usage au Nouveau-Brunswick, très distinctives, les unes des autres, sont regroupées habituellement en trois zones géographiques: yLa région du Nord-Ouest yLa région du Nord-Est yLa région du Sud-Est

5 Les 3 régions yLa région du Nord-Ouest partage une frontière avec le Québec et de lÉtat américain du Maine. 95% de la population est francophone dans le Madawaska, seulement 64,2% dans le Restigouche, région du centre-nord de la province. Le français du Madawaska est perçu comme très influencé par le français québécois. yLa région du Nord-Est est bordée par la mer et sa population est majoritairement francophone (84%). Le français quon y parle est perçu par les Acadiens, comme le meilleur français de la province, le plus pur, le moins influencé par langlais. yLa région du Sud-Est est entourée des régions majoritairement anglophnes et voit sa proportion de francophone réduite à 42,8% dans le Grand Moncton, malgré la forte population acadienne (78,6%) dans le comté rural de Kent. Leur langue est très influençée par l anglais. Vernaculaire particulier :le chiac.

6 Quelques particularités du chiac zLangue dont la matrice est française et le lexique généreusement enrichi de langlais. zEmprunte le vocabulaire anglais, même si léquivalent français existe et reste disponible, grâce à linstruction française. zTouche la langue à tous les niveaux de structuration : lexical, phonologique, morphologique et syntaxique. zDegré danglicisation de la langue variable selon les sujets et la situation de communication. zDécrit par les locuteurs comme moitié anglais-moitié français ou un mot français par ci, un mot anglais par-là.

7 Emprunts lexicaux ( Tirés de tous les champs lexicaux et de toutes les catégories grammaticales ) Noms : allowance, babe, babysit, babysitter, bag, basement, bathroom, bike, blast, booze, contest, contract, credit, doctor, expense… zAdjectifs : awsome, baggy, bored, boring, bright, funny, fussy, good, great, pissed off… zVerbes : assist, barfé, beaté, behavent, joguer, kicker, minder, mover, phoner, stander, watcher zAdverbes : alright, anything, anyway, anyways, anywhere, barely, everywhere, everywheres (sic!), exactly..., exactly… zMarqueurs discursifs et interjections : well (ben), but (mais), so (ça fait que, alors), whatever, anyway(s), cool, O.K., yeah, wow, who cares zJurons : Oh my god! godame! holy mac; holy sheet; fuck/frigs, shit/shoot, (à lopposé des jurons québécois tirés de la liturgie)

8 Emprunts intégrés (Prononciation anglaise mais incorporés morphologiquement) zDérivations originales yFREAK : freakant, freaké, freakée, freaker yBORE : bored, boring yCHUM : chum, chumer zFlexions françaises et acadiennes yje mindais, je minderais yalle a pas noticé (elle n a pas remarqué) yils wonderont (3 e pers. pluriel en vieil acadien)

9 Emprunts intégrés (emplois conformes et originaux) zAdverbe dinstensité right (supplante vraiment chez les jeunes) ydevant un adverbe : xright through, right there (emploi canonique en anglais) ydevant adjectif : xright cool; right cher; jétais right stressée (anglais rétional) ydevant nom ou SN : xjai right faim, cest right la fun (sic!), cest right pas elle

10 Emprunt incorporé au français : Verbe anglais + flexion française zJai jamais watché ça ( watch = regarder) zil a fallé in love (fall in love = tomber en amour) zon a été gone (go=partir : verbe irrégulier en français emprunté tel quel)

11 Restructuration de la structure verbale Verbe anglais + flexion française + particule verbale anglaise zjai freaké out (freak out avoir peur) zdu stuff qui va on dans la vie (go onse passer) ztu peux pas driver up the wall (drive up smthmonter en voiture) zmes enfants turnont out comme des bums (turn outdevenir)

12 Création lexicale Verbe français+ flexion française + particule verbale anglaise zil a timbé off la cliff fall off tomber (en bas) de la falaise zil est revenu back à la maison come backrevenir zil est back revenu à la maison

13 Restructuration du syntagme nominal zMatrice française à la source : le déterminant, maintenu, toujours français. zTête nominale ou modificateur adjectival : en français ou en anglais. y des bonnes movies intelligentes ydes awsome movies yde ma whole life y mon own château à moi, zladjectif anglais est antéposé; ladjectif français conserve sa position normale; zle nom emprunté prend la morphologie française ou anglaise : [muvi]/[muviz]

14 Problèmes liés au traitement de l oral. zLa phrase orale ne correspond pas à la phrase écrite:délimitation de la phrase par les pauses (barres obliques dans les texte) ou par des marqueurs comme ça fait que; pis, quand, de là, après ? zCorpus Péronnet-Kasparian : NIC-MO y... fait-que j'ai euh travaillé deux ans à la firme comptable après mon bacc. / pis chuivais ces cours de correspondance-là / quand j'ai vu que ça marchait pas les cours / j'ai euh / appliqué à l'Université Laval pour la licence// j'ai faiT un an là pour euh obtenir ta licence pis là ton coaching de l'été qu(i) est de / juin/ juillet/ août / genre revue de tout cque/ que tas vu / euh de là / on fait note/ j'ai fait mon examen de comptable agréé // euhm // après mon / ma licence à Québec / là chuis déménagée à Montréal / pis j'ai travaillé pour une firme

15 Traitement de l oral zLes transcriptions de productions orales visent à reproduire le plus fidèlement possible les paroles énoncées, y inclus: les hésitations // euhm // les répétitionstout c que/ que tas vu les mots omis (ça-)fait-que les élisionsqu(i)est en juin; t(u)as vu; not(r)e yles ratéesmon / ma licence zLes transcriptions visent à reproduire les particularités de prononciation à travers lesquelles les locuteurs reconnaissent leur usage, tout en préservant la lisibilité du texte. pis chuivaisje suivais là chuis déménagéeje suis

16 Phénomèmes liés à loral en français familier z1. Élision du e de je devant [s] et désonorisation y j + s => ch xchusje suis xcheraisje serais xché pas je sais pas xchavaisje savais xchta habituée jétais habituée zhapax : ju je suis

17 Phénomèmes liés à loral en français familier z2. Métathèse de re en début de mot : yre => er x- chus Erevenue à Edmunston revenue x- Eretourner sur le marché du travail retourner x- des belles choses qui Eressortent de tout çaressortent

18 Phénomèmes liés à loral en français familier z3. Élision de consonnes finales yble => btre => tst => s xensemb(l)e xresponsab(l)e xformidab(l)e xles artic(l)esêt(r)e xlaut(r)e patron xmett(r)e sur pied xtouT les aut(r)esspécialis(t)e xBathurs(t) xpos(t)e xjus(t)e

19 Élision de consonnes finales

20 Demonstratif: CE et cas particuliers z4. Demonstratifs CE ycte,ce.mscte point là ycta,ce.fscta grille là yctés,ce.mpctés gens là yctes,ce.mpctes matins là z5. v =>m : y- mas jvas y- chuis menu venu y- je voulais m'emenir m'en venir

21 Problèmes liés à la transcription : cas généraux zAbsence de normalisation des conventions pour transcrire les particularités régionales ou particularités de registre y avoir => aouèr, awèr, awér yici =>icitte, icite, iciT ychiac => shiaque, shiac, chiak yces => ctés, ctes, ctès tout ce que tu as vu => tout c(e) que/ que t(u) as vu; touT cque tas vu ynotre => not, note, noT, not(r)e zUsage de caractères typographiques réservés au langage dexploitation: parenthèses, accolades, parenthèses carrées, sensibilité à la case, +, =, -, etc., les annotations entre parenthèses...

22 Objectif zLobjectif de ce projet de recherche est de développer loutil INTEX pour décrire les parlers acadiens et chiac, en particulier les transferts linguistiques entre le français acadien et langlais dune part, et dautre part, les transferts entre les variétés acadiennes et les variétés qui lui servent de référence, les français hexagonal et québécois. zNotre recherche vise également à faire la synthèse des travaux existants en description de différentes variétés de lacadien et à consigner les résultats des descriptions anciennes et nouvelles dans INTEX.

23 Objectifs spécifiques zConstruire un lexique-grammaire informatisé des parlers acadiens à partir de la recherche existante, de nouveaux corpus non exploités comme la presse et les œuvres littéraires, ainsi que de nouvelles descriptions ; yCe dictionnaire intégré dans INTEX comprendra des dictionnaires lexico-sémantiques, des dictionnaires de graphes morphosyntaxiques, de graphes de désambiguïsation de mots, de graphes orthographiques. zIntégrer au dictionnaire les résultats des travaux existants zCréer les outils qui permettront une reconnaissance automatique de textes en acadien, notamment pour les phénomènes transcodiques en chiac.

24 Les corpus zDes corpus acadiens informatisés (dictionnaires et textes) du Centre détudes acadiennes de lUniversité de Moncton, dirigé par Maurice Basque ; zDes corpus du sud-est du Nouveau-Brunswick sur le vieil acadien et le chiac déposés au Centre de recherche en linguistique appliquée (Gauvin et Chevalier 1994; Péronnet 1989; Roy 1979) zLe corpus sociolinguistique Beaulieu de lacadien du nord-est du Nouveau-Brunswick ; zLe corpus de français standard Péronnet-Kasparian de trois régions linguistiques du Nouveau-Brunswick : Moncton (Sud-Est), Bathurst (Centre-Nord) et Edmundston (Nord-Ouest) ; Corpus chiac Kasparian H99: Corpus de conversations ou entrevues. zLes corpus dœuvres littéraires acadiennes, de discours officiels et denquêtes sociolinguistiques déposés au Laboratoire danalyse des données textuelles du Département détudes françaises ; zDes corpus écrits, des journaux acadiens :

25 Variantes orthographiques zPrésence de transcriptions des formes orales non conformes au français écrit standard. Ex:avoir = aouère, awère zCes formes ne seront pas reconnues par INTEX. y exemple du verbe aller: « il faut que jialle » zLes transducteurs finis nous permettent de lui faire reconnaître ces particularités

26 Transducteur des différentes graphies, du subjonctif présent du verbe aller, en acadien. Que jaille – que jialle Que tu ailles – que tu ialles Quils aillent – quils iallent

27 Transducteur des différentes formes graphiques du verbe aller, en acadien.

28 Application du delaf + delafc au corpus NIC.MO : mots inconnus zalle amagamation assisais astêure aut aute autes zbacc Brunswick zcapabe ch ché cherais chuis chuivais chum coaching comptabes cte dansS décembe Dieppe douxième Dover ej enwèye enwèyes Eregarde Eremarque Eremet Eretourner euhm zfédérals Fredericton zgénérals Gérard zHalifax hey ieux juse zLaval lè LeBlanc zMalenfant Moncton Montreal Montréal zNadeau NICOLE Nicole zoctobe ok ouaye prêe provincials zQuébec queque queques zRiverview Robertson Shediac slash zSt Stephens zti tite tou touTzfait zvesais vesait

29 Dictionnaire de mots complexes : delafcAcadien.dic znous aut.nous autres.PRO:P3mp,3fp zoù-ce-que,où est-ce que.INTER zquand-ce-que,quand est-ce que.INTER zcombien-ce-que,combien est- ce que.INTER zcomment-ce-que,comment est-ce que.INTER zieux-autres,eux.PRO:P3mp,fp z nous aut.nous autres.PRO:P3mp,3fp z nous-aut.nous autres.PRO z comptable agréé,comptable agréé.N:ms,fs z ah well,ah well.INT+eng z holy mac,holy mac.INT+eng z oh my god,oh my god.INT+eng z young offernders,young offender.N+eng.Jeune délinquant

30 Morphologie : 3 e personne pluriel zappelont,appeler.V+prés.:3p zdisont,dire.V+prés.:3p zécoutont,écouter.V+prés. zenlevont,enlever.V+prés. zétiont,être.V+prés.:3p zhabillont,habiller.V+prés.:3p zjouont,jouer.V+prés. zlaisseriont.V+cond.:3p, zmetteront,mettre.V+fut:3p zmoquont,moquer.V+prés. zprenont,prendre.V+prés.:3p z tournont out,tourner out.V+eng.+prés.:3p z venont,venir.V+prés. z voulont,vouloir.V+prés. z voyageont,voyager.V+prés.

31 Dictionnaire de mots anglais indépendant ou intégré au delaf? zIntégrer au dictionnaire Acadien ou constituer un dictionnaire différent? zPrendre pour lemme la forme anglaise (kick) ou acadienne (kicker)? yallowance.N, allocations yalright,alright.ADV, daccord yanyway, anyway.ADV. Peu importe yanyways,anyway.ADV.Peu importe ybeaté,beat.V,battre. ybehavent,behave.V,se comporter ybored,bore.V :K, ennuyé yboring,boring.A,ennyuant ybouncée,bouncer.V ychumais,chum.V ychumé,chum.V :K ychums,chum.N:mp,fp ydozais,doz.V+imp ydozée,doz.V :K

32 Dictionnaire des noms propres : NpropresAcadien.dic zDieppe,.N+Loc+ville+CDN zDover,.N+Loc+ville+CDN zFredericton,.N+Loc+ville+CDN zGérard,.N+prénom:ms zHalifax,.N+Loc+ville+CDN zLaval,.N+Loc+ville+CDN zLeBlanc,.N+pers:s zMalenfant,.N+famille:s zMoncton,.N+Loc+ville+CDN zMontreal,.N+Loc+ville+CDN+eng zMontréal,.N+Loc+ville+CDN zNadeau,.N+pers:s zNicole,.N+prénom:fs zQuébec,.N+Loc+province+CDN:s z Riverview,.N+Loc+ville+CDN+eng:s z Robertson,.N+pers:s z Shediac,.N+Loc+ville+CDN:s

33 Dictionnaire de mots simples acadiens : DelafAcadie.dic zalle,elle.PRO zamagamation,amalgamation.N+f zassisais,asseoir.V+se+i zastêure,asteur.ADV zbacc,baccalauréat.N:ms zchum,chum.N+eng:ms zcoaching,.N+eng:ms zcte,cette.DET+dem:fs zcte,cette.DET+dem:ms zenwèye,envoyer.V+t+i+p:P1s zenwèyes,envoyer.V+t+i+p:P2s zfédérals,fédéral.A:mp zgénérals,général.A:mp zhey,hey.INT zjuse,juste.ADV z ok,ok.INT z ouaye,oui.INT z provincials,provincial.A:mp z queque,quelque.DET:ms z queques,quelques.DET:mp z slash,.N:ms z ti,est-ce que.PartInter z tite,petite.A:fs z vesais,faire.V z vesait,faire.V

34

35 Graphe global: trajets avant le verbe z sujet de P y la négation ex: vous nallez pas me dire que on y met des formes y le pronominal ex: Je men vas mémoyer. y chemin direct ex: Le coffre allait devenir un oratoire y suivi dun verbe ex: La charrette de la Mort pouvait saller embourber dans les marais »

36 Graphe « sujet de P »

37 Transducteur du sous-graphe « Pronoms sujet de P »

38 Transducteurs des sous-graphes inclus dans « Pronoms sujet de P »

39 Graphe global: trajets avant le verbe z chemin direct ex: Allez-vous-en déterrer les squelettes des vaches marine z prépositions ex: et plus fous que obtus pour s'en aller en plein jour éveiller l'ours qui dort « se laisser » ex: Se laisser aller à sa mort, ce nest pas se tuer

40 Graphe global: trajets après le verbe z chemin direct ex: Fallait point de laisser le temps de nourrir des pressentiments. Allez ! z suivi de GP ex: par rapport que elle va sus ses vingt ans et sus sa vie de femme z suivi d'un infinitif ex: Bon, ça va faire.

41 Transducteur du sous-graphe « GP » situé après le verbe

42 Plan de travail zPremière phase yla désambiguïsation des lexiques français; yla construction de graphes pour résoudre la questions des graphies multiples et de la variation morphologique des formes de conjugaison; ylintégration des éléments lexicaux non reconnus par INTEX aux dictionnaires des mots simples, composés et des expressions figées; yle recensement des travaux descriptifs sur lacadien et lintégration des données pertinentes. zDeuxième phase yIntégration des travaux accomplis et de nouvelles descriptions qui ressortent de lapplication de nouveaux corpus; ydes descriptions qui ressortent à lapplication de nouveaux corpus comme la description de certaines classes de verbes tels les verbes supports, les verbes pronominaux et les constructions avec particules verbales (back, out, up) en chiac.

43 Plan de travail (suite) zTroisième phase yla validation de nos travaux par le traitement de nouveaux corpus de tous genres ; yvérifications des entrées linguistiques auprès dinformateurs ; yÉvaluation des questions de recherche à prioriser.

44 Objectif : zAdapter les fonctionalités de lanalyseur linguistique INTEX pour le traitement automatique de corpi écrits et oraux en français régional, les variétés de français acadien parlées dans les provinces Maritimes. zIntégrer les descriptions des parlers acadiens disponibles et de décrire les aspects inexplorés.

45 Particularités des textes en français acadien zLangue orale zNon standardisée à lécrit zArchaïsmes zEmprunts à langlais et langues amérindiennes zLangue mixte

46 Particularités des textes en français acadien zPhénomènes orthographiques ou phonétiques yex: Tu m'avartiras (avertiras), mon houmme (homme) yPhénomènes délision, ex: cte (cette), c'ti-là (celui-là) yAouère, awère (avoir) zPhénomènes morphologique yFlexions du verbe: Javions (javais), Fallit (fallu), l'amenit (lamène), zPhénomènes syntaxiques yEx: cétait très différent de quest-ce que je faisais zVariantes lexicales yEx: garrocha (lança), asteur (maintenant), bécosse (back house) zExpressions figées: « aller sur ses 20 ans »

47 Cas particulier du Chiac zÉtat de langue mixte stabilisée avec des règles et une grammaire. y« toi tas des owsome parents » y« cest des cool movies intéressantes que jai watché hier» y« il est back revenu à la maison » y« Je ne veux pas que mes enfants turnont out comme des bums » y« Anyways, on a été gone comme cinq semaines » y« moi jétais comme, je minderais pas davoir ça dans ma maison »


Télécharger ppt "Lexique-grammaire évolutif de l'acadien avec INTEX Gisèle Chevalier, Sylvia Kasparian, Laboratoire danalyse de Données Textuelles (LADT) Université de."

Présentations similaires


Annonces Google