La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Www.atilf.fr Pour une lexicographie fermement pilotée par la lexicologie : les projets en linguistique historique française et romane du laboratoire ATILF.

Présentations similaires


Présentation au sujet: "Www.atilf.fr Pour une lexicographie fermement pilotée par la lexicologie : les projets en linguistique historique française et romane du laboratoire ATILF."— Transcription de la présentation:

1 Pour une lexicographie fermement pilotée par la lexicologie : les projets en linguistique historique française et romane du laboratoire ATILF de Nancy 30 mai 2011

2 Analyse et Traitement Informatique de la Langue Française Sommaire 1. Caractérisation générale 2. Dictionnaire du Moyen Français (DMF) 2.1. Cœur du dispositif : le dictionnaire 2.2. Portail de référence pour létude du moyen français 3. Critique métalexicographique 3.1. Base des mots fantômes 3.2. Bibliographie Godefroy 4. TLF-Étym (Trésor de la Langue Française et étymologie) 5. Französisches Etymologisches Wörterbuch (FEW) 6. Dictionnaire Étymologique Roman (DÉRom) 7. Conclusion

3 Analyse et Traitement Informatique de la Langue Française Équipe « Linguistique historique » Linguistique historique française et romane Recherches fondamentales : lexicologie, lexicographie, métalexicographie, syntaxe historiques françaises, galloromanes et romanes Projets lexicographiques Méthodologie largement commune, mutualisation des ressources documentaires, développement informatique cohérent Élaboration ou mise à jour de dictionnaires de référence (DMF, TLF-Étym, FEW, DÉRom) Lexicographie en tant que mode dexposition

4 Analyse et Traitement Informatique de la Langue Française 1. Caractérisation générale 2. Dictionnaire du Moyen Français (DMF) 2.1. Cœur du dispositif : le dictionnaire 2.2. Portail de référence pour létude du moyen français 3. Critique métalexicographique 3.1. Base des mots fantômes 3.2. Bibliographie Godefroy 4. TLF-Étym (Trésor de la Langue Française et étymologie) 5. Französisches Etymologisches Wörterbuch (FEW) 6. Dictionnaire Étymologique Roman (DÉRom) 7. Conclusion

5 Analyse et Traitement Informatique de la Langue Française Dictionnaire du Moyen Français III e Colloque international sur le moyen français (1980) 1330–1500 Dirigé par Robert Martin (1982–2000), Bernard Combettes (2000–2002), Hiltrud Gerner (2003– 2007), Sylvie Bazin-Tacchella (2008–) Volume A ah (DMF 0, 1998) Publication électronique par étapes successives (base de données lexicales évolutive encodée au format XML)

6 Analyse et Traitement Informatique de la Langue Française Robert Martin : préface du DMF « Lidée centrale qui guide le projet du DMF est que linformatique autorise désormais une lexicographie évolutive : il ne sagit plus de rédiger le dictionnaire lettre par lettre, ce qui le laisserait dans linachèvement aussi longtemps que la lettre ultime nest pas atteinte, mais plutôt de procéder par une suite détapes dont chacune possède sa propre clôture tout en restant ouverte à tous les développements ultérieurs. La facilité avec laquelle les outils informatiques permettent daugmenter, de corriger, de restructurer les données ne peut rester sans incidence sur la technique lexicographique. Loption choisie pour le DMF sappuie fortement sur lidée que les dictionnaires daujourdhui, non pas commerciaux mais scientifiques, ne devraient plus être des produits figés que seules peuvent modifier dhypothétiques rééditions, inévitablement coûteuses et elles-mêmes figées pour longtemps, mais au contraire des bases informatisées, faciles daccès et ouvertes à peu de frais à tous les enrichissements et à toutes les améliorations que lon peut estimer souhaitables. »

7 Analyse et Traitement Informatique de la Langue Française Étapes du DMF DMF1 (2002) 13 lexiques (Machaut, Pizan etc.), entrées DMF2 (2007, CILPR 25) 16 lexiques + lexique complémentaire (vocables rares), plus de entrées DMF lexiques, synthèses exhaustives, 50% des synthèses de lexiques DMF 2010 (CILPR 26) 21 lexiques, synthèses exhaustives, 100% des synthèses de lexiques

8 Analyse et Traitement Informatique de la Langue Française Des objectifs denvergure en synchronie Limites chronologiques (1330–1500) : avènement des Valois (1328) – début des guerres dItalie (1497) ; pronom sujet proclitique obligatoire ; complémentarité Tobler-Lommatzsch et Huguet Nomenclature : unités lexicales (noms, adjectifs, verbes, adverbes, interjections, numéraux), y compris hapax, à lexclusion (pour linstant) des unités grammaticales Position centrale en lexicologie/lexicographie du moyen français

9 Analyse et Traitement Informatique de la Langue Française Potentiel heuristique pour létymologie Renvois systématiques au FEW ; ajouts : « *FEW » DMF1 : 97 rattachements étymologiques à la tranche alphabétique B- du volume 1 du FEW Exemple Lexique de la langue scientifique : 339 ajouts dunités lexicales, 74 nouveaux étymons ainsi que des centaines dantédatations par rapport au FEW (cf. Gerner & Martin 2005) Dictionnaire étymologique du moyen français !

10 Analyse et Traitement Informatique de la Langue Française Consultation du dictionnaire Dictionnaire du Moyen Français

11 Analyse et Traitement Informatique de la Langue Française De multiples exploitations du dictionnaire (1/2) Lexicologie : adresse n.f. « habileté » (dp. 1559, TLF) DMF : ca 1350/1400 TLF-Étym Pragmatique : enfin adv. « citons pour terminer (dernier élément dune énumération) » (dp. 1587, Hansen 2005 : 47) DMF Recherche plein texte : ca 1400 Buchi & Städtler 2008

12 Analyse et Traitement Informatique de la Langue Française De multiples exploitations du dictionnaire (2/2) Morphologie constructionnelle : Apothéloz 2003 : préfixe IN- du français contemporain (1) in- 1 : allomorphie /in-/ + V (inutile), / ɛ ̃ -/ + C bruyante (imbattable), /i-/ + C sonante (illégal) ; soit négatif (inutile), soit superlatif (inqualifiable « dune extrême bassesse ») (2) in 2 : + C sonante (/ ɛ ̃ -/ : [ ɛ ̃ n ɔ mabl]) ; négatif (inréparable « qui ne peut pas être réparé ») DMF « Recherche dune entrée », « + options », « inr- » :Recherche dune entrée 28 réponses, dont inracontable (1419) Buchi à paraître

13 Analyse et Traitement Informatique de la Langue Française Sommaire 1. Caractérisation générale 2. Dictionnaire du Moyen Français (DMF) 2.1. Cœur du dispositif : le dictionnaire 2.2. Portail de référence pour létude du moyen français 3. Critique métalexicographique 3.1. Base des mots fantômes 3.2. Bibliographie Godefroy 4. TLF-Étym (Trésor de la Langue Française et étymologie) 5. Französisches Etymologisches Wörterbuch (FEW) 6. Dictionnaire Étymologique Roman (DÉRom) 7. Conclusion

14 Analyse et Traitement Informatique de la Langue Française Bien plus quun dictionnaire ! Métamorphose progressive du DMF en un véritable espace en ligne de recherche et de rédaction, avec quatre niveaux de consultation reliées par une navigation hypertextuelle : dictionnaire, lexiques, base textuelle, outil daide à lédition Lien direct sur un article Analyse de mots-formes Lemmatisation dun texte Construction semi-automatique de glossaires Élaboration dindex lemmatisés Réalisation déditions électroniques en ligne

15 Analyse et Traitement Informatique de la Langue Française Lemmatiseur État de langue non standardisé lemmatiseur LGeRM (Lemmes, Graphies lemmatisées et Règles Morphologiques (Gilles Souvay) Accès au lemme pertinent à partir de nimporte quelle variante flexionnelle ou graphique Navigation (par un double clic de souris) à lintérieur du dictionnaire, voire entre la base Frantext et le DMF Frantext Rattache chaque mot-forme au lexème dont il relève (ex. traveilhiéz TRAVAILLER )

16 Analyse et Traitement Informatique de la Langue Française Sommaire 1. Caractérisation générale 2. Dictionnaire du Moyen Français (DMF) 2.1. Cœur du dispositif : le dictionnaire 2.2. Portail de référence pour létude du moyen français 3. Critique métalexicographique 3.1. Base des mots fantômes 3.2. Bibliographie Godefroy 4. TLF-Étym (Trésor de la Langue Française et étymologie) 5. Französisches Etymologisches Wörterbuch (FEW) 6. Dictionnaire Étymologique Roman (DÉRom) 7. Conclusion

17 Analyse et Traitement Informatique de la Langue Française Mots fantômes ? Pseudo-lexèmes disposant à tort d'un statut lexicographique (y compris sens fantômes et lemmatisations erronées) Godefroy : LABAILLE, s. f., syn. descope, mod. écope, sorte de pelle creuse qui sert à vider leau entrée dans une embarcation : Et en doivent les vaisseaulx qui viennent esditz havres chargez de blez en grenier chascun vaissel plaine une escope ou labaille ou len puche leaue. (1413, Denombr du baill. de Constentin, Arch. P 304, f o 116 v o.) Von Wartburg 1968 in FEW 23, 108b (Mots dorigine inconnue ou incertaine)

18 Analyse et Traitement Informatique de la Langue Française Une solution en vue Chauveau 2006 in FEW s.v. BĀJULA « bonne denfants » : *labaille = mélecture de la baille (baille n.f. « baquet de bois en forme de demi- tonneau ou de cône tronqué, spécialement utilisé sur les bateaux », dp. 1340) Mais distance sémantique « écope »/« bonne » ! Base des mots fantômes centralise les identifications de mots fantômes dispersées dans des articles de revues, des communications, des comptes rendus et des articles lexicographiques, sans parler des rattachements inédits Base des mots fantômes

19 Analyse et Traitement Informatique de la Langue Française Sommaire 1. Caractérisation générale 2. Dictionnaire du Moyen Français (DMF) 2.1. Cœur du dispositif : le dictionnaire 2.2. Portail de référence pour létude du moyen français 3. Critique métalexicographique 3.1. Base des mots fantômes 3.2. Bibliographie Godefroy 4. TLF-Étym (Trésor de la Langue Française et étymologie) 5. Französisches Etymologisches Wörterbuch (FEW) 6. Dictionnaire Étymologique Roman (DÉRom) 7. Conclusion

20 Analyse et Traitement Informatique de la Langue Française Godefroy Fr. Godefroy, Dictionnaire de l'ancienne langue française et de tous ses dialectes du IX e au XV e siècle, 1881– volumes, pages, pas de bibliographie Problématique : sigles pour Dit de buffet (mil. 13 e s.) : « Dit de buffet », « Dit du buffet », « Du Vilain au buffet », sans datation Cf. Ringenbach 2010

21 Analyse et Traitement Informatique de la Langue Française Exemple dexploitation Étude diachronique de IN- Godefroy : Quant est de toy, tu mors et pinces Par ton envye inraisonnable Plus cun serpent (Envye, Estat et Simplesse, p. 6, ap. Ler. de Lincy et Michel, Farces, Moral. et Serm. joy., t. I) Bibliographie Godefroy : milieu 16 e siècle Bibliographie Godefroy Dernière attestation de inraisonnable, évincé par irraisonnable (dp. 14 e siècle)

22 Analyse et Traitement Informatique de la Langue Française Sommaire 1. Caractérisation générale 2. Dictionnaire du Moyen Français (DMF) 2.1. Cœur du dispositif : le dictionnaire 2.2. Portail de référence pour létude du moyen français 3. Critique métalexicographique 3.1. Base des mots fantômes 3.2. Bibliographie Godefroy 4. TLF-Étym (Trésor de la Langue Française et étymologie) 5. Französisches Etymologisches Wörterbuch (FEW) 6. Dictionnaire Étymologique Roman (DÉRom) 7. Conclusion

23 Analyse et Traitement Informatique de la Langue Française Un programme de recherche collaboratif Révision sélective des notices étymologiques du Trésor de la Langue Française (1971–1994) Étymologie-histoire, cf. Baldinger 1959 : 239 : « létymologie, [...] cest [...] la biographie du mot » Fédère les forces vives de létymologie française à travers le monde (Sarah Leroy ; Frankwalt Möhren, Thomas Städtler ; Franz Rainer ; Takeshi Matsumura ; etc.) TLF s.v. phonologie : (Besch. : Phonologie. [...] Gramm. Traité sur les sons) ; « science qui a pour objet l'étude fonctionnelle des sons » (Trubetzkoy). Comp. de l'élém. formant phon(o)-* « voix » et du suff. -logie*. TLF-Étym

24 Analyse et Traitement Informatique de la Langue Française Triple plus-value Étymologies inédites bienfaisance : calque du latin et non pas création française bigler : continuateur du protoroman et non pas emprunt au latin fare : emprunt au breton et non pas dorigine inconnue Antédatations fabulateur : 1541 ca 1360/1380 laconique : 1529 ca 1372/1374 ostensoir : Rétrodatations féodalement : iota : ca 1240 ca 1300 vélocipède :

25 Analyse et Traitement Informatique de la Langue Française Et surtout, au niveau conceptuel : Élaboration dune typologie de 22 sous-classes étymologiques, dotées de formules analytiques précises et cohérentestypologie Lexique héréditaire S.v. claie : « Continuateur régulier du protoroman régional */'kleta/ » (TLF : « du gaul. cleta ») Emprunts S.v. riesling : « Transfert linguistique : emprunt à lallemand Riesling » (TLF : « mot all. ») Créations internes S.v. cerbère : « Formation française : translation déonomastique du nom propre de créature mythologique Cerbère » (TLF : « Empr. au lat. Cerberus »)

26 Analyse et Traitement Informatique de la Langue Française Sommaire 1. Caractérisation générale 2. Dictionnaire du Moyen Français (DMF) 2.1. Cœur du dispositif : le dictionnaire 2.2. Portail de référence pour létude du moyen français 3. Critique métalexicographique 3.1. Base des mots fantômes 3.2. Bibliographie Godefroy 4. TLF-Étym (Trésor de la Langue Française et étymologie) 5. Französisches Etymologisches Wörterbuch (FEW) 6. Dictionnaire Étymologique Roman (DÉRom) 7. Conclusion

27 Analyse et Traitement Informatique de la Langue Française Un digne héritage Walther von Wartburg, Französisches Etymologisches Wörterbuch, 25 vol., 1922–2002 Ouvrage majeur de létymologie romane depuis le début de sa parution Renouvellement constant afin de conserver ce statut Refonte de la tranche alphabétique B- (publication sur Internet)Internet Informatisation planifiée (thèse Pascale Renders)

28 Analyse et Traitement Informatique de la Langue Française Jean-Paul Chauveau : préface du FEW « La traduction du titre de louvrage : Dictionnaire étymologique français et son sous-titre : Une représentation du trésor lexical galloroman [...] déterminent la perspective et lobjet que lui avait assignés Wartburg. Le FEW vise à fournir le tableau le plus complet possible du lexique galloroman dans une perspective génétique. Véritable Thesaurus galloromanicus, le FEW sefforce de rassembler toutes les données accumulées par la lexicographie du français, du francoprovençal, de loccitan et du gascon, de leurs parlers dialectaux, de leurs argots et de leurs technolectes, tant dans leurs états passés que modernes. Ces données, après analyse des évolutions phonétiques, morphologiques et sémantiques qui les ont marquées, sont classées, avec les références précises aux sources, dans des articles qui décrivent et expliquent le développement depuis l'étymon jusquaux aboutissements contemporains dans toutes ses ramifications morphologiques et sémantiques. »

29 Analyse et Traitement Informatique de la Langue Française Intérêt de la refonte ? Exemple : BĀSIOLUM Christel Nissille (aujourdhui rédactrice au Glossaire des patois de la Suisse romande) Lexème latin que les romanistes de renom ont rejeté comme étymon de formes galloromanes et que von Wartburg seul a retenu En nourrissant par les données collectées par la lexicographie moderne et contemporaine lhypothèse de von Wartburg et en exploitant toutes les possibilités de celle-ci, larticle parvient à en tirer létymologie, jusque là disputée et irrésolue, de mfr. bisel « facette dun diamant », (> fr. biseau « bord taillé obliquement », angl. bezel « facette dun diamant », occit. bisèu « biseau », esp. port. bisel, cat. bisell) Représentants héréditaires directs (baiseul « baiser ; baisure du pain ») manquent aussi bien aux dictionnaires canoniques des états anciens des langues traitées quà ceux du français moderne et contemporain et ne se rencontrent que dans les parlers dialectaux de trois domaines linguistiques galloromans : français, francoprovençal et occitan – ce sont des matériaux qui nont une chance dêtre étudiés que dans le cadre du FEW

30 Analyse et Traitement Informatique de la Langue Française Sommaire 1. Caractérisation générale 2. Dictionnaire du Moyen Français (DMF) 2.1. Cœur du dispositif : le dictionnaire 2.2. Portail de référence pour létude du moyen français 3. Critique métalexicographique 3.1. Base des mots fantômes 3.2. Bibliographie Godefroy 4. TLF-Étym (Trésor de la Langue Française et étymologie) 5. Französisches Etymologisches Wörterbuch (FEW) 6. Dictionnaire Étymologique Roman (DÉRom) 7. Conclusion

31 Analyse et Traitement Informatique de la Langue Française Dictionnaire étymologique roman de référence *Dübendorf 1861 Bonn 1936 Romanisches Etymologisches Wörterbuch Wilhelm Meyer-Lübke REW : 1930– (1911– )

32 Analyse et Traitement Informatique de la Langue Française Du REW au DÉRom « Nouveau REW » (cf. J. M. Piel, colloque TLF Strasbourg 1957) CILPR 21 Palerme (1995) : Table ronde « È oggi possibile o augurabile un nuovo REW ? » « Le besoin où nous sommes dun nouveau Meyer- Lübke a été plusieurs fois évoqué. Le secret espoir des organisateurs était que quelquun dans lassistance se lève et dise : Cest moi ! […] Mais cet espoir a été déçu… Alors que faire ? » (Chambon & Sala, Actes CILPR 21, 3, 1019)

33 Analyse et Traitement Informatique de la Langue Française Du REW au DÉRom Dictionnaire Étymologique Roman Projet européen, surtout franco-allemand Financé par lANR (Agence Nationale de la Recherche) et la DFG (Deutsche Forschungs- gemeinschaft) 2008–2010 (et 2012–2014 ?) 50 linguistes romanistes 1 ingénieur informaticien 2 documentalistes

34 Analyse et Traitement Informatique de la Langue Française École dété franco-allemande en étymologie romane (juillet 2010)

35 Analyse et Traitement Informatique de la Langue Française Méthodologie Première raison dêtre dun dictionnaire étymologique consacré à une famille linguistique : reconstruction du lexique de lancêtre commun Cadre théorique : grammaire comparée-reconstruction (cf. A. Fox, Linguistic Reconstruction, 1995) Objectif du DÉRom : reconstruction du lexique protoroman Approche discutée en linguistique romane (cf. A. Vàrvaro in Revue de linguistique romane 75 [2011] et réponse Buchi & Schweickard)

36 Analyse et Traitement Informatique de la Langue Française Chambon 2010 : 3 : « […] les mots du latin écrit de lAntiquité ne sauraient être placés à lorigine des mots héréditaires du français ou des autres langues (gallo)romanes […]. Le seul moyen de faire venir à lexistence létymon (oral) dun mot héréditaire est de le reconstruire sur la base de la comparaison entre formes orales affines, cest-à-dire dont on a montré quelles étaient reliées par un ensemble de correspondances phoniques régulières. […] létablissement des étymons des mots héréditaires correspond au segment de la recherche étymologique où celle-ci coïncide avec la grammaire comparée-reconstruction des parlers romans. » Cognats

37 Analyse et Traitement Informatique de la Langue Française Question de directionnalité REW : « Quest devenu le lexique latin [classique] ? » Même questionnement quen étymologie slave, germanique, austronésienne, bantoue etc. DÉRom : « Doù vient le lexique roman ? »

38 Analyse et Traitement Informatique de la Langue Française Notation des étymons Conséquence de loption « grammaire comparée-reconstruction » : DÉRom : */' ɸ ak-e-/ Étymons du lexique héréditaire en notation phonologique avec astérisque REW : *abbĭbĕrāre DÉRom : notation des étymons en graphie conventionnelle réservée aux latinismes Fr. Noël < protorom. */na'tal-e/ Fr. natal adj. < lat. natalis * = « reconstruit »* = « non attesté »

39 Analyse et Traitement Informatique de la Langue Française Statut du latin écrit de lAntiquité Témoignage du latin écrit de lAntiquité pratiques idiosyncrasiques en étymologie romane Les langues romanes ne sont-elles pas des langues « normales » ? Idée sous-jacente du DÉRom : le latin ne constitue une plus-value pour les études romanes que sil complète la méthodologie générale plutôt que de sy substituer

40 Analyse et Traitement Informatique de la Langue Française Détour par une anecdote Mesures imprécises Confiance Calculs imprécis

41 Analyse et Traitement Informatique de la Langue Française Appliqué à létymologie Protoroman reconstruit Confiance + Données du latin écrit

42 Analyse et Traitement Informatique de la Langue Française La pertinence dune méthodologie se mesure à ses résultats Signifié : */'β ɪ nd ɪ k a / « sauver ; venger » (REW : « venger ») */'mεnt e/ « esprit ; tempe ; manière » (REW : « esprit ») */sa'g ɪ tt a/ « flèche ; courson ; éclair » (REW : « flèche ») DÉRom / Signifiant : */a'pril-e/ et */a'pril i u/ (REW : aprīlis) */' ɛ rb-a/ ~ */' ɛ rβ-a/ (REW : hĕrba) */ ɸ e'βrari-u/ (REW : februarius) Catégorie grammaticale : */'barb a/ 1 s.f. et */'barb a/ 2 s.m. (REW : barba [s.f.]) */βi'n aki a/ s.f. (REW : vīnāceus adj.)

43 Analyse et Traitement Informatique de la Langue Française Sommaire 1. Caractérisation générale 2. Dictionnaire du Moyen Français (DMF) 2.1. Cœur du dispositif : le dictionnaire 2.2. Portail de référence pour létude du moyen français 3. Critique métalexicographique 3.1. Base des mots fantômes 3.2. Bibliographie Godefroy 4. TLF-Étym (Trésor de la Langue Française et étymologie) 5. Französisches Etymologisches Wörterbuch (FEW) 6. Dictionnaire Étymologique Roman (DÉRom) 7. Conclusion

44 Analyse et Traitement Informatique de la Langue Française Nous sommes des lexicologues avant dêtre des lexicographes ! Mots fantômes Steinfeld 2010 (mfr. de note) TLF-Étym Andronache 2009 (continuité) FEW Chauveau 2009 (sémantique historique) DÉRom Buchi et al ; Buchi & Schweickard 2008 ; 2009 ; 2010 (changement de paradigme en étymologie romane)

45 Analyse et Traitement Informatique de la Langue Française Pour en savoir plus Pierrel & Buchi 2009 HAL (Hyper Article en Ligne) HAL Journée détude TLF-Étym (Buchi 2006/2007) Journée détude TLF-Étym Séminaire de méthodologie (Buchi 2005–2007) Séminaire de méthodologie

46 Analyse et Traitement Informatique de la Langue Française Non pas zbógom, mais na svídenje! 27 e Congrès International de Linguistique et de Philologie Romanes Nancy, ATILF juillet 2013 Venez nombreux ! Hvála lépa, da ste prišlí!


Télécharger ppt "Www.atilf.fr Pour une lexicographie fermement pilotée par la lexicologie : les projets en linguistique historique française et romane du laboratoire ATILF."

Présentations similaires


Annonces Google