La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada

Présentations similaires


Présentation au sujet: "Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada"— Transcription de la présentation:

1 Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada

2 Évaluation finale 50% note finale: En groupes de deux: constitution dun prototype de ressource lexicographique (à finir pour le 14 février) 50% note finale: Examen final: des questions courtes sur le contenu du cours (14 février) 2

3 Objectifs partie II Constitution dun corpus Comment dégager les information sémantiques, syntaxiques et pragmatiques nécessaires à partir des corpus ? Analyse du corpus avec WordSmith tools 3

4 Des dictionnaires au corpus et inversement Première étape : étude des dictionnaires existants Les dictionnaires témoignent dune connaissance linguistique quil serait imprudent dignorer. Certaines définitions des dictionnaires, comme le TLFi, se basent sur des corpus (même si exclusivement littéraires). Ne pas tomber dans la caricature du « linguiste de corpus » vs. le « linguiste de fauteuil » (Fillmore 2006) 4

5 « Armchair linguist » « Corpus linguist » - Armchair linguist: Why should I think that what you tell me is interesting ? - Corpus linguist: Why should I think that what you tell me is true? 5

6 1. Définir le profil de lusager Décrivez a)le type de ressource que vous envisagez de créer (typologie des dictionnaires), b) b) les besoin de lusager auquel il est destiné -> Un dictionnaire bilingue FR-AN des verbes des Sciences de lenvironnement (volcanologie) 6

7 2. Constitution et analyse du corpus « A corpus is a collection of pieces of language that are selected according to explicit linguistic criteria in order to be used as a sample of the language. » (Sinclair 1996 : 4) Constitué selon des critères visant à délimiter la langue définie par les limites temporelles, le registre et le milieu social: « The texts are selected according to explicit criteria in order to capture the regularities of a language, a language variety or a sub-language. » (Tognini Bonelli 2001: 55) 7

8 2.a. Avantages de lutilisation des corpus dans la lexicographie Rapidité, efficacité, gain de temps Permet de mieux définir la combinatoire des mots Permet de différencier les nuances sémantiques des mots grâce à leurs contextes Reflète la langue utilisée par les locuteurs (et pas lidiolecte du linguiste) Fournit des données quantitatives Permet dappréhender le « linguistic behaviour » (Hanks) des UL, l « usage syntagmatique réel » La linguistique des corpus: une théorie ou une méthode ? 8

9 2.b. Corpus based vs. Corpus driven Approche « corpus based » Les exemples de corpus servent à illustrer la théorie. Approche « corpus driven » Le corpus a une suprématie absolue. Il nexiste pas de modélisation théorique préalable. Les découvertes réalisées dans le corpus conduisent à la construction des connaissances linguistiques. Les affirmations théoriques sont dérivées de laccumulation de phénomènes linguistiques. ! Mais toute analyse linguistique comporte des postulats théoriques Lanalyse de corpus ne peut pas remplacer la réflexion linguistique. Attention à ne pas tomber dans lun ou lautre des extrêmes. Il est fécond dassocier les deux démarches. 9

10 « On peut donc reprendre, sans risque dêtre démenti, laffirmation quil nexiste aucun dictionnaire neutre, en ce sens que tout dictionnaire est nécessairement conditionné par des théories linguistiques, sociales, économiques ou même parfois politiques, même sil tente de rester représentatif. » (André Clas 1996 : 201) 10

11 2.c. Délimitation du corpus Unités lexicales choisies: langue générale / langue de spécialité (domaine- sous domaine) catégorie grammaticale : nom, verbe, adjectif, adverbe Période Registre Langue orale/écrite Monolingue, bilingue, plurilingue ? Langue générale ou spécialisée 11

12 2.e. Constitution du corpus: ressources Délimitez le corpus. Faites linventaire des ressources que vous allez utiliser pour le constituer. Textes parallèles : thèses, mémoires, revues scientifiques, articles ! Tous les textes doivent être convertis au format.txt 12

13 2.f. Mesurer la fiabilité des textes parallèles 13 notoriété de lauteur, entité qui finance, maison dédition… date de publication ou dernière mise à jour public auquel louvrage est destiné objectifs de louvrage (pédagogique, informatif, normatif,…) langue dans laquelle il a été rédigé (sagit-il dune traduction?) origine géographique (un jargon local?) information sur la terminologie employée (définitions, équivalents dans dautres langues, contextes, images,…) niveau dusage et reconnaissance de louvrage accès à linformation (qualité de la présentation, organisation…) bibliographie éventuellement utilisée

14 Constitution du corpus 1.En groupes de deux, constituez un corpus avec des textes du domaine de la volcanologie Assurez-vous quils remplissent les conditions de qualité. Consigne de base : plus le corpus est large, plus il est représentatif. 2.Noubliez pas de convertir les documents au format.txt Domaine général: Sciences de lenvironnement Sous-domaine: volcanologie

15 C. Pré-analyse du corpus 15

16 Pre-analyse a) Sketch engine 16

17 Pre-analyse b) Analyse des diccionaires Avec Sketch engine, faites une première ébauche: Verbes liés au termes volcan (FR) et volcano (AN) Axe paradigmatique: verbes liés à ces termes dans les deux langues Axe syntagmatique: structures syntaxique et sémantique (types de compléments, types de N des copléments, structures syntaxiques). 17

18 Axe paradigmatique Faites une analyse de la description des verbes sélectionnés dans les dictionnaires généraux pour une première ébauche de leur comportement et en vue dune future description dans le domaine de la volcanologie Construire un corpus (AN ou FR) dans le domaine de la volcanologie pour demain, mardi 7. 18


Télécharger ppt "Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada"

Présentations similaires


Annonces Google