Module lexicographie II

Slides:



Advertisements
Présentations similaires
La recherche documentaire
Advertisements

Cours de sensibilisation de base à lERM Overview – Basic awareness course on microbiological risk assessment Présentation générale Cours de sensibilisation.
Secrétariat général de la Commission bancaire
Sandrine Peraldi (ISIT) Jean-Philippe KOTOWICZ (INSA Rouen)
Olivier Kraif, Agnès Tutin LIDILEM
UNIVERSITÉ PARIS 3 ─ SORBONNE NOUVELLE
Épreuve pratique en Terminale Mercatique
Épreuve pratique en Terminale Mercatique
Urbanisation de Systèmes d'Information
Module d’Enseignement à Distance pour l’Architecture Logicielle
Exemple : Itinéraire de lecture.
SYSTRAN Un outil du TAL Victoria AUPERT Marjorie LORSUNG.
Les outils du TAL Par RIGAUD Anaïs RALLIER Armelle SANTIAGO Gwendoline
OLST — Université de Montréal
E 1 Rénovation STMG : programme dÉconomie ENTRE CONTINUITÉ ET RUPTURES.
ETAPES DE LA RECHERCHE DOCUMENTAIRE
Méthodologie de la recherche universitaire
La démarche pédagogique du MF1
Rénovation de la filière STL - PNF Biotechnologies - 1 et 2 décembre 2011 LES BIOTECHNOLOGIES Une culture technologique.
Contexte et objectifs L’AFPA souhaite proposer à ses stagiaires des services complémentaires à son offre de formation standard. L’espace emploi permet.
Le portail documentaire de Paris 1
Legitimacy strategies in the annual reports What turn to social responsibility in post- privatization context Ioana IOAN Académie dEtudes Economiques de.
Recherche Documentaire et traitement de l’information
Project de la langue française
Blagovesta Cholova POLI-D-404: Etude approfondie de questions de science politique Groupe ‘Populisme et partis populistes’ Blagovesta.
TESTS D’UTILISABILITE DANS LES SERVICES PUBLICS
Introduction à la recherche en science politique
COFOR 1 Période 1 COFOR 1 Période 1 Activité en télé(présence) Une approche des relations entre les unités dinformation dans les publications électroniques.
Les Produits de Qualité Liée à lOrigine et aux Traditions en Méditerrannée Quality Food Products Linked to Geographical Origin and Traditions in the Mediterranean.
Date / references Systèmes Terre et Interarmées Projet OUTILEX Rapport détude final Octobre 2006.
© Petko ValtchevUniversité de Montréal Janvier IFT 2251 Génie Logiciel Notions de Base Hiver 2002 Petko Valtchev.
Page 1 / Titre / Auteur / Date / Confidentiel D? LA DEMARCHE COLLEGES METIER.
Plan de la rencontre #6 Approches pédagogiques pour l ’utilisation des NTIC Scénarios d ’utilisation des NTIC Logiciels-outils et écriture Activité: Réalisation.
Introduction à lutilisation des corpus 2. Comment constituer un corpus?
Introduction à lutilisation des corpus 1. Quest-ce quun corpus? Alexandra VOLANSCHI
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
Introduction théorie et pratique
Introduction théorie et pratique
Introduction à lutilisation des corpus 2. Comment constituer un corpus?
Introduction à lutilisation des corpus 2. Comment constituer un corpus?
Comment l'approche par tâches
Le portail documentaire de Paris 1
Délégation à l’Emploi et aux Formations
E 1 Rénovation STMG : programme dEconomie RUPTURE ET CONTINUITE Claude NAVA Inspecteur général de lEducation nationale.
1 er décembre 2005IFT6010 – Jean-Yves Guyomarc’h Colorless green ideas…. Une « guerre de religion »
Réunion de lancement du 18 janvier constitution, alignement, comparaison et exploitation d’ontologies géographiques hétérogènes Réunion de lancement.
Direction de la normalisation terminologique (DNT) Mai 2010 La terminologie : une passion, des métiers !
Méthodologie de recherche
Aide à la rédaction. Plan L’aide à la rédaction : principes et outils La correction orthographique –Historique –Modélisation linguistique –Evaluation.
LINGUISTIQUE APPLIQUÉE À L’ENSEIGNEMENT-APPRENTISSAGE DU FRANÇAIS
Révision en rédaction. 1 Nolwenn Kerzreho 2008 Révision en rédaction Pourquoi ? Un problème (quel problème) ? Intervention des professionnels Conclusion.
Les approches qualitatives et quantitatives pour la recherche comparative Anthony Sealey Université de Toronto This material is distributed under an Attribution-NonCommercial-ShareAlike.
Dictionnaires, lexicographie, lexicographes
BACCALAUREAT PROFESSIONNEL
Les épreuves du baccalauréat STG
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
Titre : LE PROJET Objectifs: › être capable de mener un projet › répondre aux attentes des jurys Durée: 30 min.
Comment se documenter sur un sujet Méthodologie de la traduction I.
La recherche.
JDD 2005 Utilisation et Constitution de Ressources Sémantiques pour la Recherche d'Informations Précises. Vincent Barbier, groupe LIR Langues, Information.
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
Le Traitement Automatique des Langues (TAL)
Initiation à des recherches dans le domaine de l’enseignement
But : avoir un regard réflexif sur le métier d’enseignant
Progressivité de l’enseignement grammatical A partir d’un document rédigé par : - Claudine GARCIA-DEBANC - Véronique PAOLICCI - Nicole RAMIREZ - Pierre.
Sciences du langage et de la communication Responsable du pilier : Corinne Rossari Professeure de linguistique française Présentation : Tobias von Waldkirch.
Évaluation sommative de la traduction pragmatique en dernière année de formation : expérience en cours à Lille III afin d’allier critères universitaires.
NEDERLEX : un outil en ligne d'aide à la lecture de textes en langue étrangère. G. Deville - M. Miceli (Ecole des Langues Vivantes - FUNDP) L. Dumortier.
Lycée Lucie Aubrac 224 rue Ernest Lafont Bollène Tel :
Compétences informationnelles Choisir ses sources Connaître les outils de repérage.
Transcription de la présentation:

Module lexicographie II Beatriz Sánchez Cárdenas Universidad de Granada bsc@ugr.es

Évaluation finale 50% note finale: En groupes de deux: constitution d’un prototype de ressource lexicographique (à finir pour le 14 février) Examen final: des questions courtes sur le contenu du cours (14 février)

Objectifs partie II Constitution d’un corpus Comment dégager les information sémantiques, syntaxiques et pragmatiques nécessaires à partir des corpus ? Analyse du corpus avec WordSmith tools

Des dictionnaires au corpus et inversement Première étape : étude des dictionnaires existants Les dictionnaires témoignent d’une connaissance linguistique qu’il serait imprudent d’ignorer. Certaines définitions des dictionnaires, comme le TLFi, se basent sur des corpus (même si exclusivement littéraires). Ne pas tomber dans la caricature du « linguiste de corpus » vs. le « linguiste de fauteuil » (Fillmore 2006)

« Armchair linguist » « Corpus linguist » - Armchair linguist: Why should I think that what you tell me is interesting ? - Corpus linguist: Why should I think that what you tell me is true?

1. Définir le profil de l’usager Décrivez le type de ressource que vous envisagez de créer (typologie des dictionnaires), b) les besoin de l’usager auquel il est destiné -> Un dictionnaire bilingue FR-AN des verbes des Sciences de l’environnement (volcanologie)

2. Constitution et analyse du corpus « A corpus is a collection of pieces of language that are selected according to explicit linguistic criteria in order to be used as a sample of the language. » (Sinclair 1996 : 4) Constitué selon des critères visant à délimiter la langue définie par les limites temporelles, le registre et le milieu social: « The texts are selected according to explicit criteria in order to capture the regularities of a language, a language variety or a sub-language. » (Tognini Bonelli 2001: 55)

2.a. Avantages de l’utilisation des corpus dans la lexicographie Rapidité, efficacité, gain de temps Permet de mieux définir la combinatoire des mots Permet de différencier les nuances sémantiques des mots grâce à leurs contextes Reflète la langue utilisée par les locuteurs (et pas l’idiolecte du linguiste) Fournit des données quantitatives Permet d’appréhender le « linguistic behaviour » (Hanks) des UL, l’ « usage syntagmatique réel » La linguistique des corpus: une théorie ou une méthode ?

2.b. Corpus based vs. Corpus driven Approche « corpus based » Les exemples de corpus servent à illustrer la théorie. Approche « corpus driven » Le corpus a une suprématie absolue. Il n’existe pas de modélisation théorique préalable. Les découvertes réalisées dans le corpus conduisent à la construction des connaissances linguistiques. Les affirmations théoriques sont dérivées de l’accumulation de phénomènes linguistiques. ! Mais toute analyse linguistique comporte des postulats théoriques  L’analyse de corpus ne peut pas remplacer la réflexion linguistique. Attention à ne pas tomber dans l’un ou l’autre des extrêmes. Il est fécond d’associer les deux démarches.

« On peut donc reprendre, sans risque d’être démenti, l’affirmation qu’il n’existe aucun dictionnaire neutre, en ce sens que tout dictionnaire est nécessairement conditionné par des théories linguistiques, sociales, économiques ou même parfois politiques, même s’il tente de rester représentatif. » (André Clas 1996 : 201)

2.c. Délimitation du corpus Unités lexicales choisies: langue générale / langue de spécialité (domaine- sous domaine) catégorie grammaticale : nom, verbe, adjectif, adverbe Période Registre Langue orale/écrite Monolingue, bilingue, plurilingue ? Langue générale ou spécialisée

2.e. Constitution du corpus: ressources Délimitez le corpus. Faites l’inventaire des ressources que vous allez utiliser pour le constituer. Textes parallèles : thèses, mémoires, revues scientifiques, articles ! Tous les textes doivent être convertis au format .txt

2.f. Mesurer la fiabilité des textes parallèles notoriété de l’auteur, entité qui finance, maison d’édition… date de publication ou dernière mise à jour public auquel l’ouvrage est destiné objectifs de l’ouvrage (pédagogique, informatif, normatif,…) langue dans laquelle il a été rédigé (s’agit-il d’une traduction?) origine géographique (un jargon local?) information sur la terminologie employée (définitions, équivalents dans d’autres langues, contextes, images,…) niveau d’usage et reconnaissance de l’ouvrage accès à l’information (qualité de la présentation, organisation…) bibliographie éventuellement utilisée

Constitution du corpus En groupes de deux, constituez un corpus avec des textes du domaine de la volcanologie Assurez-vous qu’ils remplissent les conditions de qualité. Consigne de base : plus le corpus est large, plus il est représentatif. N’oubliez pas de convertir les documents au format .txt Domaine général: Sciences de l’environnement Sous-domaine: volcanologie

C. Pré-analyse du corpus

Pre-analyse a) Sketch engine

Pre-analyse b) Analyse des diccionaires Avec Sketch engine, faites une première ébauche: Verbes liés au termes volcan (FR) et volcano (AN) Axe paradigmatique: verbes liés à ces termes dans les deux langues Axe syntagmatique: structures syntaxique et sémantique (types de compléments, types de N des copléments, structures syntaxiques).

Axe paradigmatique Faites une analyse de la description des verbes sélectionnés dans les dictionnaires généraux pour une première ébauche de leur comportement et en vue d’une future description dans le domaine de la volcanologie http://www.upf.edu/bibtic/es/traduc/trad1.html  Construire un corpus (AN ou FR) dans le domaine de la volcanologie pour demain, mardi 7.