La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Atelier ASSTICCOT, Conférence CFD 2002, 20-23 octobre Hammamet 1 Terminologie et corpus : la question du genre et de la variation Myriam Bouveret (DYALANG)

Présentations similaires


Présentation au sujet: "Atelier ASSTICCOT, Conférence CFD 2002, 20-23 octobre Hammamet 1 Terminologie et corpus : la question du genre et de la variation Myriam Bouveret (DYALANG)"— Transcription de la présentation:

1 Atelier ASSTICCOT, Conférence CFD 2002, octobre Hammamet 1 Terminologie et corpus : la question du genre et de la variation Myriam Bouveret (DYALANG) Anne Condamines (ERSS) Valérie Delavigne (DYALANG) Pierre Zweigenbaum (DIAM/SIM)

2 Atelier ASSTICCOT, Conférence CFD 2002, octobre Hammamet 2 Introduction le corpus permet de construire des ressources langagières de types différents (glossaires, index, terminologies, thésaurus, ontologies…) mais le corpus est aussi en soi une ressource langagière à considérer en amont des corpus, méthodes, ressources adaptées aux applications, utilisateurs

3 Atelier ASSTICCOT, Conférence CFD 2002, octobre Hammamet 3 Sens / signification Ce déplacement en linguistique renvoie à la question de la signification Linguistique et informatique ont une base logique commune qui a permis de travailler sur le sens Nécessité de trouver de nouvelles bases entre linguistique et informatique reposant sur la signification (cf. Slodzian 2000)

4 Atelier ASSTICCOT, Conférence CFD 2002, octobre Hammamet 4 Contexte, variation, genre On pose ici le problème du sens en contexte : variation et genre pour des ressources crées à partir de textes le genre, une sorte de variation Un texte nest pas normé, il est produit selon un genre (ex : comptes rendus médicaux, résumés de thèse, fiches de dégustation, etc…)

5 Atelier ASSTICCOT, Conférence CFD 2002, octobre Hammamet 5 2. La variation « La variation mesure un décalage entre une forme lexicalisée et son usage » (Slodzian 2000 :75) Le sens nest pas figé. Synonymie et polysémie comme variation inhérente à la langue naturelle Cas de variation : variation sémantique (polysémie, synonymie), variantes morphologiques et variation multilingue

6 Atelier ASSTICCOT, Conférence CFD 2002, octobre Hammamet 6 Variation sémantique et morphologique Sortie 1la sortie des informations output process Sortie 2la sortie imprimée output data Sortie 3la sortie du logiciel computer output Sortie 4la sortieplug exemples extraits du corpus LLI, Laboratoire de linguistique et d'informatique de l'université de Montréal

7 Atelier ASSTICCOT, Conférence CFD 2002, octobre Hammamet 7 Termeinstrumentlocalisation résultat mémorisermémoire formaterformat indexationindex impressionimprimanteimprimé

8 Atelier ASSTICCOT, Conférence CFD 2002, octobre Hammamet 8 TAL: Différents aspects de la variation Terme entréTerme de référence FlexionAberrations chromosomiques Aberration chromosomique DérivationSténose valve aorte Sténose aortique valvulaire Syntaxe (+ dérivation) Adénome de la prostate Adénome prostatique

9 Atelier ASSTICCOT, Conférence CFD 2002, octobre Hammamet 9 Sémantique Terme entréTerme de référence SynonymesAppareil Derme Dispositif Corium Co-référentsCanal de CuvierVeine cardinale commune

10 Atelier ASSTICCOT, Conférence CFD 2002, octobre Hammamet 10 Genre et variation lexicale Le genre dun texte influe sur sa syntaxe, mais aussi sur son lexique Une dimension du genre est le public visé Exemple: grand public vs spécialistes Crise cardiaqueInfarctus du myocarde RhumeRhinopharyngite

11 Atelier ASSTICCOT, Conférence CFD 2002, octobre Hammamet 11 Genre et variation morphologique Le genre dun texte influe sur sa syntaxe, mais aussi sur son lexique Cas: productivité des adjectifs dérivés dans des corpus médicaux (hématologie) Exemple: dérivés en –al sont plus productifs dans des documents Web que dans des comptes rendus hospitaliers

12 Atelier ASSTICCOT, Conférence CFD 2002, octobre Hammamet 12 Genre et variation syntaxique Les outils de TAL ont des performances qui varient avec le genre des textes Létiquetage morpho-syntaxique (GRACE) diffère selon le genre: HEUR et Brill-Limsi Exemple :journaux, mémoires, romans et essais. Performances homogènes sauf pour mémoires

13 Atelier ASSTICCOT, Conférence CFD 2002, octobre Hammamet La question du genre Problématique –Caractériser les textes au-delà de leur contenu –Prendre en compte la situation de production dun texte –Genre influe sur les ressources terminologiques ex : légitimité /illégitimité des textes de vulgarisation Définition –Comportement discursif observable par des régularités langagières auxquelles les locuteurs obéissent (Bahktine) –Compétence métalinguistique. –Normes: horizon dattente, modèle de création –Descriptions insuffisantes: droit, génie génétique, physique nucléaire, art pariétal…

14 Atelier ASSTICCOT, Conférence CFD 2002, octobre Hammamet 14 Une typologie des genres est-elle possible ? Tentatives nombreuses: r hétorique classique,champ littéraire, institution scolaire. Mais : Multiplication des situations possibles Classes trop générales Hétérogénéité des genres (ex: écrit vs oral) Plusieurs genres dans un même texte Diversité des critères descriptifs (action sociale, fonctionnement rhétorique, situations énonciatives, finalité du discours, situation sociale, types dinteraction, actes de langage…)

15 Atelier ASSTICCOT, Conférence CFD 2002, octobre Hammamet 15 Marqueurs de reformulation -Un exemple: les marqueurs des discours de vulgarisation indice fort : importance du métalangage juxtaposition, coordination, verbes (être, appeler, nommer, signifier, désigner…) expressions métalinguistiques (c'est-à-dire, autrement dit, en dautres termes…), joncteurs (ou, soit…) - Mais Marqueurs non spécifiques Tous les textes de vulgarisation ne portent pas ces marques Certains textes spécialisés les portent

16 Atelier ASSTICCOT, Conférence CFD 2002, octobre Hammamet 16 Marqueurs de relation Marqueur danaphorique a permis de repérer 44 génériques (cf. Aussenac, Condamines et Szulman 2000) –Exemple: Archivage de létat de configuration logiciel. Cette activité… Ces génériques apparaissent comme têtes de termes complexes: acteur, activité, composant, processus Hypothèse: si plus fréquents dans textes non spécialistes on peut utiliser ces génériques pour constituer des ressources terminologiques sadressant à des non-spécialistes

17 Atelier ASSTICCOT, Conférence CFD 2002, octobre Hammamet 17 Conclusion Pistes pour une étude de la variation –Outils dextraction cf. Syntex –Patterns dextraction –Marqueurs de genre –Modèles de ressources flexibles : intégrant la variation. Nature du sens ? –Modèles de ressources économiques : indexant la variation

18 Atelier ASSTICCOT, Conférence CFD 2002, octobre Hammamet 18 Pistes: des marqueurs de genre Quelles questions poser pour typifier les genres ? Comment exploiter les outils existants pour étudier des genres ? Ex, Biber utilise les concordanciers pour une étude des marques discursives (« study of discourse characteristics » Biber, Conrad and Reppen, 1998 :106) Des marqueurs grand public/spécialisé ?

19 Atelier ASSTICCOT, Conférence CFD 2002, octobre Hammamet 19 Pistes: des dimensions du genre Difficultés de caractériser les genres (ex Web, mémoires) On peut utiliser des traits ou des dimensions différentielles Exemple: dimensions externes (destinataire, objectif) et dimensions internes (style, factualité, technicité) cf.Sinclair (EAGLES), Biber

20 Atelier ASSTICCOT, Conférence CFD 2002, octobre Hammamet 20 Bibliographie Assadi H.et Bourigault D., 2000, « Analyse syntaxique et statistique pour la construction dontologies à partir de textes », in Actes dIC 2000, Ingénierie des connaissances, Toulouse 2002, Eyrolles, Aussenac, Condamines et Szulman, à paraître, « Prise en compte de lapplication dans la constitution de produits terminologiques » Biber D., Conrad S. and Reppen R., 1998, Corpus Linguistics. Investigating language stucture and use, Cambridge University Press Biber D., 1994, Representativeness in corpus design. Linguistica Computazionale, IX-X: Current Issues in Computational Linguistics: in honor of Don Walker. Condamines A. et Rebeyrolles J., 2000, « Construction dune BCT à partir de textes : expérimentation dune méthdoe », in Actes dIC 2000, Ingénierie des connaissances, Toulouse 2002, Eyrolles, Delavigne V. et Bouveret M. (Ed.), 2000, Sémantique des termes, Dyalang, Publications de lUniversité de Rouen Grabar et Zweigenbaum, à paraître, « Productivité à travers domaines et genres : dérivés adjectivaux et langue médicale », Langue française Illouz G., « Typage de données textuelles et adaptation des traitements linguistiques. Application à lannotation morpho-syntaxique », thèse de lUniversité de Paris XI, 2000 Illouz G ; 1999, « Méta-étiqueteurs adaptatif : vers une utilisation pragmatique des ressources linguistiques », Actes de TALN 99, (Pascal Amsili coord.), , ATALA Cargèse Sinclair J., 1996, « Preliminary Recommendations on Text Typology, document en ligne (http://nicolet.ilc.pi.cnr.it/EAGLES/texttyp/texttyp.html), EAGLES (Expert Advisory Group on Language Engineering Standards)http://nicolet.ilc.pi.cnr.it/EAGLES/texttyp/texttyp.html Slodzian M., 2000, « Lémergence dune terminologie textuelle et le retour du sens », in Béjoint et Thoiron 2000, Le sens en terminologie, Duculot-Aupelf, Zweigenbaum P. et Grabar N., « Liens morphologiques et structuration de terminologie », in Actes dIC 2000, Ingénierie des connaissances, Toulouse 2002, Eyrolles,


Télécharger ppt "Atelier ASSTICCOT, Conférence CFD 2002, 20-23 octobre Hammamet 1 Terminologie et corpus : la question du genre et de la variation Myriam Bouveret (DYALANG)"

Présentations similaires


Annonces Google