La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

ASSTICCOT, CFD,Hammamet, 20-23 octobre 20021 Constitution de produits terminologiques à partir de corpus Présentation de lAction Spécifique STIC, Corpus.

Présentations similaires


Présentation au sujet: "ASSTICCOT, CFD,Hammamet, 20-23 octobre 20021 Constitution de produits terminologiques à partir de corpus Présentation de lAction Spécifique STIC, Corpus."— Transcription de la présentation:

1 ASSTICCOT, CFD,Hammamet, octobre Constitution de produits terminologiques à partir de corpus Présentation de lAction Spécifique STIC, Corpus et Terminologie (ASSTICCOT) N. Aussenac-Gilles (IRIT), A. Condamines (ERSS) Associée au RTP-DOC (J.M. Salaün), direction Interactions Humaines et Cognition (C. Garbay)

2 ASSTICCOT, CFD,Hammamet, octobre Des applications à base de connaissances autour des documents Des applications qui améliorent laccès au contenu de documents non identifiés a priori (ex : RI) Des applications qui améliorent laccès à des documents identifiés (ex : guide de procédure, mémoire dentreprise) Des applications qui requièrent des ressources terminologiques (ex: aide à la traduction, aide à la rédaction, veille)

3 ASSTICCOT, CFD,Hammamet, octobre Rôle et nature des ressources terminologiques Ressources existantes –Sans lien vers les textes (construites par introspection ou entretiens avec des experts) –Générales (indépendantes du domaine et/ou de lapplication). –> peut-on les intégrer dans les applications ? Nouveaux besoins –Domaines spécifiques => constituer des ressources terminologiques spécialisées –Rôle majeur des documents => construire ces ressources à partir de textes pour mieux tenir compte des usages et rendre plus efficace laccès aux documents

4 ASSTICCOT, CFD,Hammamet, octobre Documents et connaissances Documents comme possibles sources de connaissances dun domaine –Comment accéder à ces connaissances ? –Comment accéder aux documents à travers les connaissances ? –Quels produits terminologiques intermédiaires pourraient faciliter cet accès ? –> lien avec lingénierie des connaissances Documents comme moyens daccès à des manifestations linguistiques (soppose à lintrospection) : mise en œuvre vs enrichissement des connaissance de la langue –Documents comme révélateurs dusages (corpus) –> lien avec la linguistique de corpus et la terminologie

5 ASSTICCOT, CFD,Hammamet, octobre Objectifs de lAction Spécifique Faire se rencontrer plusieurs communautés sur la question de la modélisation de connaissances à partir de corpus : Linguistique de corpus et terminologie Sciences de linformation Informatique Ingénierie des connaissances Recherche dinformation Traitement Automatique de la Langue Apprentissage à partir de textes

6 ASSTICCOT, CFD,Hammamet, octobre Mode de fonctionnement Composition –Une trentaine de chercheurs issus de différentes disciplines –Une dizaine de laboratoires dont DYALANG, LIPN, IRIT et ERSS. 4 groupes –Linguistique de corpus et terminologie (M. Bouveret) –TAL et apprentissage (P. Zweigenbaum) –Sciences de linformation et recherche dinformation (S. Lainé-Cruzel) –Ingénierie des connaissances (S. Després) Deux types de réunions : –travail par groupe (selon une grille de questions commune) –séances plénières (mises en commun, confrontations entre disciplines)

7 ASSTICCOT, CFD,Hammamet, octobre Motivations Des problématiques similaires Vers plus dinterdisciplinarité –Lexistant : des relations bilatérales –Lenjeu : une évaluation systématique des complémentarités Repérer des axes de recherche à développer Valoriser et fédérer les acquis dans un contexte pluridisciplinaire

8 ASSTICCOT, CFD,Hammamet, octobre Exemples de collaborations bilatérales (1) Terminologie textuelle et TAL –TAL pour la construction de ressources : Syntex et Caméléon –Données terminologiques comme ressources pour le TAL : thésaurus pour traiter des dossiers patients

9 ASSTICCOT, CFD,Hammamet, octobre Exemples de collaborations bilatérales (2) Ontologies et recherche dinformation –Hiérarchie de termes pour la classification de documents DocCUBE –Ontologies pour la reformulation de requêtes –Ontologies pour linterrogation de données semi- structurée PICSEL Terminologie textuelle et outils de TAL pour la construction dontologies –Index dun livre, Ontologie de lingénierie des connaissances

10 ASSTICCOT, CFD,Hammamet, octobre Expériences pluridisciplinaires Collaboration entre IC, Terminologie Textuelle et TAL : –Bénéficie de lexpérience du groupe TIA Collaborations entre RI, IC et Sciences de linformation : réseau Rhône Alpes Passer dexpériences ponctuelles à une théorisation des problèmes et une vraie approche pluridisciplinaire

11 ASSTICCOT, CFD,Hammamet, octobre Objectifs Mettre au jour et expliciter les méthodes, objectifs et présupposés de chaque discipline Identifier les manques, transferts et convergences possibles Localiser des questions théoriques nouvelles à traiter de manière interdisciplinaire pour –rendre plus efficace lélaboration de ressources terminologiques en fonction des besoins –repérer limpact de ces questions sur chaque discipline

12 ASSTICCOT, CFD,Hammamet, octobre Questions préalables : objets et produits des recherches de chaque discipline 6 points de réflexion principaux : –Positionnements théoriques –Rôle des Corpus -> –Définition des besoins –Définition des méthodes et outils : logiciels de Traitement Automatique de la Langue, dapprentissage, dexploration de textes –Description des modèles produits ou utilisés –Mode dévaluation des résultats

13 ASSTICCOT, CFD,Hammamet, octobre Corpus Définition commune –Lexistant : des textes (ou portions de textes) –Le corpus est construit en fonction dun besoin particulier ou dune hypothèse détude Des réalités différentes –Nature et taille –critères de construction –modes et objectifs dexploitation

14 ASSTICCOT, CFD,Hammamet, octobre Perspectives détudes sur les corpus Des besoins communs –Nécessité de caractériser les textes au delà de leur thématique –Meilleure maîtrise du lien entre caractéristiques des textes et nature des applications –Prise en compte de la méthode utilisée pour construire des ressources dans la constitution du corpus

15 ASSTICCOT, CFD,Hammamet, octobre Principes communs La construction de ressources terminologiques est un processus dinterprétation humaine de résultats fournis par des outils Les ressources doivent être spécialisées par domaine et par application (réutilisabilité ?) Les concepts sont élaborés à partir de réalisations textuelles avec lesquelles ils conservent un lien terminologique

16 ASSTICCOT, CFD,Hammamet, octobre Présentation des exposés De la construction de corpus parallèle à lextraction de terminologies bilingues : les problèmes spécifiques à larabe –François Stuck Retour dexpérience sur lutilisation de logiciels de TAL et de principes linguistiques pour la construction dontologies –Tal, IC et linguistique Corpus et ressources terminologiques : les questions du genre et de la variation –Linguistique, terminologie et Sciences de linfo –Variation terminologique et corpus


Télécharger ppt "ASSTICCOT, CFD,Hammamet, 20-23 octobre 20021 Constitution de produits terminologiques à partir de corpus Présentation de lAction Spécifique STIC, Corpus."

Présentations similaires


Annonces Google