Constitution de produits terminologiques à partir de corpus

Slides:



Advertisements
Présentations similaires
Quelques pistes pour lavenir Division des Politiques linguistiques - DG IV Conseil de lEurope, Strasbourg, France Le droit des apprenants.
Advertisements

Hippodamos Samuel GESCHE. 2 Hippodamos : lenjeu initial Cest bien connu : Modélisation de lexpertise Elaboration de théories scientifiques Modélisation.
Sémantique et droit de la Fonction publique une boucle verticale
Sandrine Peraldi (ISIT) Jean-Philippe KOTOWICZ (INSA Rouen)
ASSTICCOT, RTP-DOC, Paris
1- Petit rappel de l’histoire
5 décembre 2002TIA - prise en compte de l'application - Assises I31 Prise en compte de lapplication dans la constitution de produits terminologiques Groupe.
Jean-Louis Foulley, Christèle Robert* INRA-Génétique animale, SGQA Jouy-en-Josas; *SAGA Castanet Tolosan Journées didactiques INRIA « Modèles.
Plates-formes électroniques de gestion de connaissances et de travail partagé Nicole PINHAS Hugues RASSER.
École de la GRH 17 mars Impliquer les cadres dans la gestion des compétences Le 17 mars 2010.
UNIVERSITÉ PARIS 3 ─ SORBONNE NOUVELLE
Urbanisation de Systèmes d'Information
Recherche-Action-Formation Quelles questions se poser ? Bernadette Charlier BIE 14 juin
Entre construction théorique et mise en œuvre opérationnelle
2002 Compétitif XMiner : Plate-forme de structuration texte libre multi-approches par balisage XML de Tags Actifs Lobjectif du projet est de développer.
1 er décembre 2005Projet ILD&ISTC1 Langues et documents Perspectives.
Mise en œuvre d’une démarche et d’un outil de gestion de « connaissances métier » basés sur la collaboration. Cyril BEYLIER
Construire une politique documentaire
Nouvelle discipline MANAGEMENT DES ORGANISATIONS.
Indexation textuelle : Systèmes de recherche d’informations
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
Ametsa : un système de contrôle de l’environnement domestique générique fondé sur UPnP ENST-Bretagne.
1 Lyon juin 2008 Articuler l'enseignement et la formation... ou comment aider à la formation dans l'action. L'exemple du site PEGASE.
ANTbox La gestion collaborative de documents et de connaissances Au service dactions de veille.
INTELLIGENCE COLLECTIVE : RENCONTRES 2006Nîmes mai 2006 CENTRE DE RECHERCHE LGI2P 1- Doctorante Ecole des mines de Paris, 2- Maitre de Conférences.
Approche critique des produits IdL Master 1 IdL Année
Marketing Engineering
Opportunités de contribution au projet ISICIL
1 Mise en place dune veille socio-informatique sur les alertes santé-environnement en PACA 1ère réunion du Comité de Suivi des Projets de lenjeu Connaissance.
En Systèmes d’information
Annotations sémantiques pour le domaine des biopuces
Le périmètre diane circé été 2002.
Tous les mercredis du 3 octobre au 19 décembre 2012
LES TRAVAUX PERSONNELS ENCADRÉS
Entre construction théorique et mise en œuvre opérationnelle
SCIENCES DE L ’INGENIEUR
Présentation du deuxième document daccompagnement Ecole dété de Guidel 2010 Annie Journu.
L’organisation & les responsabilités
Journée de lancement du Réseau Thématique Pluridisciplinaire 32
UNIVERSITE DE TECHNOLOGIE COMPIEGNE Unité dInnovation – Ingénierie des Contenus et Savoirs 28/05/2007 UTC UI - ICS Valérie Moreau Scénarios de mise en.
Introduction à lutilisation des corpus 1. Quest-ce quun corpus? Alexandra VOLANSCHI
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
Le projet de terminologie
Service de la protection de lenvironnement CANTON DU VALAIS – DEPARTEMENT DES TRANSPORTS, DE LEQUIPEMENT ET DE LENVIRONNEMENT DTEE Perspectives.
Solution Athena accès sémantique à linformation MATI Montréal, Avril 2012.
RÉUNION DRAF DU 31 MARS 2009 Mise en place dune démarche dévaluation des GAL LEADER en Rhône Alpes.
UN THESAURUS Pourquoi ? Pour qui ? Comment ?
Activités développées RTP 12 : Information et connaissance : "découvrir et résumer" Actions spécifiques et équipes-projets associées Objectifs thématiques.
Projet de Recherche Nathalie GORMEZANO Directrice générale de l’ISIT
Réunion de lancement du 18 janvier constitution, alignement, comparaison et exploitation d’ontologies géographiques hétérogènes Réunion de lancement.
Human Knowledge La nouvelle génération de moteurs sémantiques.
Arkhênum Patrimoine du Futur. Répartitions par types d’erreurs mineures.
Modèle de conception et de production à la SOFAD Journée d’échange du CLIFAD Trois-Rivières, le 3 décembre 2004 Jean-Simon Labrecque, Chargé de projets.
Recherche d’information
Les épreuves du baccalauréat STG
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
L’APPROCHE PAR LA COMPÉTENCE DU PROGRAMME D’ÉCONOMIE GESTION
Comment élaborer une politique documentaire ?
1 Construction de ressources terminologiques à partir de textes : études de cas Nathalie AUSSENAC-GILLES (CNRS, Toulouse) Didier BOURIGAULT (CNRS, Toulouse)
Le Traitement Automatique des Langues (TAL)
Initiation à des recherches dans le domaine de l’enseignement
But : avoir un regard réflexif sur le métier d’enseignant
D’après une présentation de A. Conti
Le conseil en mobilité Graziana BOSCATO, DCIO Strasbourg
Mémoire de fin d’études
GFU (ABD) INTO INFO (Educate) 28 janvier 1998 De l’auto-formation... l Guides du lecteur et autres fascicules d’aide l Guides informatisés et « help »
Introduction aux Interfaces Homme-Machine
PROPOSITIONS ET PERSPECTIVES DANS LE CHAMP DE LA FORMATION EN SOINS PALLIATIFS PH. COLOMBAT, D. MALLET, R AUBRY POUR LE COMITE DE SUIVI SP.
1 4th International Conference on Arabic Language Processing, May 2–3, 2012, Rabat, Morocco Titre Mohamed El Amine ABDERRAHIM Mohamed Alaedine ABDERRAHIM.
1. La veille scientifique Amener les enseignants à parler de sciences 2.
Transcription de la présentation:

Constitution de produits terminologiques à partir de corpus Présentation de l’Action Spécifique STIC, Corpus et Terminologie (ASSTICCOT) N. Aussenac-Gilles (IRIT), A. Condamines (ERSS) Associée au RTP-DOC (J.M. Salaün), direction Interactions Humaines et Cognition (C. Garbay) www.irit.fr/ASSTICCOT/ ASSTICCOT, CFD,Hammamet, 20-23 octobre 2002

Des applications à base de connaissances autour des documents Des applications qui améliorent l’accès au contenu de documents non identifiés a priori (ex : RI) Des applications qui améliorent l’accès à des documents identifiés (ex : guide de procédure, mémoire d’entreprise) Des applications qui requièrent des ressources terminologiques (ex: aide à la traduction, aide à la rédaction, veille) ASSTICCOT, CFD,Hammamet, 20-23 octobre 2002

Rôle et nature des ressources terminologiques Ressources existantes Sans lien vers les textes (construites par introspection ou entretiens avec des experts) Générales (indépendantes du domaine et/ou de l’application). > peut-on les intégrer dans les applications ? Nouveaux besoins Domaines spécifiques => constituer des ressources terminologiques spécialisées Rôle majeur des documents => construire ces ressources à partir de textes pour mieux tenir compte des usages et rendre plus efficace l’accès aux documents ASSTICCOT, CFD,Hammamet, 20-23 octobre 2002

Documents et connaissances Documents comme possibles sources de connaissances d’un domaine Comment accéder à ces connaissances ? Comment accéder aux documents à travers les connaissances ? Quels produits terminologiques intermédiaires pourraient faciliter cet accès ? > lien avec l’ingénierie des connaissances Documents comme moyens d’accès à des manifestations linguistiques (s’oppose à l’introspection) : mise en œuvre vs enrichissement des connaissance de la langue Documents comme révélateurs d’usages (corpus) > lien avec la linguistique de corpus et la terminologie ASSTICCOT, CFD,Hammamet, 20-23 octobre 2002

Objectifs de l’Action Spécifique Faire se rencontrer plusieurs communautés sur la question de la modélisation de connaissances à partir de corpus : Linguistique de corpus et terminologie Sciences de l’information Informatique Ingénierie des connaissances Recherche d’information Traitement Automatique de la Langue Apprentissage à partir de textes ASSTICCOT, CFD,Hammamet, 20-23 octobre 2002

Mode de fonctionnement Composition Une trentaine de chercheurs issus de différentes disciplines Une dizaine de laboratoires dont DYALANG, LIPN, IRIT et ERSS. 4 groupes Linguistique de corpus et terminologie (M. Bouveret) TAL et apprentissage (P. Zweigenbaum) Sciences de l’information et recherche d’information (S. Lainé-Cruzel) Ingénierie des connaissances (S. Després) Deux types de réunions : travail par groupe (selon une grille de questions commune) séances plénières (mises en commun, confrontations entre disciplines) ASSTICCOT, CFD,Hammamet, 20-23 octobre 2002

ASSTICCOT, CFD,Hammamet, 20-23 octobre 2002 Motivations Des problématiques similaires Vers plus d’interdisciplinarité L’existant : des relations bilatérales L’enjeu : une évaluation systématique des complémentarités Repérer des axes de recherche à développer Valoriser et fédérer les acquis dans un contexte pluridisciplinaire ASSTICCOT, CFD,Hammamet, 20-23 octobre 2002

Exemples de collaborations bilatérales (1) Terminologie textuelle et TAL TAL pour la construction de ressources : Syntex et Caméléon Données terminologiques comme ressources pour le TAL : thésaurus pour traiter des dossiers patients ASSTICCOT, CFD,Hammamet, 20-23 octobre 2002

Exemples de collaborations bilatérales (2) Ontologies et recherche d’information Hiérarchie de termes pour la classification de documents DocCUBE Ontologies pour la reformulation de requêtes Ontologies pour l’interrogation de données semi-structurée PICSEL Terminologie textuelle et outils de TAL pour la construction d’ontologies Index d’un livre, Ontologie de l’ingénierie des connaissances ASSTICCOT, CFD,Hammamet, 20-23 octobre 2002

Expériences pluridisciplinaires Collaboration entre IC, Terminologie Textuelle et TAL : Bénéficie de l’expérience du groupe TIA Collaborations entre RI, IC et Sciences de l’information : réseau Rhône Alpes Passer d’expériences ponctuelles à une théorisation des problèmes et une vraie approche pluridisciplinaire ASSTICCOT, CFD,Hammamet, 20-23 octobre 2002

ASSTICCOT, CFD,Hammamet, 20-23 octobre 2002 Objectifs Mettre au jour et expliciter les méthodes, objectifs et présupposés de chaque discipline Identifier les manques, transferts et convergences possibles Localiser des questions théoriques nouvelles à traiter de manière interdisciplinaire pour rendre plus efficace l’élaboration de ressources terminologiques en fonction des besoins repérer l’impact de ces questions sur chaque discipline ASSTICCOT, CFD,Hammamet, 20-23 octobre 2002

ASSTICCOT, CFD,Hammamet, 20-23 octobre 2002 Questions préalables : objets et produits des recherches de chaque discipline 6 points de réflexion principaux : Positionnements théoriques Rôle des Corpus -> Définition des besoins Définition des méthodes et outils : logiciels de Traitement Automatique de la Langue, d’apprentissage, d’exploration de textes Description des modèles produits ou utilisés Mode d’évaluation des résultats ASSTICCOT, CFD,Hammamet, 20-23 octobre 2002

ASSTICCOT, CFD,Hammamet, 20-23 octobre 2002 Corpus Définition commune L’existant : des textes (ou portions de textes) Le corpus est construit en fonction d’un besoin particulier ou d’une hypothèse d’étude Des réalités différentes Nature et taille critères de construction modes et objectifs d’exploitation ASSTICCOT, CFD,Hammamet, 20-23 octobre 2002

Perspectives d’études sur les corpus Des besoins communs Nécessité de caractériser les textes au delà de leur thématique Meilleure maîtrise du lien entre caractéristiques des textes et nature des applications Prise en compte de la méthode utilisée pour construire des ressources dans la constitution du corpus ASSTICCOT, CFD,Hammamet, 20-23 octobre 2002

ASSTICCOT, CFD,Hammamet, 20-23 octobre 2002 Principes communs La construction de ressources terminologiques est un processus d’interprétation humaine de résultats fournis par des outils Les ressources doivent être spécialisées par domaine et par application (réutilisabilité ?) Les concepts sont élaborés à partir de réalisations textuelles avec lesquelles ils conservent un lien terminologique ASSTICCOT, CFD,Hammamet, 20-23 octobre 2002

Présentation des exposés De la construction de corpus parallèle à l’extraction de terminologies bilingues : les problèmes spécifiques à l’arabe François Stuck Retour d’expérience sur l’utilisation de logiciels de TAL et de principes linguistiques pour la construction d’ontologies Tal, IC et linguistique Corpus et ressources terminologiques : les questions du genre et de la variation Linguistique, terminologie et Sciences de l’info Variation terminologique et corpus ASSTICCOT, CFD,Hammamet, 20-23 octobre 2002