ASSTICCOT, RTP-DOC, Paris

Slides:



Advertisements
Présentations similaires
E6 : Préparation à l’épreuve de PDUC
Advertisements

Hippodamos Samuel GESCHE. 2 Hippodamos : lenjeu initial Cest bien connu : Modélisation de lexpertise Elaboration de théories scientifiques Modélisation.
Sémantique et droit de la Fonction publique une boucle verticale
Constitution de produits terminologiques à partir de corpus
5 décembre 2002TIA - prise en compte de l'application - Assises I31 Prise en compte de lapplication dans la constitution de produits terminologiques Groupe.
Urbanisation de Systèmes d'Information
Recherche-Action-Formation Quelles questions se poser ? Bernadette Charlier BIE 14 juin
Entre construction théorique et mise en œuvre opérationnelle
2002 Compétitif XMiner : Plate-forme de structuration texte libre multi-approches par balisage XML de Tags Actifs Lobjectif du projet est de développer.
1 er décembre 2005Projet ILD&ISTC1 Langues et documents Perspectives.
Mise en œuvre d’une démarche et d’un outil de gestion de « connaissances métier » basés sur la collaboration. Cyril BEYLIER
CS des IREM 12/12/2008 Jacques Douaire
Quelques pistes de réflexion pour le traitement dun thème de convergence.
LA DEMARCHE D’INVESTIGATION AU COLLEGE
Documents investigation
Animation pédagogique – Mars 2010 Mme Sellier / M. Bogart CPC Avion Cycle 2 Découverte du monde Cycle 2 La démarche expérimentale d'investigation.
METHODES ET PRATIQUES SCIENTIFIQUES
Centre Maroco Coréen de Formation en TICE
La prise en compte de lexpérience dans les processus de qualification des personnes Anne-Marie CHARRAUD Dublin 20 octobre 2005.
L’Ingénierie de la Formation Continue Session I : Méthodologie d’élaboration d’un plan de Formation
La RBPP sur l’adaptation à l’emploi Du point de vue de l’Anesm
Démarches : - d’investigation de résolution… de conception - de projet
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
THÈSE Présentée et soutenue publiquement par Jérémie VALENTIN
ANTbox La gestion collaborative de documents et de connaissances Au service dactions de veille.
La démarche « compétences »
INTELLIGENCE COLLECTIVE : RENCONTRES 2006Nîmes mai 2006 CENTRE DE RECHERCHE LGI2P 1- Doctorante Ecole des mines de Paris, 2- Maitre de Conférences.
TPE Les élèves mènent à bien une production originale, concrète et choisie par eux Ils développent des compétences individuelles à travers un travail de.
INFO-MED Réseau d information méditerranéen Problématique La production et la maîtrise des savoirs contribuent aujourdhui à laccroissement des valeurs.
B2i Lycée Circulaire BO n°31 du 29/08/2013.
Epreuve de spécialité pour BAC CFE
Tous les mercredis du 3 octobre au 19 décembre 2012
LES TRAVAUX PERSONNELS ENCADRÉS
Entre construction théorique et mise en œuvre opérationnelle
Présentation du deuxième document daccompagnement Ecole dété de Guidel 2010 Annie Journu.
Yasmina ABBAS EDF - Division Recherche et Développement (Division R&D)
Journée de lancement du Réseau Thématique Pluridisciplinaire 32
Enseignement d’exploration MPS.
Introduction à lutilisation des corpus 1. Quest-ce quun corpus? Alexandra VOLANSCHI
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
RÉUNION DRAF DU 31 MARS 2009 Mise en place dune démarche dévaluation des GAL LEADER en Rhône Alpes.
UN THESAURUS Pourquoi ? Pour qui ? Comment ?
LES TPE EN SCIENCES DE L’INGENIEUR
Le programme du cycle d’orientation
BAC STG 2007 – épreuve de spécialité L’EPREUVE DE SPECIALITE (coeff. 12) 1 EPREUVE ECRITE (4 heures, coeff. 7) 1 EPREUVE PRATIQUE (45 minutes, coeff.
Cous de 2ème cycle (8ème cohorte -2011) Mr. Dris Chennaq
LA DEMARCHE DE RECHERCHE
Sciences de l ’Ingénieur
Comment intégrer les tâches complexes dans le processus d’évaluation des progrès et des acquis des élèves ? Elias Bazah (Technologie) Nadine Billa (Mathématiques)
Recherche d’information
Les épreuves du baccalauréat STG
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
Colloque JOCAIR 2006, Amiens Les forums de discussion en milieu éducatif, Etat de recherches et des questions France Henri, Bernadette Charlier et Daniel.
Titre : LE PROJET Objectifs: › être capable de mener un projet › répondre aux attentes des jurys Durée: 30 min.
Spécialités Gestion et Finance Ressources humaines et communication
C2i niveau 2 « enseignant »
1 Construction de ressources terminologiques à partir de textes : études de cas Nathalie AUSSENAC-GILLES (CNRS, Toulouse) Didier BOURIGAULT (CNRS, Toulouse)
Bac STG:épreuve de spécialité
Initiation à des recherches dans le domaine de l’enseignement
But : avoir un regard réflexif sur le métier d’enseignant
BACCALAUREAT PROFESSIONNEL 3 ANS MICROTECHNIQUES Quelques points clés.
LES CPE ET L’ACCOMPAGNEMENT PERSONNALISE
Synthèse Thème 1 Enseignement des sciences, démarche expérimentale SESAMESMaths, ECCEMaths, Résolution collaborative, EXPRIME.
PROJET : identification et régulation des usages des TIC en lycée Lycée Marseilleveyre/ INRP
Mireille Zwiller - Janvier 2005 Le Management des organisations en Sciences et technologies de la gestion STG Horaire en première et terminale : 1 + (1)
Mémoire de fin d’études
Michel BRETON IEN-ET Académie de LYON
Emmanuelle Alves da Silva
Progressivité des compétences cycle 3 « sciences et technologie »
1. La veille scientifique Amener les enseignants à parler de sciences 2.
Transcription de la présentation:

ASSTICCOT, RTP-DOC, Paris ASSTICCOT : Constitution de produits terminologiques à partir de corpus  N. Aussenac-Gilles (IRIT), A. Condamines (ERSS) www.irit.fr/ASSTICCOT/ De janvier à décembre 2002 Plan Rappels : objectifs initiaux et mode de fonctionnement Méthode de travail Expériences interdisciplinaires Réponses à une grille de réflexion commune Résultats Perspectives 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

Objectifs de l’Action Spécifique Rappels M1/Expériences M2/Questions Résultats Perspectives Objectifs de l’Action Spécifique Faire se rencontrer plusieurs communautés sur la question de la modélisation de connaissances à partir de corpus : Linguistique de corpus et terminologie Sciences de l’information Informatique Ingénierie des connaissances Recherche d’information Traitement Automatique de la Langue Apprentissage à partir de textes 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

ASSTICCOT, RTP-DOC, Paris Rappels M1/Expériences M2/Questions Résultats Perspectives Motivations Des problématiques similaires à mieux identifier Vers plus d’interdisciplinarité L’existant : des relations bilatérales L’enjeu : une évaluation systématique des complémentarités Repérer des axes de recherche à développer Valoriser et fédérer les acquis dans un contexte pluridisciplinaire rendre plus efficace l’élaboration de ressources terminologiques en fonction des besoins repérer l’impact de ces questions sur chaque discipline 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

Mode de fonctionnement Rappels M1/Expériences M2/Questions Résultats Perspectives Mode de fonctionnement Composition Une trentaine de chercheurs issus de différentes disciplines Une dizaine de laboratoires dont DYALANG, LIPN, IRIT et ERSS. 4 groupes Linguistique de corpus et terminologie (M. Bouveret) TAL et apprentissage (P. Zweigenbaum) Sciences de l’information et recherche d’information (S. Lainé-Cruzel) Ingénierie des connaissances (S. Després) Deux types de réunions (6 réunions + 1 prévue) travail par groupe (selon une grille commune de questions) séances plénières (mises en commun, confrontations entre disciplines) Organisation d’un atelier associé à CFD (oct. 2002) 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

ASSTICCOT, RTP-DOC, Paris Rappels M1/Expériences M2/Questions Résultats Perspectives Méthode de travail Partage d’expériences pluridisciplinaires Grille de réflexion commune Exposés de synthèse disciplinaire (non développé dans l’exposé) 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

Exemples de collaborations bilatérales (1) Rappels M1/Expériences M2/Questions Résultats Perspectives Exemples de collaborations bilatérales (1) Terminologie textuelle et TAL TAL pour la construction de ressources : Syntex et Caméléon Données terminologiques comme ressources pour le TAL : thésaurus pour traiter des dossiers patients TAL et RI: Syntex et catégorisation automatique pour la Recherche d’Information 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

Exemples de collaborations bilatérales (2) Rappels M1/Expériences M2/Questions Résultats Perspectives Exemples de collaborations bilatérales (2) Ontologies et recherche d’information Hiérarchie de termes pour la classification de documents DocCUBE Ontologies pour la reformulation de requêtes Ontologies pour l’interrogation de données semi-structurée PICSEL Terminologie textuelle et outils de TAL pour la construction d’ontologies Index d’un livre, Ontologie de l’ingénierie des connaissances 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

Expériences pluridisciplinaires Rappels M1/Expériences M2/Questions Résultats Perspectives Expériences pluridisciplinaires Collaboration entre IC, Terminologie Textuelle et TAL : Bénéficie de l’expérience du groupe TIA (pb de frontière) Collaborations entre RI, IC et Sciences de l’information : réseau Rhône Alpes Passer d’expériences ponctuelles à une théorisation des problèmes et une vraie approche pluridisciplinaire 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

Grille de questions pour une réflexion interdisciplinaire Rappels M1/Expériences M2/Questions Résultats Perspectives Grille de questions pour une réflexion interdisciplinaire Définition des besoins -> Rôle des corpus Positionnements théoriques Définition des méthodes et outils : logiciels de Traitement Automatique de la Langue, d’apprentissage, d’exploration de textes Description des modèles produits ou utilisés Mode d’évaluation des résultats 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

1 - Besoins : Documents et connaissances Rappels M1/Expériences M2/Questions Résultats Perspectives 1 - Besoins : Documents et connaissances Documents et collections de documents comme possibles sources de connaissances d’un domaine Comment accéder à ces connaissances ? Comment accéder aux documents à travers les connaissances ? Quels produits terminologiques intermédiaires pourraient faciliter cet accès ? > problèmes communs à l’ingénierie des connaissances et aux sciences de l’information, recouvrant des problématiques différentes Documents comme moyens d’accès à des manifestations linguistiques (s’oppose à l’introspection) : mise en œuvre vs enrichissement des connaissances de la langue Documents comme révélateurs d’usages (corpus) > lien avec la linguistique de corpus, la terminologie, les sciences de l’information 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

1 - Besoins : Nature des ressources terminologiques Rappels M1/Expériences M2/Questions Résultats Perspectives 1 - Besoins : Nature des ressources terminologiques Ressources existantes Sans lien vers les textes (construites par introspection ou entretiens avec des experts) Générales (indépendantes du domaine et/ou de l’application) Figées dans le temps > peut-on les intégrer dans les applications ? Nouveaux besoins Domaines spécifiques => constituer des ressources terminologiques spécialisées Rôle majeur des documents => construire ces ressources à partir de textes pour mieux tenir compte des usages et rendre plus efficace l’accès aux documents Masse et évolutivité => savoir gérer la cohérence entre documents et ressources 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

Grille de questions pour une réflexion interdisciplinaire Rappels M1/Expériences M2/Questions Résultats Perspectives Grille de questions pour une réflexion interdisciplinaire Définition des besoins Rôle des Corpus -> Positionnements théoriques Définition des méthodes et outils : logiciels de Traitement Automatique de la Langue, d’apprentissage, d’exploration de textes Description des modèles produits ou utilisés Mode d’évaluation des résultats 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

ASSTICCOT, RTP-DOC, Paris Rappels M1/Expériences M2/Questions Résultats Perspectives 2 - Corpus Définition commune L’existant : des textes (ou portions de textes) Le corpus est construit en fonction d’un besoin particulier ou d’une hypothèse d’étude Des réalités différentes Collection, document, corpus Nature et taille critères de construction modes et objectifs d’exploitation 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

2 - Bilan d’étude sur les corpus Rappels M1/Expériences M2/Questions Résultats Perspectives 2 - Bilan d’étude sur les corpus Des besoins communs Nécessité de caractériser les textes au delà de leur thématique (problème des genres textuels) Meilleure maîtrise du lien entre caractéristiques des textes et nature des applications Prise en compte de la méthode utilisée pour construire des ressources dans la constitution du corpus 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

2 - Une étude sur genre textuel et variation des phénomènes langagiers Rappels M1/Expériences M2/Questions Résultats Perspectives 2 - Une étude sur genre textuel et variation des phénomènes langagiers Le genre d’un texte influe sur sa syntaxe, mais aussi sur son lexique Diversité des critères descriptifs : public visé (grand public vs spécialistes : Crise cardiaque / Infarctus du myocarde), statut du locuteur, finalité du discours, … Ex : Productivité des adjectifs dérivés dans des corpus médicaux (hématologie) : les dérivés en –al sont plus productifs dans des documents Web que dans des comptes rendus hospitaliers Une typologie des genres est-elle possible ? Multiplication des situations possibles Classes trop générales Hétérogénéité des genres (ex: écrit vs oral) Plusieurs genres dans un même texte Trop grande diversité des critères descriptifs 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

Grille de questions pour une réflexion interdisciplinaire Rappels M1/Expériences M2/Questions Résultats Perspectives Grille de questions pour une réflexion interdisciplinaire Définition des besoins Rôle des corpus Positionnements théoriques Définition des méthodes et outils : logiciels de Traitement Automatique de la Langue, d’apprentissage, d’exploration de textes Description des modèles produits ou utilisés (ressources et applications) -> Mode d’évaluation des résultats 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

5 – Ressources et applications : Objets de l’étude Rappels M1/Expériences M2/Questions Résultats Perspectives 5 – Ressources et applications : Objets de l’étude S’appuyer sur des études de cas Identifier des points d’impact de l’application visée sur la démarche de construction de ressources terminologiques 1) Profil du « constructeur » 2) Construction du corpus 3) Choix de la structure de données 4) Utilisation des outils de TAL, de fouille de textes 5) Utilisation des outils de modélisation 6) Validation, évaluation Dresser des perspectives pour une meilleure maîtrise et adéquation du processus 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

5 - Résultats sur ressources et applications (1) Rappels M1/Expériences M2/Questions Résultats Perspectives 5 - Résultats sur ressources et applications (1) Il existe des résultats théoriques, des méthodes et des outils, qui aboutissent à des résultats prometteurs. Un cadre unifié, un éventail de pratiques Approche qui rend compte de l’usage spécialisé de la langue Quelle complémentarité avec des ressources existantes (dictionnaires, WordNet) ? Exploitation par les outils (Synoterm) Exploitation par le cogniticien Faut-il replacer ces ontologies dans des cadres de haut niveau ? 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

5 - Résultats sur ressources et applications (2) Rappels M1/Expériences M2/Questions Résultats Perspectives 5 - Résultats sur ressources et applications (2) Efforts à poursuivre Mieux intégrer les différents outils Mieux maîtriser le paramétrage par type de projet Trouver le bon compromis entre investissement et gain L’ontologie formelle n’est pas toujours nécessaire. Trouver le modèle optimal par contexte d’application Anticiper les besoins d’évolution Savoir faire des propositions pragmatiquement acceptables, utilisables dans un objectif d’ingénierie Aller au delà de propositions théoriques et disciplinaires 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

ASSTICCOT, RTP-DOC, Paris Rappels M1/Expériences M2/Questions Résultats Perspectives Résultats Productions Documents par discipline Atelier lors de la conférence CFD2002 Document de synthèse Collaborations bilatérales MoI en vue d’un réseau européen «SemTech» (6 PCRD) Résultats théoriques Théorisation des expériences pluridisciplinaires et situation des points de vue monodisciplinaires Identification de principes communs Perspectives de recherche 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

ASSTICCOT, RTP-DOC, Paris Rappels M1/Expériences M2/Questions Résultats Perspectives Principes communs La construction de ressources terminologiques est un processus d’interprétation humaine de résultats fournis par des outils Les ressources doivent être spécialisées par domaine et par application (réutilisabilité ?) Les concepts sont élaborés à partir de réalisations textuelles avec lesquelles ils conservent un lien terminologique 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

Perspectives scientifiques (1) Rappels M1/Expériences M2/Questions Résultats Perspectives Perspectives scientifiques (1) Problème du genre des textes Définition de critères de caractérisation des textes Objectif de l’utilisation des textes comme un des critères de caractérisation Se donner les moyens de gérer l’évolution des besoins et des ressources (textes, terminologie) Cohérence usages – ressources crées Évolution des besoins 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

Perspectives scientifiques (2) Rappels M1/Expériences M2/Questions Résultats Perspectives Perspectives scientifiques (2) Influence de l’application visée sur la nature des ressources terminologique à constituer Vers une typologie (caractérisation) des applications ? Mieux maîtriser les potentialités des différents types de ressources Prise en compte de la variation par les outils de TAL Intégration d’outils Par rapport au genre textuel : liens entre critères de caractérisation et résultats des outils de TAL Par rapport aux applications visées (accès à l’information, etc.) 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris

ASSTICCOT, RTP-DOC, Paris Rappels M1/Expériences M2/Questions Résultats Perspectives Perspectives de l’AS Equipe projet Livre Justifie demande de prolongation 3 décembre 2002 ASSTICCOT, RTP-DOC, Paris