La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

3 décembre 2002ASSTICCOT, RTP-DOC, Paris1 ASSTICCOT : Constitution de produits terminologiques à partir de corpus N. Aussenac-Gilles (IRIT), A. Condamines.

Présentations similaires


Présentation au sujet: "3 décembre 2002ASSTICCOT, RTP-DOC, Paris1 ASSTICCOT : Constitution de produits terminologiques à partir de corpus N. Aussenac-Gilles (IRIT), A. Condamines."— Transcription de la présentation:

1 3 décembre 2002ASSTICCOT, RTP-DOC, Paris1 ASSTICCOT : Constitution de produits terminologiques à partir de corpus N. Aussenac-Gilles (IRIT), A. Condamines (ERSS) De janvier à décembre 2002 Plan Rappels : objectifs initiaux et mode de fonctionnement Méthode de travail Expériences interdisciplinaires Réponses à une grille de réflexion commune Résultats Perspectives

2 3 décembre 2002ASSTICCOT, RTP-DOC, Paris2 Objectifs de lAction Spécifique Faire se rencontrer plusieurs communautés sur la question de la modélisation de connaissances à partir de corpus : Linguistique de corpus et terminologie Sciences de linformation Informatique Ingénierie des connaissances Recherche dinformation Traitement Automatique de la Langue Apprentissage à partir de textes Rappels PerspectivesM2/QuestionsRésultatsM1/Expériences

3 3 décembre 2002ASSTICCOT, RTP-DOC, Paris3 Motivations Des problématiques similaires à mieux identifier Vers plus dinterdisciplinarité –Lexistant : des relations bilatérales –Lenjeu : une évaluation systématique des complémentarités Repérer des axes de recherche à développer Valoriser et fédérer les acquis dans un contexte pluridisciplinaire –rendre plus efficace lélaboration de ressources terminologiques en fonction des besoins –repérer limpact de ces questions sur chaque discipline Rappels PerspectivesM2/QuestionsRésultatsM1/Expériences

4 3 décembre 2002ASSTICCOT, RTP-DOC, Paris4 Mode de fonctionnement Composition –Une trentaine de chercheurs issus de différentes disciplines –Une dizaine de laboratoires dont DYALANG, LIPN, IRIT et ERSS. 4 groupes –Linguistique de corpus et terminologie (M. Bouveret) –TAL et apprentissage (P. Zweigenbaum) –Sciences de linformation et recherche dinformation (S. Lainé-Cruzel) –Ingénierie des connaissances (S. Després) Deux types de réunions (6 réunions + 1 prévue) –travail par groupe (selon une grille commune de questions) –séances plénières (mises en commun, confrontations entre disciplines) Organisation dun atelier associé à CFD (oct. 2002) Rappels PerspectivesM2/QuestionsRésultatsM1/Expériences

5 3 décembre 2002ASSTICCOT, RTP-DOC, Paris5 Méthode de travail 1.Partage dexpériences pluridisciplinaires 2.Grille de réflexion commune 3.Exposés de synthèse disciplinaire (non développé dans lexposé) RappelsPerspectives M2/Questions Résultats M1/Expériences

6 3 décembre 2002ASSTICCOT, RTP-DOC, Paris6 Exemples de collaborations bilatérales (1) Terminologie textuelle et TAL –TAL pour la construction de ressources : Syntex et Caméléon –Données terminologiques comme ressources pour le TAL : thésaurus pour traiter des dossiers patients –TAL et RI: Syntex et catégorisation automatique pour la Recherche dInformation RappelsPerspectivesM2/QuestionsRésultats M1/Expériences

7 3 décembre 2002ASSTICCOT, RTP-DOC, Paris7 Exemples de collaborations bilatérales (2) Ontologies et recherche dinformation –Hiérarchie de termes pour la classification de documents DocCUBE –Ontologies pour la reformulation de requêtes –Ontologies pour linterrogation de données semi- structurée PICSEL Terminologie textuelle et outils de TAL pour la construction dontologies –Index dun livre, Ontologie de lingénierie des connaissances RappelsPerspectivesM2/QuestionsRésultats M1/Expériences

8 3 décembre 2002ASSTICCOT, RTP-DOC, Paris8 Expériences pluridisciplinaires Collaboration entre IC, Terminologie Textuelle et TAL : –Bénéficie de lexpérience du groupe TIA (pb de frontière) Collaborations entre RI, IC et Sciences de linformation : réseau Rhône Alpes Passer dexpériences ponctuelles à une théorisation des problèmes et une vraie approche pluridisciplinaire RappelsPerspectivesM2/QuestionsRésultats M1/Expériences

9 3 décembre 2002ASSTICCOT, RTP-DOC, Paris9 Grille de questions pour une réflexion interdisciplinaire 1.Définition des besoins -> 2.Rôle des corpus 3.Positionnements théoriques 4.Définition des méthodes et outils : logiciels de Traitement Automatique de la Langue, dapprentissage, dexploration de textes 5.Description des modèles produits ou utilisés 6.Mode dévaluation des résultats RappelsPerspectivesRésultats M2/Questions M1/Expériences

10 3 décembre 2002ASSTICCOT, RTP-DOC, Paris Besoins : Documents et connaissances Documents et collections de documents comme possibles sources de connaissances dun domaine –Comment accéder à ces connaissances ? –Comment accéder aux documents à travers les connaissances ? –Quels produits terminologiques intermédiaires pourraient faciliter cet accès ? –> problèmes communs à lingénierie des connaissances et aux sciences de linformation, recouvrant des problématiques différentes Documents comme moyens daccès à des manifestations linguistiques (soppose à lintrospection) : mise en œuvre vs enrichissement des connaissances de la langue –Documents comme révélateurs dusages (corpus) –> lien avec la linguistique de corpus, la terminologie, les sciences de linformation RappelsPerspectivesRésultats M2/Questions M1/Expériences

11 3 décembre 2002ASSTICCOT, RTP-DOC, Paris Besoins : Nature des ressources terminologiques Ressources existantes –Sans lien vers les textes (construites par introspection ou entretiens avec des experts) –Générales (indépendantes du domaine et/ou de lapplication) –Figées dans le temps > peut-on les intégrer dans les applications ? Nouveaux besoins –Domaines spécifiques => constituer des ressources terminologiques spécialisées –Rôle majeur des documents => construire ces ressources à partir de textes pour mieux tenir compte des usages et rendre plus efficace laccès aux documents –Masse et évolutivité => savoir gérer la cohérence entre documents et ressources RappelsPerspectivesRésultats M2/Questions M1/Expériences

12 3 décembre 2002ASSTICCOT, RTP-DOC, Paris12 Grille de questions pour une réflexion interdisciplinaire 1.Définition des besoins 2.Rôle des Corpus -> 3.Positionnements théoriques 4.Définition des méthodes et outils : logiciels de Traitement Automatique de la Langue, dapprentissage, dexploration de textes 5.Description des modèles produits ou utilisés 6.Mode dévaluation des résultats RappelsPerspectivesRésultats M2/Questions M1/Expériences

13 3 décembre 2002ASSTICCOT, RTP-DOC, Paris Corpus Définition commune –Lexistant : des textes (ou portions de textes) –Le corpus est construit en fonction dun besoin particulier ou dune hypothèse détude Des réalités différentes –Collection, document, corpus –Nature et taille –critères de construction –modes et objectifs dexploitation RappelsPerspectivesRésultats M2/Questions M1/Expériences

14 3 décembre 2002ASSTICCOT, RTP-DOC, Paris Bilan détude sur les corpus Des besoins communs –Nécessité de caractériser les textes au delà de leur thématique (problème des genres textuels) –Meilleure maîtrise du lien entre caractéristiques des textes et nature des applications –Prise en compte de la méthode utilisée pour construire des ressources dans la constitution du corpus RappelsPerspectivesRésultats M2/Questions M1/Expériences

15 3 décembre 2002ASSTICCOT, RTP-DOC, Paris Une étude sur genre textuel et variation des phénomènes langagiers Le genre dun texte influe sur sa syntaxe, mais aussi sur son lexique Diversité des critères descriptifs : public visé (grand public vs spécialistes : Crise cardiaque / Infarctus du myocarde), statut du locuteur, finalité du discours, … Ex : Productivité des adjectifs dérivés dans des corpus médicaux (hématologie) : les dérivés en –al sont plus productifs dans des documents Web que dans des comptes rendus hospitaliers Une typologie des genres est-elle possible ? Multiplication des situations possibles Classes trop générales Hétérogénéité des genres (ex: écrit vs oral) Plusieurs genres dans un même texte Trop grande diversité des critères descriptifs RappelsPerspectivesRésultats M2/Questions M1/Expériences

16 3 décembre 2002ASSTICCOT, RTP-DOC, Paris16 Grille de questions pour une réflexion interdisciplinaire 1.Définition des besoins 2.Rôle des corpus 3.Positionnements théoriques 4.Définition des méthodes et outils : logiciels de Traitement Automatique de la Langue, dapprentissage, dexploration de textes 5.Description des modèles produits ou utilisés (ressources et applications) -> 6.Mode dévaluation des résultats RappelsPerspectivesRésultats M2/Questions M1/Expériences

17 3 décembre 2002ASSTICCOT, RTP-DOC, Paris17 5 – Ressources et applications : Objets de létude Sappuyer sur des études de cas Identifier des points dimpact de lapplication visée sur la démarche de construction de ressources terminologiques 1) Profil du « constructeur » 2) Construction du corpus 3) Choix de la structure de données 4) Utilisation des outils de TAL, de fouille de textes 5) Utilisation des outils de modélisation 6) Validation, évaluation Dresser des perspectives pour une meilleure maîtrise et adéquation du processus RappelsPerspectivesRésultats M2/Questions M1/Expériences

18 3 décembre 2002ASSTICCOT, RTP-DOC, Paris Résultats sur ressources et applications (1) Il existe des résultats théoriques, des méthodes et des outils, qui aboutissent à des résultats prometteurs. Un cadre unifié, un éventail de pratiques Approche qui rend compte de lusage spécialisé de la langue –Quelle complémentarité avec des ressources existantes (dictionnaires, WordNet) ? Exploitation par les outils (Synoterm) Exploitation par le cogniticien –Faut-il replacer ces ontologies dans des cadres de haut niveau ? RappelsPerspectivesRésultats M2/Questions M1/Expériences

19 3 décembre 2002ASSTICCOT, RTP-DOC, Paris Résultats sur ressources et applications (2) Efforts à poursuivre –Mieux intégrer les différents outils –Mieux maîtriser le paramétrage par type de projet Trouver le bon compromis entre investissement et gain –Lontologie formelle nest pas toujours nécessaire. –Trouver le modèle optimal par contexte dapplication –Anticiper les besoins dévolution Savoir faire des propositions pragmatiquement acceptables, utilisables dans un objectif dingénierie –Aller au delà de propositions théoriques et disciplinaires RappelsPerspectivesRésultats M2/Questions M1/Expériences

20 3 décembre 2002ASSTICCOT, RTP-DOC, Paris20 Résultats Productions –Documents par discipline –Atelier lors de la conférence CFD2002 –Document de synthèse –Collaborations bilatérales –MoI en vue dun réseau européen «SemTech» (6 PCRD) Résultats théoriques –Théorisation des expériences pluridisciplinaires et situation des points de vue monodisciplinaires –Identification de principes communs –Perspectives de recherche RappelsPerspectives Résultats M2/QuestionsM1/Expériences

21 3 décembre 2002ASSTICCOT, RTP-DOC, Paris21 Principes communs La construction de ressources terminologiques est un processus dinterprétation humaine de résultats fournis par des outils Les ressources doivent être spécialisées par domaine et par application (réutilisabilité ?) Les concepts sont élaborés à partir de réalisations textuelles avec lesquelles ils conservent un lien terminologique RappelsPerspectives Résultats M2/QuestionsM1/Expériences

22 3 décembre 2002ASSTICCOT, RTP-DOC, Paris22 Perspectives scientifiques (1) Problème du genre des textes –Définition de critères de caractérisation des textes –Objectif de lutilisation des textes comme un des critères de caractérisation Se donner les moyens de gérer lévolution des besoins et des ressources (textes, terminologie) –Cohérence usages – ressources crées –Évolution des besoins Rappels Perspectives RésultatsM2/QuestionsM1/Expériences

23 3 décembre 2002ASSTICCOT, RTP-DOC, Paris23 Perspectives scientifiques (2) Influence de lapplication visée sur la nature des ressources terminologique à constituer –Vers une typologie (caractérisation) des applications ? –Mieux maîtriser les potentialités des différents types de ressources Prise en compte de la variation par les outils de TAL –Intégration doutils –Par rapport au genre textuel : liens entre critères de caractérisation et résultats des outils de TAL –Par rapport aux applications visées (accès à linformation, etc.) Rappels Perspectives RésultatsM2/QuestionsM1/Expériences

24 3 décembre 2002ASSTICCOT, RTP-DOC, Paris24 Perspectives de lAS Equipe projet Livre Justifie demande de prolongation Rappels Perspectives RésultatsM2/QuestionsM1/Expériences


Télécharger ppt "3 décembre 2002ASSTICCOT, RTP-DOC, Paris1 ASSTICCOT : Constitution de produits terminologiques à partir de corpus N. Aussenac-Gilles (IRIT), A. Condamines."

Présentations similaires


Annonces Google