Equipe-projet « TAL» « Traitement Algorithmique du Langage »

Slides:



Advertisements
Présentations similaires
GDRMACS Objectifs thématiques et Structuration
Advertisements

POUR SOUTENIR LA MISSION DES CÉGEPS… IL FAUT INVESTIR DANS LENSEIGNEMENT.
La formation intellectuelle par l’apprentissage par problèmes
Organisation médicale Cadre Universitaire pour les formations de santé Professeur Jean Pierre FARCET XIes Assises – Lille – 11 & 12 décembre 2008.
Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.
Département Informatique Responsable :M. Huchard Responsables adjoints : A. Jean-Marie, F. Koriche, P. Séébold.
Département XYZ Equipe-projet « Acronyme » (insérer une image appropriée) « intitulé complet » Responsable : Y. Azerty.
Olivier Bournez Professeur à l’Ecole Polytechnique
AXES DENGAGEMENT EN PEDAGOGIE DES SCIENCES DE LA SANTE Plusieurs voies non exclusives : - clinique - académique - scientifique - institutionnelle Plusieurs.
UNIVERSITÉ PARIS 3 ─ SORBONNE NOUVELLE
École doctorale CLESCO
Dalila CHIADMIIFISI TIC et le développement de la recherche scientifique Revue scientifique : le modèle du libre accès Dalila Chiadmi.
1 DISIC Option Systèmes Intelligents / Données, Documents et Connaissances DISIC Option Systèmes Intelligents / Données, Documents et Connaissances.
TRAITEMENT AUTOMATIQUE DES LANGUES : LES PRINCIPAUX PROGRAMMES
SYSTRAN Un outil du TAL Victoria AUPERT Marjorie LORSUNG.
Les outils du TAL Par RIGAUD Anaïs RALLIER Armelle SANTIAGO Gwendoline
Par Aline Mahot et Charlyne Routier
OLST — Université de Montréal
EQUIPE TaToo Extraction de connaissances dans les bases de données : motifs séquentiels et ontologie LIRMM - CNRS - Université Montpellier II.
LES METIERS ET LES DOMAINES DE LA RECHERCHE
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
INTELLIGENCE COLLECTIVE : RENCONTRES 2006Nîmes mai 2006 CENTRE DE RECHERCHE LGI2P 1- Doctorante Ecole des mines de Paris, 2- Maitre de Conférences.
Analyses des situations didactiques
TOULOUSE Juin 2009 Recherche et sécurité des soins Perspectives nationales M. Sfez - SoFGRES.
Traducteur Technique en Interne Christophe Jovelin DESS ILTS 2005
Reconnaissance Vocale
Introduction à la littérature scientifique
Date / references Systèmes Terre et Interarmées Projet OUTILEX Rapport détude final Octobre 2006.
Le Sémiographe Outil générique pour effectuer des opérations texte sens texte ou texte sens actions
«Du projet de thèse au "métier" de doctorant-e»
la maîtrise de la langue française Inspection Pédagogique Régionale
1 er décembre 2005IFT6010 – Jean-Yves Guyomarc’h Colorless green ideas…. Une « guerre de religion »
UN THESAURUS Pourquoi ? Pour qui ? Comment ?
Soutenance de stage 16 Mai au 5 Août 2011
Activités développées RTP 12 : Information et connaissance : "découvrir et résumer" Actions spécifiques et équipes-projets associées Objectifs thématiques.
Approches Formelles en Systèmes d'information
Préambule Le présent document a pour objectif d'aider et d'aiguiller tous les porteurs de projets dans la réalisation et la conception d'une présentation.
Praxiling – UMR Université de Montpellier 3 - CNRS Sciences du langage. Moujahed AL SABRI NEDEP juin 2009 Evaluation d’un support numérique.
LINGUISTIQUE APPLIQUÉE À L’ENSEIGNEMENT-APPRENTISSAGE DU FRANÇAIS
Thomas LOPEZ - Equipe BUNRAKU Candidature au monitorat INSA– Vendredi 10 Octobre 2008.
Master 2 COGNITION LANGAGE EMOTIONS, Spécialité CLE Responsable : Pr.F.Labrell Laboratoire d’adossement : CLEA (Cognition, Langage, Emotions et Acquisitions)
MENTION : Physique SPÉCIALITÉ : M odélisation, S imulation et A pplications de la P hysique Elle se décline au quotidien pour améliorer notre vie et notre.
Préambule PRESENTATION F R1.03-V1
Recherche d’information
A-t-on besoin des psychologues pour concevoir des environnements d’apprentissage ? Pr. Patrick Mendelsohn TECFA Faculté de Psychologie et des Sciences.
1 Deux exemples de management (et d’organisation) de la recherche : le CNRS et l’INRIA Club EEA, Tours, 13 mai 2009.
UMR CNRS 6181 LM2P2 Mécanique, Modélisation et Procédés Propres
Projet de Laboratoire d’Excellence Sciences de la Décision.
Groupe XXX Bilan Tourniquet Section novembre 2013
SCI6304 – Bibliométrie et communication savante Cours 1 Introduction
( ) Collège de Maisonneuve
Période 2 Séance 61 Les icones dans les environnements informatiques standardis é s Daniel Peraya M. Viera, M. Acosta TECFA Universit é.
Le Traitement Automatique des Langues (TAL)
Informatique et Sciences du Numérique
L'évaluation bibliométrique des départements des universités du G13
Ministère de l’Enseignement Supérieur et de la Recherche Scientifique
1 Colloque 2002 de l’OCCOPPQ Le professionnalisme au cœur de nos pratiques Recherche et intervention: un couple à redéfinir Pierre Potvin, Ph.D., psychoéducateur.
Consolidation de grands réseaux lexicaux
Conférences (CR) PACLING'03 Pacific Association for Computational LINGuistics 22 au 25 août 2003 Halifax, côte Est Canada RANLP Recent Advances in Natural.
"Au delà des mots : les langues au service des sciences»
Sigle : PA-CLC Financement : AUF-BOA
Sciences du langage et de la communication Responsable du pilier : Corinne Rossari Professeure de linguistique française Présentation : Tobias von Waldkirch.
Bilan du cours Information Spécialisée M1 RETIC. Objectifs du cours (annoncés) Acquérir une culture informationnelle en SIC ; Acquérir une culture informationnelle.
Proposition d’un cadre de projet pédagogique en EPS
PROPOSITIONS ET PERSPECTIVES DANS LE CHAMP DE LA FORMATION EN SOINS PALLIATIFS PH. COLOMBAT, D. MALLET, R AUBRY POUR LE COMITE DE SUIVI SP.
Modélisation des Actions Mécaniques Première sti2d
Deux types de structures d’édition scientifique 1. Publications de la Sorbonne = maison d’édition universitaire - Structure autonome, placée sous la tutelle.
Transmodalité – Multimodalité Fabrice Maurel IRIT – Toulouse Directeur : Luis Fariñas Del Cerro Équipe DIAMANT – Nadine Vigouroux Concours CNRS CR
Groupe TICE Directions de travail –Analyse de ressources et d’usages des TICE par élèves et enseignants, –Conception d’ingénieries et développement.
1 4th International Conference on Arabic Language Processing, May 2–3, 2012, Rabat, Morocco Titre Mohamed El Amine ABDERRAHIM Mohamed Alaedine ABDERRAHIM.
Transcription de la présentation:

Equipe-projet « TAL» « Traitement Algorithmique du Langage » Département Informatique Equipe-projet « TAL» *with courtesy of the National Institute of Health (USA) « Traitement Algorithmique du Langage » Responsable : Violaine Prince

TAL : présentation 2 PR, 2 MCF LIRMM > Equipe-projet > TAL> présentation Composition Enseignants-chercheurs 4 Chercheurs -> Soit équivalent temps plein 2 HDR Doctorants 3 Post-docs Invités Autres (associés) Commentaires 2 PR, 2 MCF Un PR émérite 3 doctorants (en cours) 1 thèse soutenue Pluridisciplinaire : informatique, mathématiques et linguistique Mots-clés Syntaxe, sémantique, pragmatique et dialogue

Objectifs Etendre les modèles fondamentaux du TAL en : LIRMM > Equipe-projet > TAL> objectifs Etendre les modèles fondamentaux du TAL en : Syntaxe Sémantique Pragmatique du dialogue Valider les avancées théoriques par des applications en : Traduction automatique Vérification grammaticale Classification automatique de textes Bases de connaissances lexicales mono et multilingues…

Contributions (1/19) LIRMM > Equipe-projet > TAL > contributions

Contributions (2/19) LIRMM > Equipe-projet > TAL > contributions

Contributions (3/19) LIRMM > Equipe-projet > TAL > contributions

Contributions (4/19) LIRMM > Equipe-projet > TAL > contributions

Contributions (5/19) Jacques Chauché LIRMM > Equipe-projet > TAL > contributions Jacques Chauché PR UM2 , UFR des Sciences, recrutement :1990 Carrière : PR depuis 1976 Directeur de l’IUT du Havre(1984-1989) Président de la CSE 27e section de l’UM 2 de 1996 à 2004 Réalisations logicielles SYGMART (sous licence) SYGFRAN (analyseur du Français)

Contributions (6/19) Contribution majeure à l’analyse syntaxique LIRMM > Equipe-projet > TAL > contributions Contribution majeure à l’analyse syntaxique Algorithmes de réécriture de Markov appliqués aux transducteurs d’arbres syntaxiques Caractéristiques de l’analyseur SYGFRAN: Plus de 12 000 règles. algorithme sous contexte. Complexité : knlogn. environ 35 % d’analyse complète et correcte d’un texte tout venant (en constituants et dépendances) Campagnes d’évaluation EASY (2005) DEFT (2005) Analyse syntaxique associée à une représentation sémantique

Contributions (7/19) LIRMM > Equipe-projet > TAL > contributions Contribution à la modélisation sémantique: vecteurs sémantiques (1990) Associer un champ sémantique à chaque terme de la structure syntaxique Produire une représentations des idées contenues dans la phrase puis le discours Tenir compte des fonctions syntaxiques : « compte rendu » est différent de « rendu compte » « Le calcul du sens » vs « Le sens du calcul »

Contributions (8/19) Mathieu Lafourcade LIRMM > Equipe-projet > TAL > contributions Mathieu Lafourcade MCF UM2 , UFR des Sciences, recrutement :1997 Carrière : MCF depuis 1997 Coopération Internationale : Coopération avec la Malaisie - Universiti Sains Malaisia – à Penang Coopération avec la Thailande – Université Chulalongkorn et Kasetsat Projets PAPILLON et UNL (Asie du Sud-Est)

Contributions (9/19) LIRMM > Equipe-projet > TAL > contributions Contribution à la modélisation sémantique: vecteurs conceptuels (1999) Acquisition automatique de vecteurs conceptuels Apprentissage en boucle Contextualisation forte et faible Structuration terminologique Fonctions lexicales (avec D. Schwab) Synonymie relative et Hyperonymie (avec V. Prince) Notion d’horizon conceptuel

Contributions (10/19) LIRMM > Equipe-projet > TAL > contributions Contribution à l’analyse sémantique: algorithme à fourmis multi-caste PH GV GN GN avocat mange une glace le glace/eau avocat/loi manger glace/sorbet avocat/fruit hyper agent patient personne avocat/loi hypo glace/sorbet personne agent manger nourriture hypo

Contributions (11/19) Anne Preller PR Emérite UM3 depuis 2000 LIRMM > Equipe-projet > TAL > contributions Anne Preller PR Emérite UM3 depuis 2000 Carrière : PR de 1970 à 2000 25ème puis 27ème section CNU Travaux en logique et théorie des catégories Investissement théorique fort en TALN « Reconversion » très marquée vers le TALN depuis 3 ans : grand nombre de publications en revue dans le domaine Spécialiste de la théorie des prégroupes de Lambek et de leur application au TALN

Contributions (12/19) Travaux autour de la syntaxe du langage naturel LIRMM > Equipe-projet > TAL > contributions Travaux autour de la syntaxe du langage naturel (encadrement thèse Sylvain Degeilh) Application à plusieurs langues Français : Degeilh S., A. Preller, Efficiency of pregroups and the French nounphrase, Journal of Language, Logic and Information, Vol 14, Number 4, pp. 423-444, Springer, 2005 Allemand :J. Lambek, A. Preller, An algebraic approach to the German sentence, Linguistic Analysis, Vol.31, pp. 270-290, 2004 Anglais : A. Preller, Linear Processing of Coordinate Structures in Pregroup GrammarCG'04: 7th Conference on Categorial Grammars, Montpellier (France), June 2004, pp. 210-2

Contributions (13/19) Travaux théoriques introducteurs LIRMM > Equipe-projet > TAL > contributions Travaux théoriques introducteurs Aux propriétés des grammaires de prégroupes A. Preller, Category Theoretical Semantics for Pregroup Grammars, Blache and Stabler (Eds.): LACL 2005, LNAI 3492, pp. 254-270, Springer, 2005 Aux propriétés algébriques des 2-catégories A. Preller, J. Lambek, Free compact 2-categories, accepted October 2005 by Mathematical Structures for Computer Sciences, Cambridge University Press

Contributions (14/19) Violaine Prince LIRMM > Equipe-projet > TAL > contributions Violaine Prince PR UM2, UFR des Sciences, recrutement : 2000 Carrière : PR depuis 1994 Présidente du CNU 27eme section (1999) Directrice du département informatique (enseignement) de l’UFR des sciences depuis 2003 Valorisation scientifique Présidence de comité de programme de plusieurs conférences (NîmesTIC2002,CMMR2003, Categorial Grammars 2004, DEFT 2005, etc.) Co-direction d’une EPML du RTP 14 « sémantique dynamique »

Contributions (15/19) Travaux théoriques : LIRMM > Equipe-projet > TAL > contributions Travaux théoriques : IA et TALN (modèles sémantiques lexicaux) : Synonymie Hyperonymie Polysémie Pragmatique et dialogue :Théorie des rôles fonctionnels Agents cognitifs naturels et artificiels Conceptualisation des messages (« knowledge chunk »)

Contributions (16/19) LIRMM > Equipe-projet > TAL > contributions Travaux applicatifs induisant des extensions théoriques: Théorie de la divergence : Prototype de traduction automatique (SYGFtoE) Théorie de l’effacement : contraction de textes préservant la cohérence grammaticale (thèse Mehdi Yousfi-Monod) Théorie des prégroupes : k- linéarité des algorithmes de vérification grammaticale utilisable dans l’enseignement des langues secondes (Anne Preller)

Contributions (17/19) Mathieu Roche LIRMM > Equipe-projet > TAL > contributions Mathieu Roche MCF UM2, UFR des Sciences, recrutement : 2005 Carrière : MCF depuis 2005 2001-2005 : Allocataire-Moniteur et ATER à l'Université Paris - Sud Valorisation scientifique Création et organisation avec J. Azé (LRI) de DEFT'05 et DEFT'06 (DEfi fouille de Textes) Intersection thématique Apprentissage (IA) et TALN

Contributions (18/19) Travaux sur la terminologie: LIRMM > Equipe-projet > TAL > contributions Travaux sur la terminologie: Extraction des collocations : associations syntagmatiques, restreintes, semi-figées et fortement dépendantes du contexte d'utilisation. Méthode mixte : linguistique et statistique [Roche, Thèse au LRI, 2004 ; etc.] Processus d'apprentissage supervisé [Roche et al., ROCAI'04 ; Azé et al., ASMDA'05 ; etc.] Études sur l'évaluation de la terminologie : Numérique [Roche et Kodratoff, EGC'06] Qualitative [Roche et Prince, TALN'06 (soumis)]

Contributions (19/19) LIRMM > Equipe-projet > TAL > contributions Connaissances syntaxiques et méthodes statistiques Étude relative à l'ajout de connaissances syntaxiques (avec SYGMART) à des méthodes statistiques de classification [Roche et Chauché, FDC'06] Étude des gloses (commentaires dans les textes expliquant le sens des termes) en collaboration avec Augusta Mela (MdC, Montpellier 3) [Mela et Roche, CALS'06 (soumis)]

Positionnement Local National International LIRMM > Equipe-projet > TAL> positionnement Local Seule équipe TALN en Languedoc Roussillon En étroite liaison avec les équipes en PACA (LIA, Aix-Marseille) National RTP 14 (Dialogue) Communauté syntaxe (EVALDA) Fouille de texte (DEFT) International Principales collaborations avec l’Asie du Sud-Est

Audience internationale Valorisation (1/3) LIRMM > Equipe-projet > TAL > valorisation Production scientifique (2002-2005) 2002 2003 2004 2005 Total Thèses soutenues 1 HDR Brevets Audience internationale Audience nationale 2002 2003 2004 2005 Total Livres Chapitres d’ouvrages 1 Edition d’ouvrages Revues avec comité de lecture 2 4 8 Conférences : actes et comité de lecture 6 7 27 9 Conférences invitées Autres conférences

Valorisation (2/3) Faits marquants Transfert Vulgarisation Rayonnement LIRMM > Equipe-projet > TAL > valorisation Faits marquants Organisation de conférence internationale (Categorial grammars 2004) Campagnes d’évaluation : EASY, DEFT Transfert Projet SPRINT Makkina News ZENVIA (Languedoc Roussillon Incubateur) NOUT (Languedoc Roussillon Incubateur) Vulgarisation L’IA et le langage naturel Rayonnement Nombreux comités de lecture de congrès et de revue Edition de numéro spécial de revue

Valorisation (3/3) Implication dans les institutions (EPST) LIRMM > Equipe-projet >TAL> valorisation Implication dans les institutions (EPST) Direction adjointe de département LIRMM (2002-2003) Présidence de la CSE 27ème section Direction du département d’enseignement (800 étudiants propres, 300 étudiants dans des parcours communs avec d’autres disciplines) 2003-2006 Présence dans les conseils Implication dans les structures régionales de transfert scientifique Pôle TIIM Conseil d’Orientation Scientifique et Technique sur l’Innovation en région Languedoc Roussillon

Prospective (1/5) Avancées scientifiques LIRMM > Equipe-projet > TAL > prospective Avancées scientifiques Evaluation de l’efficacité à grande échelle des grammaires à transduction d’arbre Validation théorique sur le problème difficile de la traduction VS méthodes statistiques lexicales par expérimentation en: Segmentation thématique automatisée Classification de documents Autres types de fouille de textes Objectifs : Analyse totalement correcte (en constituants et dépendances) à 50% sur du tout venant Prototype de traduction autour de 2000 règles, robuste, évaluable

Prospective (2/5) Avancées scientifiques LIRMM > Equipe-projet > TAL > prospective Avancées scientifiques Approfondissement de l’utilisation de la théorie des prégroupes en TALN Généralisation à des constituants de grande taille Etude de la sémantique Travaux pluridisciplinaires autour du dialogue (lien IA, Cognition et TALN) Modélisation sémantique Treillis de Galois et Thésaurus Larousse : modélisation et étude des zones de grande densité lexicale (avec l’équipe DOC)

Prospective (3/5) Forte implication dans les applications du TALN LIRMM > Equipe-projet > TAL > prospective Forte implication dans les applications du TALN Grandes masses de données (ANR FORUM) Collaboration avec le projet IDC Résumé automatique Bases de connaissances multilingues Recherche d’information avancée Ontologies et modélisation (projet France Telecom) Collaboration avec l’équipe DOC

Prospective (4/5) un projet TAL en informatique à Montpellier : TAL: SDL Situation 2002-2005 TAL: INFO

Prospective (5/5) Voilà ce que nous ambitionnons sur le plan du rayonnement TAL: SDL Objectifs 2006-2009 TAL: INFO

Conclusion L’équipe TAL est une petite structure qui a de grandes ambitions. Constituée effectivement durant le dernier quadriennal (2002-2005), elle a réussi son démarrage en tant qu’équipe et a fait preuve d’un grand dynamisme (valorisation, production scientifique, rayonnement). Bien que numériquement modeste, elle touche de nombreux domaines du TALN en raison de la polyvalence de ses membres. Elle est très bien insérée dans son département où elle collabore activement avec plusieurs autres équipes. Elle se définit à la fois par des préoccupations théoriques majeures et un souci constant de validation expérimentale et d’évaluation par des procédures externes (campagnes). contact : prince@lirmm.fr