Consolidation de grands réseaux lexicaux

Slides:



Advertisements
Présentations similaires
QUALIFICATION COMPORTEMENTALE DES BASES DE DONNEES CLIENTS
Advertisements

Action Innovante: Maison Intelligente
OPIR & SES OUTILS Mme Annick Weizman, Adjointe scientifique
Réunion Comité Exécutif Réseau Bilan Professeur Référent Français 18 septembre 2012.
Indexation vidéo Indexation multimédia
UML - Présentation.
Les méthodes formelles en ingénierie des connaissances Damien Lhomme-Desages Jérémie Barlet.
Understanding, building and using ontologies. Understanding Ontologie : la définition des concepts utilisés dans un langage donné Première approche (Gruber)
Analyse et structuration thématiques
1 Premier bilan de l utilisation de LinguaStream pour le rep é rage de la coh é sion nom-verbe Yu-Ting HUANG UE TAL Le 10/01/2006.
Continuité des apprentissages Ecole-Collège mars 2008 J Borréani IA-IPR mathématiques.
Directeur de thèse : Régine André-Obrecht
ETAPES DE LA RECHERCHE DOCUMENTAIRE
Reconnaissance et validation en Pologne
La compréhension en lecture, J. Giasson
Université de Franche-Comté, France
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
ARC RAPSODIS Reconnaissance Automatique de la Parole Suivie et Orientée par Des Informations Syntaxico-Sémantiques PAROLE – METISS – TALARIS – TEXMEX –
L’observation réfléchie de la langue au cycle 3
Les Systèmes Experts I.A. Session 2009/2010
Etude des Technologies du Web services
Des ressources pour l'enseignement en langue des signes aux élèves sourds Patrice DALLE • IRIT-UPS (Toulouse 3) •
Opportunités de contribution au projet ISICIL
DURIBREUX, Michèle & COCQUEBERT & HOURIEZ, Bernard,
LOST en France : les projets en cours – avril LOST en France : les projets et activités en cours Chris Roth Responsable du pôle indicateurs et études.
Modèle, Méthode et Conception
Le langage oral en maternelle
OIL & UPML DREVET - HUMBERT Introduction OIL : un langage de description dontologies UPML : un langage de description de systèmes à base.
Amaury Daele FUNDP – Namur - Journée "NetMeeting"
Mamadou Dieye, Mohamed Rafik Doulache,
Reconnaissance Vocale
WikiViz La visualisation dun réseau sémantique Travail de diplôme 2005 Urs Richle / 31 it.
Date / references Systèmes Terre et Interarmées Projet OUTILEX Rapport détude final Octobre 2006.
Grammaire de compréhension à émission de concepts
1 Workshop : modelling relationships between agriculture and environment - Brussels - 15/02/2001 Ecole Doctorale SPI Mercredi 27 Juin 2001 Prospective.
Sensibilisation a la modelisation
LRI-INRIA Saclay LRI- UMR CNRS Univ Paris-Sud et UR-INRIA Saclay 12 Equipes au LRI - 7 projets INRIA Equipe IASI-GEMO (IA et BD) « Gestion de données et.
Présenté par : Attia Hamza Merzouk Abdelkrim 2003/2004
Projet de Recherche Nathalie GORMEZANO Directrice générale de l’ISIT
Département fédéral de l’intérieur DFI Office fédéral de la statistique OFS Rapport sur le développement durable 2012 – Le système d’indicateurs MONET.
Approches Formelles en Systèmes d'information
Animation Pédagogique FRANCHEVILLE – LYON – S te -FOY 10 Janvier 2007.
CoRRecT : Démarche coopérative pour l’évaluation de systèmes de reconnaissance de termes Chantal Enguehard IRIN – Université de Nantes 2 rue de la Houssinière.
Aide personnalisée Démarche Constat : Eléments d’évaluation, puis la différenciation s’avère une aide insuffisante. Définition d’objectifs s’inspirant.
Avancement des équipes de rédaction INSPIRE CNIG - Groupe de liaison INSPIRE 8 septembre 2009 Marie-Louise ZAMBON - IGN.
Journée Ecoles Doctorales, Constantine 23 juin 2009 Les Ecoles Doctorales dans le cadre de la réforme LMD Philippe Vidal Direction Générale de l’Enseignement.
Arkhênum Patrimoine du Futur. Répartitions par types d’erreurs mineures.
La construction d'argumentaires pour la négociation des politiques agricoles Présentation du Pôle de formateurs africains en politique agricole Cirad,
Sylwia Ozdowska1, Vincent Claveau2
RAISONNEMENT À PARTIR DE CAS R à PC. PLAN DU TRAVAIL Introduction Introduction Raisonnement analogique Raisonnement analogique Principe et étapes de R.
Reveal-This Ou comment générer des métadonnées utiles automatiquement.
Soutenance du mémoire de synthèse
Ecole Normale Supérieure 1 rue Maurice Arnoux F Montrouge Université Paris 7 30 rue du château des rentiers, F Paris Adresse postale : 2, place.
Journée des doctorants 2005 ENST-Bretagne, Brest juin 2005
M EILLEURES P RATIQUES : S CHÉMAS DE D ONNÉES E FFICACES James STEWART MEASURE Evaluation 16 février 2011 Suivi et Evaluation des programmes VIH/SIDA –
TEXT MINING Fouille de textes
L’analyse de système : le cas des hypertextes Cours Ergonomie des Interactions Personne-Machine 28 octobre 2009 Présentation réalisée par Mireille Bétrancourt.
GPA-779 Application des systèmes experts et des réseaux de neurones.
Le Traitement Automatique des Langues (TAL)
Journée Des Doctorants – 12/06/2012 Groupe CPU 10/2012 – 10/2015 Co-directeurs : Jean-Claude Martin & Céline Clavel Ecole Doctorale Informatique Paris-Sud.
Modélisation de l’inférence et application à un système de question-réponse Anne-Laure Ligozat Groupe LIR Directrice : Michèle Jardino Encadrante : Isabelle.
IFT – Ingénierie des connaissances Exposé d’article
Apéro Techno Romain Maragou - Aliou Sow Web sémantique.
Date: Globplex-Workshops Collaboratifs et Délibératifs Bruxelles © Globplex.org & Associés Observatoires Sociétaux.
Conférences (CR) PACLING'03 Pacific Association for Computational LINGuistics 22 au 25 août 2003 Halifax, côte Est Canada RANLP Recent Advances in Natural.
« Pars-en-thèse » Guide en ligne pour les doctorants
Année Universitaire : 2013/2014 Réalisée par: Rahma DAIKHI Encadrants : M. Jean-Yves TIGLI M. Stéphane LAVIROTTE Au sein de : Laboratoire I3S, Equipe RAINBOW.
1 4th International Conference on Arabic Language Processing, May 2–3, 2012, Rabat, Morocco Titre Mohamed El Amine ABDERRAHIM Mohamed Alaedine ABDERRAHIM.
Master EISIS – Michel JOUBERT – LERTIM, Faculté de Médecine, Marseille UMLS « Unified Medical Language System » U.S. National Library of Medicine.
Résumé Titre de la communication (en français) Titre de la communication (en anglais) Noms des auteurs Affiliation s ; Addresses Auteur Principal é-mail.
Transcription de la présentation:

Consolidation de grands réseaux lexicaux Bonjour à tous. Je m’appelle Manel Zarrouk , j’effectue mes recherches au sein du laboratoire LIRMM à Montpellier et je vais vous présenter aujourd’hui une partie de nos travaux autours des inférences déductives et réconciliation dans un réseau lexico-sémantique Consolidation de grands réseaux lexicaux Thèse de Manel ZARROUK supervisée par Mathieu LAFOURCADE

Plan Contexte Contribution Perspectives Publications et activités je vais commencer par vous (mettre bien dans )présenter le contexte de ce que je fais , je vous parlerai ensuite de mes inférences déductives et de la procédure de réconciliation qui vise à identifier le problème quand une des inférences s’avère fausse, avant de terminer par quelques expérimentations et résultats. Perspectives Publications et activités

Réseau lexico-sémantique Comment les construire? •Manuellement (par des experts ou des linguistes) Long, coûteux, statique, normatif •Automatiquement (extraction à partir des corpus) Difficile + connaissances implicites absentes des corpus • Collaborativement - par externalisation ouverte (crowdsourcing)

Externalisation ouverte Externalisation ouverte (crowdsourcing) (populaire, pas chère, rapide) GWAP (game with a purpose/jeux sérieux) Contribution Le réseau lexico-sémantique JDM est construit par externalisation ouverte JeuxDeMots Diko Un outil contributif Contribution négociée Un GWAP en ligne Contribution non-négociée La construction d’un réseau lexical collaboratif (ou de n’importe quelle ressource similaire) peut étre catégorisée selon deux stratégies. SILENCE + BRUIT Relations triviales ignorées par les utilisateurs mais primordiales pour la bonne qualité de la ressource Essentiellement issu des jeux termes ou consignes difficiles contrainte de temps

Approche uniquement endogène Contribution Enrichir et consolider le réseau par le remplissage des silences Inférer des relations manquantes à partir de celles déjà existantes Approche uniquement endogène Consolidation Relations candidates Moteur d’inférences d’expliciter en quoi la relation considérée est incorrecte Moteur de réconciliation RLS JDM

Contribution ~ Déduction Schéma descendant fondé sur la transitivité de la relation ontologique is-a. générique ⇒ spécifique (A est un type de B) et (B a une relation R avec C) alors (A possède la relation R avec C) H Application sur 25 000 termes aléatoires  1 500 000 inférences (80-90% valides)

Contribution ~ Induction Schéma ascendant se basant sur la transitivité de la relation ontologique is-a. spécifique => générique (A est un type de B) et (A a une relation R avec C) alors (B possède la relation R avec C) H Application sur 25 000 termes aléatoires  360 000 inférences (80-95% valides)

Contribution ~ Abduction Sélection d’un ensemble d’exemples Les relations pas déjà partagées entre l’ensemble et A sont proposées comme potentielles pour A Présentations des relations proposées pour la validation/invalidation Une stratégie fondée sur des exemples + similarité entre ces exemples Partage d’un nombre de relations sortantes entre les termes Principe : supposer que les relations sortantes d’un ensemble de termes similaires à un terme cible A peuvent être valable pour ce dernier. Production de 629 987 relations dont 137 416 nouvelles 12 nouvelles relations/entrée (10 889 entrées lexicales)

Contribution ~ Grib Schéma qui vise à enrichir les raffinements et les utiliser pour enrichir les termes connexes Produit > 300 000 relations candidates Tableau de résultats préliminaires présentant le taux de validation des inférences de ce schéma

Récapitulatif Le système de consolidation est un : densificateur de relations ~ mais aussi ~ détecteur d’erreurs identificateur de polysémie marqueur d’exception annotateur de relations valides non pertinentes => Les premiers pas vers un raisonneur autonome

Perspectives Découverte automatique et mémorisation de règles d’inférences (schéma d’inférence à une seule inconnue et plusieurs prémisses) Avion film Pièce de théâtre roman is-a is-a is-a is-a loc A1 A2 A3 A hôtesse loc has-author has-author has-author is-a passager avion de ligne ? ? ? Indiquer une information potentielle Instancier une conclusion

un langage de modélisation spécifique Perspectives ? ? ? ? un langage de modélisation spécifique ? ? ? ?

Publications et activités ZARROUK, M., LAFOURCADE, M. et JOUBERT, A. (September 7-13, 2013). Inductive and deductive inferences in a crowdsourced lexical-semantic network. 9th International Conference on Recent Advances in Natural Language Processing (RANLP 2013), 6p. ZARROUK, M., LAFOURCADE, M. et JOUBERT, A. (Juin 2013). Inférences déductives et réconciliation dans un réseau lexico-sémantique. 20éme conférence du Traitement Automatique du Langage Naturel 2013 (TALN 2013), 14p. LAFOURCADE, M., ZARROUK, M. et JOUBERT, A. (Juin 2013). Inférence de règles déductives par abduction. Méthodes mixtes pour l’analyse syntaxique et sémantique du français (Mixer), Atelier (TALN-2013), 4p. ZARROUK, M., LAFOURCADE, M. et JOUBERT, A. (March 24–30, 2013). Inference and reconciliationin a lexical-semantic network. 14th International Conference on Intelligent Text Processing and Computational Linguistic (CILING-2013), 13p.

Publications et activités — Module doctoral : Prise de parole en public, pédagogie interactive niveau 1 (21 heures validées) — Organisation DOCTISS 2013 journée conférence des doctorants de l’école doctorale i2s (40 heures validées) — école d’été : ESSLI 2013 (The 25th European Summer School in Logic, Language and Information (ESSLLI 2013) Heinrich Heine University in Dûsseldorf, Germany, August 5-16, 2013.) — Co-encadrement d’un groupe TER M1 (sujet : Construction d’un programme qui joue à JeuxDeMots)

Publication et activités — Relectures CICLING 2013 et TALN 2013 — Participations aux conférences CICLING2013 à SAMOS et TALN2013 aux SABLES D’OLONNES — Participation aux Workshops : Workshop on The logic of the lexicon January 2013 : Toulouse Atelier Méthodes mixtes pour l’analyse syntaxique et sémantique du français (Mixer)(TALN-2013)

Merci