LRI-INRIA Saclay LRI- UMR CNRS Univ Paris-Sud et UR-INRIA Saclay 12 Equipes au LRI - 7 projets INRIA Equipe IASI-GEMO (IA et BD) « Gestion de données et.

Slides:



Advertisements
Présentations similaires
MOT Éditeur de modèles de connaissances par objets typés
Advertisements

Analyse et Programmation Orientées Objets
Eclipse Plug-ins Factory
But de la lecture critique
La lecture critique des essais thérapeutiques
19 septembre 2006 Tendances Logicielles IBM Rational Data Architect Un outil complet de modélisation et de conception pour SGBD Isabelle Claverie-Berge.
Eric BONJOUR, Maryvonne DULMET
Systèmes Experts : Principes
1 DISIC Option Systèmes Intelligents / Données, Documents et Connaissances DISIC Option Systèmes Intelligents / Données, Documents et Connaissances.
Séminaire Groupes 27 mars 2003 Des concepts …... Des principes dutilisation ….. Des fiches pratiques ….. Des stratégies de mise en route ….
Gelly J, Suarez Valencia JS, Salaün A, Worré S, Christidis A,
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
INTELLIGENCE COLLECTIVE : RENCONTRES 2006Nîmes mai 2006 CENTRE DE RECHERCHE LGI2P 1- Doctorante Ecole des mines de Paris, 2- Maitre de Conférences.
LA SEGMENTATION STRATÉGIQUE
Classification automatique de documents XML : le système Semistix Alexandre Termier Marie-Christine Rousset Michèle Sebag Séminaire du 23/01/2001 Université
Introduction à la conception de Bases de Données Relationnelles
Gestion de la relève et développement des compétences Congrès national du RCCFC Novembre 2006.
Annotations sémantiques pour le domaine des biopuces
RDF(S)
1 Exercice : longueur d’un mot est-elle paire ?  Test fonctionnel  Quel ensemble de valeur choisir / spécification  Test structurel  Soit le code d’un.
OIL & UPML DREVET - HUMBERT Introduction OIL : un langage de description dontologies UPML : un langage de description de systèmes à base.
MOT Éditeur de modèles de connaissances par objets typés
Colloque IC-2012– Montréal 6-7 juin 2012
Présentation du projet technique / sous-épreuve U62
MODULE 19 INTRODUCTION AU DOMAINE CONSTITUTION DES GROUPES.
Un modèle sémantique pour linteropérabilité de systèmes dinformation Equipe Ingénierie informatique et base de données – Laboratoire LE2I Université de.
Le Sémiographe Outil générique pour effectuer des opérations texte sens texte ou texte sens actions
Gestion des connaissances
Détection du meilleur format de compression pour une matrice creuse dans un environnement parallèle hétérogène Olfa HAMDI-LARBI.
Projet de Master première année 2007 / 2008
Toujours partir du besoin métier – Pas dune envie de linformatique Concevoir les services – puis concevoir leur implémentation Le vrai bénéfice est.
EP1 – Première situation d’évaluation
Ingénierie Système en SysML appliquée à la rédaction du cahier des charges Y. Le Gallou Séminaire académique STI2D - Calais – 1er avril 2014.
Patrons de conceptions de créations
Vers une génération automatique du mapping de sources biomédicales
Découverte de correspondances entre ontologies distribuées
Partie A Système d ’information et organisation
IC'2005 : Ingénierie des Connaissances
Les logiques de descriptions
Présentation du projet edot Revue intermédiaire - 29 Juin 2004.
E.Dot – juillet 2005 Page 1 Conclusion [ Lot 4. Validation et Évaluation ] Rapport Final 4 juillet 2005.
ICT Channel Intelligence & Services Construire et développer votre canal de ventes indirectes Thuy Nguyen Consultante commerciale compuBase France.
18 février 2010 Environnement numérique d’apprentissage Réalisation de la phase 1 18 février 2010.
RESEAU.
Approche Big Data et Web Sémantique pour la fouille et la classification automatique de données Web Ces travaux sont effectués dans le cadre d’un partenariat.
Réunion de lancement du 18 janvier constitution, alignement, comparaison et exploitation d’ontologies géographiques hétérogènes Réunion de lancement.
Thésaurus et accès à l’information Sylvie Dalbin Assistance & Techniques Documentaires Conseil en ingénierie documentaire,
Supports de formation au SQ Unifié
1 Réconciliation de références LRI (UMR 8623 CNRS) / INRIA-Futurs, équipe IASI/Gemo Université Paris-Sud XI.
Approches Formelles en Systèmes d'information
LE PLAN QUALITE Utilité du plan qualité :
CoRRecT : Démarche coopérative pour l’évaluation de systèmes de reconnaissance de termes Chantal Enguehard IRIN – Université de Nantes 2 rue de la Houssinière.
Intégration de schémas
ESTIMATION / CHIFFRAGE
Critères ergonomiques et WCAG : Une approche étendue pour l’évaluation de l’accessibilité & de l’expérience utilisateur Loïc Nunez 23 Novembre 2012.
1 e.dot – septembre e.dot Entrepôts de Données Ouverts sur la Toile RNTL.
10 juin 2008 Journée Technologies et Enjeux de l'Apprentissage Mobile Equipe SIMBAD.
190, boulevard Haussmann Paris - Tel : Télécopieur : Colisée Conseil SARL au capital.
Présentation AICHA REVEL INGENIEUR D’ÉTUDE STERIA DEPARTEMENT TRD
COMMUNICATION et MEDIAS
MOCK.
La veille à l’Institut national du cancer Identifier des sources d’information fiables Rencontre De la veille à la gestion des connaissances, Bordeaux,
1.3.3 La classification des catégories de connaissances
Recherche Documentaire et traitement de l’information
dans le référentiel du BTS comptabilité et gestion des organisations
Cellules intersectorielles de promotion de la santé et marché d’échange de projets Des dispositifs pour promouvoir l’intersectorialité et les partenariats.
Architectures articulant des représentations hétérogènes L’exemple de Gate (Mini tutoriel, journée Atala du 12 février 2005) Thierry Poibeau LIPN (CNRS.
RESSOURCES EPS
Année Universitaire : 2013/2014 Réalisée par: Rahma DAIKHI Encadrants : M. Jean-Yves TIGLI M. Stéphane LAVIROTTE Au sein de : Laboratoire I3S, Equipe RAINBOW.
ARIANE : Interopérabilité sémantique et accès aux sources d'information sur Internet Sylvain Aymard, Michel Joubert, Dominique Fieschi, Marius Fieschi.
Transcription de la présentation:

LRI-INRIA Saclay LRI- UMR CNRS Univ Paris-Sud et UR-INRIA Saclay 12 Equipes au LRI - 7 projets INRIA Equipe IASI-GEMO (IA et BD) « Gestion de données et de connaissances distribuées sur le Web » Intégration sémantique (Alignement d’ontologies, Réconciliation d’instances, Annotation, Evolution) Pair-à-pair Web services

2 Alignement : TaxoMap  Objectif : Aligner la taxonomie d’un portail avec celles de sources externes pour permettre une interrogation unifiée. z Spécificités : dissymétrie dans la structure et la taille des taxonomies comparées ( taxonomie du portail a priori plus riche que celles de sources externes isolées ) z Approche : générique, semi-automatique, composite (techniques terminologiques et structurelles) Processus orienté : alignement des termes d’une taxonomie source (T S ) vers ceux de la taxonomie cible (T C ) : z Contexte : Small is beautiful (ontologies simples : taxonomies où les concepts sont reliés par des liens de subsomption isA )

Alignement d’ontologies O Source O Cible X S  O S, Y C  O C Recherche de mappings (X S relation Y C )

4 Trois catégories de mappings Relations de spécialisation ( isA ) : lien entre un élément de T S et un élément plus général de T C. e S : Precooked chicken isA e c : chicken e S : Asparagus isA e c : Vegetable Relations d’équivalence ( isEq ) : lien entre un élément de T S et un élément similaire de T C.  Des noms de termes rigoureusement identiques e S : beef fat isEq e c : beef fat  Des expressions composées de mots, pas toujours ordonnés à l’identique, ayant la même signification e S : Pork sausage (liver) isEq e c : Pork liver sausage Relations de proximité ( isClose ) : lien quand on ne sait pas expliciter la nature du lien entre un élément de T S et un élément de T C. e S : Cantaloupe isClose e c : Water melon

Approche séquentielle, en 3 phases 1.Génération automatique de mappings « probables » 2.Suggestion de mappings « potentiels » exploitant TaxoMap Expert du domaine 3. Validation des mappings générés : mappings confirmés ou rejetés, suggestion de nouveaux mappings. Techniques terminologiques Techniques structurelles basée sur l’étude des labels des éléments (n-gram, inclusion de chaînes)  Éléments équivalents  Inclusion de labels  Similarité relative  la position des candidats au mapping dans T Cible  la structure d’une ressource externe (WordNet)  la structure de T Source

Evaluation Techniques appliquées séquentiellement Pertinentes quand Les relations dans les taxonomies sont vraiment des liens de subsomption (isA et non partOf) Les labels sont composées de nombreux mots Un même mot appartient à plusieurs labels Existence d’une ressource externe (WN en anglais) Testées sur ≠ benchmarks

Objectifs dans le projet Tester et étendre l’outil existant Expliciter des critères sur des ensembles d’appariements trouvés (ou pas) entre des parties d’ontologies, utiles pour la fusion ou la réorganisation Expliciter d’autres chaînes de traitement à partir des techniques d’alignement, utiles pour les autres tâches. X X’ Y’ Y Z Z’ O1O1 O2O2

Planning sous lot 2.1. Premières tâches Juin 08 : Tests de TaxoMap sur les taxonomies existantes fournies par le COGIT (2.1), 3 taxonomies ? OntoGeo, Topo, Carto Evaluation sur les mappings de référence ? Dec 08 : identification des limites, spécification des amélioration à apporter (2.2) ….