1 Réconciliation de références LRI (UMR 8623 CNRS) / INRIA-Futurs, équipe IASI/Gemo Université Paris-Sud XI.

Slides:



Advertisements
Présentations similaires
Programmation linéaire et Recherche opérationnelle
Advertisements

RDA : Pourquoi, quoi, qui et quand Des règles aux entités : Catalogage avec la RDA ACB, le 29 mai 2009 Gillian Cantello Bibliothèque et Archives Canada.
LA CONTRAINTE BUDGETAIRE
UE 102 (M1.CE) Communication d’entreprise
Rencontre avec… DICTIONNAIRES EN LIGNE ET OUTILS DE TRADUCTION
Modélisation et calcul scientifique
Corese Moteur de recherche sémantique pour RDF
Le langage de requêtes SPARQL SPARQL Protocol And RDF Query Language
Le langage de requêtes SPARQL SPARQL Protocol And RDF Query Language
Théorie N2 CONSOMMATION - A quoi est liée notre consommation
Les espaces de nommage XML par Philippe Poulard 1
Cours n°1ue304b (S. Sidhom) UE 304 b Cours_L2.documentation_n°1 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi.
Bloc 2 : Modèles d’optimisation par la programmation linéaire
Domaines nominaux XSLT
Les sciences à l’école DUCOURTIOUX Laetitia RIBETTE Magalie.
1 Efficient Data and Program Integration Using Binding Patterns Ioana Manolescu, Luc Bouganim, Francoise Fabret, Eric Simon INRIA.
EQUIPE TaToo Extraction de connaissances dans les bases de données : motifs séquentiels et ontologie LIRMM - CNRS - Université Montpellier II.
Dossier TICE Excel.
Jocelyne Erhel Equipe SAGE de l’INRIA Rennes
Méthodes d‘optimisation en finance
Des RRA à la diagnosticabilité
20ème Anniversaire de l’Université Ibn Tofail
Aide à la décision multicritères
Comparaison de structures d’ARN
Introduction à la conception de Bases de Données Relationnelles
Méthodes Numériques appliquées à la
Isostatisme Equation de mobilité Schéma cinématique
Doctorat/Web of Science Les nouveautés du Web of Science Formations Master et Doctorants Voir aussi
Corpus parallèles et textométrie
IGL301 - Spécification et vérification des exgiences 1 Chapitre 2 Le processus dingénierie des exigences (ref : Bray chapitre 2)
La résolution de la référence et son évaluation: un Atelier de Traitement de la Référence mettant en œuvre les « représentations mentales » Andrei Popescu-BelisISSCO,
Introduction à la programmation linéaire
Diagnostic utilisant les tests d’hypothèses structurés.
DONG Xiaoguang HONG Liang OULDBABA Fadel WANG Min
PROJET DE DÉPISTAGE DE LA RÉTINOPATHIE DIABÉTIQUE CHEZ LES COMMUNAUTÉS DES PREMIÈRES NATIONS DU QUÉBEC.
Évolution de schémas par classification automatique dans les entrepôts de données 3ème journée francophone sur les Entrepôts de Données et l'Analyse en.
Institut Provincial des Arts et Métiers
Soutenance de stage 16 Mai au 5 Août 2011
Soutenance de stage 16 Mai au 5 Août 2011
Retour d’expérience sur le pilote ASPECT Rosa Maria Gómez de Regil Séminaire technique sur les normes et l’interopérabilité des ressources numériques éducatives.
Soutenance de stage 16 Mai au 5 Août 2011
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels
E.Dot – juillet 2005 Page 1 Conclusion [ Lot 4. Validation et Évaluation ] Rapport Final 4 juillet 2005.
LRI-INRIA Saclay LRI- UMR CNRS Univ Paris-Sud et UR-INRIA Saclay 12 Equipes au LRI - 7 projets INRIA Equipe IASI-GEMO (IA et BD) « Gestion de données et.
1 Outils bibliographiques Plume 20 mars- Lyon Yannick Maignien.
ASI 3 Méthodes numériques pour l’ingénieur
Projet Campus AAR ANR-13-CORD Présentation de l’existant Patrick Courounet (INA)
VOX-TELEMARK Créateur de clients.
Chapter 8A Semantic Web Primer 1 Chapitre 8 - Conclusions et perspectives Grigoris Antoniou Frank van Harmelen.
Ontologies et description du contenu de documents AV : Une expérimentation dans le domaine médical Mardi 31 mai 2005 Raphaël Troncy 1 & Antoine Isaac 2.
Ressources Internet liées à la CIB
La méthode publique Praxeme
2. Modèles linéaires.
Réunion de lancement du 18 janvier constitution, alignement, comparaison et exploitation d’ontologies géographiques hétérogènes Réunion de lancement.
Modèles et Algorithmes pour la Bioinformatique et la Visualisation d'informations Guy Melançon Pascal Ferraro David Auber David Sherman.
Supports de formation au SQ Unifié
Le rôle des connaissances dans l’identification automatique d’icones Une comparaison avec des humains Philippe Dessus* & Daniel Peraya** *LSE, Univ. Pierre-Mendès-France.
Des autorités aux autorités enrichies : vers une liaison automatique sémantiquement contrôlée aux autorités Sudoc Collaboration Abes/Lirmm dans le cadre.
Praxiling – UMR Université de Montpellier 3 - CNRS Sciences du langage. Moujahed AL SABRI NEDEP juin 2009 Evaluation d’un support numérique.
Critères ergonomiques et WCAG : Une approche étendue pour l’évaluation de l’accessibilité & de l’expérience utilisateur Loïc Nunez 23 Novembre 2012.
1 e.dot – septembre e.dot Entrepôts de Données Ouverts sur la Toile RNTL.
RAISONNEMENT À PARTIR DE CAS R à PC. PLAN DU TRAVAIL Introduction Introduction Raisonnement analogique Raisonnement analogique Principe et étapes de R.
Présentation AICHA REVEL INGENIEUR D’ÉTUDE STERIA DEPARTEMENT TRD
RDA : Pourquoi, quoi, qui et quand Des règles aux entités : Catalogage avec la RDA ACB, le 29 mai 2009 Gillian Cantello Bibliothèque et Archives Canada.
Reveal-This Ou comment générer des métadonnées utiles automatiquement.
Présentation de la taxonomie XBRL BE-fr-pfs-ci Bruxelles, le 25 janvier 2006 Camille Dümm Pascal Rodrique Centrale des bilans.
5 La grammaire dans les méthodes multimédia
DYNI DYNamiques de l'Information [DYNI – UMR LSIS] Activité en traitement image resp. Pr. GLOTIN Inst. Univ de France & USTV - Contexte.
A L I M E N T A T I O N A G R I C U L T U R E E N V I R O N N E M E N T ProdInra en Web sémantique Esther Dzalé Y. Kaboré Sophie Aubin Hugues Leiser.
Réseaux de Petri et suivi du joueur
Transcription de la présentation:

1 Réconciliation de références LRI (UMR 8623 CNRS) / INRIA-Futurs, équipe IASI/Gemo Université Paris-Sud XI

2 Différents problèmes de réconciliation  Alignement/Réconciliation de schémas  Réconciliation de données Apparier des données avec un schéma cible/annoter Détecter que deux descriptions de données représentent la même entité (ex: hôtel, gene, publication,...) => intégration de données provenant de différentes sources (élimination des redondances, combiner des éléments d’informations) => nettoyage d’une source de données

3 "A semantic enrichment … " Author Title H. Gagliardi PersName Author grimm/ ~ohaemmerle O. Haemmerle PersName Author N. Pernelle PersName "Discovery in Science " PublishedIn “LNAI-3735 " Notes Author F. Saïs PersName Author Title Hélène Gagliardi PersName Author Ollivier Haemmerle PersName Author Nathalie Pernelle PersName “DS’05 c PublishedIn Author Fatiha Saïs PersName "A semantic enrichment … " Author “E.DOT" InProject Source 1 Source 2 Reconcile ?( Reconcile ?( inria ) Reconcile ?( Reconcile ?("Discovery in Science ", “DS’05 ") Compare({"Hélène G.",“Ollivier H.", “Nathalie P.", "Fatiha S."}, {"H. Gagliardi", “O. Haemmerle", “N. Pernelle", "F. Saïs"})

4 Approche LN2R - Combinaison de 2 méthodes  L2R : méthode logique partielle. Génération automatique de règles d’inférence qui traduisent la sémantique logique des connaissances déclarées en RDFS+ (+ disjonction, PF) Exemple : traduction de PF(R): R6.1(R): Reconcile(X, Y)  R(X, Z)  R(Y, W)  Reconcile (Z, W) R6.1(Located): Reconcile(X, Y)  Located (X, Z)  Located (Y, W)  Reconcile (Z, W) R6.2(A): Reconcile(X, Y)  A(X, Z)  A(Y, W)  SynVals(Z, W) R6.2(MuseumName):Reconcile(X,Y)  MuseumName (X, Z)  MuseumName (Y,W)  SynVals(Z, W) Utilisation de la résolution unitaire pour inférer des décisions de réconciliation et de non réconciliation correctes.

5 Approche LN2R - Combinaison de 2 méthodes  N2R : méthode numérique itérative qui complète les résultats de L2R. Fondée sur un calcul de similarité informé et modélisé dans un système d’équations. Décision de réconciliation, fondée sur les scores de similarité.  Approche LN2R automatique et déclarative, fondée sur la sémantique du schéma et des données.  Testées sur 2 corpus dont le benchmark CORA.

6 N2R: illustration m1, m’1 c1, c’1 p1, p’1 “Le Louvre”, “Louvre” “Paris”, “La ville de Paris” “La Joconde”, “l’Européenne” x1 = max(max(max(b11, x3), x4), * x2) x2 = max(b21, x1) x3 = max(b31, * x1) x4 = max(b41, * x1) x1 x2 x3 b11 p1, p’2 “La Joconde”, “Joconde” x4 b41 b21 b31 = 1/(| CAttr | + | CRel |)  = 0.02 b11 = 0.8, b21 = 0.3, b31 = 0.1, b41 = 0.7 x1x2x3x4 Initialisation0.0 Itération Itération Itération Solution : x1 = 0.8 x2 = 0.8 x3 = 0.4 x4 = 0.7