Découverte automatique de mappings fondée sur les requêtes dans un environnement P2P Présenté Par: Lyes LIMAM Encadré Par: Mohand-Said Hacid.

Slides:



Advertisements
Présentations similaires
Ecole Centrale de Lille/LAGIS (France) *ENSI de Tunis/SOIE (Tunisie)
Advertisements

Structures de données avancées : MBT ( Multidimensional B-trees )
ANALYSE DU REFERENTIEL
Le modèle relationnel Frédéric Gava (MCF)
Thème : science et investigation policière
0BJECTIF 4 POINTS - CAISSE La Routine de votre Activité
TRAVAIL DE GROUPE SUR LA SYMETRIE CENTRALE:
Le tableur Le tableur.
BREVET DE TECHNICIEN SUPÉRIEUR ÉLECTROTECHNIQUE
19 septembre 2006 Tendances Logicielles IBM Rational Data Architect Un outil complet de modélisation et de conception pour SGBD Isabelle Claverie-Berge.
Chapitre 3 Equilibre des solides
Algèbre relationnelle
Les opérateurs combinatoires
Les circuits séquentiels
Rappels / concepts de base de l’IA
1 DISIC Option Systèmes Intelligents / Données, Documents et Connaissances DISIC Option Systèmes Intelligents / Données, Documents et Connaissances.
TP T1 Suivant INTENTIONS PEDAGOGIQUES Ce TP vise à faire analyser et justifier les choix technologiques retenus par le constructeur. Pour la détection.
Statistiques 3.
Tableur.
Programme Introduction aux BD et aux SGBD Le modèle relationnel
Tests et Validation du logiciel
ALGORTHME DE COMPOSITION INTRODUCTION PRINCIPES DE BASE LES ETAPES CONCLUSION.
Visibilité depuis un (des) point(s) de vue ou sur un (des) aménagement(s) Visibilité depuis ou sur un linéaire Synthèse dinformations Reclassement de paysages.
Apprendre à se servir d’un tableur
A1. Gallimard est une maison d'édition parisienne tout juste centenaire, qui respire à l'ombre du cimetière Montparnasse. Faux Il s’agit d’Albin Michel.
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
1 ARCHITECTURE DACCÈS la méthode générale modèle de données définitions module daccès / modules métiers construction des modèles les modules daccès, les.
Les BDAs (Les bases de données réparties)
Page de garde présentation
A1 Entwicklung gesundheitsfördernder Angebote A2 Interessenvertretung Zusammenarbeit Organisationen A3 Soziale Mobilisierung A4 Entwicklung persönlicher.
Microsoft Excel Avancé
Des RRA à la diagnosticabilité
Corrigé du test de lecture
Pour un système formel de description linguistique
METHODE d’ESTIMATION selon l’U.N.T.E.C
Classification automatique de documents XML : le système Semistix Alexandre Termier Marie-Christine Rousset Michèle Sebag Séminaire du 23/01/2001 Université
Présenté par : Yasser HACHAICHI Sous la direction de : Mr. Jamel FEKI
B, A BA dEXCEL Déjà familiers dExcel : sabstenir.
Introduction Introduction b) Equations c) Schéma structurel
Finger Cryptosystem pour L’Authentification
EXCEL Premiers pas dans les formules. Opérations simples Soient 2 nombres inscrits dans 2 cellules 12 dans B1 et 5 dans B2 Réalisons les 4 opérations.
LANGAGES LIES AU MODELE RELATIONNEL
CALCUL MENTAL ET REFLECHI
Corrigé du test de lecture
Programmation logique Démonstrateur automatique
C n a m L y o n Schéma explicatif sur la « COMPTABILITE ANALYTIQUE »
Rénovation du baccalauréat professionnel Environnement Nucléaire Rapport détape.
Quelle est la vitesse d’un solide en rotation ?
Recombination and the Nature of Bacterial Speciation
Cycle préparatoire PeiP Parcours élève ingénieur Polytech
1 SQL: Requêtes, Programmation et Triggers Chapitre 5, Sections 15.5.
Ontology Evolution and Source Autonomy in Ontology-based Data Warehouses Nguyen Xuan Dung Ladjel Bellatreche
Révisions - IA Généralité: problèmes de lIA Recherche Logique Traitement de lincertitude Apprentissage Langue naturelle.
Les outils d'évaluation du C2i
Les modalités d’évaluation dans le cadre du C2i
Thematic Alignment of Static Documents with Meeting Dialogs Dalila Mekhaldi Diva Group Department of Computer Science University of Fribourg.
Why You Ought To Use Formal Methods: a 3-Pages 11-Slides Illustration Eric Jaeger, UPMC / LIP6 Réunion SSURF du 5 avril 2007.
Initiation aux bases de données et à la programmation événementielle
Paysages et cours d’eau
Découverte de correspondances entre ontologies distribuées
ClientsComptes Clients (codeCli,nom) Comptes (numC,codeType) Gestion bancaire ClientsComptes Clients (codeCli,nom) Comptes (numC,codeType) Gestion bancaire.
Aide à la conception de systèmes distribués
Vers l'échantillonnage d'un entrepôt de données
Les brassages chromosomiques
ISI1 MIAG-Modélisation des traitements
DU TRAITEMENT DU SIGNAL
Le modèle à base d'activités : caractérisation
Chapitre 1 Introduction à la sociologie
Sélection de colonnes (la projection)
1 Structure en MC Principes Stockage des données dans la mémoire volatile d’un ordinateur Problèmes Stockage temporaire «Petits» volumes de données Langages.
Transcription de la présentation:

Découverte automatique de mappings fondée sur les requêtes dans un environnement P2P Présenté Par: Lyes LIMAM Encadré Par: Mohand-Said Hacid

Contexte et problématique Les applications modernes sont caractérisées par : Une gestion de données dans des environnements distribués et à large échelle !! Les BDDs sont conçues indépendamment i.e. hétérogènes sur l’ensemble des sites du réseau !!

Contexte et problématique Dans notre cas, la structure du réseau suit une logique P2P Il faut rajouter toutes les contraintes liées à celle là La problématique traitée dans notre cas est liée essentiellement à l’hétérogénéité des schémas

Contexte et problématique On doit réconcilier les différentes sources de données : Trouver toutes les correspondances entre les différents schémas de données Transférer les données d’un Pair à un autre Exemple de Mapping entre deux schémas

Contexte et problématique Les outils développés pour la découverte et la génération des Mappings sont : Semi-automatiques (intervention de l’expert du domaine) Moins performants (temps de calcule) D’une qualité critiquable (précision, et rappel )

Quelques approches sur la découverte des mappings Le Mapping d’ontologies [OMWG] (alignement d’ontologies) Découverte syntaxique (String Matching) Découverte sémantique (Dictionnaires et thesaurus) La théorie des graphes [Yuan An, Sergey Melnik, R. Miller et autres] Matching de graphes (Expressions de mappings) L’inférence sur les tables de mappings (Data Mapping) [Anastasios Kementsietsidis, R. Miller et autres ] Découvrir des nouveaux mappings indirectes Et autre …

Proposition … Notre approche comporte deux étapes : Premièrement, on génère un modèle statistique (matrice de co-occurence) pour chacun des schémas qui seront ajustés grâce à LSA Puis, on minimise la distance Euclidienne entre les deux modèles pour avoir les mappings recherchés

Application de l’approche Proposition … Entrés Des requêtes Stockées sous forme (SELECTE, FROM, WHERE) Sorties L’ensemble des correspondances entre les attributs des deux schémas S1 S2 SELECT FROM WHERE {a1, a2,. } {R1, R2 ...} {a1,…} {a4,a5, ..} {R1, R3 ...} ?? SELECT FROM WHERE {b1, b2,. } {S1, S4 ...} {b2,…} {b3,b5, ..} {S1, S3 ...} {b5,…} Q1 Q2 Q1 Q2 ?? Application de l’approche

Etape 1: Génération des modèles statistiques (Matrices) LSA ? « Latent semantic Analysis » une approche statistique: Fondée sur la notion de co-occurrence d’éléments dans un contexte Utilise la SVD (Singular Value Decomposition) Découvre des relations profondes (cachées) entre les éléments d’un même schéma Une méthode largement utilisée dans les moteurs de recherche (Google)

Exemple d’application de la LSA

Exemple d’application de la LSA Décomposition de la matrice de correspondances (X) par la SVD

Etape 2: Comparaison des modèles Construire les matrices de co-occurrence des éléments de chaque schéma C1= X1*XT1 et C2= X2*XT2 Minimiser la distance Euclidienne entre les deux modèles Représenter les deux matrices sous forme de graphes d’adjacence Trouver le matching entre les deux graphes qui minimise la distance euclidienne (Hill Climbing)

Comparaison des modèles … A6 A1 A2 .… A6 C1 X1 X2 …. X6 B1 B2 … B6 B1 B2 .… B6 C2 Y1 Y2 …. Y6 Distance Euclidienne (Dé-similarité) B3 A1 B1 A2 A4 B2 B5 A3 A5 B4 B6 A6 Minimisation de la distance euclidienne