La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Découverte automatique de mappings fondée sur les requêtes dans un environnement P2P Présenté Par: Lyes LIMAM Encadré Par: Mohand-Said Hacid.

Présentations similaires


Présentation au sujet: "Découverte automatique de mappings fondée sur les requêtes dans un environnement P2P Présenté Par: Lyes LIMAM Encadré Par: Mohand-Said Hacid."— Transcription de la présentation:

1 Découverte automatique de mappings fondée sur les requêtes dans un environnement P2P Présenté Par: Lyes LIMAM Encadré Par: Mohand-Said Hacid

2 Contexte et problématique Les applications modernes sont caractérisées par : Une gestion de données dans des environnements distribués et à large échelle !! Les BDDs sont conçues indépendamment i.e. hétérogènes sur lensemble des sites du réseau !!

3 Contexte et problématique Dans notre cas, la structure du réseau suit une logique P2P Il faut rajouter toutes les contraintes liées à celle là La problématique traitée dans notre cas est liée essentiellement à lhétérogénéité des schémas

4 Contexte et problématique On doit réconcilier les différentes sources de données : Trouver toutes les correspondances entre les différents schémas de données Transférer les données dun Pair à un autre Exemple de Mapping entre deux schémas

5 Contexte et problématique Les outils développés pour la découverte et la génération des Mappings sont : Semi-automatiques (intervention de lexpert du domaine) Moins performants (temps de calcule) Dune qualité critiquable (précision, et rappel )

6 Quelques approches sur la découverte des mappings Le Mapping dontologies [ OMWG ] (alignement dontologies) Découverte syntaxique ( String Matching) Découverte sémantique (Dictionnaires et thesaurus) La théorie des graphes [ Yuan An, Sergey Melnik, R. Miller et autres ] Matching de graphes (Expressions de mappings) Linférence sur les tables de mappings (Data Mapping) [ Anastasios Kementsietsidis, R. Miller et autres ] Découvrir des nouveaux mappings indirectes Et autre …

7 Proposition … Notre approche comporte deux étapes : Premièrement, on génère un modèle statistique (matrice de co-occurence) pour chacun des schémas qui seront ajustés grâce à LSA Puis, on minimise la distance Euclidienne entre les deux modèles pour avoir les mappings recherchés

8 Proposition … Entrés Des requêtes Stockées sous forme (SELECTE, FROM, WHERE) Sorties Lensemble des correspondances entre les attributs des deux schémas SELECTFROMWHERE {a1, a2,. }{R1, R2...}{a1,…} {a4,a5,..}{R1, R3...}{a1,…} S1 S2 ?? Q1 Q2 Q1 Q2 Application de lapproche SELECTFROMWHERE {b1, b2,. }{S1, S4...}{b2,…} {b3,b5,..}{S1, S3...}{b5,…}

9 Etape 1: Génération des modèles statistiques (Matrices) LSA ? « Latent semantic Analysis » une approche statistique: Fondée sur la notion de co-occurrence déléments dans un contexte Utilise la SVD (Singular Value Decomposition) Découvre des relations profondes (cachées) entre les éléments dun même schéma Une méthode largement utilisée dans les moteurs de recherche (Google)

10 Exemple dapplication de la LSA

11 Décomposition de la matrice de correspondances (X) par la SVD

12 Etape 2: Comparaison des modèles Construire les matrices de co-occurrence des éléments de chaque schéma C 1 = X 1 *X T 1 et C 2 = X 2 *X T 2 Minimiser la distance Euclidienne entre les deux modèles Représenter les deux matrices sous forme de graphes dadjacence Trouver le matching entre les deux graphes qui minimise la distance euclidienne (Hill Climbing)

13 Comparaison des modèles Minimisation de la distance euclidienne A1 A2 A3 A4 A5 A6 B1 B2 B3 B4 B5 B6 Distance Euclidienne (Dé-similarité) A1 A2 … A6 A1 A2.… A6 C1 X 1 X 2 …. X 6 B1 B2 … B6 B1 B2.… B6 C2 Y 1 Y 2 …. Y 6


Télécharger ppt "Découverte automatique de mappings fondée sur les requêtes dans un environnement P2P Présenté Par: Lyes LIMAM Encadré Par: Mohand-Said Hacid."

Présentations similaires


Annonces Google