La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Représentation et indexation dobjets mobiles dans un entrepôt de données Tao Wan, Karine Zeitouni EDA 2006 Université de Versailles.

Présentations similaires


Présentation au sujet: "Représentation et indexation dobjets mobiles dans un entrepôt de données Tao Wan, Karine Zeitouni EDA 2006 Université de Versailles."— Transcription de la présentation:

1 Représentation et indexation dobjets mobiles dans un entrepôt de données Tao Wan, Karine Zeitouni EDA 2006 Université de Versailles

2 EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 2 Contexte Objet Mobile (OM) Objet dont la localisation change continuellement dans le temps Objet Mobile Contraint par le réseau (OMC) Objet se déplaçant dans un espace restreint (ex : couloirs, réseau) Ex: voiture, train, avion… Recherche active en gestion de bases d'objets mobiles Problème posé ici : Exploitation dhistoriques dobjets mobiles dans un but décisionnel

3 EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 3 Sommaire Exemples et motivation Conception et représentation de lentrepôt Implémentation optimisée des requêtes OLAP Résultats dexpérimentation Conclusion & Perspectives

4 EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 4 Exemples et motivation Application réelle: étude sur lexposition de la population aux facteurs de risques Requêtes typiques : Combien de personnes sont exposées au cours du temps au champ de pollution ? Combien de personnes par catégorie d'âge sont exposées au cour du temps au champ de pollution ? SELECT p.loc, p.temps, COUNT(DISTINCT m.id_personne) AS nb_personnes FROMmobilité m, pollution p WHERE m.trajectoire INTERSECT (p.loc, p.temps) GROUP BY p.loc, p.temps SELECT p.loc, p.temps, COUNT(DISTINCT m.id_personne) AS nb_personnes FROMmobilité m, pollution p WHEREm.trajectoire INTERSECT (p.loc, p.temps) GROUP BY m.âge, p.loc, p.temps Ces requêtes sont des agrégats multidimensionnels – type OLAP

5 EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 5 Sommaire Exemples et motivation Conception et représentation de lentrepôt Implémentation optimisée des requêtes OLAP Résultats dexpérimentation Conclusion & Perspectives

6 EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 6 Spécificités de la modélisation multidimensionnelle dobjets mobiles Spécificités Trajectoires dobjets mobiles forment une variation continue dans le temps et lespace Or, les modèles multidimensionnels conventionnels sont basés sur des faits discrets ou discrétisés Les critères de regroupement ne sont pas forcément connus à lavance et implique une recherche spatio-temporelle. Il faut intégrer les dimensions discrètes comme les attributs de lobjet mobiles

7 EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 7 Travaux liés Entrepôts de données spatiales ou spatiotemporelles Entrepôts de données spatiales : [Stefanovic & Han 2000] Entrepôts de données spatiotemporelles : [Bédard & Marchand 2004] Entrepôts dobjets mobiles aRB-tree, double comptage : [Papadias et al. 2002] Estimation probabiliste : [Tao et al. 2004] Problèmes: Objets mobiles agrégés à lorigine; ne permet pas de représenter dautres dimensions que lespace et le temps; résultats basés sur des statistiques approximatives Intégrer les propriétés dOMs dans lanalyse : [Wan & Zeitouni 2005] Problèmes: Se basant sur des découpages de référence pour lespace et le temps => Limite aux agrégations spatiotemporelles à cheval Aucune véritable approche existe pour lanalyse en ligne dobjets mobiles !

8 EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 8 Dimension continue Est une dimension variant dans un domaine continu sans limite de granularité Fait continu Comprend une mesure résultat dune fonction continue qui dépend dune ou de plusieurs dimensions continues Fait mobile Est un fait continu dépendant de lobjet OMC et défini par une fonction F OMC (t) = s continue du temps dans lespace Modèle logique

9 EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 9 Préliminaires - Modèle dobjets mobiles contraints par le réseau Réseau routier Composé de : tronçon et nœuds OMC (Objet Mobile Contraint par le réseau) OMC(id_obj, attributs, #trajectoires) Hypothèse : vitesse constante par tronçon Trajectoire T : Représentée par une séquence de tronçons r i, traversés dans un sens donné pendant un intervalle de temps donné [t i t i+1 ]. r1r1 r2r2 r3r3 r4r4 r5r5 r7r7 r9r9 r 10 r 12 r 13 r 14 r 15 r 16

10 EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 10 Modèle multidimensionnel logique Réduction de dimensionnalité [Pfoser 03] Avantages simplification de la représentation de lespace optimisation de lespace de stockage optimisation des temps de réponses aux requêtes TR T t2t2 t3t3 t end TT p 1 p end t1t1 p2p2 p3p3 Tr 1 Tr 2 Tr 3 Temps MO_ID Jack Tao Fred TR Trid 1 Trid 2 Trid 3 Marie Trid 4 0.21.12.23.04.8 1.12.0 3.1 3.5 Modèle multidimensionnel logique F OMC (t) = s r2r2 r1r1 r3r3

11 EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 11 Sommaire Exemples et motivation Conception et représentation de lentrepôt Implémentation optimisée des requêtes OLAP Résultats dexpérimentation Conclusion & Perspectives

12 EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 12 Index proposé – TTR-tree (Transformed Trajectories R-tree) 0101 1101 R1R2R3 R4 TR Temps Trid 1 QS R1 Trid 2 Trid 3 Trid 4 R2 R3 1001 Marie FredTao Jack Avantages Recherche similaire au R-tree, plus efficace Si QS contient x, on retourne directement le bitmap pointé par x Bitmap évite le double comptage Permet la combinaison avec les attributs de lobjet

13 EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 13 Optimisations Problèmes : Coût de stockage pour les index bitmap Coût de la réduction de dimensionnalité Transformation du réseau Transformation de requêtes spatiales Solutions : Appliquer une technique de bitmap compressé sur les index bitmap : WAH: Word-Aligned Hybrid Code Zhang et al. (2004) Appliquer lordre des tronçons dans un index spatial pour numéroter par proximité ces tronçons et les intervalles de laxe TR correspondant.

14 EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 14 Sommaire Exemples et motivation Conception et représentation de lentrepôt Implémentation optimisée des requêtes OLAP Résultats dexpérimentation Conclusion & Perspectives

15 EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 15 Résultats dexpérimentation (1) Méthodes comparées Indexation Pfoser [Pfoser & Jensen 2003] 3DR-tree Configuration dexpérimentation Réseaux routier: Oldenburg 7035 tronçons, San Joaquin 24123 tronçons Données dentrée : générées par le générateur Brinkhoff Jeux de données Jeux de données Réseau sous-jacent Nombre dobjets Taille des données nombre de tronçons traversés (=segments indexés) DS1Oldenburg10 00024.1 Mo407 419 DS2Oldenburg20 00049.4 Mo829 103 DS3San Joaquin10 00057.4 Mo804 660 DS4San Joaquin20 000114.1 Mo1 640 815

16 EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 16 Coût de stockage Requêtes dagrégation Facteur « espace » qs : 0.5 %, 2 %, 8 %, 16 % et 32% Facteur « temps » qt : 1 %, 5 %, 10 %, 30 % et 50 % Résultats dexpérimentation (2) Jeux de donnéesPfoser 3DR-treeTTR-tree avec compression de bitmaps DS18 925 K34 753 K9 025 K8 790 K DS218 020 K71 351 K18 884 K17 899 K DS318 251 K67 616 K18 221 K17 771 K DS436 849 K138 601 K38 399 K36 397 K

17 EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 17 Résultats dexpérimentation (4) Coût en faisant varier lextension de la requête selon lespace

18 EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 18 Résultats dexpérimentation (5) Coût en faisant varier lextension de la requête selon le temps

19 EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 19 Contributions et perspectives Contributions Modèle multidimensionnel pour objets mobiles contraints par le réseau Implémentation optimisée pour des requêtes OLAP Prototype développé et bons résultats expérimentaux Travaux futurs Test de la combinaison avec des dimensions discrètes Extension aux agrégats complexes (spatiotemporels) Extension aux mesures continues (capteurs embarqués) Extension à dautres types de « faits continus »


Télécharger ppt "Représentation et indexation dobjets mobiles dans un entrepôt de données Tao Wan, Karine Zeitouni EDA 2006 Université de Versailles."

Présentations similaires


Annonces Google