Représentation et indexation dobjets mobiles dans un entrepôt de données Tao Wan, Karine Zeitouni EDA 2006 Université de Versailles.

Slides:



Advertisements
Présentations similaires
Optimisation des requêtes
Advertisements

Structures de données avancées : MTH ( Multidimensional trie hashing )
Chaîne de Synthèse Réel Modélisation Rendu Image Fichier Scène
Fabrice Lauri, François Charpillet, Daniel Szer
Regroupement (clustering)
Calcul géométrique avec des données incertaines
Regroupement (clustering)
Journée Intech Device Independence – Page 1 IHM et multiplicité des supports : aperçu de la recherche actuelle et future Anne-Marie Déry
Projet n°4 : Objecteering
JXDVDTEK – Une DVDthèque en Java et XML
Transformations discrètes et relation discret - continu Lyon, Juin 2006 Eric ANDRES Laboratoire SIC Signal – Image - Communications Université de Poitiers.
Le Modèle Logique de Données
Algèbre relationnelle
Master Génie Biologique et Informatique, première année
Génération interactive dimages projectives : Application à la Radiothérapie Pierre BLUNIER Du 01/12/2002 au 28/03/2003 Centre Léon Bérard.
Yann SEMET Projet Fractales, INRIA Rocquencourt
1 Efficient Data and Program Integration Using Binding Patterns Ioana Manolescu, Luc Bouganim, Francoise Fabret, Eric Simon INRIA.
Modélisation et commande hybrides d’un onduleur multiniveaux monophasé
1 ACI DADDI - Réunion de lancement IRISA - Projet ADEPT Michel Hurfin Jean-Pierre Le Narzul Frédéric Tronel 23 mai 2005.
Tests et Validation du logiciel
Journée de Travail Groupe “Bermudes”
Ordonnancement des mouvements de deux robots
Safae LAQRICHI, Didier Gourc, François Marmier {safae
Sélection automatique d’index et de vues matérialisées
Estella Annoni, Franck Ravat, Olivier Teste, Gilles Zurfluh
Environnement de réalité augmentée : vers les jeux vidéos
Développement d’applications web
PBST*: une nouvelle variante des SDDS
Des RRA à la diagnosticabilité
Contrôles d'accès aux données
Application des algorithmes génétiques
Optimisation des Requêtes. Introduction Introduction.
Adaptation de documents multimédia
Principes de persistance dans les applications orienté objet
Introduction à la conception de Bases de Données Relationnelles
OLAP : Un pas vers la navigation
Anne Tchounikine, Maryvonne Miquel, Robert Laurini,
Etude longitudinale d’essais multilocaux: apports du modèle mixte
Feature Driven Development (FDD)
1 1 ST Crolles 2 Université Montpellier II France FTFC 2003 Représentation Unifiée des Performances Temporelles dune Bibliothèque de Cellules Standards.
Introduction - Modèle Discret – Modèle Continu - Algorithmes - Conclusion
SYSTEMES D’INFORMATION
Maîtrise des risques et sûreté de fonctionnement – Avignon – 6-10 Octobre 2008 Modélisation des dysfonctionnements dun système dans le cadre dactivités.
SCIENCES DE L ’INGENIEUR
Mehrdad Salehi, candidat au doctorat Directeur: Dr. Yvan Bédard Codirecteur: Dr. Mir Abolfazl Mostafavi Conseiller: Dr. Jean Brodeur Chaire de recherche.
Interprétation de séquences dimages pour des applications MédiaSpace Alberto AVANZI François BREMOND Monique THONNAT Projet ORION INRIA de Sophia Antipolis.
1 Du pixel à lobjet : méthodes stochastiques X. Descombes Projet Ariana Orféo, 14 juin 2005.
Courbes de Bézier.
Corrélation Principe fondamental d’une analyse de corrélation
Universté de la Manouba
Article présentée par : Étudiante en 2ème année mastère F.S.T. Tunisie
Riadh Ben Messaoud Kamel Aouiche Cécile Favre
Modèle d’entrepôt de données à base de règles
1 Séminaire LOVe du 29/03/07 Combinaison d'objets (fusion centralisée) T3.2 Combinaison de pistages (fusion décentralisée) T3.3.
Michael Esfeld Université de Lausanne
29/06/2005 Page 1 ROBIN - Techno-Vision Base dimages EADS DS l Introduction l Description générale l Description détaillée l Quicklook des données sources.
1 Couplage dun langage de contrôle de formatage avec un système de formatage existant DEA ISC : 1 avril 2003 Fateh Boulmaiz
Couplage d'un langage de contrôle un système de formatage existant
électroencéphalographie Estimation des conductivités in vivo
Méthode de modélisation multidimensionnelle
Découverte de correspondances entre ontologies distribuées
I MAGIS est un projet commun CNRS - INPG - INRIA - UJF iMAGIS-GRAVIR / IMAG Optimisation à base de flot de graphe pour l'acquisition d'informations 3D.
Évolution de schémas par classification automatique dans les entrepôts de données 3ème journée francophone sur les Entrepôts de Données et l'Analyse en.
MODELE CONCEPTUEL POUR L’ANALYSE MULTIDIMENSIONELLE DE DOCUMENTS
Présentation de la méthode des Eléments Finis
Potentiel électrostatique
Prédiction de Jeu dans un Assemblage - Application au Calage
Visualisation d’un entrepôt de données Pré soutenance technique
Intégration des Tableaux Multidimensionnels en Pig pour
Structures de données avancées : MTH ( Multidimensional trie hashing ) D. E ZEGOUR Institut National d ’Informatique.
Transcription de la présentation:

Représentation et indexation dobjets mobiles dans un entrepôt de données Tao Wan, Karine Zeitouni EDA 2006 Université de Versailles

EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 2 Contexte Objet Mobile (OM) Objet dont la localisation change continuellement dans le temps Objet Mobile Contraint par le réseau (OMC) Objet se déplaçant dans un espace restreint (ex : couloirs, réseau) Ex: voiture, train, avion… Recherche active en gestion de bases d'objets mobiles Problème posé ici : Exploitation dhistoriques dobjets mobiles dans un but décisionnel

EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 3 Sommaire Exemples et motivation Conception et représentation de lentrepôt Implémentation optimisée des requêtes OLAP Résultats dexpérimentation Conclusion & Perspectives

EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 4 Exemples et motivation Application réelle: étude sur lexposition de la population aux facteurs de risques Requêtes typiques : Combien de personnes sont exposées au cours du temps au champ de pollution ? Combien de personnes par catégorie d'âge sont exposées au cour du temps au champ de pollution ? SELECT p.loc, p.temps, COUNT(DISTINCT m.id_personne) AS nb_personnes FROMmobilité m, pollution p WHERE m.trajectoire INTERSECT (p.loc, p.temps) GROUP BY p.loc, p.temps SELECT p.loc, p.temps, COUNT(DISTINCT m.id_personne) AS nb_personnes FROMmobilité m, pollution p WHEREm.trajectoire INTERSECT (p.loc, p.temps) GROUP BY m.âge, p.loc, p.temps Ces requêtes sont des agrégats multidimensionnels – type OLAP

EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 5 Sommaire Exemples et motivation Conception et représentation de lentrepôt Implémentation optimisée des requêtes OLAP Résultats dexpérimentation Conclusion & Perspectives

EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 6 Spécificités de la modélisation multidimensionnelle dobjets mobiles Spécificités Trajectoires dobjets mobiles forment une variation continue dans le temps et lespace Or, les modèles multidimensionnels conventionnels sont basés sur des faits discrets ou discrétisés Les critères de regroupement ne sont pas forcément connus à lavance et implique une recherche spatio-temporelle. Il faut intégrer les dimensions discrètes comme les attributs de lobjet mobiles

EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 7 Travaux liés Entrepôts de données spatiales ou spatiotemporelles Entrepôts de données spatiales : [Stefanovic & Han 2000] Entrepôts de données spatiotemporelles : [Bédard & Marchand 2004] Entrepôts dobjets mobiles aRB-tree, double comptage : [Papadias et al. 2002] Estimation probabiliste : [Tao et al. 2004] Problèmes: Objets mobiles agrégés à lorigine; ne permet pas de représenter dautres dimensions que lespace et le temps; résultats basés sur des statistiques approximatives Intégrer les propriétés dOMs dans lanalyse : [Wan & Zeitouni 2005] Problèmes: Se basant sur des découpages de référence pour lespace et le temps => Limite aux agrégations spatiotemporelles à cheval Aucune véritable approche existe pour lanalyse en ligne dobjets mobiles !

EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 8 Dimension continue Est une dimension variant dans un domaine continu sans limite de granularité Fait continu Comprend une mesure résultat dune fonction continue qui dépend dune ou de plusieurs dimensions continues Fait mobile Est un fait continu dépendant de lobjet OMC et défini par une fonction F OMC (t) = s continue du temps dans lespace Modèle logique

EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 9 Préliminaires - Modèle dobjets mobiles contraints par le réseau Réseau routier Composé de : tronçon et nœuds OMC (Objet Mobile Contraint par le réseau) OMC(id_obj, attributs, #trajectoires) Hypothèse : vitesse constante par tronçon Trajectoire T : Représentée par une séquence de tronçons r i, traversés dans un sens donné pendant un intervalle de temps donné [t i t i+1 ]. r1r1 r2r2 r3r3 r4r4 r5r5 r7r7 r9r9 r 10 r 12 r 13 r 14 r 15 r 16

EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 10 Modèle multidimensionnel logique Réduction de dimensionnalité [Pfoser 03] Avantages simplification de la représentation de lespace optimisation de lespace de stockage optimisation des temps de réponses aux requêtes TR T t2t2 t3t3 t end TT p 1 p end t1t1 p2p2 p3p3 Tr 1 Tr 2 Tr 3 Temps MO_ID Jack Tao Fred TR Trid 1 Trid 2 Trid 3 Marie Trid Modèle multidimensionnel logique F OMC (t) = s r2r2 r1r1 r3r3

EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 11 Sommaire Exemples et motivation Conception et représentation de lentrepôt Implémentation optimisée des requêtes OLAP Résultats dexpérimentation Conclusion & Perspectives

EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 12 Index proposé – TTR-tree (Transformed Trajectories R-tree) R1R2R3 R4 TR Temps Trid 1 QS R1 Trid 2 Trid 3 Trid 4 R2 R Marie FredTao Jack Avantages Recherche similaire au R-tree, plus efficace Si QS contient x, on retourne directement le bitmap pointé par x Bitmap évite le double comptage Permet la combinaison avec les attributs de lobjet

EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 13 Optimisations Problèmes : Coût de stockage pour les index bitmap Coût de la réduction de dimensionnalité Transformation du réseau Transformation de requêtes spatiales Solutions : Appliquer une technique de bitmap compressé sur les index bitmap : WAH: Word-Aligned Hybrid Code Zhang et al. (2004) Appliquer lordre des tronçons dans un index spatial pour numéroter par proximité ces tronçons et les intervalles de laxe TR correspondant.

EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 14 Sommaire Exemples et motivation Conception et représentation de lentrepôt Implémentation optimisée des requêtes OLAP Résultats dexpérimentation Conclusion & Perspectives

EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 15 Résultats dexpérimentation (1) Méthodes comparées Indexation Pfoser [Pfoser & Jensen 2003] 3DR-tree Configuration dexpérimentation Réseaux routier: Oldenburg 7035 tronçons, San Joaquin tronçons Données dentrée : générées par le générateur Brinkhoff Jeux de données Jeux de données Réseau sous-jacent Nombre dobjets Taille des données nombre de tronçons traversés (=segments indexés) DS1Oldenburg Mo DS2Oldenburg Mo DS3San Joaquin Mo DS4San Joaquin Mo

EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 16 Coût de stockage Requêtes dagrégation Facteur « espace » qs : 0.5 %, 2 %, 8 %, 16 % et 32% Facteur « temps » qt : 1 %, 5 %, 10 %, 30 % et 50 % Résultats dexpérimentation (2) Jeux de donnéesPfoser 3DR-treeTTR-tree avec compression de bitmaps DS K K9 025 K8 790 K DS K K K K DS K K K K DS K K K K

EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 17 Résultats dexpérimentation (4) Coût en faisant varier lextension de la requête selon lespace

EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 18 Résultats dexpérimentation (5) Coût en faisant varier lextension de la requête selon le temps

EDA 2006, 19 Juin Représentation et indexation dobjets mobiles dans un entrepôt de données 19 Contributions et perspectives Contributions Modèle multidimensionnel pour objets mobiles contraints par le réseau Implémentation optimisée pour des requêtes OLAP Prototype développé et bons résultats expérimentaux Travaux futurs Test de la combinaison avec des dimensions discrètes Extension aux agrégats complexes (spatiotemporels) Extension aux mesures continues (capteurs embarqués) Extension à dautres types de « faits continus »