La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Sélection automatique dindex et de vues matérialisées dans les entrepôts de données Nora MAIZ, Kamel AOUICHE et Jérôme DARMONT Laboratoire ERIC 5 avenue.

Présentations similaires


Présentation au sujet: "Sélection automatique dindex et de vues matérialisées dans les entrepôts de données Nora MAIZ, Kamel AOUICHE et Jérôme DARMONT Laboratoire ERIC 5 avenue."— Transcription de la présentation:

1 Sélection automatique dindex et de vues matérialisées dans les entrepôts de données Nora MAIZ, Kamel AOUICHE et Jérôme DARMONT Laboratoire ERIC 5 avenue pierre Mendès-France Bron Courriel : EDA Versailles

2 2 Plan Contexte et motivation État de lart Sélection simultanée dindex et de vues matérialisées Expérimentation Conclusion et perspectives

3 3 Contexte et motivation Optimiser les performances Automatisation des tâches dadministration Auto-administration des entrepôts de données

4 4 Problème de sélection dindex Charge de requêtes Temps de réponse Temps Configuration dindex Temps de réponse Sélection dindex Gain Contrainte despace de stockage Configuration dindex Maximiser

5 5 Problème de sélection de vues matérialisées Gain Configuration de vues Temps de réponse Sélection de vues matérialisées Temps Charge de requêtes Temps de réponse Contrainte despace de stockage ou de maintenance Maximiser Configuration de vues

6 6 Problème de sélection simultanée dindex et de vues matérialisées Index candidats Vues candidates Sélection dindex Sélection de vues matérialisées Configuration de vues et dindex Configuration de vues et dindex Contrainte despace de stockage Partage statique de lespace de stockage Sélection isolée dindex et de vues Sélection simultanée Index candidats Vues candidates Configuration de vues et dindex Configuration de vues et dindex Contrainte despace de stockage Prise en compte des interactions index-vues Gestion efficace de lespace de stockage

7 7 État de lart Bellatreche et al. (2000) Agrawal et al. (2000) Rizzi et Saltarelli (2003)

8 8 État de lart Bellatreche et al. (2000) Redistribution de lespace de stockage Compétition entre deux espions dindex et de vues Politique de remplacement

9 9 État de lart Agrawal et al. (2000) Trois alternatives : MVFIRST INDFIRST Joint enumeration

10 10 État de lart Rizzi et Saltarelli (2003) Détermination a priori dun compromis entre lespace de stockage alloué aux index et aux vues Niveau dagrégation de la requête Liste des attributs de la clause Group by Sélectivité des attributs présents dans les clauses having et where

11 11 Sélection simultanée dindex et de vues matérialisées charge Entrepôt de données Métadonnées, schéma, statistiques 1 1. Extraction des requêtes résolues par le système …

12 12 Sélection simultanée dindex et de vues matérialisées Entrepôt de données Métadonnées, schéma, statistiques charge 1 Configuration de vues 2 2. Construction de lensemble des vues matérialisées candidates Matrice requêtes-vues candidates QV

13 13 Sélection simultanée dindex et de vues matérialisées Configuration dindex Entrepôt de données Métadonnées, schéma, statistiques charge 1 Configuration de vues Construction de lensemble dindex candidats Matrice requêtes-index candidats QI

14 14 Sélection simultanée dindex et de vues matérialisées Matrice vues-index VI 3. Construction de lensemble dindex candidats Entrepôt de données Métadonnées, schéma, statistiques charge 1 Configuration de vues 2 Configuration dindex 3 Configuration dindex 3

15 15 Entrepôt de données Métadonnées, schéma, statistiques charge 1 Configuration de vues 2 Configuration dindex 3 Configuration dindex Modèles de coût 4 Configuration dindex et de vues 4. Sélection simultanée dindex et de vues matérialisées Algorithme glouton bénéfice de matérialisation et dindexation Sélection simultanée dindex et de vues matérialisées

16 16 Configuration dindex et de vues Entrepôt de données Métadonnées, schéma, statistiques charge 1 Configuration de vues 2 Configuration dindex 3 Configuration dindex Modèles de coût Construction de la configuration finale dindex et de vues matérialisées Algorithme glouton bénéfice de matérialisation et dindexation Sélection simultanée dindex et de vues matérialisées

17 17 Calcul de bénéfice dindexation Lajout dun index donné à la configuration Config peut améliorer le coût des requêtes de la charge : de façon directe de façon indirecte à travers les vues auxquelles cet index est associé

18 18 Calcul du bénéfice de matérialisation Lajout dune vue à la configuration Config peut améliorer le coût des requêtes de la charge : De façon directe De façon collaborative avec les index associés à cette vue

19 19 Algorithme de sélection simultanée dindex et de vues matérialisées Coût de la charge 1 V1V1 Contrainte despace de stockage Configuration finale dindex et de vues matérialisées i2i2 i2i2 V2V2 i0i0 2 i1i1 V1V1 i1i1 3 ijij … itérations k i1i1 inin i n-1 … Configuration dindex et de vues Fonction objectif VmVm V2V2 i0i0 i2i2 V1V1 i1i1 Charge

20 20 Expérimentation Conditions Entrepôt de données test au sein du SGBD Oracle 9i PC : Windows XP Pro, processeur Pentium 4 à 2.4 GHz, RAM 512 Mo, Disque dur IDE de 120 Go La charge de requêtes est composée de 64 requêtes Stratégie Mesures observées : le temps dexécution de la charge : sans vues matérialisées ni index avec index avec vues matérialisées avec vues matérialisées et index

21 21 Résultats expérimentaux

22 22 Conclusion Une stratégie doptimisation des performances des entrepôts de données : Sélection simultanée dindex et de vues matérialisées Prend en compte linteraction vue-index Traite la sélection de vues et dindex simultanément Notre solution : Générique Modulaire Validée par des expérimentations

23 23 Perspectives Poursuivre les expérimentations et les comparer avec les approches existantes Rendre la sélection de vues et dindex dynamique : Appliquer les travaux de YAO et al. (2005) pour la détection des sessions basée sur le calcul dentropie Rendre la méthode orientée utilisateur (profil): Groupe dutilisateurs Intégrer ou coupler avec dautres mécanismes doptimisation de performance comme la gestion de cache, le regroupement et le partitionnement. Agrawal et al.(2004), Zilio et al.(2004), Bellatreche et al.(2005)

24 24 Merci de votre attention Questions?


Télécharger ppt "Sélection automatique dindex et de vues matérialisées dans les entrepôts de données Nora MAIZ, Kamel AOUICHE et Jérôme DARMONT Laboratoire ERIC 5 avenue."

Présentations similaires


Annonces Google