Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parValentine Audy Modifié depuis plus de 8 années
1
Un système autonomique basé sur des bases de connaissances pour améliorer les performances d’un entrepôt de données Réalisé par : OUSSAFI MOHAMMED HOURRI SOUFIANE Encadré par : MME. L.LAMRINI 1
2
Réalisateurs de l’article Vlad Nicolicin-Georgescu, Vincent Benatier, Rémi Lehn, Henri Briand, Université de Nantes 2
3
PLAN Introduction Problématique Objectif Bases de connaissances - gestion et proposition Calcul autonomique et la gestion de la base de connaissances Approche – conception et résultats Conclusion 3
4
Problématique L’augmentation de la quantité et de la complexité des informations pose de plus en plus de problèmes pour les performances des entrepôts de données 4
5
Objectif Système autonomique permettant d’analyser et d’optimiser les allocations de caches mémoire des entrepôts de données 5 Nouveaux paramètres d’allocation Statistiques d’exploitation en cours Amélioration des performances
6
Connaissances Le système proposé est basé sur des connaissances décrivant : Le système et son architecture, Les valeurs des caches, Règles représentant des contraintes et des conseils pour l'allocation des caches 6
7
Connaissances Architectures matérielles et logicielles Les mesures de performances des systèmes Formaliser Base de connaissances
8
Système proposé Processus De prise de décision Besoins du Client Bases de Connaissances 8 ? Le calcul autonomique
9
Base de connaissance Gestion d’une base de connaissance Unifiée Représentation PartageableExploitable 9
10
Base de connaissance Trois principaux types de connaissances impliqués dans la prise de décision : L'information sur les systèmes et leur architecture Les rapports des performances des systèmes L'analyse des systèmes et de leur fonctionnement 10
11
L'information sur les systèmes et leur architecture Correspond à toutes les données concernant n'importe quel matériel ou logiciel impliqué dans l'aide à la décision 11 Exemple : Quantité mémoire cache disponible
12
Les rapports des performances des systèmes Ils contiennent de nombreux indicateurs de performance à prendre en compte tels que : Le temps de réponse sur les requêtes, le taux d'utilisation des caches, 12
13
L'analyse des systèmes et de leur fonctionnement Un ensemble de règles décrire des processus d'analyse et d'optimisation : Les conseils Les contraintes 13
14
Calcul autonomique et la gestion de la base de connaissances 14
15
Calcul autonomique et la gestion de la base de connaissances Les organisations en informatiques décisionnelle passent l’essentiel de leur temps au niveau de l’infrastructure, Limitation des activités de supervision des systèmes, Les empêchant de prévoir les problèmes avant que ceux-ci n’aient un impact auprès des utilisateurs, Sujet a déjà été appliqué a l’optimisation des performances des Bases de données par IBM et Microsoft, 15
16
Calcul autonomique et la gestion de la base de connaissances Les spécification d’IBM définissent un composant: Le gestionnaire autonomique (rôles): 1. Coordonner l’ensemble de l’activité du processus de calcul autonomique, 2. Détecter les changement à la proposition d’actions, Le gestionnaire autonomiques(phases d’activité): 1. Supervision, 2. Analyse, 3. Planification, 4. Exécution, Notation: MAPE-K boucle(Monitoring, Analysis, Planning, Execution & Knowledge) 16
17
Calcul autonomique et la gestion de la base de connaissances Application de la boucle MAPE-K aux bases des connaissances, principalement au niveau de l’analyse du système et de son fonctionnement, Définition des ensembles de règles pour chacune des phases de la boucle MAPE-K, Idée : Une boucle passant par différents états qui analyse et optimise un système donnée, 17
18
Calcul autonomique et la gestion de la base de connaissances La boucle MAPE-K est régulièrement évaluée lors de la modification de valeurs de caches pour chaque base, Elle est évaluée chaque nuit lors de traitements par lots, Les statistiques sur le taux d’utilisation du cache sont collectées le jour, À chaque itération, les paramètres de cache sont ajustés jusqu'à obtenir un taux d'utilisation du cache demandé, 18
19
Calcul autonomique et la gestion de la base de connaissances Evolution du taux moyen d'utilisation du cache pour l'ensemble des bases du système décisionnel, pour une période de deux semaines, sans prendre en compte les métriques d'optimisation. 19
20
Calcul autonomique et la gestion de la base de connaissances Le temps mis à déterminer de nouvelles valeurs de cache est important, Proposition des règles de gestion à base de métrique dans la boucle, afin que les mises à jour des paramètres de cache soient plus efficaces et plus pertinentes. 20
21
Approche – conception et résultats 21
22
Approche – conception et résultats Utilisation d’un jeu de test dans lequel ils ont simulé un environnement du monde réel avec ses paramètres associés, Types de données et les liens entre ces données utilisation des ontologies, Les modèles de connaissances sont abordés selon deux points de vue: Statique, dynamique, 22
23
Point de vue statique Point de vue statique de la base de connaissances est représenté par les deux types d’information: L’information sur les systèmes, Les rapports de performances des systèmes, La base de connaissances est décrite par: Classes, Individus, Propriétés, Associations, Langage d’ontologie: OWL (Web Ontology Language) 23
24
Point de vue statique Les valeurs de cache et de taille de fichiers sont exprimées grâce à des « datatype properties » OWL, Les concepts sont mis en relation au moyen d'object properties OWL, Au total, l’ontologie regroupe actuellement: plus de 150 axiomes, 16 classes, 35 individus, 15 propriétés objet, 46 propriétés data type, 24
25
Point de vue dynamique Point de vue dynamique (Principale enjeu de l’approche): Il regroupe: toutes les règles correspondant à la boucle du calcul autonomique, les états du gestionnaire autonomique, les règles déterminant les dépendances entre les propriétés, les inférences d'instances de l'ontologies, Utilisation des règles Jena via l’API Java Jena pour le développement de l’ontologie, 25
26
Point de vue dynamique Les règles sont réparties selon les connaissances qu'elles produisent, conformément à la boucle du calcul autonomique, Au total, il y a un nombre de 56 règles, qui regroupent les règles métiers et les règles de gestion des phases du gestionnaire autonomique, 26
27
Point de vue dynamique La règle d'analyse métier décrite de manière informelle de la façon suivante: Pour une base, La valeur du cache d’index doit être la plus proche possible de la taille de fichier d’index (Cas idéal = 100% utilisation de cache), 27
28
Point de vue dynamique Processus d’optimisation sans/avec règles métier … la meilleure configuration de cache possible du point de vue de la métrique d’amélioration 28
29
Conclusion 29
30
Conclusion Gestion des systèmes décisionnels, L‘ajustement des paramètres d’allocation de cache dans les cubes, Application du calcul autonomique et les ontologies, 30
31
Merci de votre attention 31
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.