La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Approche semi-automatisée de conception de schémas multidimensionnels valides Laboratoire Article présentée par : Ahlem SOUSSI Ingénieur en informatique.

Présentations similaires


Présentation au sujet: "Approche semi-automatisée de conception de schémas multidimensionnels valides Laboratoire Article présentée par : Ahlem SOUSSI Ingénieur en informatique."— Transcription de la présentation:

1 Approche semi-automatisée de conception de schémas multidimensionnels valides Laboratoire Article présentée par : Ahlem SOUSSI Ingénieur en informatique & Étudiante en 2ème année mastère F.S.T. Tunisie Directeurs de Mastère M.A. Jamel FEKI M.C. Faiez GARGOURI 10 Juin 2005

2 2 Plan Introduction État de lart Approche proposée Architecture fonctionnelle Modules Conclusion et perspectives

3 3 Systèmes décisionnels Deux espaces de stockage : lentrepôt de données (ED) les magasins de données (MD) Systèmes transactionnels => production Système décisionnel => pilotage ED MD SOURCES DE DONNEES

4 4 Modèles Multidimensionnels

5 5 Plan Introduction État de lart Approche proposée Architecture fonctionnelle Modules Conclusion et perspectives

6 6 Etat de lart Guidée par les besoins Guidée par la source Mixte Basée sur requêtes décisionnels Source de données requêtes et source Participation des utilisateurs dans la conception de lED fortelimitéeforte Structuration de lapproche nonoui Automatisation manuellesemi-automatique Adopté par Kimball Golfarelli, Cabibbo, Moody, Hüsemann Bonifati, Phipps Types dapproche Propriété

7 7 Plan Introduction État de lart Approche proposée Architecture fonctionnelle Modules Conclusion et perspectives

8 8 Approche proposée Limite des approche mixtes : Générer et gérer un grand nombre de schémas candidats inutiles Approche proposée : Mixte Privilégie les besoins OLAP / aux besoins offerts par les sources

9 9 Architecture fonctionnelle Génération de schémas en constellation Génération de schémas en étoile Correspondance et validation des schémas en étoile Dictionnaire Schémas des Sources de Données Schémas en étoile idéaux des MD Schémas en étoile valides des MD Acquisition graphique des besoins OLAP Génération de schémas de MD Génération dun schéma dED Besoins OLAP semi-structurés Schéma de lED Besoins OLAP exprimés BD de spécification des besoins décisionnels Schémas valides des MD Génération de schémas de MD

10 10 Structure des besoins OLAP

11 11 Génération des étoiles Enrichissement des tableaux de besoins Tableaux spécifiés => Tableaux enrichis Construction des étoiles Tableaux enrichis ===> schémas en étoiles GEN E T O I L E DOM 1DOM 2 DOM 3 f1 f2 f3

12 12 Sch : Schéma en étoile équivalent au tableau T 1 T1T1 Exemple T2T2 Sch 1 : Schéma en étoile résultant de lajout de T 2 à Sch

13 13 Correspondance étoiles/Source Correspondance des : Faits, Mesures, Dimensions, Hiérarchies Deux étapes : –Extraction des termes potentiels sources –Correspondance Correspondance étoile idéale / source (E/R) Validation des correspondances effectuées

14 14 Exemple dune source E/R

15 15 faits potentiels ? Entités ou associations n-aires contenant au moins un attribut numérique non-clé. Correspondance du fait DIM 1 DIM 2 fait mesures Identifiant H1_DIM1H2_DIM1 Param 1 Param N Enseignement

16 16 Mesures potentielles d1 fait F ? Si F-ass est une association n-aire : Les attributs numériques non-clés appartenant au(x) : Fait F-ass Associations parallèles à F-ass Entités directement liées par F-ass Si F-ass est une entité : Les attributs numériques non-clés appartenant au(x) : F-ass Entités ou association porteuse de données (Ent ou Apd) liées à F-ass par un lien (1,1) Entités liées à F-ass par un lien (1,n) Correspondance des mesures DIM 1 DIM 2 Identifiant H1_DIM1H2_DIM1 Param 1 Param N fait mesures Nbre_ groupe_ enseignés, … Enseignement

17 17 Identifiant H1_DIM1H2_DIM1 DIM 2 DIM 1 Param 1 Param N fait mesures Correspondance des dimensions (1) identifiants potentiels de dimensions ? Les attributs appartenant au(x) : Fait F-ass Ent ou Apd appartenant à la fermeture transitive de F-ass ( c. à d. directement ou transitivement liées à F-ass par un lien (1,1) ou (1,n)) Nbre_ groupe_ enseignés, … Enseignement MATIERE Code_Matière

18 18 Attributs faibles potentiels de ldentifiant dune dimension ? Les attributs appartenant au(x) : Fait F-ass Ent ou Apd liées à F-ass par un lien (1,1) Correspondance des dimensions (2) Libellé_Matière Identifiant H1_Matière DIM 2 DIM 1 Cycle fait mesures Nbre_ groupe_ enseignés, … Enseignement MATIERE Code_Matière Code_Auditoire Attributs_faibles

19 19 Libellé_Section Code Section Code Matière Code Auditoire Libellé Matière Volume horaire MATIERE Libellé_Auditoire H1_Matière Correspondance des hiérarchies (1) identifiants potentiels de dimensions ? Les attributs appartenant au(x) : Fait F-ass Ent ou Apd appartenant à la fermeture transitive de F-ass ( c. à d. directement ou transitivement liées à F- ass par un lien (1,1) ou (1,n))

20 20 Correspondance des hiérarchies (2) Matière Libellé_Auditoire Code_Auditoire Code_Matière Code_Section Libellé_Matière Volume_horaire Extraction des attributs faibles potentiels de P ? Les attributs non-clés appartenant à : Lélément E contenant P-ass Ent ou Apd liées à E par un lien (1,1)

21 21 Validation des correspondances Ajustement des correspondances effectuées corriger/supprimer les correspondances incorrectes Compléter les correspondance manquantes Choix de la correspondance la plus appropriée Amélioration de la correspondance retenue éliminer les éléments sans correspondant ajouter des mesures calculables valides ajouter des dimensions et des attributs supplémentaires

22 22 Métrique des : Mesures Dimensions Hiérarchies Paramètres Calculés pour chaque solution de correspondance Comptent le nombre de mesures, dimensions, hiérarchies et paramètres (dun schéma en étoile) ayant un correspondant dans la source Cas de plusieurs solutions de correspondance Fp 1 : Fp i : Fp n Sol n Sol i Sol 1 Corresp. des mesures Corresp. des dimensions Corresp. des hiérarchies Corresp. des mesures Corresp. des dimensions Corresp. des hiérarchies Corresp. des mesures Corresp. des dimensions Corresp. des hiérarchies Comparer les n solutions de corresp Sol j choisie fait F Faits potentiels associés à F Fait Fp j associé à F

23 23 Génération des constellations Entrée : des étoiles valides Sortie : des étoiles + des constellations Idée de base : similitude entre schémas multidimensionnels CritèreSim(Si,Sj) si p=0 0 si p=n=m 1 si p=1 1/5 si p=n et n=m/2 et n

24 24 Algorithme de principe : Calculer MS et son maximum Max Consteller les schémas les plus similaires Mettre à jour la matrice MS Réitérer Génération des constellations (2) Arrêt : - Taille(MS) =1, - valeurs de similitude faibles - sur demande. MSS1S1. SiSi SkSk S1S1 - ???? :- ??? SiSi - ?? :- ? SkSk -

25 25 Plan Introduction État de lart Approche proposée Architecture fonctionnelle Modules Conclusion et perspectives

26 26 Conclusion et perspectives Approche de construction de MD en 3 étapes : Génération des étoiles Correspondance et validation des étoiles Génération des constellations Perspectives Implémentation de la méthode de correspondance avec des sources de données relationnelles. Intégration des schémas de MD schéma de lED.

27

28 28 Modèles Multidimensionnels Fait : activité analysé Dimension : axe danalyse Modèle en étoile 1 fait central dimensions Modèle en constellation ++ faits ayant des dimensions communes Fusion de ++ schémas en étoile

29 29

30 30 ED & MD Entrepôt de données ("data warehouse") – lieu de stockage centralisé d'un – extrait des sources – pertinent pour les décideurs, – daté, historisé – organisé selon un modèle informatique facilitant la gestion des données. Magasin de données ("data mart") – extrait de l'entrepôt – adapté à une classe de décideurs (ou à un usage particulier) – organisé selon un modèle approprié aux outils d'analyse.


Télécharger ppt "Approche semi-automatisée de conception de schémas multidimensionnels valides Laboratoire Article présentée par : Ahlem SOUSSI Ingénieur en informatique."

Présentations similaires


Annonces Google