Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parWillelm Revel Modifié depuis plus de 10 années
1
Présenté par : Yasser HACHAICHI Sous la direction de : Mr. Jamel FEKI
DU RELATIONNEL AU MULTIDIMENSIONNEL : CONCEPTION DE MAGASINS DE DONNÉES Présenté par : Yasser HACHAICHI Sous la direction de : Mr. Jamel FEKI
2
PLAN : Systèmes d’information décisionnels Contexte et motivations
Présentation de l’approche Extraction des concepts multidimensionnels Bilan & Perspectives
3
Systèmes d’information décisionnels (SID)
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Introduction : Systèmes d’information décisionnels (SID) Dédiés au pilotage des entreprises Basés sur des structures particulières de stockage ED & MD MD SOURCES DE DONNEES ED MD Réduites à des MD pour des raisons telle que d’économie de coûts, de délais du projet décisionnel Approche quasi-automatique de construction de schémas de MD à partir de sources cible
4
Contexte : Approches de conception de SD : Ascendantes
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Approches de conception de SD : Ascendantes, Descendantes et Mixtes Ascendantes Partant de diagrammes E/R E/R parfois non disponible ou obsolète Double compétence en : Modélisation du SI, Modélisation MD Génération d’un grand nombre de schémas MD Pas de règles pour dériver automatiquement les représentations logiques =>Approche quasi-automatique partant d’une source relationnelle
5
Problématique : Méthode
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Problématique : Méthode Objectif : Méthode et outil de conception Élaborer une méthode quasi-automatique Identifier les concepts multidimensionnels pertinents Assister le concepteur décisionnel Utiliser une version récente du schéma de la source Préparer le passage automatique vers le niveau logique Proposition : Développer un outil d’aide à la conception de MD Définir des heuristiques d’extraction (source rela.), Affecter un niveau de pertinence aux concepts extraits Associer concept-source
6
Attribution de pertinence Interventions du concepteur
Principe de la méthode Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives BD Attribution de pertinence MD retenus Interventions du concepteur
7
Extraction de Concepts MD
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Identification : travaux sur l’E/R Associations n-aire fait (Kimball 97), (Golfarelli et al. 98), (Cabibbo et al. 98), (Soussi et al. 05) Entité dimension, paramètre ou fait (Moody et al 2000), (Bonifati et al 2001), (Phipps et al 2002) Concepts E/R : Deux concepts Relationnel : Un concept Difficulté : Une relation R, Est-elle entité ? ou association ?
8
Identification de la classe conceptuelle :
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Identification de la classe conceptuelle : Source Relationnelle … R1(A1,A2,A3) R2(A4,A5,A6) Rn(A1#,A4#,…,A9) Entité Association Éléments de réponse (structure des rel.) : Relation-entité : Clé primaire Clé étrangère Relation-association : Clé primaire Clé étrangère Je préfère : Clé primaire (ne contient pas : même symbole mais dans le sens contraire ) clé étrangère Clé primaire contient des clés étrangères
9
Extraction d’un fait : Origine
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Origines des faits dans une source E/R : Origine des faits dans une source rel. Relation Fait L’animation de la branche gauche n’est pas bien visible. Relation-Association Relation-Association Relation-Entité Deux niveaux de pertinence de faits
10
Extraction des faits : Relation-association (R-a)
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Hf1 : Toute R-a contenant au moins un attribut numérique non clé est un fait candidat pertinent. R-association Numérique COMPORTE_GRP (AN_UNIV, COD_MAT#, NAT_ENSMT, NBR_GRP)
11
Extraction des faits : Relation-entité (R-e)
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Hf2 : Toute R-e contenant au moins un attribut numérique non clé est un fait candidat de faible pertinence. R-entité Numérique AUDITOIRE (COD_AUD, INT_AUD, NUM_CYC, COD_SEC #)
12
Extraction des mesures : Origine
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Deux cas : Attributs Mesures Relation-Fait F Relation-Fait F Relations parallèles Deux niveaux de pertinence de mesures
13
Extraction des mesures : Relation-fait :
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Hm1 : Les attributs numériques non clés appartenant exclusivement à une relation-fait F sont des mesures candidates pour F. Numérique Relation fait COMPORTE_GRP (AN_UNIV, COD_MAT #, NAT_ENSMT, NBR_GRP)
14
Extraction des mesures : Relations //
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Associations parallèles // Relations parallèles R1 (ID_ENT2#, ID_ENT1, ATT_NUM1) R1 (ID_ENT2#, ID_ENT1, ATT_NUM1) // = R2 (ID_ENT2#, ID_ENT1, ID_ENT3, ATT_NUM1) R2 (ID_ENT2#, ID_ENT1, ATT_NUM1)
15
Extraction des mesures : Relations // :
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Hm2 : Si une relation-fait R1 est parallèle à une autre R2 alors les attributs numériques non clés appartenant à R2 constituent des mesures candidates, éventuellement agrégées, pour R1. REGROUPE_ETUD (AN_UNIV, COD_MAT #, NBR_ETUD) Agrégation COMPORTE_GRP (AN_UNIV, COD_MAT #, NAT_ENSMT, NBR_GRP)
16
Extraction des dimensions : Origines
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Plusieurs cas : Dimension (F) Attribut Entité vide Relation-Entité Directement liées à F Relation-Entité Directement liées à F Attributs temporels ou Booléens Attributs temporels ou Booléens Deux niveaux de pertinence
17
Extraction des dimensions : Relation
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Hd1 : Toute relation-entité R directement référencée par une relation-fait F est une dimension candidate pour F. L’identifiant de cette dimension est celui de R COMPORTE_GRP (AN_UNIV, COD_MAT #, NAT_ENSMT, NBR_GRP) MATIERE (COD_MAT, COD_AUD #, INT_MAT, VOL_HOR_MAT) Dimension ID_dimension
18
Extraction des dimensions : Attribut (1)
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Attributs booléens ou temporels Hd2 : Tout attribut booléen ou temporel (Hd3) appartenant à une relation-fait donne naissance à une dimension pertinente dont il est l’identifiant.
19
Extraction des dimensions : Attribut (2)
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Extraction des dimensions : Attribut (2) Attribut clé décrivant une entité vide Ent_2 (A4, A5) Assoc_1 (A4#, A1, A7) Hd4 : Si un attribut de la clé primaire d'une relation-fait de classe Ra n'est pas une clé étrangère alors cet attribut construit une dimension candidate.
20
Extraction des dimensions : Attribut (3)
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Extraction des dimensions : Attribut (3) Attribut non clé décrivant une entité vide Ent_1 (A1, A2, A4). Problème!! Résolu si Ent_1 (A1, A2, A4). Ent_3 (A7,…, A4) (si y = 1) Assoc_2 (A7, A4) (si y>1) ?,n ?,y
21
Extraction des dimensions : Attribut (3)
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Extraction des dimensions : Attribut (3) Attribut non clé décrivant une entité vide Hd5 : Tout attribut a non clé appartenant à une relation-fait et à d’autre(s) relation(s) est un identifiant candidat d'une dimension construite sur a. ENSEIGNANT (NUM_ENS, NOM_ENS, PRE_ENS, NUM_TEL_F, NUM_TEL_M, E_MAIL, TYP_ENS, GRAD_ENS) Problème CHARGE_EXIGEE (NAT_ENSMT, GRAD_ENS, CHARG_HOR_EXI)
22
Extraction des hiérarchies : Origines
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Plusieurs cas : Hiérarchie (Hd1) Attribut Entité vide Relation-Entité Directement liées à d Relation-Entité Directement liées à d Attributs temporels ou Booléens Attributs temporels ou Booléens une dimension d (construite sur une relation par Hd1) pourrait contenir des attributs où être liée à d'autres relations qui pourraient fournir des niveaux hiérarchiques pour d. Deux niveaux de pertinence
23
Extraction des hiérarchies : Relations
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Paramètres de rang 2 Hh1 : Si la clé primaire PK d'une relation de classe R-e est directement référencée par une relation-dimension d alors PK est un paramètre candidat de rang 2 pour une nouvelle hiérarchie de d.
24
Extraction des hiérarchies : Attributs (1)
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Paramètres de rang 2 Hh2 : Tout attribut booléen ou temporel appartenant à une relation-dimension d est un paramètre candidat terminal de rang 2 d'une hiérarchie définie sur d.
25
Extraction des hiérarchies : Attributs (2)
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Paramètres de rang 2 Hh3 : Tout attribut non clé appartenant simultanément à une relation-dimension d et à d'autre(s) relation(s) est un paramètre candidat de rang 2 d'une hiérarchie de d. Paramètres de rang > 2 L'application récursive de Hh1 à Hh3 sur les relations dont la clé est un paramètre de rang i>1(Hh1) produit des paramètres de rang i+1.
26
Extraction de Concepts MD
Illustration : Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives MATIERE COD_MAT COD_AUD : INT_MAT, VOL_HOR_MAT Hd1 AUDITOIRE COD_AUD, INT_AUD, NUM_CYC, COD_SEC Hh1 P P ENSEIGNEMENT _ASSURE COD_MAT : NUM_ENS : NUM_SEM, NAT_ENSMT, AN_UNIV, NBR_GRP_ENS Hf1 Hh1 ENSEIGNANT NUM_ENS, NOM_ENS, PRE_ENS, NUM_TEL_F, NUM_TEL_M, E_MAIL, TYP_ENS, GRAD_ENS Hd1 SECTION COD_SEC, INT_SEC P Hd4 P M Si tu ajoutes le numéro de l’heuristique à chaque fois ? Hm1 Hh4 CHARGE_EXIGEE NAT_ENSMT GRAD_ENS, CHARG_HOR_EXI P
27
Extraction de Concepts MD
Illustration : Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives AN_UNIV TYP_ENS DCS_AN_UNIV INT_AUD E_MAIL NUM_CYC COD_ENS GRAD_ENS ENSEIGNEMENT_ASSURE COD_MAT COD_SEC ENSEIGNANT MATIERE NBR_GRP_ENS COD_AUD INT_SEC NOM_ENS INT_MAT PRE_ENS DCS_NUM_SEM DCS_NAT_ENSMT NUM_SEM NAT_ENSM
28
Extraction de Concepts MD
Evaluation : Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Appliqué en plus sur des sources dans la littérature des systèmes décisionnels : CAME : identifie toutes les dimensions à l'exception des dimensions construites sur des entités vides uniquement liées au fait CAME : identifie toutes les mesures à l'exception des mesures calculables. CAME : identifie automatiquement tous les faits possibles
29
Bilan & Perspectives : Bilan Perspectives
Introduction Contexte Présentation de l’approche Extraction de Concepts MD Bilan & Perspectives Bilan Méthode de construction assistée de schémas de MD en étoile Outil CAME Tests de notre méthode sur plusieurs cas type de sources relationnelles Perspectives Finaliser CAME produit qui aide les entreprises à se doter de leur propre SD : Introduction des mesures calculées Génération automatique des procédures de génération de schémas logiques et de chargement (Mastère qui démarre). Diversification des sources
30
Merci de votre attention
Yasser Hachaichi Laboratoire MIRACL Département Informatique, Faculté des Sciences Economiques et de Gestion de Sfax-Tunisie
31
JFO 2007 2002, 2004 2006 2007 … INVITE
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.