Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parFrançois Pinto Modifié depuis plus de 10 années
1
Modèle d’entrepôt de données à base de règles
3ème atelier sur la « Fouille de données complexes dans un processus d’extraction des connaissances » FDC06 Lille, Mardi 17 Janvier 2006 Modèle d’entrepôt de données à base de règles Cécile Favre, Fadila Bentayeb et Omar Boussaïd Laboratoire ERIC Université Lyon 2
2
Contexte 1/2 Collaboration avec LCL–Le Crédit Lyonnais
Demande de marketing local : Formulation d’une demande de ciblage pour une action marketing ponctuelle (opération spécifique à un produit ou à un événement). Extraction d’une liste de clients répondant à certains critères Mesure de résultats Analyser des données provenant de sources hétérogènes, indépendantes pour enrichir nos connaissances sur les demandes marketing : données complexes C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006
3
Contexte 2/2 Architecture d’entreposage virtuel de données basée sur la médiation et l’entreposage C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006
4
Problématique Répondre à des besoins d’analyse qui évoluent rapidement
Intégrer des connaissances pour enrichir l’analyse Impliquer davantage l’utilisateur dans le processus décisionnel C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006
5
Modèle multidimensionnel : exemple
Données de LCL pour l’analyse du PNB C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006
6
Modèle d’entrepôt de données à base de règles : R-DW
C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006
7
Connaissances : exemple
Identifiants des agences dédiées aux étudiants : ‘01903’, ‘01905’, ‘02256’ Connaissances utiles pour l’analyse Expression sous forme de règles : si idAgence∈{‘01903’, ‘01905’, ‘02256’} alors type_agence=‘étudiant’ C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006
8
Modèle R-DW : exemple Modèle conceptuel R-DW pour l'analyse du PNB
C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006
9
Règles Expression en extension Expression en intention
Règle de type « si-alors » Ex : agences dédiées aux étudiants Expression en intention Règle de calcul : extraction de caractères, fonction de scoring, … Ex : calcul de l’affinité d’un client pour un produit si idAgence∈{‘01903’, ‘01905’, ‘02256’} alors type_agence=‘étudiant’ affinité=f(caractéristiques du client) C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006
10
Application aux données LCL
Règles enrichissant l’analyse du PNB : C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006
11
Implémentation Plateforme Web (HTML/PHP) qui interface le SGBD Oracle
Principe SGBD Oracle C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006
12
Travaux relatifs : évolution de schéma
Mise à jour de schéma Migrer les données vers le schéma le plus récent (Blaschka et al. 1999, Hurtado et al. 1999) Versionnement de schémas Historiser les dimensions (Bliujute et al. 1998, Chamoni et Stock 1999, Eder et Koncilia 2001) C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006
13
Travaux relatifs : utilisation de règles dans les ED
Définition du modèle d’entrepôt à partir des schémas sources (Kim et al. 2003, Peralta et al 2003) Contraintes d’intégrité (Carpani et Ruggia 2001, Hurtado et Mendelzon 2002, Ghozzi et al. 2003) Gestion d’exceptions dans le processus d’agrégation (Espil et Vaisman 2001) C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006
14
Conclusions Proposition du modèle R-DW pour :
créer des hiérarchies de dimension de façon dynamique ; faire évoluer les contextes d'analyse ; intégrer des connaissances dans le modèle renforcer l'interaction entre l'utilisateur et le système d'aide à la décision Implémentation d’un prototype C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006
15
Perspectives Enrichir l’implémentation
Mesurer la performance de l’approche en termes d'espace de stockage et de temps de réponse Introduire les méthodes d’optimisation (index/vue) Réfléchir à la matérialisation des données générées par les règles Définir un langage qui permet de valider les règles utilisées (gestion des conflits entre les règles, vérification de contraintes sur celles-ci) Prendre en compte l’évolution des règles dans le temps Utiliser des méthodes d'apprentissage non supervisé pour découvrir de nouvelles règles C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006
16
Merci de votre attention.
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.