Modèle d’entrepôt de données à base de règles

Slides:



Advertisements
Présentations similaires
QUALIFICATION COMPORTEMENTALE DES BASES DE DONNEES CLIENTS
Advertisements

GSI Gestion des systèmes dinformation Présentation GSI GSI Gestion des systèmes dinformation.
GROUPES D'INNOVATION.
Internet et le client- serveur Licence Pro IE Cours Internet / Intranet Le Web HTML Protocoles Le client universel Contenus dynamiques.
La distance en formation: une occasion de repenser l’acte d’apprendre
LES INDICATEURS DE PERFORMANCE, « QU’OSSA ÇA DONNE »?
HISTORIQUE DE LA DEMARCHE
IREMIA : Institut de REcherche en Mathématiques et Informatique Appliquées Université de la Réunion Uniformisation des mécanismes de conception de SMA.
Infométrie, ingénierie et métadonnées XML Introduction
19 septembre 2006 Tendances Logicielles IBM Rational Data Architect Un outil complet de modélisation et de conception pour SGBD Isabelle Claverie-Berge.
Evidence Based Medicine (EBM – mise à jour 2006)
Mise en œuvre d’une démarche et d’un outil de gestion de « connaissances métier » basés sur la collaboration. Cyril BEYLIER
Eric BONJOUR, Maryvonne DULMET
La conception d’un tableau de bord prospectif (BSC)
EMN compétences R UV 8 novembre EMN Approche compétences Mission daide à la mise en œuvre opérationnelle Réunion R UV du 8 novembre 2006 GHL Conseil.
Génération interactive dimages projectives : Application à la Radiothérapie Pierre BLUNIER Du 01/12/2002 au 28/03/2003 Centre Léon Bérard.
LÉducation à lEnvironnement pour un Développement Durable dans lacadémie de Rennes Mercredi 31 mai 2006 / IUFM - Brest 1.
15 mai 2006kaETL - Assises CSIESR kaETL ka Extract Transfert Load Jean Marie THIA – Université Pierre et Marie CURIE
15 mai 2006kaETL - Assises CSIESR kaETL ka Extract Transfert Load Jean Marie THIA – Université Pierre et Marie CURIE
PROJET PERSONNEL ET PROFESSIONNEL
LA SEMIOTIQUE DU MULTIMEDIA
Sélection automatique d’index et de vues matérialisées
SAARA : Un Système d’Aide à l’Aménagement Routier Automatisé
Estella Annoni, Franck Ravat, Olivier Teste, Gilles Zurfluh
Un système de médiation basé sur les ontologies
LES OUTILS POUR LA GOUVERNANCE DES DONNÉES LA PASSION DES DONNÉES LA PRÉCISION DES RÉSULTATS.
L’expérience a de l’avenir
XML-Family Web Services Description Language W.S.D.L.
1. Spécialisation de GeoConcept
L'INFORMATION GEOGRAPHIQUE
Chap 4 Les bases de données et le modèle relationnel
SITools Système léger d’accès aux données spatiales
Étude d’un système technique industriel
SYSTEMES D’INFORMATION
SCIENCES DE L ’INGENIEUR
Vincent GOURCUFF, Olivier De SMET, Jean-Marc FAURE
Universté de la Manouba
Riadh Ben Messaoud Kamel Aouiche Cécile Favre
Ecaterina Giacomini Pacurar
Ecully 13 janvier 2006 TROUBLES BIPOLAIRES, ACTUALITES EN PSY, ENTOURAGE ET VIE SOCIALE Jean Pierre GIOT, vice Président - Unafam Rhône, Guy ARDIET.
La discrimination à l’embauche
Évolution de schémas par classification automatique dans les entrepôts de données 3ème journée francophone sur les Entrepôts de Données et l'Analyse en.
Introduction.
Activités développées RTP 12 : Information et connaissance : "découvrir et résumer" Actions spécifiques et équipes-projets associées Objectifs thématiques.
ANALYSE METHODE & OUTILS
BiblioInfo Répertoire des bases de données et des ouvrages de référence Jean-Blaise Claivaz.
1 Gestion des intérêts d’une communauté au moyen d’un agent intelligent El Bachir Boukherouaa, El Bachir Gardouh, Claude Frasson Laboratoire HERON Informatique.
Mise en oeuvre et exploitation
Outil de gestion des cartes grises
© MDTVISION 2006 MDTVISION aide les industriels à gérer le cycle de vie de leurs objets physiques Traçabilité et Auto-identification dans l’industrie |
MTT / RADARR Activité MTT Analyse et représentation conceptuelle
Supports de formation au SQ Unifié
Mise en œuvre d’un portail « OpenSocial » s’appuyant sur la gestion documentaire Nuxeo-DM JRES 2011 –
ATELIER GENIE LOGICIEL
LE DATA WAREHOUSE.
Un processus pour la prise de décision spatiale.
Olivier Leclair, Université Laval Un algorithme de fouille dans une représentation des données par objets: une application médicale SIMON, Arnaud.
L’enseignement de spécialité SLAM
Évaluation et enrichissement de l'approche MUM pour évaluer la qualité décisionnelle a posteriori des données géospatiales Johann Levesque 28 avril Université.
Réunion GafoDonnées: Equipe SIG/IRIT 24/25 janvier 2002
Faiza GHOZZI, Olivier TESTE, Gilles ZURFLUH
Intégration des Tableaux Multidimensionnels en Pig pour
1 Structure en MC Principes Stockage des données dans la mémoire volatile d’un ordinateur Problèmes Stockage temporaire «Petits» volumes de données Langages.
Proposition de possibilité d’évolution de nos spécialités Deux projets (liés) : Projet 1 : Informatique Computationnelle – Etudiants 4 e et 5 e IR Projet.
Les bases, les entrepôts et l’exploration de données
Projet de session Par Eve Grenier Dans le cadre du cours SCG Réalisation d’applications en SIG Jeudi le 20 avril 2006.
PROJET DE SESSION PRÉSENTÉ PAR : Rosemarie McHugh DANS LE CADRE DU COURS : SCG Réalisation d’applications en SIG 16 avril 2007.
3ème Forum de la Finance Islamique – Shari’a Board 09/12/2009 – Paris 1 Shari’a Board Un apport d’accompagnement et d’évolution Ahmed JABALLAH  Conseil.
ARIANE : Interopérabilité sémantique et accès aux sources d'information sur Internet Sylvain Aymard, Michel Joubert, Dominique Fieschi, Marius Fieschi.
Séminaire IRIT-UT1 « Les nouveaux de 2010 » Novembre 2010 Les entrepôts de données et des documents = des entrepôts de documents ? Ronan Tournier
Transcription de la présentation:

Modèle d’entrepôt de données à base de règles 3ème atelier sur la « Fouille de données complexes dans un processus d’extraction des connaissances » FDC06 Lille, Mardi 17 Janvier 2006 Modèle d’entrepôt de données à base de règles Cécile Favre, Fadila Bentayeb et Omar Boussaïd Laboratoire ERIC Université Lyon 2

Contexte 1/2 Collaboration avec LCL–Le Crédit Lyonnais Demande de marketing local : Formulation d’une demande de ciblage pour une action marketing ponctuelle (opération spécifique à un produit ou à un événement). Extraction d’une liste de clients répondant à certains critères Mesure de résultats Analyser des données provenant de sources hétérogènes, indépendantes pour enrichir nos connaissances sur les demandes marketing : données complexes C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006

Contexte 2/2 Architecture d’entreposage virtuel de données basée sur la médiation et l’entreposage C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006

Problématique Répondre à des besoins d’analyse qui évoluent rapidement Intégrer des connaissances pour enrichir l’analyse Impliquer davantage l’utilisateur dans le processus décisionnel C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006

Modèle multidimensionnel : exemple Données de LCL pour l’analyse du PNB C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006

Modèle d’entrepôt de données à base de règles : R-DW C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006

Connaissances : exemple Identifiants des agences dédiées aux étudiants : ‘01903’, ‘01905’, ‘02256’ Connaissances utiles pour l’analyse Expression sous forme de règles : si idAgence∈{‘01903’, ‘01905’, ‘02256’} alors type_agence=‘étudiant’ C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006

Modèle R-DW : exemple Modèle conceptuel R-DW pour l'analyse du PNB C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006

Règles Expression en extension Expression en intention Règle de type « si-alors » Ex : agences dédiées aux étudiants Expression en intention Règle de calcul : extraction de caractères, fonction de scoring, … Ex : calcul de l’affinité d’un client pour un produit si idAgence∈{‘01903’, ‘01905’, ‘02256’} alors type_agence=‘étudiant’ affinité=f(caractéristiques du client) C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006

Application aux données LCL Règles enrichissant l’analyse du PNB : C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006

Implémentation Plateforme Web (HTML/PHP) qui interface le SGBD Oracle Principe SGBD Oracle C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006

Travaux relatifs : évolution de schéma Mise à jour de schéma Migrer les données vers le schéma le plus récent (Blaschka et al. 1999, Hurtado et al. 1999) Versionnement de schémas Historiser les dimensions (Bliujute et al. 1998, Chamoni et Stock 1999, Eder et Koncilia 2001) C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006

Travaux relatifs : utilisation de règles dans les ED Définition du modèle d’entrepôt à partir des schémas sources (Kim et al. 2003, Peralta et al 2003) Contraintes d’intégrité (Carpani et Ruggia 2001, Hurtado et Mendelzon 2002, Ghozzi et al. 2003) Gestion d’exceptions dans le processus d’agrégation (Espil et Vaisman 2001) C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006

Conclusions Proposition du modèle R-DW pour : créer des hiérarchies de dimension de façon dynamique ; faire évoluer les contextes d'analyse ; intégrer des connaissances dans le modèle renforcer l'interaction entre l'utilisateur et le système d'aide à la décision Implémentation d’un prototype C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006

Perspectives Enrichir l’implémentation Mesurer la performance de l’approche en termes d'espace de stockage et de temps de réponse Introduire les méthodes d’optimisation (index/vue) Réfléchir à la matérialisation des données générées par les règles Définir un langage qui permet de valider les règles utilisées (gestion des conflits entre les règles, vérification de contraintes sur celles-ci) Prendre en compte l’évolution des règles dans le temps Utiliser des méthodes d'apprentissage non supervisé pour découvrir de nouvelles règles C. Favre, F. Bentayeb et O. Boussaïd Atelier FDC – 17 Janvier 2006

Merci de votre attention.