R. Saint-Paul, G. Raschia and N. Mouaddib IRIN, Nantes (France)

Slides:



Advertisements
Présentations similaires
REFERENTIEL DE LA SERIE STG
Advertisements

Applications N-Tiers Rappels: architecture et méthodologie
STEVE WOLOZ & ASSOCIATES INC. MANAGEMENT CONSULTANTS Meilleures Pratiques de Collecte, DAnalyse et de Documentation de Données RH Le 8.
Optimisation des requêtes
Approche graphique du nombre dérivé
« Systèmes électroniques »
A. Cornuéjols IAA (basé sur Rob Schapires IJCAI99 talk) Combiner des apprenants: le boosting.
Classification et prédiction
Projet extranet My.Eolas
Projet de Base de Données Groupe Moteur encadré par Mr MAINGUENAUD KikiTeam – ASI3 – 19 / 06 / 2002 Soizic Geslin Minh Le Hoai Samy Fouilleux Maxime Chambreuil.
1 1 Momentum. 2 2 Tout objet en mouvement continuera son mouvement tant que rien nentrave sa progression.
Le developpement web  Préparé par : ASSAL Lamiae JAMALI Zakarya
Choisir les membres de votre équipe. « Personne ne peut siffler une symphonie. Seul un orchestre peut la jouer. » ~Halford E. Luccock 1.
1. 2 LE DÎNER TRADITIONNEL CHINOIS OU LIMAGE DUN MODÈLE SYSTÉMIQUE DE LAPPRENTISSAGE EN MILIEU SCOLAIRE.
La méthode expérimentale TD 2 - Licence Laure Fernandez
JXDVDTEK – Une DVDthèque en Java et XML
Le Modèle Logique de Données
Optimisation algébrique de requêtes relationnelles
Défi écriture BEF Couverture. Défi écriture BEF Page 1.
1 Efficient Data and Program Integration Using Binding Patterns Ioana Manolescu, Luc Bouganim, Francoise Fabret, Eric Simon INRIA.
Optimisation de Requêtes
Gestion des connaissances
Plus rapide chemin bicritère : un problème d’aménagement du territoire
Conception d’une application de gestion de fiches études
Interface Homme Machine IHM Pro
Sélection automatique d’index et de vues matérialisées
Initiation au système d’information et aux bases de données
Coupe de France de Robotique 2007 Candidat n°4 – Steven LY BTS IRIS – PROMOTION
XT-SOFT SQL-TUNE. 2 Menu dAccueil 3 Sélection des Statistiques Maintenant allons sur Statistics : PF4 04 par PF4 ou en entrant dans Enter option : la.
PBST*: une nouvelle variante des SDDS
Modèle d’interaction pour les systèmes mixtes
Contrôles d'accès aux données
Introduction to Information Systems
Principes de persistance dans les applications orienté objet
Méthode des k plus proches voisins
Les requêtes Les requêtes permettent dinterroger une base de données suivant 3 opérateurs : La projection Affiche le contenu dun champ complet En langage.
Configuration de Windows Server 2008 Active Directory
Quelques Modèles de conception
Recherche Documentaire et traitement de l’information
L’utilisation des bases de données
SYSTEMES D’INFORMATION
SCIENCES DE L ’INGENIEUR
Projet de diplôme 2011 Miserez David
IGL301 - Spécification et vérification des exgiences 1 Chapitre 1 Introduction (ref : Bray chapitre 1)
1 SQL: Requêtes, Programmation et Triggers Chapitre 5, Sections
Algèbre Relationnelle
1 SQL: Requêtes, Programmation et Triggers Chapitre 5, Sections
Universté de la Manouba
Cours de Base de Données & Langage SQL
Cours N°2 Base de Données & Langage SQL
Ecaterina Giacomini Pacurar
Web sémantique : Web de demain
Module d’Enseignement à Distance pour l’Architecture Logicielle
1 Protection des arbres multicast avec une forêt duale Mohand Yazid SAIDI Bernard COUSIN Miklós MOLNÁR 15 Février 2006.
Conception des Réalisé par : Nassim TIGUENITINE.
Michel Tollenaere SQL et relationnel ENSGI Cours MSI 2A Relationnel et SQL version 1.4 du 25 septembre 2007 (ajout jointures) 1 Modèle relationnel Historique.
Christine Bonnet SOURCES : « Samples » dOracle, « Oracle 8 » R. Chapuis PRO*C – C ++
BLOGS (carnets web, cybercarnets) Didactiques des NTICS.
Découverte de correspondances entre ontologies distribuées
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
ECOLE DES HAUTES ETUDES COMMERCIALES
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
1 Modèle pédagogique d’un système d’apprentissage (SA)
Introduction.
ANALYSE METHODE & OUTILS
Quel est l’intérêt d’utiliser le diagramme de Gantt dans la démarche de projet A partir d’un exemple concret, nous allons pouvoir exploiter plusieurs parties.
PRESTO Programme d’étude de séries temporelles Projet 4 ème année Jean-Frédéric Berthelot Paul-Alain Bugnard Camille Capelle Sébastien Castiel.
Réalisé par : Mr IRZIM Hédi Mr JRAD Firas
Optimisation de requêtes
L T I Laboratoire de Téléinformatique 2 Projet de semestre Parseur XML basé sur la DTD : Buts –Utiliser la grammaire définissant un type de fichiers XML.
Transcription de la présentation:

R. Saint-Paul, G. Raschia and N. Mouaddib IRIN, Nantes (France) Résumé de base de données: Application à des données marketing bancaires R. Saint-Paul, G. Raschia and N. Mouaddib IRIN, Nantes (France)

Table des matières Présentation rapide du modèle SaintEtiQ pour le résumé de données Application à une base de données réelle: marketing bancaire Méthode d’exploitation des résumés pour la prise de décisions 2

Vue générale du modèle 3

Connaissances du domaine Permet à l’utilisateur de définir un langage pour la description de ses données A chaque attribut est affecté une partition linguistique floue Exemple: Partition linguistique pour l’attribut revenu 4

Apprentissage Incrémental Clustering conceptuel incrémental Optimisation locale : Mesure de la qualité de la partition (typicité et contraste) utilisée pour choisir le meilleur opérateur d’apprentissage Mise à jour de la description du contenu intensionnel du résumé 5

Opérateurs d’apprentissage Tuple Candidat z3 z2 z1 z0 z0 z0 affectation z1 z2 z3 création z3 z2 z1 z0 z4 6

Opérateurs d’apprentissage z3 z2 z1 z0 z3 z4 z0 z2 z1 fusion z2 z1 z0 z12 z11 éclatement z2 z12 z11 z0 7

Contenu intensionnel La description du contenu intensionnel des résumés est, pour chaque attribut, un ensemble flou de descripteurs linguistiques avec leurs supports relatifs Exemple : revenu = <raisonnable/0.9, modeste/0.7> Un processus de généralisation est possible en se basant sur les connaissances de domaine Exemple : <misérable/0.9, modeste/0.7> <faible/0.8> 8

Application réelle Présentation du jeux de données: Données marketing du groupe CIC 33700 enregistrements 70 attributs (10 utilisés pour le résumé) 3 à 8 labels définis sur chaque attribut comme connaissance de domaine 9

Comportement dynamique

Hiérarchie finale Temps total d’exécution: 21 minutes Tuples candidats traités : 55 724 depuis les 33700 tuples originaux Nombre de feuilles : 14 766 Pour un total de 1,036,800 modalités possibles Dépendant des connaissances de domaine 11

Vue d’ensemble des 8 premiers niveaux de la hiérarchie de résumés Hiérarchie finale Vue d’ensemble des 8 premiers niveaux de la hiérarchie de résumés 12

Largeurs moyenne et maximum par niveau de la hiérarchie finale Dépendant des paramètres (stratégie) 13

Méthode d’aide à la décision Vue d’ensemble de la méthode: SQL Résultats de la requête Hiérarchie de résumés Liste de résumés Niveau le plus informatif 14

Information d’un niveau Probabilité d’un tuple résultat d’être trouvé dans un résumé z: Entropie de la distribution de probabilité : 15

Méthode d’aide à la décision Requête d’exemple Q: select CutomerID from DATA where Nombre_de_Libre_Choix_souscrits > 0 Q retourne 242 identifiant Information (1-Hl) par niveau de la hiérarchie: 16

Méthode d’aide à la décision liste des résumés de niveau 6 : 512 résumés au niveau 6 60 résumés résultat de la requête 402 tuples candidats 2 résumés suffisent à couvrir plus de 50% des tuples candidats de la requête 17

Méthode d’aide à la décision Contenu intensionnel du résumé R.2.4.2.0.1.0 18

Méthode d’aide à la décision Interface utilisateur du système SaintEtiQ 19

Conclusion Nous avons présenté : Développements : Modèle SaintEtiQ pour la génération de résumés Une expérimentation sur des données marketing réelles Une méthode pour l’exploitation des résumés dans une démarche d’aide à la décision Mise à jour en ligne des résumés Optimisation de certaines requêtes flexibles par l’utilisation des résumés Développements : 20