La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Résumé de base de données: Application à des données marketing bancaires R. Saint-Paul, G. Raschia and N. Mouaddib IRIN, Nantes (France)

Présentations similaires


Présentation au sujet: "Résumé de base de données: Application à des données marketing bancaires R. Saint-Paul, G. Raschia and N. Mouaddib IRIN, Nantes (France)"— Transcription de la présentation:

1 Résumé de base de données: Application à des données marketing bancaires R. Saint-Paul, G. Raschia and N. Mouaddib IRIN, Nantes (France)

2 Table des matières Présentation rapide du modèle SaintEtiQ pour le résumé de données Application à une base de données réelle: marketing bancaire Méthode dexploitation des résumés pour la prise de décisions 2

3 Vue générale du modèle 3

4 Connaissances du domaine Permet à lutilisateur de définir un langage pour la description de ses données A chaque attribut est affecté une partition linguistique floue 4 Exemple: Partition linguistique pour lattribut revenu

5 Apprentissage Incrémental Clustering conceptuel incrémental 1.Optimisation locale : Mesure de la qualité de la partition (typicité et contraste) utilisée pour choisir le meilleur opérateur dapprentissage 2.Mise à jour de la description du contenu intensionnel du résumé 5

6 z0z0 Opérateurs dapprentissage 6 z3z3 z2z2 z1z1 Tuple Candidat z0z0 z3z3 z2z2 z1z1 z0z0 affectation z3z3 z2z2 z1z1 z0z0 z4z4 création

7 Opérateurs dapprentissage 7 z3z3 z2z2 z1z1 z0z0 fusion z2z2 z1z1 z0z0 z 12 z 11 z3z3 z4z4 z0z0 z2z2 z1z1 z2z2 z 12 z 11 z0z0 éclatement

8 Contenu intensionnel La description du contenu intensionnel des résumés est, pour chaque attribut, un ensemble flou de descripteurs linguistiques avec leurs supports relatifs Exemple : revenu = Un processus de généralisation est possible en se basant sur les connaissances de domaine Exemple : 8

9 Application réelle Données marketing du groupe CIC enregistrements 70 attributs (10 utilisés pour le résumé) 3 à 8 labels définis sur chaque attribut comme connaissance de domaine 9 Présentation du jeux de données:

10 Comportement dynamique

11 Hiérarchie finale 11 Temps total dexécution: 21 minutes Tuples candidats traités : depuis les tuples originaux Nombre de feuilles : Pour un total de 1,036,800 modalités possibles Dépendant des connaissances de domaine

12 Hiérarchie finale 12 Vue densemble des 8 premiers niveaux de la hiérarchie de résumés

13 Hiérarchie finale 13 Largeurs moyenne et maximum par niveau de la hiérarchie finale Dépendant des paramètres (stratégie)

14 Méthode daide à la décision 14 Vue densemble de la méthode: SQL Résultats de la requête Niveau le plus informatif Hiérarchie de résumés Liste de résumés

15 Information dun niveau 15 Probabilité dun tuple résultat dêtre trouvé dans un résumé z : Entropie de la distribution de probabilité :

16 Méthode daide à la décision 16 Information (1-H l ) par niveau de la hiérarchie: Requête dexemple Q: select CutomerID from DATA where Nombre_de_Libre_Choix_souscrits > 0 Q retourne 242 identifiant

17 Méthode daide à la décision 17 liste des résumés de niveau 6 : 512 résumés au niveau 6 60 résumés résultat de la requête 402 tuples candidats 2 résumés suffisent à couvrir plus de 50% des tuples candidats de la requête

18 Méthode daide à la décision 18 Contenu intensionnel du résumé R

19 Méthode daide à la décision 19 Interface utilisateur du système SaintEtiQ

20 Conclusion Modèle SaintEtiQ pour la génération de résumés Une expérimentation sur des données marketing réelles Une méthode pour lexploitation des résumés dans une démarche daide à la décision Mise à jour en ligne des résumés Optimisation de certaines requêtes flexibles par lutilisation des résumés 20 Nous avons présenté : Développements :


Télécharger ppt "Résumé de base de données: Application à des données marketing bancaires R. Saint-Paul, G. Raschia and N. Mouaddib IRIN, Nantes (France)"

Présentations similaires


Annonces Google