La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Treillis Relationnel : Une Structure Algébrique pour le Data Mining Multidimensionnel Alain Casali, Rosine Cicchetti, Lotfi Lakhal Laboratoire dInformatique.

Présentations similaires


Présentation au sujet: "Treillis Relationnel : Une Structure Algébrique pour le Data Mining Multidimensionnel Alain Casali, Rosine Cicchetti, Lotfi Lakhal Laboratoire dInformatique."— Transcription de la présentation:

1 Treillis Relationnel : Une Structure Algébrique pour le Data Mining Multidimensionnel Alain Casali, Rosine Cicchetti, Lotfi Lakhal Laboratoire dInformatique Fondamentale Marseille

2 Plan 1.Nécessité dun espace de recherche pour le data mining multidimensionnel 2.Treillis relationnel 3.Treillis relationnel contraint 4.Treillis relationnel vs Datacube 5.Perspectives Casali, Cicchetti, Lakhal : Treillis Relationnel 2

3 1. Nécessité dun espace de recherche pour le data mining multidimensionnel Problème de la transformation dune relation dattributs catégories en une relation binaire Treillis des parties : une structure mal adaptée au contexte multidimensionnel Non préservation de la complexité des algorithmes par niveaux Casali, Cicchetti, Lakhal : Treillis Relationnel 3

4 Exemple: EntréePlat principalDessertQuantité Salade composéeAgneauGlace3 Salade composéeBœufGlace2 Salade composéeAgneauFruit2 Salade composéeBœufFruit2 JambonAgneauGlace1 MelonAgneauGlace1 Casali, Cicchetti, Lakhal : Treillis Relationnel 4

5 Treillis des attributs binaires : Mais toutes les solutions ne sont pas valides Casali, Cicchetti, Lakhal : Treillis Relationnel 5

6 Plan 1.Nécessité dun espace de recherche pour le data mining multidimensionnel 2.Treillis relationnel 3.Treillis relationnel contraint 4.Treillis relationnel vs Datacube 5.Perspectives Casali, Cicchetti, Lakhal : Treillis Relationnel 6

7 2. Treillis relationnel 2.1 Espace multidimensionnel tuple = élément de space(r) = motif multidimensionnel ex: et 2.2 Ordre de généralisation On munit space(r) de lordre de généralisation g ex: g Casali, Cicchetti, Lakhal : Treillis Relationnel 7 r : relation de schéma

8 Casali, Cicchetti, Lakhal : Treillis Relationnel Opérateurs de base (a) La Somme ? ALL

9 Casali, Cicchetti, Lakhal : Treillis Relationnel 9 (b) Le Produit

10 2.4 Caractérisation du treillis relationnel Théorème: soit r une relation dattributs catégories sur.Lensemble ordonné (space(r), g ) est un treillis complet, atomique, co-atomique et gradué, appelé treillis relationnel et noté RL(r), dans lequel : Casali, Cicchetti, Lakhal : Treillis Relationnel 10

11 2.5 Treillis relationnel vs Treillis des parties Casali, Cicchetti, Lakhal : Treillis Relationnel 11

12 Plan 1.Nécessité dun espace de recherche pour le data mining multidimensionnel 2.Treillis relationnel 3.Treillis relationnel contraint 4.Treillis relationnel vs Datacube 5.Perspectives Casali, Cicchetti, Lakhal : Treillis Relationnel 12

13 3. Treillis relationnel contraint 3.1 Définition des contraintes Une contrainte cont est anti-monotone w.r.t. g ssi Une contrainte cont est monotone w.r.t. g ssi Casali, Cicchetti, Lakhal : Treillis Relationnel 13

14 3.2 Structure convexe « garantie » Théorème: le treillis relationnel contraint est un espace convexe (représentable par bordures) dans lequel la borne maximale S + cont et la borne minimale G + cont sont: 1. Si cont = cmc, G + = min ({t RL(r) : cmc(t)} ) et S + = 2. Si cont = camc, G + = et S + = max({t RL(r) : camc(t)}) 3. Si cont = chc, G + = min({t RL(r) :chc(t)}) et S + = max({t RL(r) : chc(t)}) Casali, Cicchetti, Lakhal : Treillis Relationnel 14

15 3.3 Exemples de contraintes (a) Fréquence Freq(t) minfreq est une contrainte anti-monotone et Freq(t) maxfreq est une contrainte monotone. (b) Fréquence de la disjonction Freq(vt) minfreq est une contrainte monotone et Freq(vt) maxfreq est une contrainte anti- monotone. Casali, Cicchetti, Lakhal : Treillis Relationnel 15

16 3.4 Exactitude des solutions (a) freq(t) 3/11 (contrainte anti-monotone) EPPDQ SAG3 SBG2 SAF2 SBF2 JAG1 MAG1 Casali, Cicchetti, Lakhal : Treillis Relationnel 16 Algorithme par niveau binaire donne le même résultat ?

17 (b) freq(t) 4/11 (contrainte monotone) EPPDQ SAG3 SBG2 SAF2 SBF2 JAG1 MAG1 Casali, Cicchetti, Lakhal : Treillis Relationnel 17 Si algorithme (cadre binaire) => SJ fait partie des résultats. Solution possible: ajouter la contrainte freq(t)>0. Mais freq( )=0 et vérifie la contrainte.

18 (c) freq(Vt) 6/11 (contrainte anti-monotone) EPPDQ SAG3 SBG2 SAF2 SBF2 JAG1 MAG1 Casali, Cicchetti, Lakhal : Treillis Relationnel 18 Freq(V ) = 5/11 mais Freq( ) = 0 Donc la contrainte Freq(t) > 0 ne permet pas dobtenir lensemble des solutions dun problème de data mining multidimensionnel en utilisant les techniques de data mining binaire.

19 Plan 1.Nécessité dun espace de recherche pour le data mining multidimensionnel 2.Treillis relationnel 3.Treillis relationnel contraint 4.Treillis relationnel vs Datacube 5.Perspectives Casali, Cicchetti, Lakhal : Treillis Relationnel 19

20 4. Treillis relationnel vs Datacube Datacube est un problème de data mining multidimensionnel dont lespace de recherche est le treillis relationnel. RL(r) = Datacube( ) + ordre de généralisation + opérateurs Produit et Somme Ordre de généralisation et opérateurs de base permettent la navigation dans le Datacube Casali, Cicchetti, Lakhal : Treillis Relationnel 20

21 Projet similaire Laksmanan, Pei, Han pour lextraction des connaissances (sémantiques) dans le Datacube. Premiers résultats (VLDB02) : Cube Quotient : Treillis des classes déquivalences selon des fonctions agrégatives. Ce cube (réduit) permet la navigation comme dans le Datacube. Casali, Cicchetti, Lakhal : Treillis Relationnel 21

22 Plan 1.Nécessité dun espace de recherche pour le data mining multidimensionnel 2.Treillis relationnel 3.Treillis relationnel contraint 4.Treillis relationnel vs Datacube 5.Perspectives Casali, Cicchetti, Lakhal : Treillis Relationnel 22

23 5. Perspectives 1.Treillis relationnel fermé 2.Espace de version 3.Espace de version émergent ( 2 Datacubes) 4.Représentations concises/condensées du treillis relationnel contraint Casali, Cicchetti, Lakhal : Treillis Relationnel 23


Télécharger ppt "Treillis Relationnel : Une Structure Algébrique pour le Data Mining Multidimensionnel Alain Casali, Rosine Cicchetti, Lotfi Lakhal Laboratoire dInformatique."

Présentations similaires


Annonces Google