La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Cliques & Bicliques Maximales Vers une présentation unifiée des algorithmes dénumération Alain Gély – LIMOS – Clermont-Ferrand GDR fouille de données –

Présentations similaires


Présentation au sujet: "Cliques & Bicliques Maximales Vers une présentation unifiée des algorithmes dénumération Alain Gély – LIMOS – Clermont-Ferrand GDR fouille de données –"— Transcription de la présentation:

1 Cliques & Bicliques Maximales Vers une présentation unifiée des algorithmes dénumération Alain Gély – LIMOS – Clermont-Ferrand GDR fouille de données – Lyon - 21 Novembre 2005

2 Cliques maximales & fouille de données Bio-Informatique Web Mining

3 Bicliques maximales & fouille de données Itemset fermés (fréquent ou non) Utile pour les règles dimplications…

4 Enumération vs Construction GENERATION CONSTRUCTION Graphe de couverture Complexité théorique O(n²).|C| Enumération des fermés Espace polynomial Complexité théorique O(n 3 ).|C| Taille exponentielle E D C B A X X X X X X X X XX, A, AB, ABC, AC, D, DE, ABCDE E D C B A X X X X X X X X XX D DE ACAB ABC A ABCDE EntréeSortie

5 Generation vs Construction E D C B A X X X X X X X X XX, A, AB, ABC, AC, D, DE, ABCDE EntréeSortie

6 Pourquoi juste énumérer ? Délai polynomial Utile en «pipe line » Construction / Traitement Enumération

7 Plusieurs sources dalgorithmes Fouille de données Analyse de Concept Formel Algorithmique des systèmes de fermeture Analyse de données / problèmes matriciels Algorithmes de graphes

8 Fouille de données CHARM CLOSET, CLOSET+ LCM, LCM v2 Apriori

9 Analyse de concepts formel Lindig (Fast Concept Analysis) Vatchev et al. Godin et al.

10 Algorithmique des systèmes de fermeture Ganter (Next-closure) Nourine-Raynaud

11 Analyse de données / problèmes matriciels Algorithme de Chein Algorithme de Bordat

12 Algorithmes de graphe Enumération des cliques maximales Algorithme de Tsukiyama et al Algorithme de Johnson et al Algorithmes de Makino et Uno …

13 Cliques & bicliques maximales Transformation classique

14 Graphe de transition : Cas des bicliques maximales

15 Comparaisons des algorithmes ?

16 Pour un algorithme… Etudier la complexité au pire Comportement sur Benchmark Influence de limplémentation

17 Comparaisons des algorithmes ? Deux questions Peut-on expliquer les différences de comportement des algorithmes par des Propriétés structurelles ? Les structures de données peuvent jouer un rôle important sur lefficacité. Y-a-t-il dautres facteurs influençant les performances ?

18 Graphe de transition des cliques maximales dun graphe

19 Unifier la présentation des algorithmes existants ? Structure élémentaire Briques élémentaires sur cette structure Passage dun élément à un autre Vérification dappartenance [ Graphe ] [ arêtes ] [ arbre couvrant ]

20 Graphe de transition des bicliques maximales Cas particulier des graphes Propriétés particulières de numérotation G(U,V,E) Hypothèse : U > V Partitionnement sur les éléments de V Transitions « lexicographique » Graphe de couverture contenu dans le graphe de transition

21 Graphe de transition entre bicliques

22 Next-Closure & Ordre Lectique, {A 1 } Pomme/Apple, {A 2 } Orge/Barley, {A 3 } Litchi/Lychee, {A 4 } Légume/Vegetable, Même structure de treillis Mais Un comportement différent des algorithmes

23 Données « En français » Next-Closure( )=1 BC(B)F< i C(B) Réponse { 123} 4C(4)=1234 < Non (invalide) Next-Closure(1)=12 Next-Closure(12)=123 Next-Closure(123)=1234 { 123} 4C(3)=123 < 3 123Non (invalide) { 123} 4C(2)=12 < 2 12Non (invalide) { 123} 4C(2)=12 < 1 1Oui {1 123} 4C(14)=1234 1< Non (invalide) { 12} 3C(13)=123 < 3 123Non (invalide) {1 1} 2C(12)=12 1< 2 12Oui {12 123} 4C(124)= < Non (invalide) {12 12} 3C(123)=123 12< 3 123Oui { } 4C(1234)= < Oui 10 Calculs de fermeture

24 Données « En anglais » Next-Closure( )=4 BC(B)F< i C(B) Réponse Next-Closure(4)=34 Next-Closure(34)=234 Next-Closure(123)=1234 { 123} 4C(4)=4 < 4 4Oui {4 12} 3C(3)=34 4< 3 34Oui {34 1} 2C(2)=234 34< 2 234Oui {234 } 1C(1234)= < Oui 4 Calculs de fermeture

25 C(1234) =1234 C(4)=1234C(3)=123 C(2)=12 C(1)= C(14)= C(124)= C(12)=12 C(123)=123 Exécution de Next-closure XXX 4 X X 3 X2 1 A4A4 A3A3 A2A2 A1A1

26 12=34 1=234 Exécution de Next-closure - Amélioration 123 C(1234) = C(4)=1234C(3)=123 C(2)=12 C(1)= C(14)= C(124)= C(12)=12 C(123)= XXX 4 X X 3 X2 1 A4A4 A3A3 A2A2 A1A1

27 Dun élément vers un prédécesseur Algorithmes parcourant le graphe de couverture Approche « top-down » Test dunicité

28 A Parcours de graphes en profondeur AXXX BXX CXX DXX EX D/3 E/5 C/2B/1 4 A BCDE 23145

29 Connaître une arête de larbre couvrant ? ABCD E ABCDE ABC DE D/3 E/5 C/2 B/1 4 A 4 D/3 E/5

30 Enumérer les ensembles fermés Choisir un élément a de JCalculer C(a)GENERER(R)R1 (J, a,I 1 ) ; GENERER (R 1 )R2 (J\ a,M,I 2 ) ; GENERER (R 2 )Afficher C(a)

31 Systèmes de fermeture résultant ABCD 2314 A,1B,2C,3D,4 C,3 ABCD 3 ABD 214

32 Méthode générique dénumération Choisir un élément a de J Calculer C(a) GENERER(R) R1 (J, a,I 1 ) ; GENERER (R 1 ) R2 (J\ a,M,I 2 ) ; GENERER (R 2 ) Si C(a) est valide Afficher C(a)

33 Next-closure (ordre lectique) Choisir a, élément de plus petit label de J Calculer C(a)GENERER(R)R2 (J\ a,M,I 2 ) ; GENERER (R 2 ) R1 (J, a,I 1 ) ; GENERER (R 1 ) Si C(a)est valide Afficher C(a)

34 Next-closure (ordre lexicographique) Choisir j élément de plus petit label de J Calculer C(a)GENERER(R)R2 (J\ a,M,I 2 ) ; GENERER(R 2 )R1 (J, a,I 1 ) ; GENERER(R 1 )Si C(a)est valideAfficher C(a)

35 Algorithme parcourant le graphe de couverture Choisir a, élément minimal de JCalculer C(a)GENERER(R)R1 (J, j,I 1 ) ; GENERER(R 1 )R2 (J\ j,M,I 2 ) ; GENERER(R 2 )Si C(a)est valide

36 Choix dun élément non irréductible d f e g a bc d b a c d e f g Pour séparer le système de fermeture Un élément non Sup-irreductible nest pas un bon choix

37 Heuristique de choix délément Elément de plus petit label (Next Closure) Elément minimal (parcours du graphe de couverture) Elément maximal (de lordre induit par J) … Au hasard

38 Conclusion Trouver un compromis entre : La complexité de la fonction choix Le nombre de fermeture calculé (#invalide) Perspectives : methode de comparaison dalgorithmes Etude de linfluence pratique de fonctions choix Fonctions choix spécifiques à certaines situations ?


Télécharger ppt "Cliques & Bicliques Maximales Vers une présentation unifiée des algorithmes dénumération Alain Gély – LIMOS – Clermont-Ferrand GDR fouille de données –"

Présentations similaires


Annonces Google