La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Apprentissage Data mining ILP KDD. Formal Concept Analysis Un contexte est un triplet (O,A,I) où O et A sont des ensembles et I O Aest une relation. O\A.

Présentations similaires


Présentation au sujet: "Apprentissage Data mining ILP KDD. Formal Concept Analysis Un contexte est un triplet (O,A,I) où O et A sont des ensembles et I O Aest une relation. O\A."— Transcription de la présentation:

1 Apprentissage Data mining ILP KDD

2 Formal Concept Analysis Un contexte est un triplet (O,A,I) où O et A sont des ensembles et I O Aest une relation. O\A a1a2a3a4a5a6a7a

3 Correspondance de Galois Soit ƒ lapplication qui à tout élément o de O associe ƒ(o)={a A / (o,a) I} g lapplication qui à tout élément a de A associe g(a)={o O / (o,a) I} ƒ et g sont étendues aux parties de O et de A comme suit: Pour O1 O et A1 A ƒ(O1)= o O1 ƒ(o)g(A1)= a A1 g(a) On note h=g o ƒ et h= ƒ o g

4 Propriétés des fonctions ƒ, g et h,h ƒ et g sont des applications monotones décroissantes O1 O2 ƒ(O1) ƒ(O2) h et h sont des applications monotones croissantes, extensives et idempotentes. O1 O2 h(O2) h(O1) O1 h(O1) h(O1)=h(h(O1))

5 Concept Pour un contexte (O,A,I) Le couple [01,A1] O1 O, A1 A est un concept ssi ƒ(O1)=A1 et g(A1)=O1 O1 est appelé lextension du concept A1 est appelé lintention du concept Exemple pour la relation binaire précédente [{01,02,03,04},{a1,a2,a3,a4}] est un concept [{01,02,03},{a4,a5}] nest pas un concept en effet ƒ({01,02,03})={a1,a2,a3,a4}{a4,a5} de plus g({a3,a4})={01,02,03,04}{01,02,03} Remarque Du point de vue de la relation binaire, un concept est un rectangle maximal rempli de 1

6 Ordre sur les concepts Pour deux concepts [O1,A1] et [O2,A2] dun contexte (O,A,I) [O1,A1] [ 02,A2] A1 A2 O2 O1 On dit que le concept [01,A1] est plus général que le concept [O2,A2].

7 Treillis de Galois (Treillis des concepts) Théorème Lensemble L de tous les concepts dun contexte (O,A,I), muni de la relation dordre, possède la structure mathématique de treillis et est appelé treillis de Galois (ou des concepts) du contexte (O,A,I). [O1,A1][O2,A2] [g(A),A=A1 A2] [O=O1 O2,ƒ(O)]

8 Complexité Opération entre concepts Calcul de lintersection de deux ensembles A1,A2 O(|A1|+|A2|) si A1 et A2 sont triès Calcul de g(A) O( |ƒ(a)|) a A Ceci peut être fait par des opérations binaires rapides. Polynomialité du calcul des (et ) La taille du treillis peut être en 2 k ou k=min(|O|,|A|)

9 Algorithmes Il y a de nombreux algorithmes Un algorithme Norris (Repris par Godin avec relation dordre) Entrées: Une liste L de concepts Un nouvel exemple {e, A e } Pour C i :(Oi,Ai) L Si Ae Ai ajoute e à Oi Sinon Faire C n =C i {e, A e } Si C n est nouveau ajout à L Si {e, A e } nouveau (non = A e ) ajout à L Sortie: Nouveau L => algorithme incrémental

10 [{01,02,03,04,05,06,07}{a1}] [{01,02,03,04,05,06}{a1,a2}] [{01,02,03,04,06,07}{a1,a3}] [{01,02,03,04,05}{a1,a2,a4}][{01,02,03,05,06}{a1,a2,a5}][{01,02,03,04,06}{a1,a2,a3}][{01,02,04,07}{a1,a3,a6}] [{01,02,03,05}{a1,a2,a4,a5}][{01,02,03,04}{a1,a2,a3,a4}][{01,02,03,06}{a1,a2,a3,a5}] [{01,02,05}{a1,a2,a4,a5,a7}][{01,02,03}{a1,a2,a3,a4,a5}][{01,02,03}{a1,a2,a3,a4,a6}][{02,03,06}{a1,a2,a3,a5,a8}] [{01,03}{a1,a2,a3,a4,a5,a7}][{01,02}{a1,a2,a3,a4,a5,a6}][{01,03}{a1,a2,a3,a4,a5,a8}] [{03}{a1,a2,a3,a4,a5,a7,a8}][{01}{a1,a2,a3,a4,a5,a6,a7}][{02}{a1,a2,a3,a4,a5,a6,a8}] [{}{a1,a2,a3,a4,a5,a6,a8}] Exemple

11 Généralisation

12 Deux treillis Treillis des classes Treillis des descriptions g f Treillis de Galois

13 Concepts et Relations. E A E E et A E A ExtensionIntentionConcepts: Ordre partiel E1 A1E2 A2 Eg E1 E2 Ag=A1 A2 Es = E1 E2 As A1 A2 Structure de lespace Cas propositionnel

14 E D E E et D D E D ExtensionIntention Description Concepts: Ordre partiel E1 D1E2 D2 Eg E1 E2 Dg=D1 D2 Es = E1 E2 Ds D1 D2 Structure de lespace Concepts et Relations.Cas général

15 L-Langage de description Catégorie Objet: expression du langage de description -> : Ordre partiel (être plus général que) : Opérateur de généralisation (produit catégoriel) Exemple Langage propositionnel Objet: Liste dattributs ->: : D1D2 D1 D2 D

16 Relation entre graphes Morphisme Un homomorphisme entre deux graphes étiquettés G1:(V1,E1,L1), G2:(V2,E2,K2à est une application ƒ:V1 -> V2 telle que v V1, L(v)=L(ƒ(v)) et pour (v1,v2) E1 alors (ƒ(V1),ƒ(V2)) E2 Notation G1 G2 Complexité NP-Complet pour des graphes quelconques Ordre ?: Pre-ordre entre les graphes (manque lanti-symétrie)

17 Graphe irredondant Graphe irredondant (code graph): Un graphe irredondant est un graphe qui na pas dhomomorphisme sur un de ses sous-graphes. La relation dhomomorphisme, pour les graphes irredondants, est une relation dordre partiel. Théorème La structure de lordre partiel basé sur lhomomorphisme entre des graphes irredondants est un treillis.

18 Graphe -> Graphe irredondant Complexité de la Recherce du graphe minima Réduction: NP-complet Propriété Si, pour une sous-classe spécifique de graphes, lopération dhomomorphisme est polynomiale alors la complexité de lopération de réduction est aussi polynomiale. On considére que deux graphes sont équivalents ssi g1 g2 et g2 g1. Propriété Pour un ensemble de graphes équivalents il existe un unique graphe irredondant minima (plus petit nombre de sommets).

19 Homomorphisme polynomial Lhomomorphisme dun arbre dans un graphe est polynomial Un graphe étiquetté G:(V,E) est dit localement injectif ssi pour chaque sommet v V, v1,v2 N(v) (voisins de V) alors si v1v2, L(v1)L(v2) Notation LIG graphe Cette définition peut facilement être étendue au cas des graphes orientés. Propriétés Lhomomorphisme entre deux LIG est polynomial. Un LIG connexe est irredondant.

20 Produit de deux graphes Pour deux graphes étiquetés G1:(V1,E1,L1) G2:(V2,E2,L2) Le produit G(V,E,L)= G1*G2 est défini par: L = L1 L2 V V1 x V2= {v / v=[v1,v2] avec L(v1)=L(v2)=L(v)} U={(v=[v1,v2],v=[v1,v2]) / (v1,v1) V1 et (v2,v2) V2} Complexité: Polynomiale O(|V1|*|V2|)

21 Opérateur de généralisation Pour deux graphes irredondants G1,G2 G1 G2=Reduction(G1*G2) Propriété Lopération est un opérateur de généralisation sur les graphes

22 Questions:Morphisme injectif Ordre partiel => gestion ensembliste opérateur de généralisation ???

23 Exemples de L-Langages L-Langage Complexité Ensemble P Séquence du début Plus long préfixe commun P {Séquences} Utilisant pour des séquences KMR + sous ensemble P XMLInclusion darbreSous-arborescence maximale P Graphe irredondant MorphismeProduit et réductionNP P pour GLI Clause réduite -subsumption lggNP

24 Treillis de Galois Théorème pour un ensemble dexemples O, un L-langage de description L et une application d de O dans L, lespace de recherche (classification) est structuré sous la forme dun treillis de Galois Notation TG(L,O,d)

25 Treillis de Galois pour L=GLI circle rectangle right on {0,1} rectangle circleright on {1,4} rectangleonsquare {2,4} {0,1,2} rectangle on rectangle on circle rectangle on {0,1,3} rectangle circle right on {0,1,4} {0,1,2,3} {0,1,2,4} {0,1,3,4} {0,1,2,3,4}

26 Propositionnalisation

27 Passage dune description structurelle à une description propositionnelle équivalente. Interêt gain en utilisation, réutilisation, explication (création dune ontologie) équivalence ? complexité de la recherche ?

28 1 c7 Bf5 2 Nc6 Bh3 3 Ne7 Bd7 4 h7 Kg7 5 Ng6 Kxh7 6 Nf8+ Rb(f3),Rn(f7),Fn(c2),Cb(a7),P b(c6),Pb(h6),Pn(f6),Pn(h4) Egalité matérielle Non Opposition Fou noir 2° Grande Diagonale Cavalier blanc Coin 2 Pions blancs avancés 1 Pion noir avancé Rectangle arrêt Roi blanc …. Exemple Structurel / propositionnel

29 Irréductibles irréductible: Elément dun treillis ayant un seul prédécesseur irréductible : Elément dun treillis ayant un seul successeur. irréductibles

30

31 Irréductibles et Treillis A partir de lensemble des irréductibles et des irréductibles dun Treillis T on construit la relation binaire R suivante: A chaque élément irréductibles x on associe lensemble R(x) des éléments irréductibles à x Théorème le Treillis de Galois construit à partir de la relation binaire R et isomorphe au treillis T. (Birkhoff)

32 Equivalence entre L-langages Définition Deux L-Langages L1 et L2 sont dit équivalent pour un même ensemble dexemples O TG(L1,O,d1) TG(L2,O,d2) Théorème Pour tout L-Langage L et un ensemble dexemple O décrit par des expression de L. Il existe un L-langage propositionnel LP minimal équivalent à L. Ce langage LP est construit à partir de lensemble des irréductibles du treillis de Galois TG(L,O)

33 Irréductibles et Treillis de Galois circle rectangle right on {0,1} rectangle circleright on {1,4} rectangleonsquare {2,4} {0,1,2} rectangle on rectangle on circle rectangle on {0,1,3} {0,1,2,3}{0,1,2,4} {0,1,3,4} {0,1,2,3,4} S1 S2 S3 S4 S5S6S7 rectangle circle right on {0,1,4}

34 L-Langage propositionnel

35 Parcours de lespace des descriptions Opérateur de spécialisation S: S(d)=d1 tel que d > d1 Opérateur de spécialisation complet: S(d)=d1 tel que d > d1 et d2 / d > d2 > d > Base de certaines méthodes ILP: Parcours Aveugle Spécialisation infinie Expression de L Etre plus générale que

36 Espace de spécialisation et exemple Expression napparaissant Pas sur les exemples Expression apparaissant En même temps

37 Complexité de la recherche des irréductibles Idée 1) Construction du treillis en généralisation construction complète: taille du treillis importante complexité de lopération -Irréductibles dans le haut du treillis Idée 2) Parcours de lespace en spécialisation avec utilisation de lopération

38 Principe E1 A1E2 A2E2 A3En An …… Es = E1 E2 As A1 A2 Es = E1 En As A2 An2 … Nécessite A1, A2, ……An Retour au cas propositionnel !! LD1 Spécialisation des langages

39 Langage de décomposition Exemple Langage de description Graphe Langage de décomposition Chemin de longueur k Définition Pour un langage de description L, Un langage de décomposition LD est inclus dans L, il existe un opérateur permettant de trouver les expressions de LD présente dans une expression de L

40 Algorithme RechIrre Entree : un contexte (E,A,R) (relation binaire) Sortie ; lensemble des -irreductibles R=Ø Elimination des égalités (réunion en un seul attribut des attributs tel que e(a1)= e(a2)) Pour chaque attribut a si estIrreductible(a) ajouter a à R retourner Complexité: O(|A] 2 *|E|)

41 Exemple chemin longueur 0 irréductibles [{0,1,4},{right}] [{0,1,3,4},{Circle}] [{2,4},{Square}]

42 Exemple chemin longueur 1 Recherche des -Irréductibles: Polynomiale ici!!

43 Complexité La recherche des -irréductibles dépend de la complexité de la recherche des éléments de LD du calcul de la relation dordre entre les éléments de LD du calcul de lappariement dun élément de LD avec un élément de L Pour une étape k, si ces trois calcul sont polynomiaux / nombre dexemples et le nombre dexpressions du langage LD alors la méthode est polynomiale Exemple L=graphe et LDk={chemins élémentaires de longueur k} Calcul polynomial à chaque étape (anytime)

44 Opérateur de spécialisation pour les graphes Produit de Graphes G1:(E1,A1)G2:(E2,A2) On calcule E1xE2 puis on met un arc entre (e1,e2) et (e1,e2) (e1,e1) A1 et (e2,e2) A2 Généralisation de lopération produit pour n graphes: Principe: Pour un ensemble de graphes S:(e1,e2,…em) >>>> S:(e1,e2,…en) ssi e S, e S tel que (e,e) G


Télécharger ppt "Apprentissage Data mining ILP KDD. Formal Concept Analysis Un contexte est un triplet (O,A,I) où O et A sont des ensembles et I O Aest une relation. O\A."

Présentations similaires


Annonces Google