La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Mini Projet. Rappel : Apriori (1) Algorithme par niveau permettant l’extraction des motifs fréquents (ie. AprioriCAM appliqué à la contrainte anti-monotone.

Présentations similaires


Présentation au sujet: "Mini Projet. Rappel : Apriori (1) Algorithme par niveau permettant l’extraction des motifs fréquents (ie. AprioriCAM appliqué à la contrainte anti-monotone."— Transcription de la présentation:

1 Mini Projet

2 Rappel : Apriori (1) Algorithme par niveau permettant l’extraction des motifs fréquents (ie. AprioriCAM appliqué à la contrainte anti-monotone « X est un motif fréquent ») Algorithme de base C 1 := { A  I : |A| = 1 } I := 1 tant que C i ≠ {Φ} //balayer la relation binaire pour trouver la fréquence des motifs de niveau i et construire L i L i := { X  C i | Freq(X) ≤ minsup} //génération des motifs de niveau i+1 C i+1 := AprioriGen(L i ) i := i + 1 fin tant que Retournez  L i

3 Rappel : Apriori (2) AprioriGen : génération de candidats de niveau i+1 à partir des motifs de niveau i vérifiant la contrainte anti-monotone. Cand := Φ Pour chaque X  L i Pour chaque Y  Li Si X ⊍ Y ≠ Φ alors Cand := Cand  (X ⊍ Y) Fin Pour Fin Pour Pour chaque X  Cand Pour chaque x  X Si X\x  L i alors Cand := Cand \ X Fin Pour Fin Pour Retourner Cand

4 Mini Projet r r1r1 rnrn r1r1 rnrn On considère que la relation binaire r est répartie sur plusieurs ordinateurs distants r 1, …, r n (1 base / ordinateur) On veut extraire les motifs fréquents sur r, sans faire remonter les i bases sur la machine centrale puis faire tourner Apriori sur la machine centrale

5 Support local vs support global on considère les deux relations suivantes et le seuil minsup = 1/6 RowIdItem 1BE 2ABCE 3BCE RowIdItem 1ACD 2BCE 3ABCE Seuil global !! Freq(D,r 1 ) = 1/3Freq(D,r 2 ) = 0 D est fréquent sur r 1 D n’est pas fréquent sur r 2 Freq(D,r) = (Freq(D,r1) + Freq(D,r2))/2 = 1/6 D est fréquent sur r Nombre de sous relations Par soucis de simplicité, on considère la fréquence d’un motif non plus comme une probabilité mais uniquement comme le nombre d’occurrence du motif

6 Algorithme réparti (client) C 1 := { A  I : |A| = 1 } I := 1 tant que C i ≠ {Φ} //balayer la relation binaire r i pour trouver la fréquence des motifs de niveau i et envoyer ces informations (lequelles ?) au serveur // recevoir du serveur les informations permettant l’élagage des motifs globalement non fréquents L i * := { X  C i | Freq(X) ≤ minsup} //génération des motifs de niveau i+1 C i+1 := AprioriGen(L i * ) i := i + 1 fin tant que

7 Algorithme réparti (serveur) Attendre la connexion des clients i := 1 Tant que L i ≠ {Φ} // recevoir les informations des clients concernant les motifs de niveau i // calculer le support global des motifs de niveau i // on ne garde que ceux dont la fréquence est ≤ seuil L i := { X | Freq(X) ≤ minsup} // envoi des informations aux clients pour leur permettre l’élagage local i := i +1 Fin tant que Retournez  L i

8 Schéma général Client TCP Client UDP Serveur fils TCP fils UDP Envois des informations sur les motifs de niveau i calcule des fréquences globales Envois des informations permettant de calculer les motifs de niveau i +1 On mesure : 1.La quantité d’information envoyée sur le réseau (clients + serveur) 2.Le temps passé par le(s) client(s) (hors attente de la réponse du serveur) 3.Le temps passé par le serveur (hors attente de l’envoi des info par les clients)


Télécharger ppt "Mini Projet. Rappel : Apriori (1) Algorithme par niveau permettant l’extraction des motifs fréquents (ie. AprioriCAM appliqué à la contrainte anti-monotone."

Présentations similaires


Annonces Google