Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parRoxane Grimaud Modifié depuis plus de 9 années
1
Mini Projet
2
Rappel : Apriori (1) Algorithme par niveau permettant l’extraction des motifs fréquents (ie. AprioriCAM appliqué à la contrainte anti-monotone « X est un motif fréquent ») Algorithme de base C 1 := { A I : |A| = 1 } I := 1 tant que C i ≠ {Φ} //balayer la relation binaire pour trouver la fréquence des motifs de niveau i et construire L i L i := { X C i | Freq(X) ≤ minsup} //génération des motifs de niveau i+1 C i+1 := AprioriGen(L i ) i := i + 1 fin tant que Retournez L i
3
Rappel : Apriori (2) AprioriGen : génération de candidats de niveau i+1 à partir des motifs de niveau i vérifiant la contrainte anti-monotone. Cand := Φ Pour chaque X L i Pour chaque Y Li Si X ⊍ Y ≠ Φ alors Cand := Cand (X ⊍ Y) Fin Pour Fin Pour Pour chaque X Cand Pour chaque x X Si X\x L i alors Cand := Cand \ X Fin Pour Fin Pour Retourner Cand
4
Mini Projet r r1r1 rnrn r1r1 rnrn On considère que la relation binaire r est répartie sur plusieurs ordinateurs distants r 1, …, r n (1 base / ordinateur) On veut extraire les motifs fréquents sur r, sans faire remonter les i bases sur la machine centrale puis faire tourner Apriori sur la machine centrale
5
Support local vs support global on considère les deux relations suivantes et le seuil minsup = 1/6 RowIdItem 1BE 2ABCE 3BCE RowIdItem 1ACD 2BCE 3ABCE Seuil global !! Freq(D,r 1 ) = 1/3Freq(D,r 2 ) = 0 D est fréquent sur r 1 D n’est pas fréquent sur r 2 Freq(D,r) = (Freq(D,r1) + Freq(D,r2))/2 = 1/6 D est fréquent sur r Nombre de sous relations Par soucis de simplicité, on considère la fréquence d’un motif non plus comme une probabilité mais uniquement comme le nombre d’occurrence du motif
6
Algorithme réparti (client) C 1 := { A I : |A| = 1 } I := 1 tant que C i ≠ {Φ} //balayer la relation binaire r i pour trouver la fréquence des motifs de niveau i et envoyer ces informations (lequelles ?) au serveur // recevoir du serveur les informations permettant l’élagage des motifs globalement non fréquents L i * := { X C i | Freq(X) ≤ minsup} //génération des motifs de niveau i+1 C i+1 := AprioriGen(L i * ) i := i + 1 fin tant que
7
Algorithme réparti (serveur) Attendre la connexion des clients i := 1 Tant que L i ≠ {Φ} // recevoir les informations des clients concernant les motifs de niveau i // calculer le support global des motifs de niveau i // on ne garde que ceux dont la fréquence est ≤ seuil L i := { X | Freq(X) ≤ minsup} // envoi des informations aux clients pour leur permettre l’élagage local i := i +1 Fin tant que Retournez L i
8
Schéma général Client TCP Client UDP Serveur fils TCP fils UDP Envois des informations sur les motifs de niveau i calcule des fréquences globales Envois des informations permettant de calculer les motifs de niveau i +1 On mesure : 1.La quantité d’information envoyée sur le réseau (clients + serveur) 2.Le temps passé par le(s) client(s) (hors attente de la réponse du serveur) 3.Le temps passé par le serveur (hors attente de l’envoi des info par les clients)
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.