METHODE DESCPIPTIVE : ASSOCIATION Exposé DATAMINING METHODE DESCPIPTIVE : ASSOCIATION
Les régles d’association : OBJECTIF : Approche automatique pour découvrir des relations / corrélations intéressantes entre des objets. Transcrire la connaissance sous forme de règles d’association Applications: Utilisé pour analyser le panier de la ménagère Détection des fraudes Gestion des stocks
Tableau de transactions tableau binaire 0/1 Contenu du caddie trans-actions confiture fromage pain clt1 clt2 Lait clt3 clt4 lait formage clt5 clt6 L’analyse du panier de la Ménagère : lait confiture fromage pain 1 Clt1 Clt2 clt3 Clt4 Clt5 Clt6 Mettre en évidence les produits achetés ensemble, pour avoir une régle sous forme: Par exemple : Si pain alors lait ; Si antécédent Alors conséquent
Critères d’évaluation des règles d’association : Ces règles d’association seront sous forme : (R) : Si conditions Alors resultants Si pain alors lait SUPPORT : Un indicateur de « fiabilité » de la règle , recherche des ensemble de produits fréquents, c’est le nombre de transactions d’apparition simultanée des produits le nombre d’apparition (ex. sup{pain et lait} = 2) CONFIANCE : Un indicateur de « précision » de la règle, c’est à partir des ensemble de produit fréquents, produire les règles, (Conf = sup{pain,lait} / sup( pain ) = 2/4 = 50% Bonne règle = règle avec un support et une confiance élevée SUP (condition et résultat). CONF= sup (condition et résultat) / sup (condition).
Extraction des règles d’association : Paramètres : Fixer un degré d’exigence sur les règles à extraire >> Support-min. <.ex 2 transactions) >> Confiance-min < ex. 75%) l’idée est surtout de contrôler (limiter) le nombre de règles produites
Recheche des fréquence et production desrégles: >> recherche des ensemble produit fréquents (support >= support min.) >> à partir des ensemble produit fréquents, produire les règles (conf. >= conf. min.), {p;f} p f conf: ¾= 0,75 (accepter) f p conf : 3/5= 0,6 ( refuser) {p;f} {p;c} {p;l} {f;c} {f;l} {c;l} 2 3 2 1 2 3 Card {p,f}= 2
• Lift d’une règle : mesure son intérêt LIFT : L’amélioration apportée par une règle, par rapport à une réponse au hasard est appelée « lift » et vaut (EX = conf (pain et lait) /p (lait) = 0,5/(3/6)= 1) • Quand le lift est < 1, la règle n’apporte rien. • Exemples : • lift (C ⇒ B) = 5/6 < 1(règle inutile) • lift (B ⇒ E) = 5/4 (règle utile). lift (règle) = confiance (règle) / p (résultat)
Cas pratique Avec le logiciel TANAGRA: Cas d’une base de donnée d’un banque (population), Construire des règles d’association à partir d’un fichier EXCEL« individus x variables ». qui recense les caractéristiques d’un ensemble de clients ayant déposé un dossier de demande de crédits.
Des variables discréts On a 9 attributte , ayant tous Des variables discréts Charger le fichier BANQUE.BDM
Sélectionne les attributs Insérer le composant « Define Status» Sélectionne les attributs
• Le nombre d’items ayant un support supérieur à SUPPORT_MIN ; Ces paramètres sont donné Par Défaut, et dès lors possible de lancer les calculs , et voir les resultats On glissa, le composant A PRIORI dans la filière Le nombre d’items • Le nombre d’items ayant un support supérieur à SUPPORT_MIN ; • Le nombre d’itemsets de cardinal égal à 2, 3, …
Les resultats sont triées par ordre décroissant selon le LIFT Pour chaque règle, Affichera son antécédent, son conséquent, le lift, le support et la confiance associés.
Merci pour votre attention