Technologies de l’intelligence d’affaires Séance 10 L’analyse des paniers de la ménagère ou Analyse des associations
Références: Documentation SAS: Berry et Linoff, Chapitre 8. « ASSOCIATION NODE » de SAS EM Berry et Linoff, Chapitre 8. Han et Kamber, Chapitre 6. Hastie et al. (2001). The elements of statistical learning, Chapitre 14, sections 14.1 à 14.2.3
Objectif de l’analyse des associations Identifier des profils, associations ou structures causales entre les items ou objets qui sont fréquents dans les bases de données transactionnelles, relationnelles, ou dans les entrepôts de données. Autrement dit, il s’agit d’identifier les items qui apparaissent souvent ensemble lors d’un événement (ex. les items achetés lors d’une visite dans un magasin) ou dans une unité expérimentale donnée.
Applications Achats croisés et bonification des ventes Les achats sur cartes de crédit (ordinaire, or, platine) Les services téléphoniques (services optionnels) Services bancaires (produits financiers) Offres promotionnelles (coupons, ventes) Design de catalogues Disposition des produits sur les étagères
Applications (suite) Sites Web Comportements de navigation (cliques) Séquences de navigation
Exemples de règles d’association Si un client achète des souliers, alors 10% du temps il achète aussi des bas. 80% des clients qui achètent des chips tortilla achètent aussi un pot de salsa. Les clients qui achètent de la peinture au Latex, achètent également des rouleaux à peinture dans 85% du temps.
Les règles d’associations peuvent être Utiles Triviales Inexplicables Temporelles
Règles d’associations: Concept de base Soit une base de données transactionnelles où chaque transaction est une liste d’items (achats par un client lors d’une visite) Trouver: toutes les règles qui associent la présence d’un ensemble d’items avec la présence d’un autre ensemble d’items; ex., 98% des personnes qui achètent des pneus et d’autres accessoires d’autos, achètent également un service pour l’auto (changement de pneus et/ou autres services) Applications * service de maintenance (Qu’est-ce que le magasin peut faire pour augmenter ses ventes de service de maintenance)
Méthode Choisir les bons ensembles de produits Générer les règles de comptage ou matrice de co-occurrence Dépasser les limites imposées par les milliers d’articles
Choix des ensembles
Matrice de co-occurrences Client Fromage Oignons Poivrons Champi-gnons Olives 1 X 2 3 4 5
Matrice de co-occurrences Nbr. de Clients Fromage Oignons Poivrons Champi-gnons Olives 3 1 2
Avantages Résultats explicites facilement applicables Calculs simples (à comprendre) Adaptée à l’exploitation non dirigée des données
Désavantages Volume est exponentiel Difficulté à déterminer le nombre d’articles Ignore les articles rares
Structure du fichier pour utiliser SAS EM Cl. Visite Prod. 1 1 Fromage 1 1 Oignons 1 2 Olives 2 1 Poivrons 3 1 Fromage 3 2 Champign. Cl. Visite Prod. 4 1 Olives 5 1 Fromage 5 2 Champign. 5 2 Poivrons 5 2 Olives
Algorithme Apriori Exemple avec support minimum = 3
Définitions pour l’algorithme Apriori Support: nombre de transactions avec la combinaison d’items. Ex: support de {E,B} = 3 (ou 30%) Confiance (E=>B)= support(E,B)/support(E) Ex: Confiance (E=>B)= 3/3=100% Confiance (B=>E)= support(E,B)/support(B) Ex: Confiance(B=>E)=3/9=33,3% Levier (lift) de (E=>B)=confiance (E=>B)/confiance(B) Ex:Levier(E=>B)=100%/90%=1,11
Exemple si client remplace transaction