INTRODUCTION Grande quantité de données Difficultés à en extraire de la connaissance Identification de schémas nouveaux
Trois phases: Préparation de données Extraction Interprétation des résultats
Processus d’extraction de connaissances Préparation Extraction Interprétation Projet Sources de données Données consolidées Données formatées Modèles Connaissances Recherche de données Nettoyage des données Pré traitements des données Fouille de données Décisions Données Consommateurs Magasins Ventes Démographie Géographie Information X habite la région R Y a A ans Z dépense son argent dans la ville V de la région R Connaissance Une quantité Q du produit P est vendue en région R Les familles de profil F utilisent M% de P durant la période N Décision Promouvoir le produit P dans la région R durant la période N Réaliser un mailing asur le produit P aux familles du profil F
Techniques classiques de data mining Les règles d’association La classification L’estimation La segmentation
Problématique abordée En quoi le Web Mining permet-il d’optimiser les sites de E-commerce ?
1 Répercussions sur l’architecture des sites 1.1 étude du trafic inter sites Le référencement : étude des pages d’entrée L’analyse de liens : étude des liens entre page consultée et provenance de l’internaute L’analyse des mots clés : optimisation du référencement
1 Répercussions sur l’architecture des sites 1.2 Etude du trafic intra sites Etude de l’activité générale : nombre de visiteurs… Analyse de la navigation Les arbres de décision : connaître les comportements généraux sur le site
1 Répercussions sur l’architecture des sites 1.3 Optimisation des pages et de leur contenu Opérations de comptage Ex : Segmentation des pages en fonction du nombre de visiteurs et de la fréquence des visites Identification de pages idéales pour bandeaux ou pages a modifier…
2 Personnalisation des contenus 2.1 Création de segments d’utilisateurs Classification en fonction : Des habitudes de navigation Du profil sociodémographique Des comportemens d’achat
2.2 La modélisation prédictive Modélisation par arbre de décision Analyse des séquences de navigation Détermination des séquences à forte probabilité d’achat Croisement des données avec informations sur l’utilisateur
2.2 La modélisation prédictive Ventes Croisées « un client qui achète les produits A et B va également acheter le produit C avec une probabilité p »
2.2 La modélisation prédictive Modélisation des risques de fraude 2 cas de figure: L’utilisateur est connu L’utilisateur est inconnu
2.3 Le filtrage collaboratif L’exemple Amazon: « ceux qui ont acheté ce livre ont aussi acheté….. »
3 Mise en œuvre et Intelligence économique Les différentes phases du projet de Web Mining 1.1 Identifier les problèmes propres au business 1.2 Préparation des données
Les phases du projet Données Enregistrées Nettoyage Identification des utilisateurs Id. des pages vues Fichier des sessions Chemins de navigation Méthode Statistiques et Mathématiques Informations sur la structure et le contenu du site
1.3 L’architecture à mettre en place
1.4 Compréhension des données 1.5 Modélisation 1.6 Evaluation 1.7 Déploiement
Les bénéfices et leurs impacts. Analyse des données de navigation Analyse de la provenance Profiling et segmentation des visiteurs
Les bénéfices et leurs impacts. Modélisation du churn Modélisation prédictive Amélioration du processus d’achat
CONCLUSION « C’est désormais l’information que l’on détient sur le client qui devient la clé du succès...qui permettra d’ajuster toujours mieux le produit ou le service à la demande ».