Clickstream et modélisation Atelier thématique du GERAD Modèles d’aide à la décision en marketing HEC Montréal 25 janvier 2007 Sylvain Sénécal Professeur agrégé Département de l’enseignement du marketing Chaire de Commerce Électronique RBC Groupe Financier HEC Montréal
Présentation Introduction Qu’est-ce que le clickstream? Site web et clickstream Pourquoi s’intéresser à l’analyse et la modélisation du clickstream? Efforts de modélisation du clickstream en marketing Un projet récent Mot de la fin Références
Qu’est-ce que le clickstream? Définition: Parcours d’un usager sur un site web ou sur plusieurs sites web. Inter-sites Sites visités Intra-site Pages visitées, temps par page, panier, achat, etc. But: Comprendre et/ou prévoir les comportements de navigation et d’achat. Quelques défis: Nature stratégique des données Qualité des données (log files) Seulement l’observation des comportements
Qu’est-ce que le clickstream? Source: Montgomery et al. (2004)
Site web et clickstream De façon générale, un site web à trois objectifs: Attirer des visiteurs (Clickstream inter-sites) Satisfaire les visiteurs (Clickstream inter et intra-sites) Pour un site transactionnel: Convertir les visiteurs en clients Pour un site informationnel: Permettre aux visiteurs de trouver l’information recherchée Faire revenir les visiteurs et clients sur le site régulièrement (Clickstream inter et intra-sites)
Pourquoi s’intéresser à l’analyse et la modélisation du clickstream? Compréhension des comportements en ligne à améliorer Taux d’abandon des paniers élevés Taux de conversion des sites peu élevés Les données clickstream offre l’opportunité d’observer les comportements à la fois de façon relativement: Complète: Du déclenchement au comportement post-achat Détaillée: Séquence des sites et pages visités, temps, produits considérés, etc. La modélisation du clickstream et par la suite son utilisation à des fins marketing peut contribuer à améliorer la performance marketing.
Efforts de modélisation du clickstream en marketing Propensité à cliquer sur une bannière d’un site (Chatterjee, Hoffman et Novak 2003) Recherche d’information inter-site (Johnson et al. 2004) But de la visite (Moe 2003) Propensité à poursuivre la visite et à passer du temps sur une page (Bucklin et Sismeiro 2003) Identification du processus décisionnel (Moe 2006; Sénécal, Kalczynski et Nantel 2004) Prédiction de la complétion de la tâche (Kalczynski, Sénécal et Nantel 2006) Prédiction d’achat sur un site (Moe and Fader 2004; Montgomery et al. 2004; Sismeiro et Bucklin 2004)
Prédiction d’achat sur un site (Montgomery et al. 2004) Taux de conversion du site: 7%
Un projet récent Predicting Online Task Completion with Clickstream Complexity Measures: A Graph- Based Approach (Kalczynski, Sénécal et Nantel 2006)
Objectif Développer et identifier des mesures de complexité de clickstream qui peuvent aider à prédire la complétion de tâche, indépendamment du contenu du site web.
Approche Clickstream et Théorie des graphes Graph: Hypertexte (site web) Subgraph: chemin parcouru par l’usager (clickstream)
Étude 1: Collecte de données Procédure: 485 participants (en laboratoire) Clickstream Pages visitées, temps, etc. Complétion de tâche
Étude 1: Mesures 10 mesures de complexité de clickstream (indépendantes du site) MesureDescription Compactness (CP)Densité du clickstream Stratum (ST)Linéarité du clickstream Average Link Traversals (ALT) Moyenne de cliques sur les hyperliens utilisés Average Degree (AD)Degré de visites multiples de pages Connection Ratio (CR)% de pages visitées Relative Diameter (RD)Linéarité du clickstream Relative Mean Dist. From Root (RMDFR) Distance moyenne entre la page d’accueil les autres pages Relative Nb of Links in Cycles (RNLC) % de pages dans des cycles (loops) Detourness (DT)Nombre de pages minimum requis / nombre de pages visitées Relative Time in Cycles (RTC) % de temps dans des cycles (loops)
Étude 1: Analyse Identifier les mesures pouvant prédire la complétion de tâche. Test de normalité des distributions des mesures Analyse factorielle exploratoire 1 Variance expliquée: 76.5% 2 facteurs: Facteur 1: Linéarité (CP, ST, AD, RD, RMDFR, DT) Facteur 2: Densité (RNLC, RTC, 1/CR) Analyse factorielle exploratoire 2 Variance expliquée: 80.4% 2 facteurs: Facteur 1: Linéarité (CP, ST, AD, RD, RMDFR, DT) Facteur 2: Densité (1/CR)
Étude 1: Analyse Régressions logistiques Variables indépendantes: RD (AD) et 1/CR Variable dépendante: Complétion de tâche
Étude 2: Validation But: Validation des résultats Même procédure que Étude 1 1 site, 70 consommateurs
Conclusion de ce projet Mesures indépendantes du site 2 mesures de complexité de clickstream (Average degree et Connection ratio) explique une bonne partie de la complétion de tâche à travers plusieurs sites. Avenues: Prédiction dynamique de complétion de tâche Mesures dépendantes du site Complémentaires Ex.: représentativité des hyperliens, etc.
Mot de la fin…
Mot de la fin Améliorations et développement de modèles Utilisation marketing des modèles Ex.: Courriel promotionnel suite à une ou plusieurs visites Ex.: Personnalisation dynamique du site suite à l’identification du but de la visite Ex.: Personnalisation dynamique du site compte tenu de la probabilité d’achat
Merci! Cette présentation sera disponible sous peu à l’adresse suivante:
Références Ansari, A. and Mela, C.F. (2003), "E-Customization," Journal of Marketing Research, 40 (2), 131. Bucklin, R. E. and Sismeiro C. (2003), "A Model of Web Site Browsing Behavior Estimated on Clickstream Data," Journal of Marketing Research, 40 (3), 249. Bucklin, R., Lattin, J.M., Ansari, A., Gupta, S., Bell, D., Coupey, E., Little, J.D.C., Mela, C., Montgomery, A., and Joel Steckel (2002), “Choice on the Internet: From Clickstream to Research Stream,” Marketing Letters, 13 (3), Bucklin, R.E. and Sismeiro, C. (2003), “A Model of Web Site Browsing Behavior Estimated on Clickstream Data,” Journal of Marketing Research, 40 (3), Chatterjee, P., Hoffman D.L., and Novak, T.P. (2003), "Modeling the Clickstream: Implications for Web-Based Advertising Efforts," Marketing Science, 22 (4), 520. Johnson, E. J., Moe, W.W., Fader, P.S., Bellman, S., and Lohse, G.L. (2004), "On the Depth and Dynamics of Online Search Behavior," Management Science, 50 (3), Kalczynski, P. Senecal, S., and Nantel, J. (2006), “Predicting Online Task Completion with Clickstream Complexity Measures: A Graph-Based Approach,” International Journal of Electronic Commerce, 10 (3), Moe W.W. and Fader P.S (2004), “Capturing Evolving Visit Behavior in Clickstream Data,” Journal of Interactive Marketing, 18 (1), Moe, W. W. (2003), "Buying, searching, or browsing: differentiating between online shoppers using in-store navigational clickstream," Journal of Consumer Psychology, 13 (1&2), Moe, W.W. (2006), « An Empirical Two-Stage Choice Model with Varying Decision Rules Applied to Internet Clickstream Data, » Journal of Marketing Research, 43, Montgomery, A.L., Li, S., Srinivasan, K., and Liechty, J.C. (2004), "Modeling Online Browsing and Path Analysis Using Clickstream Data," Marketing Science, 23 (4), 579. Park, Y-H. and Fader, P.S. (2004), “Modeling Browsing Behavior at Multiple Websites,” Marketing Science, 23 (3), Sénécal, S., Kalczynski, P., and Nantel, J. (2005), “Consumers’ Decision-Making Process and Their Online Shopping Behavior: A Clickstream Analysis,” Journal of Business Research, 58 (11), Sismeiro, C. and Bucklin, R.E. (2004), “Modeling Purchase Behavior at an E-Commerce Web Site: A Task- Completion Approach,” Journal of Marketing Research, 41 (3),