Traces d'Interaction au sein d'un Environnement de Collaboration Qiang LI Atelier Trace IC 2011 16/05/2011 Chambéry
Plan Trace & Trace numérique (TN) Web Mining – Web Usage Mining Trois Niveaux de Trace Numérique Environnement: E-MEMORAe 2.0 Conclusion et Perspective Atelier Trace IC 2011 16/05/2011 Chambéry
Atelier Trace IC 2011 16/05/2011 Chambéry
Trace Etymologie Latin: «tractiare»-- L’action de tirer. …… « une petite quantité, résiduelle, subsistante » « l’exemple à suivre » « paradigme indiciaire » …… Des siècles 1120 1190 1250 1530 1847 1989 « l’impression qu’il reste quelque chose » ou « ce qui reste du passé » « Une suite d’empreintes laissée par le passage d’un homme ou d’un animal » « La marque laissée par ce qui agit sur quelque chose » Atelier Trace IC 2011 16/05/2011 Chambéry
Traces Numériques Une trace numérique d’interaction peut se définir comme une suite temporellement située d’observés, qui relève soit d’une interaction entre humains, médiatisée et médiée de diverses façon par ordinateur soit d’une suite d’actions et réactions entre un humain et une machine [Lund K. & Mille A., 2009]. Figure 2 Généralisation de systèmes traçants [Laflaquière J., 2009] Atelier Trace IC 2011 16/05/2011 Chambéry
Généralisation de systèmes traçants User Server (SQL or cache) Collection Analysis Process Read Interpretation /Transformation Process Presentation Record Visualisation Techniques de Web Usage Mining Atelier Trace IC 2011 16/05/2011 Chambéry
Web Mining Categories [Raymond K. & Hendrik B. , 2000] Tableau 1. Web Mining Categories [Raymond K. & Hendrik B. , 2000] Web Mining Web Content Mining Web Structre Mining Web Usage Mining -Informatioin Retrieval (IR) View -Database(DB) View View of Data -Unstructured -Semi-Structured -Semi Structured -Web Site as DB -Links structure -Interactivity Main Data -Text documents -Hypertext documents -Hypertext doc -Server logs -Brower logs Representation -Bag of words, n-grams -Terms, phrases -Concepts or ontology -Relational -Edge-labeled graph (OEM) -Graph -Relational table Method -TFIDF and variants -Machine Learning -Statistcal (including NLP) -Proprietary algorithms -ILP -Modified association rules -Machine learning -Statistical -(Modified) association rules Application Categories -Categorization -Clustering -Finding extraction rules -Finding patterns in text -User modeling -Finding frequent sub- structures -Web site schema discovery - Categorization -Site construction, adaptation, and management -Marketing -E-learning 1 Web Content Mining: texte, image, records, etc. 2 Web Structure Mining: hyperlinks, tags, etc. 3 Web Usage Mining (Web log mining): http logs, app server logs, etc. Atelier Trace IC 2011 16/05/2011 Chambéry
Web Usage Mining « Web usage mining is the application of data mining techniques to discover usage patterns from Web data, in order to understand and better serve the needs of Web-based applications » [Srivastava J. et al. 2000]. Figure 3. High Level Web Usage Mining Process [Srivastava J. et al. 2000] Atelier Trace IC 2011 16/05/2011 Chambéry
Trois Niveaux de Trace Numérique TN EN1 EN2 EN3 ENn … Organisation Filtre d’Organisation G1 G2 G3 … Filtre de Groupe U1 U2 U3 Un Filtre Individuel … Atelier Trace IC 2011 16/05/2011 Chambéry
Environnement E-MEMORAe E-MEMORAe (MEMoire ORganisation Appliqué e à l’e-learning) est une plateforme de collaboration informatique qui facilite l’apprentissage organisationnel et la capitalisation des connaissances (Leblanc A. & Abel M.-H., 2010). Atelier Trace IC 2011 16/05/2011 Chambéry
Empreintes Numériques Dans la plateforme E-EMEMORAe2.0, TNI constitue la trace de base et elle sera exploitée pour constituer les traces de groupe (niveaux supérieurs). ENi Usage Données qui décrivent le modèle d’usage de pages de Web, tel qu’adresses IP, références de la page et le temps d’accès etc. Profil d’utilisateur Les données d’enregistrement; Les informations de profil d’utilisateur; Atelier Trace IC 2011 16/05/2011 Chambéry
Conclusion et Perspective TN Web Mining Les trois niveaux de TNI E-MEMORAe2.0 Personnalisation Semantic Web Mining Fusion de TN Web Intelligence Moteur de Recommandation Traitement de l’Information Multimédia Atelier Trace IC 2011 16/05/2011 Chambéry
Références Lund K. & Mille A. (2009). Traces, traces d'interaction, traces d'apprentissages : définition, modèles informatiques, structurations, traitements et usage, Chapitre 1, Analyse de traces et personnalisation des Environnements Informatiques d'Apprentissage Humain, IC2 - Série Informatique et Systèmes d'Information, Hermes. Leblanc A. & Abel M.-H. (2009). Knowledge Sharing via the E-MEMORAe2.0 Platform. Proceedings of 6th International Conference on Intellectual Capital, Knowledge Management & Organisational Learning, Montreal Canada, pp. 10-19. Laflaquière J. (2009). Conception de système à base de traces numériques dans les environnements informatiques documentaires. Thèse. Srivastava J., Cooley R., Deshpande M., et Tan P.-N. (2000). Web usage mining: Discovery and applications of usage patterns from web data. SIGKDD Explorations, 1(2). Marty J.C & Mille, A. (2009). Analyse de traces et personnalisation des environnements informatiques pour l'apprentissage humain. Hermes Sciences Publications. Raymond K. & Hendrik B. (2000), Web mining Research: A Survey, ACM Special Interest Group on Knowledge Discovery in Data, Volume 2 Issue 1, p1-15, June. Ruselle S. & Norvig P. (2010). Artificial Intelligence: A Modern Approach, 3/E. Prentice Hall. Etc.. Atelier Trace IC 2011 16/05/2011 Chambéry
Merci 李强 Atelier Trace IC 2011 16/05/2011 Chambéry