Classification Ascendante 2-3 Hiérarchique: Applications au Web Mining

Slides:



Advertisements
Présentations similaires
1 ère Rencontre Multisports Présentation Générale Cet évènement sportif vient clôturer 5 années de construction déquipements sportifs de proximité
Advertisements

Lycée Jean-Paul Sartre
Fabrice Lauri, François Charpillet, Daniel Szer
Organisation et Evolutions Commission Sportive Nationale IFSQUASH-DTN-2013 COPYRIGHT©
Exigences réglementaires pour les copropriétés
Mon carnet De comportement
M Les Promotions de lété Bertrand Launay Directeur de la division PME-PMI Microsoft France Etienne Jacques Responsable Marketing Partenaires Jeudi 2 Juin.

Graphes et Applications Thème de léquipe « Combinatoire et Algorithmique » LaBRI – janvier 2008.
Introduction aux classes empiétantes François Brucker Brest (Breizh)
Corese Moteur de recherche sémantique pour RDF
Stage serveur web sémantique
Projet FIACRE 1 ACI Sécurité InformatiqueToulouse, novembre 2004 FIACRE Fiabilité des Assemblages de Composants Répartis Modèles et outils pour lanalyse.
Synthèse des textes officiels
Regroupement (clustering)
Congrès SPECIF janvier 2002 Sur la politique scientifique de lINRIA Bernard Larrouturou
Présentation de lESSI le 16 Mai Qui sommes nous ? n Une école dingénieurs, créée en 1987 n Basée à Sophia-Antipolis n Habilitée par la Commission.
Comité de pilotage (Rochefort le 20 mai 2005) Indicang – Interreg III Comité de Pilotage Bordeaux le 15 décembre 2005 Communication.
GDR ONDES – PESSAC – Novembre 2007
COST – 20 mai Paris Une recherche sur la diminution de la consommation énergétique dans le domaine de Supply Chain et stockage de yaourt en Bulgarie.
SATELLITES et PLANETES.
Directeur de Thèse : Pr. Witold Litwin
du 22 mai DADDi Dependable Anomaly Detection with Diagnosis ACISI 2004.
METADYNE... L’architecture clients-serveurs d’un hypermédia adaptatif
Karel Heurtefeux1, Fabrice Valois2
Copyright © 2004, SAS Institute Inc. All rights reserved. Processus Stockés SAS une perspective analytique Sylvain Tremblay SAS Canada 25 avril 2006.
1 LENT, an X Quelques observations issues du dispositif national de mesure daudience des ENT Educatice 2013, Sylvie Le Loup.
COMPARAISON DES PROFILS DE TENEUR EN EAU ET DE SUCCION DANS LES LIMONS
Structuration & Organisation de Données Complexes Workshop « Fouille de données complexes » Clermont-ferrand, 20 Janvier 2004 O. Boussaid, F. Masseglia.
Architecture Les Couches Présentation Services Métier
C.H.I.C. ET LES ÉTUDES DOCIMOLOGIQUES Gérard FROSSARD Département des Sciences de la Formation et de la Communication Unité propre Développement professionnel.
Web Services - ADFS Pellarin Anthony En collaboration avec : Sogeti 1.
Éclairage Structuré et vision active pour le contrôle qualité de surfaces métalliques réfléchissantes Olivier Morel*, Ralph Seulin, Christophe Stolz, Patrick.
OLAP : Un pas vers la navigation
1 11 avril 2005 Toulouse Franck MERCIER Ouan-Zan ZANIFE Franck FERREIRA CLS, Direction Océanographie Spatiale Contribution de lAltimétrie Spatiale à lHydrologie.
7 mai ème Il faut effectuer le calcul rouge (comme bâbord) pour celui qui est à gauche de sa table et vert (comme tribord) pour celui qui est.
La classe européenne du Lycée Michelet
Champs de Markov cachés pour la classification de gènes..
La segmentation
Indices de performance des sites de e-commerce 2ème trimestre 2009 par Eric VARSZEGI - ip-label.newtest.
SCIENCES DE L ’INGENIEUR
Présentation des outils de recherche dinformations scientifiques.
L1 - MC1 Contrôle continu : - Partiel 1 (note N1) : 23 octobre 18h
Exemple d'application des STIC pour la télégestion de méthaniseurs:
CAssiopée, un système de vidéosurveillance bancaire
1 Techniques de généralisation des URLs pour l'analyse des usages du Web Yves Lechevallier, Florent Masseglia, Doru Tanasa et Brigitte Trousse Projet AxIS,
Marie-Laure Potet et Yves Ledru(LSR/IMAG)
Annexe 1 VISITE SUR
1 DataGRAAL DataGRid pour Animation et Applications à Large échelle Yves Denneulin IMAG-ID Pierre Sens LIP6 - INRIA.
Découverte de correspondances entre ontologies distribuées
ALGORITHME DE TRI Le tri par insertion.
Classification automatique
Suivi d’individus et interprétation vidéo
Outils mathématiques pour le datamining
1 Détecteurs de défaillances adaptables Marin BERTIER Thèmes SRC Laboratoire d'Informatique de Paris 6 Université Pierre & Marie Curie.
Colloque Lycée Académie de Nantes ePrep Clemenceau NANTES Sophia-Antipolis, 6 et 7 mai 2002 Atelier N°6 Quel plan de formation.
Atelier technique SAS – 19 juin 2001
Option Découverte Professionnelle (3heures)
1 Alain Casali Christian Ernst Extraction de Règles de Corrélation Décisionnelles 29 Janvier 2009.
Sériation et traitement de données archéologiques
Thierry Despeyroux Yves Lechevallier Brigitte Trousse
Présentation du budget & Comparaison avec les derniers comptes.
1/17FDC janvier 2006 Alice MARASCU Florent MASSEGLIA Projet AxIS INRIA Sophia Antipolis Classification de flots de séquences basée sur une approche.
1 Deux exemples de management (et d’organisation) de la recherche : le CNRS et l’INRIA Club EEA, Tours, 13 mai 2009.
Sabrina Tollari, Hervé Glotin, Jacques Le Maitre
20/06/2015propagation de signatures lexicales dans le graphe du Web 1 Propagation de signatures lexicales dans le graphe du Web M. Bouklit M. Lafourcade.
Les aspects financiers : Quel impact sur les dotations de l’État ?
1 INRIA 29 Novembrei 2010 AxIS - Living Labs Conception, Analyse et Amélioration de Systèmes d’information dirigées par les usages Brigitte Trousse INRIA.
Localisation collaborative dans les réseaux de capteurs
WAAPP GHANA NCoS REGIONAL CONFERENCE, 2016 Thème: Caractérisation agro-morphologique de 44 accessions de manioc (Manihot esculenta Crantz) cultivés en.
Transcription de la présentation:

Classification Ascendante 2-3 Hiérarchique: Applications au Web Mining Sergiu Chelcea, Brigitte Trousse Projet AxIS INRIA Sophia Antipolis {Sergiu.Chelcea, Brigitte.Trousse}@inria.fr

Objectifs Analyser l’impact de l’organisation scientifique de l’INRIA sur le comportement des internautes Classification des rubriques visitées (équipes de recherche) utilisant la CAH classique et la 2-3 CAH introduite par P. Bertrand en 2002

Propriétés 2-3 CAH Généralise la CAH Construit une structure plus riche que la CAH CAH 2-3 CAH Algorithme avec la même complexité que la CAH : O(n2 log n)

Application de la 2-3 CAH au Web Mining Pour classer les rubriques visitées : navigations = vecteurs binaires sur le rubriques visitées Calcul de la matrice de dissimilarités sur les rubriques : Indice de Jaccard : N1 N2 N3 ... R1 R2 R3 . 1

Première analyse 1/2 L’impact de la structure globale des site Web sur les navigations : application de la 2-3 CAH sur les rubriques visitées dans les navigations sur les deux serveurs La distribution des équipes de recherche (ER) dans la classification obtenue

Première analyse 2/2 (singletons pas représentes)

Deuxième analyse 1/2 L’impact de l’organisation scientifique sur les navigations : Classification des ER basée sur les rubriques visitées du serveur INRIA principal L’évolution de la distribution des ER de la theme 3 (COG) : Comparaison entre deux périodes : 1 – 15 Janvier 2003 27 Mai – 10 Juin 2004

Deuxième analyse 2/2 - Thème 3 - Per1 - ancienne Thème 3 - Per2

Troisième analyse Comparaison entre la CAH classique et la 2-3 CAH (Thème 3): CAH : 15 classes crées 2-3 CAH : 22 classes crées

Conclusions L’organisation scientifique des équipes de recherche de l`INRIA a un grand impact sur les navigations La structure globale du site Web influence aussi les navigations