1/17FDC 2006 17 janvier 2006 Alice MARASCU Florent MASSEGLIA Projet AxIS INRIA Sophia Antipolis Classification de flots de séquences basée sur une approche.

Slides:



Advertisements
Présentations similaires
Placement de Motifs Architecture Application Contraintes: - Charge
Advertisements

La Couche Réseau.
Regroupement (clustering)
Efficient Simplification of Point-Sampled Surfaces
Recherche de motifs par méthodes exploratoires: Comparaisons de performances et statistiques sur le score.
Regroupement (clustering)
Évaluation de la qualité d'une clusterisation
GEF 435 Principes des systèmes d’exploitation
1 Vers la découverte de nouvelles modalités sensori-motrices. Encadrants : Pierre Bessière Anne Spalanzani Pierre Dangauthier DEA I.V.R. 24 Juin 2003 Sélection.
Master Génie Biologique et Informatique, première année
Les bases de données temps-réel
Mémoire & Processus Cours SE - SRC
Analyse de la tâche et méthode des scénarios
Séminaire IMS 10/01/2008 Distribution large échelle d’un algorithme financier de contrôle stochastique CIGC05 - GCPMF Xavier WARIN (EDF R&D - OSIRIS) Stéphane.
EQUIPE TaToo Extraction de connaissances dans les bases de données : motifs séquentiels et ontologie LIRMM - CNRS - Université Montpellier II.
Sélection automatique d’index et de vues matérialisées
Eric Guilbert, Marc Daniel *, Eric Saux
Auto-organisation dans les réseaux ad hoc
Classification Ascendante 2-3 Hiérarchique: Applications au Web Mining
1. L’ADN et l’information génétique
UE : 3.4. S4 Initiation à la démarche de recherche
Méthode des k plus proches voisins
Concepts avancés en mathématiques et informatique appliquées MAP-6014.
Champs de Markov cachés pour la classification de gènes..
Construction de modèles visuels
RECONNAISSANCE DE FORMES
UBLO Comparaison de génomes bactériens : questions méthodologiques autour de la définition du squelette et des boucles
Mesurer l’efficacité des algorithmes
Méthode des Ensembles de Niveaux par Eléments Finis P1
Equipe : VAISSET Antoine, MATHEOSSIAN Dimitri
Systèmes Superscalaires et VLIW
Gestion de Fichiers Tri Interne Efficace et Tri Externe.
Universté de la Manouba
Modèle d’entrepôt de données à base de règles
1 Techniques de généralisation des URLs pour l'analyse des usages du Web Yves Lechevallier, Florent Masseglia, Doru Tanasa et Brigitte Trousse Projet AxIS,
Apprentissage semi-supervisé
Analyse des algorithmes: une introduction. La question abord é e dans ce chapitre est la suivante: Comment choisir parmi les diff é rentes approches pour.
Partie II Sémantique.
Détection du meilleur format de compression pour une matrice creuse dans un environnement parallèle hétérogène Olfa HAMDI-LARBI.
RE161 IDS : Intrusion Detection System Le trafic habituel qui entre dans votre réseau sert à : Résoudre des requêtes DNS Accéder à des pages web La messagerie.
L'Unité centrale (CPU) Le CPU doit être rapide (mesuré en temps de CPU) UNITE DE CONTROLE Générer les signaux de control/temps Contrôler le décodage/exécution.
Quelques principes de référence pour l’évaluation des systèmes éducatifs Alain Mingat Décembre 2013.
Ministère de l’Enseignement Supérieur et de la Recherche Scientifique
1 Alain Casali Christian Ernst Extraction de Règles de Corrélation Décisionnelles 29 Janvier 2009.
Stockage d’information sur un périphérique non sécurisé Stage INRIA - Projet SMIS Cryptographie et Bases de données Septembre 2006 Soutenance de Vincent.
1 Nomination de mandataire Marin BERTIER. 2 Contexte ► Développement des GRIDs  Grand nombre de sites  Organisé hiérarchiquement ► Niveau local  cluster.
Fouille de données issues de capteurs : problématique et méthodes Journée “Les Capteurs en Agriculture” Paris 18 avril 2014 Pascal Poncelet
GF-11: Tri Interne Efficace et Tri Externe
Travaux Pratiques Optimisation Combinatoire
6° Conférence Francophone de Modélisation et de simulation 3 / 5 Avril Rabat Outil d’aide à l’analyse des interactions de contraintes pour l’ordonnancement.
Classification de données par l’algorithme FPSO-GA
Sujets spéciaux en informatique I
Optimisation pour la Conception de Systèmes Embarqués
PaCO++ André Ribes Réunion Hydrogrid Rennes 15/09/03.
Vers une intégration plus poussée de la recherche Web avec les Systèmes d’Information Géographiques Adapté de «Toward Tighter Integration of Web Search.
DU TRAITEMENT DU SIGNAL
Étude de faisabilité Détection de piétons sur une vidéo
Knowledge discovery in Databases (KDD)
D. Steinberg, N. Monmarché, M. Slimane, G. Venturini
Intégration des Tableaux Multidimensionnels en Pig pour
1 INRIA 29 Novembrei 2010 AxIS - Living Labs Conception, Analyse et Amélioration de Systèmes d’information dirigées par les usages Brigitte Trousse INRIA.
FAUVET Nicolas 1 Gestion de données scientifiques 3d massives pour l’interaction en Réalité Virtuelle Doctorant: Nicolas Fauvet Encadrant: Jean-Marc Vézien.
Étude de systèmes de fichiers distribués Théorie et pratique Cyril Séguin Directeurs de thèse Gaël Le Mahec Alain Cournier Benjamin Depardon c.
D’autres critères que le support ? Exemple avec la recherche de périodes denses : 1.Les méthodes de fouille actuelles dépendent d’un découpage arbitraire.
Visualisation des flots optiques en 3D
Systèmes d’exploitation Processus conclusion Modèle conceptuel de processus Pour masquer les effets des interruptions, les SE fournissent un modèle conceptuel.
Gestion des documents internes avec SQL Server 2005 Date de publication : janvier 2006.
Apprentissage semi-supervisé avec des modèles discriminants : application au résumé automatique de texte Massih-Réza Amini LIP6, Université de Paris VI.
Seconde 8 Module 7 M. FELT 03/11/ Module 7: Algorithmique #2  Objectifs:  AlgoBox.  Définition d’un algorithme.  Affectation de variable. 
Equipe Projet DOLPHIN 03/04/08.
Transcription de la présentation:

1/17FDC janvier 2006 Alice MARASCU Florent MASSEGLIA Projet AxIS INRIA Sophia Antipolis Classification de flots de séquences basée sur une approche centroïde

2/17FDC janvier 2006 Plan  Objectif  Contexte et contraintes  SCDS : clustering de flots de séquences  Expérimentations  Conclusion  Perspectives

3/17FDC janvier 2006 Objectif  Travail au croisement entre:  Motifs séquentiels « enchaînements fréquents de séquences dans les bases de données, avec des contraintes temporelles »  Data streams « une séquence infinie de données produites sans interruption à une grande vitesse »  Objectif: extraire les motifs séquentiels dans les data streams

4/17FDC janvier 2006 Contexte & Contraintes CONTEXTE  Des données arrivant avec une grande rapidité.  Des données en quantité potentiellement infinie.  Des données que l’on ne peut pas stocker de manière exhaustive. CONTRAINTES  Mémoire limitée.  Algorithmes fonctionnant en une seule passe ( pas de backtracking sur les données ).  Contraintes de performances : - pas de requêtes bloquantes - réaction rapide aux valeurs entrantes  Les requêtes longues doivent s’adapter aux changements qui ont lieu pendant leur exécution.

5/17FDC janvier 2006 Idée générale résumés des clusters (résumé du batch)

6/17FDC janvier 2006 Affecter une séquence à un cluster Cluster 1 Cluster 2 Cluster n …… ? Cluster i séquence 1 séquence 2 séquence 3 … séquence j … séquence n i Beaucoup de temps ! Nouvelle séquence

7/17FDC janvier 2006 Affecter une séquence à un cluster Cluster i séquence 1 séquence 2 séquence 3 … séquence j … séquence n i Nouvelle séquence Résumé du cluster

8/17FDC janvier 2006 Méthode proposée Sequence Clustering in Data Streams (SCDS)

9/17FDC janvier 2006 Alignement

10/17FDC janvier 2006 Résumer un cluster Cluster i (a:2, c:1, d:1):2 (e:2):2 (h:1):1 (m:2, n:2):2 (a:3, b:1, c:1, d:1):3 (e:3):3 (h:1, i:1, j:1):2 (m:3, n:2):3 (a:3, b:2, c:1, d:1):4 (e:4):4 (h:2, i:2, j:1):3 (m:4, n:2):4 (a, c) (e) (m, n)

11/17FDC janvier 2006 Ordre de stockage des séquences Cluster i séquence j séquence 2 séquence n i … séquence 3 … séquence 1 Cluster i séquence 1 séquence 2 séquence 3 … séquence j … séquence n i temps

12/17FDC janvier 2006 Distance entre séquences s 1 : (a) (a) (c) s 2 : (a, c) … similitude (s 1, s 2 ) =1+0+1 = 2

13/17FDC janvier 2006 Affecter une séquence à un cluster Cluster 1 Cluster 2 Cluster n …… Cluster i Nouvelle séquence Centroïde du cluster 1 Centroïde du cluster 2 Centroïde du cluster i Centroïde du cluster n …… Conditions : ? dist(s 1, s 2 ) =

14/17FDC janvier 2006 Temps de réponse et robustesse de SCDS

15/17FDC janvier 2006 Qualité du clustering

16/17FDC janvier 2006 Conclusion  Méthode d’extraction SCDS  Méthode centroïde de clustering  Analyse du temps d’exécution

17/17FDC janvier 2006 Perspectives Améliorer l’analyse de la qualité du résultat  Comparer à une classification hiérarchique  Autre classification ?  Méthode de comparaison ?

18/17FDC janvier 2006 Détection des cluters dégradés Cluster dégradé Nouveaux clusters