EQUIPE TaToo Extraction de connaissances dans les bases de données : motifs séquentiels et ontologie LIRMM - CNRS - Université Montpellier II.

Slides:



Advertisements
Présentations similaires
Diffusion des résultats de la recherche européenne
Advertisements

Ordre du jour : Approbation du PV du lundi 13 février 2006
Formations et diplômes
Colloque le 1 er octobre 2008 de 8h45 à 17h30 organisé par l AESN, l AFSSA, l AFSSAPS, la DGS et l Université Paris Sud 11 au Ministère de la Santé, de.
Le simulateur d’anesthésie : au service de la performance
UE 102 (M1.CE) Communication d’entreprise
TIC pour le nouvel environnement d’affaires
Data Mining.
Classification et prédiction
Règles d’association.
Plates-formes électroniques de gestion de connaissances et de travail partagé Nicole PINHAS Hugues RASSER.
SDTICE Séminaire national C2i niveau 2 Métiers du Droit Université dAix-Marseille 3 27 et 28 mai 2010.
SDTICE Séminaire national C2i niveau 2 Métiers du Droit Université de Montpellier 1 28 et 29 mai 2009.
Département Informatique Responsable :M. Huchard Responsables adjoints : A. Jean-Marie, F. Koriche, P. Séébold Département Informatique Responsable :M.
Extraction de Connaissances à partir de Données et Fouille de Données Knowledge Discovery in Data Bases and Data Mining Pascal Poncelet
Département Informatique Responsable :M. Huchard Responsables adjoints : A. Jean-Marie, F. Koriche, P. Séébold.
Sujet de Thèse "Gestion des méta données dans une architecture de médiation à large échelle" Federico DEL RAZO
L’HISTOIRE DES ARTS UN ENSEIGNEMENT POUR TOUS
Quelle heure est-il?. Il est … Trois heures Quelle heure est-il? Il est … Deux heures.
Extraction des connaissances dans les bases de données
AAP structure expérimentale d’accueil de personnes jeunes atteintes de la maladie Alzheimer
Avec le soutien des Conseils généraux de l’Hérault, du Gard de l’Aude, de la Lozère et des Pyrénées Orientales.
Choix des Taches et des Compétences associées
INTRODUCTION Grande quantité de données
SDTICE Les certifications Jean-Paul BELLIER Chef du bureau de la formation et de la qualité
Cours n°1ue304b (S. Sidhom) UE 304 b Cours_L2.documentation_n°1 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi.
Page 1 Direction Scientifique 2005 GET Recherche Enseignement et Recherche au service de la Société de lInformation Groupe des Ecoles des Télécommunications.
1 DISIC Option Systèmes Intelligents / Données, Documents et Connaissances DISIC Option Systèmes Intelligents / Données, Documents et Connaissances.
Electronique et rayonnements naturels au niveau du sol 2 e journées nationales consacrée à la mise en place de méthodologies de conception, de qualification.
1 Efficient Data and Program Integration Using Binding Patterns Ioana Manolescu, Luc Bouganim, Francoise Fabret, Eric Simon INRIA.
LUniversité Rennes 2 Présentation de luniversité.
Un projet collectif pour le réseau : la production d’écrit
Christelle Scharff IFI Juin 2004
ACTIVITES DE FORMATION DU CRCF
Common Gateway Interface
Université Paris I – Panthéon Sorbonne
Monique THONNAT et Nathanaël ROTA Projet ORION
INTELLIGENCE COLLECTIVE : RENCONTRES 2006Nîmes mai 2006 CENTRE DE RECHERCHE LGI2P 1- Doctorante Ecole des mines de Paris, 2- Maitre de Conférences.
INTRODUCTION Objectif:
Initiation aux bases de données et à la programmation événementielle
Tecsan Technologies pour la santé et l'autonomie
Université Mouloud Mammeri de Tizi-Ouzou
La Bioinformatique à Nancy
Date / references Systèmes Terre et Interarmées Projet OUTILEX Rapport détude final Octobre 2006.
Modèle d’entrepôt de données à base de règles
1 Techniques de généralisation des URLs pour l'analyse des usages du Web Yves Lechevallier, Florent Masseglia, Doru Tanasa et Brigitte Trousse Projet AxIS,
1 Dans le cadre des Ateliers de dialogue interdisciplinaires Recherche, Action et Expertise : regards croisés Nord-Sud Quelles relations entre experts,
Cornet Annie - UER management - présidente du collège de doctorat 1 Doctorat – situation actuelle.
1 DataGRAAL DataGRid pour Animation et Applications à Large échelle Yves Denneulin IMAG-ID Pierre Sens LIP6 - INRIA.
D.Delaunay-Verneuil - Technologies et handicap dans un centre de documentation (2008)1 CRÉATION DUN PÔLE DEXPERTISE « TECHNOLOGIES ET HANDICAP » DANS UN.
Méthode de modélisation multidimensionnelle
IFT6255 – Recherche d’information Jian-Yun Nie
Le Comité d’Ethique du CHU de Bordeaux
Activités développées RTP 12 : Information et connaissance : "découvrir et résumer" Actions spécifiques et équipes-projets associées Objectifs thématiques.
Sylvie Gendron, Ph.D. Faculté des sciences infirmières Université de Montréal 3e colloque international de programmes locaux et régionaux de santé : des.
INF3500 : Conception et implémentation de systèmes numériques Pierre Langlois Augmenter le débit d’un.
1 Projet Interuniversitaire Ciblé « POLITIQUES FONCIERES ET STRATEGIES PAYSANNES DANS LE NOUVEAU CONTEXTE MALIEN DE LIBERALISATION ET DE DECENTRALISATION.
synthèse onduleur autonome
Fouille de données issues de capteurs : problématique et méthodes Journée “Les Capteurs en Agriculture” Paris 18 avril 2014 Pascal Poncelet
1 Mini projet sur les entrepôts de données. 2 Un DW dans les télécoms Sujets – suivi du marché: lignes installées/ désinstallées, services et options.
1/17FDC janvier 2006 Alice MARASCU Florent MASSEGLIA Projet AxIS INRIA Sophia Antipolis Classification de flots de séquences basée sur une approche.
1 Deux exemples de management (et d’organisation) de la recherche : le CNRS et l’INRIA Club EEA, Tours, 13 mai 2009.
Visualisation interactive de données hétérogènes pour l ’ amélioration des dépenses énergétiques du bâtiment Benoit LANGE Rapporteurs M. Gilles GESQUIÈRE,
Groupe XXX Bilan Tourniquet Section novembre 2013
TEXT MINING Fouille de textes
Réunion GafoDonnées: Equipe SIG/IRIT 24/25 janvier 2002
1 INRIA 29 Novembrei 2010 AxIS - Living Labs Conception, Analyse et Amélioration de Systèmes d’information dirigées par les usages Brigitte Trousse INRIA.
D’autres critères que le support ? Exemple avec la recherche de périodes denses : 1.Les méthodes de fouille actuelles dépendent d’un découpage arbitraire.
1 Les URFIST comme acteurs et partenaires de la formation continue. Exemple de l’URFIST de Rennes Alexandre Serres Co-responsable de l’URFIST de Rennes.
Séminaire IRIT-UT1 « Les nouveaux de 2010 » Novembre 2010 Les entrepôts de données et des documents = des entrepôts de documents ? Ronan Tournier
Transcription de la présentation:

EQUIPE TaToo Extraction de connaissances dans les bases de données : motifs séquentiels et ontologie LIRMM - CNRS - Université Montpellier II

EQUIPE TaToo 8 Permanents (3 Pr, 5 MCF dont 1 HDR), 2 Associés, 7 Doctorants Thèmes de recherche : Fouille de données Textes (Text Mining), Arborescentes (Schema - Web Structure Mining) Multidimensionnelles (Cube - Web Usage Mining) Flots (Stream Mining) Ontologie Annotation, Indexation, Modélisation, Mise-à-jour Motifs séquentiels

Vers un nouveau processus EXPERTISE Représentation Des DONNEES Traitement Visualisation Fouille de données CONNAISSANCES aux DECISIONS PROBLEME

Résultats récents 6 thèses soutenues 2008-2007 (Jurys prestigieux : Jian Pei, Toon Calders, Osmar Zaiäne …) Publications (co-publications) avec CL sur 2008 (2007) : 5 (3) RI - 28 (14) CI DMKD, IEEE Transaction on Fuzzy Sets, ODBASE, CIKM, PAKDD, PKDD, DASFAA, BDA … Comités de Programme, Relecteur ICDM, PKDD, DEXA, IEEE TKDE, …

Domaines d’application Web Mining, Text Mining, Schema Mining, Tree Mining, Stream Mining … Santé : 3 partenariats forts (Inserm Bordeaux, Montpellier I et II) 2 Programmes Exploratoires Pluridisciplinaires 2008 PEPS ST2I « GeneMining » PEPS STI-SHS    « Langage, Mémoire et Alzheimer » Environnement ….

Outils de visualisation Demon

Transferts de technologie Axiliance (Région LR) (30K) Filtrage de requêtes à risque EDF (R&D Paris) (80K) Recherche de comportements temporels atypiques ANR Midas avec ENST, INRIA, EDF R&D, Orange R&D Modélisation et fouille dans les flots de données We are cloud Calcul dans les cubes de données En cours (PIKKO, Spotter)

Conclusion Ambition (Equipe – Séminaire) Forte implication au sein de l’Université (Présidence, Direction adjointe UFR Info, Direction Dept IG, Responsable de Parcours …), de la région (IBM, cluster INTS, journées MIPS) Mais Affectation des ressources

Le Processus d’Extraction de Connaissances Identifier dans les données des schémas valides, nouveaux, potentiellement utiles et compréhensibles [Fayyad et al., 1996]

Panier de la ménagère Localisation Produits achetés Identification Date, heure

Règles d’Association vs Motifs Séquentiels Corrélation entre les produits (RA) Les personnes qui achètent des couches achètent de la bière Comportement des clients au cours du temps (MS) Les personnes qui achètent des couches achètent trois jours après de la bière

Extraction de Motifs Séquentiels Considérons la base de données D suivante avec I = {a,b,c,d} : C1 t1 t2 a,b,c,d a,b C2 t3 C3 t4 b,c,d <(a,b)> séquence fréquente [Agrawal & Srikant, 95] [Srikant & Agrawal, 96] GSP [Masseglia et al., 98] PSP [Zaki., 01] SPADE [Ayres et al. 02] SPAM [Han et al.., 00] FreeSpan [Pei et al.., 01] PrefixSpan [Zaki, 07] PRIMAL Par niveau Pattern-Growth Par niveau, représentation

Des constats Quid des nouvelles données ? des quantités ? des contraintes temporelles ? des données plus complexes ? des connaissances plus riches ?