La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

E QUIPE TaToo Extraction de connaissances dans les bases de données : motifs séquentiels et ontologie LIRMM - CNRS - Université Montpellier II.

Présentations similaires


Présentation au sujet: "E QUIPE TaToo Extraction de connaissances dans les bases de données : motifs séquentiels et ontologie LIRMM - CNRS - Université Montpellier II."— Transcription de la présentation:

1 E QUIPE TaToo Extraction de connaissances dans les bases de données : motifs séquentiels et ontologie LIRMM - CNRS - Université Montpellier II

2 E QUIPE TaToo 8 Permanents (3 Pr, 5 MCF dont 1 HDR), 2 Associés, 7 Doctorants Thèmes de recherche : Fouille de données Textes (Text Mining), Arborescentes (Schema - Web Structure Mining) Multidimensionnelles (Cube - Web Usage Mining) Flots (Stream Mining) Ontologie Annotation, Indexation, Modélisation, Mise-à-jour Motifs séquentiels 2

3 3 PROBLEME Fouille de données CONNAISSANCES aux DECISIONS Visualisation EXPERTISE Des DONNEES Représentation Traitement Vers un nouveau processus

4 Résultats récents 6 thèses soutenues (Jurys prestigieux : Jian Pei, Toon Calders, Osmar Zaiäne …) Publications (co-publications) avec CL sur 2008 (2007) : 5 (3) RI - 28 (14) CI DMKD, IEEE Transaction on Fuzzy Sets, ODBASE, CIKM, PAKDD, PKDD, DASFAA, BDA … Comités de Programme, Relecteur ICDM, PKDD, DEXA, IEEE TKDE, … 4

5 Domaines dapplication Web Mining, Text Mining, Schema Mining, Tree Mining, Stream Mining … Santé : 3 partenariats forts (Inserm Bordeaux, Montpellier I et II) 2 Programmes Exploratoires Pluridisciplinaires 2008 PEPS ST2I « GeneMining » PEPS STI-SHS « Langage, Mémoire et Alzheimer » Environnement …. 5

6 Outils de visualisation Demon 6

7 Transferts de technologie Axiliance (Région LR) (30K) Filtrage de requêtes à risque EDF (R&D Paris) (80K) Recherche de comportements temporels atypiques ANR Midas avec ENST, INRIA, EDF R&D, Orange R&D Modélisation et fouille dans les flots de données We are cloud Calcul dans les cubes de données En cours (PIKKO, Spotter) 7

8 Conclusion Ambition (Equipe – Séminaire) Forte implication au sein de lUniversité (Présidence, Direction adjointe UFR Info, Direction Dept IG, Responsable de Parcours …), de la région (IBM, cluster INTS, journées MIPS) Mais Affectation des ressources 8

9 9 Le Processus dExtraction de Connaissances

10 10 Panier de la ménagère Produits achetés Identification Date, heure Localisation

11 11 Règles dAssociation vs Motifs Séquentiels Corrélation entre les produits (RA) Les personnes qui achètent des couches achètent de la bière Comportement des clients au cours du temps (MS) Les personnes qui achètent des couches achètent trois jours après de la bière

12 Extraction de Motifs Séquentiels C1C1 t1t2t1t2 a,b,c,d a,b C2C2 t3t3 C3C3 t1t4t1t4 b,c,d a,b Considérons la base de données D suivante avec I = {a,b,c,d} : séquence fréquente [Agrawal & Srikant, 95] [Srikant & Agrawal, 96] GSP [Masseglia et al., 98] PSP [Zaki., 01] SPADE [Ayres et al. 02] SPAM [Han et al.., 00] FreeSpan [Pei et al.., 01] PrefixSpan [Zaki, 07] PRIMAL Par niveau Pattern-Growth Par niveau, représentation

13 13 Des constats Quid des nouvelles données ? des quantités ? des contraintes temporelles ? des données plus complexes ? des connaissances plus riches ?


Télécharger ppt "E QUIPE TaToo Extraction de connaissances dans les bases de données : motifs séquentiels et ontologie LIRMM - CNRS - Université Montpellier II."

Présentations similaires


Annonces Google