EGC Brest Président du CO : Ali Khenchaf Président du CP : Pascal Poncelet 1 Comité de Pilotage - 5 mai 2010
2 Plan Calendrier et Lieu Proposition de Président d’Honneur Principes pour le Comité de programme Conférenciers invités Thèmes Tutoriaux, Ateliers Comité d’organisation Affiche, Site Web Organisation Montant des inscriptions et budget prévisionnel
3 Calendrier Prévisionnel Lieu :Brest, Ensieta Date :25 janvier-28 janvier 2011 Président d'Honneur de la conférence : Jiawei Han ou Jian Pei (Simon Fraser University) ? Président du comité de programme : Pascal Poncelet Président du comité d'organisation : Ali Khenchaf Proposition des principes du comité de programme académique par le président : 5 mai 2010 Mise en place du Comité de Programme définitif : fin mai juin 2010 Rédaction de l’appel à communication : mai 2010 Nomination des médiateurs et des responsables ateliers, tutoriaux : Début juin Mise en ligne du site EGC 2011 : à partir du mardi 1 juin 2010 1 er appel à communication : jeudi 3 juin 2010 diffusion sur les listes de diffusion EGC, Gazette BDA, IC, DBWORLD, … Budget prévisionnel : 7 juin 2010
4 Calendrier Prévisionnel Date limite de réception des résumés de communication académique : vendredi 24 septembre 2010 Appel aux membres du CP pour biding : lundi 27 septembre 2010 Fin de remise des biding : vendredi 1 octobre 2010 Premières affectations des papiers et discussions avec les modérateurs : du lundi 4 au vendredi 8 octobre 2010 Date limite de réception des articles : vendredi 8 octobre 2010 (FIRM DEADLINE) Affectation des papiers au membres du CP : lundi 11 octobre mardi 12 octobre 2010 Date de proposition des tutoriels et ateliers (à faire par deux responsables) : vendredi 15 octobre 2010 Date de proposition de démonstrations de logiciels (à faire par un responsable) : vendredi 15 octobre 2010
5 Calendrier Prévisionnel Discussion (par mail) avec le comité de pilotage des tutoriels et ateliers : à partir de lundi 18 octobre 2010 Date d'acceptation des tutoriels et ateliers : vendredi 22 octobre 2010 Date d’acceptation des démonstrations de logiciels : vendredi 22 octobre 2010 Appel à com pour les ateliers : vendredi 22 octobre 2010 Retour des évaluations papiers : jeudi 11 novembre (1 mois pour évaluer les papiers) Réunion du Comité de Programme : Paris - jeudi 18 novembre – vendredi 19 novembre 2010 Etablissement des sessions et établissement du programme : jeudi 18 novembre – vendredi 19 novembre 2010 (lors du Comité de Programme) Notification des résultats aux auteurs : vendredi 19 novembre 2010 – samedi 20 novembre 2010 Rediffusion de l’appel à communications des ateliers pour les articles refusés : à partir du 20 novembre 2010 Mise sur le site de la liste des papiers acceptés : vendredi 19 novembre 2010 – samedi 20 novembre 2010 Sélection des meilleurs papiers potentiels pour les prix : (par mail) du 22 novembre au 3 décembre 2010 Version finale des papiers : vendredi 3 décembre 2010 Envoi au meilleur papier de la possibilité de faire un poster (après réception du papier pour vérification qu’il n’y ait pas de problème) : lundi 6 décembre 2010 Mise sur le site du programme détaillé de la conférence avec présidents de session : lundi 6 décembre 2010 Mise sur le site du programme des ateliers et tutoriels : vendredi 17 décembre 2010 Vérification des papiers et élaboration du document imprimable : du vendredi 3 au vendredi 17 décembre 2010 Remise document imprimable : 17 décembre 2010
6 Questions ? Création d’une sélection spéciale de papiers jeunes chercheurs ? Prix associé ? Intégration dans la conférence ? Réponse : création d’une catégorie jeune chercheur avec un prix de 500 euros pour le meilleur papier. Définir ce qu’est un jeune chercheur Création d’une sélection spéciale de papiers industriels ? Prix associé ? Intégration dans la conférence ? Réponse : Existe plutôt dans la catégorie applications. Le CP doit veiller à ce qu’il s’agisse bien d’un papier d’industriel lors de la sélection
7 Proposition du Président d’Honneur Contacter J. Han pour savoir s’il ne veut pas être pr é sident d ’ honneur sinon : Jian Pei Associate Professor of Computing Science at Simon Fraser University DBLP : articles avec Jiawei Han 20 KDD, 12 ICDE, 13 SIGMOD, 11 TKDE, 7 ICDM, 2 DMKD, WWW, CIKM, SDM Google scholar : FP-growth (frequent patterns) : cité 3367 fois Prefix Span (Sequential patterns) : cité 769 fois CMAR : multiple class association rule : cité 546 fois Web logs : cité 369 fois Data stream : cité 271 fois
8 Proposition du Président d’Honneur Bioinformatics and health-informatics (18): microarray data clustering, phenotype mining, informative gene discovery, quasi-clique mining, disease association Data mining Data mining Applications (32): software engineering, sensor networks, digital library, RFID, data cleaning Applications Change detection (7): changing region detection, distribution change detection, gradient analysis Change detection Classification (11): concept drifting, associative classification Classification Clustering (16): pattern-based clustering, density-based clustering, interactive clustering Clustering Frequent pattern mining (24): pattern-growth methods, frequent closed pattern mining, mining with constraints, approximate and compressed patterns Frequent pattern mining Graph and structure mining (12): partial orders, quasi-cliques, mining large graph databases Graph and structure mining Preference mining (4): mining preferences and preference based ranking Preference mining Sequential pattern mining (22): pattern-growth methods, mining with constraints, multidimensional/approximate patterns, mining time series Sequential pattern mining
9 Proposition du Président d’Honneur Database query answering (8): top-k/ranking quries, indexes Database query answering Data stream processing (14): answering ad hoc aggregate queries, data cubes on streams, concept-drifting Data stream processing Data warehousing and OLAP (24): semantic OLAP and quotient cube, gradient analysis, skyline cubes Data warehousing and OLAP Information retrieval (7): citation recommendation, topic evolvement, query suggestion, automatic crawling Information retrieval Privacy preservation and security (20): k-anonymity, privacy preservation against adversarial data mining, trustworthy data storage and query answering Privacy preservation and security Spatial, multidimensional, and multimedia databases (18): skyline analysis, co-location patterns, image annotation, similarity search Spatial, multidimensional, and multimedia databases Uncertainty and probabilistic databases (13): probabilistic skylines, typicality, probability threshold ranking queries Uncertainty and probabilistic databases Web data processing, analysis and mining (15): page farms, spam detection, web data extraction, web log mining Web data processing, analysis and mining Miscellanies (1) Miscellanies
10 Proposition de comité de programme Conserver les membres d’EGC 2010 « qui ont bien réalisé” le travail. Voir avec Jean Marc Petit pour valider la liste. Eventuellement Jean Gabriel Ganascia Attention : Pour le planning il est prévu un retour des évaluations le 11 novembre et un CP le 18/19 novembre. Si problème d’évaluation il faut que le Comité de Pilotage puisse remplacer les personnes dont le rapport n’a pas été fait. Objectif : au moins 3 rapporteurs par article pour le CP. Ajouter de nouvelles personnes jeunes »/internationales : Mathieu Roche, Fouille de Données Textuelles Sandra Bringay, Santé et Fouille Osmar Zaïne Toon Calders Ricardo Gavalda João Gama, Flux de données Torben Pedersen, OLAP Mining Albert Biffet, WEKA + structures complexes Eyke Hüllermeir, Classification, Fuzzy, Preference Learning Chedy Räissy Marc Plantevit Conserver les modérateurs pour aider à répartir les papiers et aider à la sélection des meilleurs articles (cf. thématique)
11 Conférenciers invités João Gama - Flots de donn é es Eyke H ü llermeir - Fuzzy systems and Mining Ricardo Baeza-Yates - Modern Information Retrieval Fosca Gionnetti - Mobilit é Privacy GeoKDD Marie Francine Moes - Opinion Mining DGA - Interop é rabilit é, syst è me de syst è mes Ne retenir que 4 maximum 5 conf é renciers invit é s Un conf é rencier invit é peut faire un tutoriel.
12 Thèmes Algorithmes de fouille de données (supervisés, semi-supervisés et non supervisés) Algorithmes de fouille de données robustes au passage à l’échelle Cadre théorique pour la fouille de données Fouille de données de motifs (associations, séquences, graphes, arbres,..) Fouille de données multidimensionnelles Données spatio-temporelles Donnes semi-structurées et textuelles Détection d’outlier, d’inattendus et détection d’anomalies Algorithmes de fouilles distribués et parallèles Fouille de comportements d’utilisateurs et de données de retour Préservation de la vie privée et de l’anonymat Fouille dynamique de données Langages de requêtes déclaratifs pour la fouille de données Apprentissage topologique, variétés mathématiques Programmation logique et par contraintes Méthodes statistiques en fouille de données Recherche de similarité en fouille de données P. Poncelet doit affiner et regrouper des thèmes La proposition de liste sera envoyée au Comité de Pilotage Ajouter Apprentissage, statistiques et fouilles de données, énergie, SIG, fouille visuelle de données, fouille de données complexes (contacter JMP pour les noms et les distributions l’année dernière) Redéfinir le nom des catégories : Domaines émergents ? Expériences/systèmes d’EGC sur des domaines Applicatifs -> Avancées concrètes
13 Thèmes Extraction et gestion de connaissances dans des domaines émergents Flux de données, réseaux de capteurs, mobilité, données RFID Données ubiquitaires, intelligence ambiance Réseaux sociaux, communauté Web Sémantique Fouille de données d’opinions Fouille de données de textes particulières : depêches, twitter Commerce électronique, systèmes de recommandations, publicité en ligne Algorithmes pour les données issues de la santé, de la chimie, de la biologie, de la pharmacologie ou de l’environnement Algorithmes de fouille de données antagoniste, sécurité Fouille de données multimédia P. Poncelet doit affiner Changer le nom de la catégorie
14 Thèmes Aspects méthodologiques de l’extraction et de la gestion de connaissances Prétraitement des données, réduction de dimensionnalité, sélection et modification de caractéristiques Intégration et indexation de données pour la fouille de données, fusion de sources diverses Prise en compte d’ontologies ou de l’expertise dans le processus d’ECD Modélisation de l’utilisateur dans le processus Post traitement des connaissances Qualité des données et des connaissances Automatisation du processus d’ECD Visualisation et interaction homme-machine Plateformes et systèmes pour l’ECD Intégration de données (entrepôts OLAP, médiation, …) P. Poncelet doit affiner Changer le nom de la catégorie
15 Thèmes Expériences/Systèmes d’EGC sur des domaines applicatifs Finance, analyse de marché Gestion de la relation clients, commerce électronique e-Santé, recherche clinique, épidémiologie, pharmacologie, Bioinformatique, chimie computationelle Environnement, télédétection, gestion agri-environnementale Télécommunication et réseaux Détection d’intrusion Génie logiciel Mémoire d’entreprise, veille technologique et stratégique Web sémantique P. Poncelet doit affiner et regrouper des thèmes La proposition de liste sera envoyée au Comité de Pilotage
16 Modérateurs 2 Responsables pour les thématiques 1 membre du Comité de Pilotage et 1 membre du Comité de Programme : Fouille « générale » Extraction et gestion de connaissances dans des domaines émergents Aspects méthodologiques de l’extraction et de la gestion de connaissances Expériences/Systèmes d’EGC sur des domaines applicatifs
17 Proposition de comité d’organisation
18 Affiche - Site Web
19 Organisation Session poster en deux sessions (à affiner) Réponse : possible dépend de l’organisation Poster des meilleurs papiers ? (e.g. PKDD) Réponse : oui mais ce ne doit pas être une obligation
20 Montant des inscriptions et budget prévisionnel Tarifs EGC 2011 Avant le 31 décembre 2010 Ateliers et tutoriels ConférenceAteliers, tutoriels et Conférence Etudiant Autre
21 Montant des inscriptions et budget prévisionnel Tarifs EGC 2011 Après le 31 décembre 2010 Ateliers et tutoriels ConférenceAteliers, tutoriels et Conférence Etudiant Autre
22 Montant des inscriptions et budget prévisionnel Stand industriels : 500 à 1000 euros Sont inclus dans les frais d’inscription à la conférence : Actes de la conférence et/ou des ateliers et des tutoriels Les pauses cafés L’adhésion à l’association EGC (20 euros) Les déjeuners Une contribution de 50 euros est demandée pour le diner de gala
23 Montant des inscriptions et budget prévisionnel La publication d’un article dans les actes de la conférence et/ou les ateliers est conditionnée par l’inscription d’au moins un auteur (1 auteur ne peut pas présenter plus de 2 papiers pour 1 étudiant et plus de trois pour les autres - reformuler) Une copie de la carte d’étudiant sera demandée à l’inscription des étudiants Tarif préférentiel pour plusieurs membres d’une même é quipe ? R é ponse : oui C.f. Site web EGC. Offrir l ’ inscription (tutoriel) à la personne qui fait le tutoriel
24 Budget prévisionnel Recettes 200 inscriptions : 50 étudiants/150 autres Avant le 31/12/ * 220 = * 350 = * 320 = Après le 31/12/ * 250 = * 350 = Total : euros (# 80 Keuros) A. Khenchaf doit affiner ;e budget
25 Budget prévisionnel Subventions BMO : 3000 (au moins) CG29 : 3000 (au moins) Région Bretagne : 3000 (au moins) DGA ? : 4000 CNRS ? Autres (industriels ?) Sous total : euros TOTAL RECETTES : 95 Keuros
26 Dépenses Location du Quartz : 25 Keuros Salles/Espaces : 4 salles, 1 amphi, salons : 7294 Personnel d’accueil : 3537 Personnel technique (préparation salle, technicien) : 1634 Matériel (-50% dès le 2nd jour) (#4 video, microcravate, wifi) : 1928 Panneaux posters : (20) 306 Pauses KF (par rapport à 200 puis 250 personnes) : 6650 Signalitique : 128 Total dépenses : 24748, 8
27 Dépenses Frais de transport invités + hébergement 6 * 3000 : Plaquettes, programme : 1000 Repas midi : (200*25)*3 : Secrétariat : 1000 Assurance : 500 Consommables : 150 Frais de gestion : 500 Actes de la conférences - tirage CD : Sacoches (négociation en cours) Diner, soirée de gala : Diner du comité de pilotage : 25 * 15 = 375 Sous total dépenses : euros
28 Budget prévisionnel Recettes : 95 Keuros Dépenses : 73 Keuros