Extraction des connaissances dans les bases de données

Slides:



Advertisements
Présentations similaires
22 mai 2007 Clauvice Kenfack – Équipe MODEME
Advertisements

Vue d'ensemble Présentation multimédia : Administration d’un environnement Microsoft Windows Server 2003 Ouverture de session sur Windows Server 2003 Installation.
Data Mining.
Forum des utilisateurs des bases de données marines 23 novembre 2006 Ordre du jour (Session 3) 13H30 Session « Données de Géosciences Marines » Présentations.
Analyse en ligne (OLAP) de documents
Atelier CDS, 1er 2 avril 2004
Datamining de la Connaissance Client orienté Objectif
Nairobi, Kenya, Septembre 2010
INTRODUCTION Grande quantité de données
Mise en œuvre d’une démarche et d’un outil de gestion de « connaissances métier » basés sur la collaboration. Cyril BEYLIER
Vue d’ensemble du Data warehousing et de la technologie OLAP
Documents investigation
Alexandre Aussem, Jean-Marc Petit LIMOS, Clermont-Ferrand
EQUIPE TaToo Extraction de connaissances dans les bases de données : motifs séquentiels et ontologie LIRMM - CNRS - Université Montpellier II.
Analyse des proximités, des préférences et typologie
Christelle Scharff IFI Juin 2004
TOMOGRAPHIE PAR PROJECTIONS ORTHOGONALES ET OUVERTURE CODEE
L ’enseignement de la construction en BEP industriel
Estella Annoni, Franck Ravat, Olivier Teste, Gilles Zurfluh
Data Mining: Définition
Gestion des réserves naturelles
BACCALAUREAT PROFESSIONNEL ELectrotechnique Energie Equipements Communicants SOUTENANCE DE STAGE.
INTELLIGENCE COLLECTIVE : RENCONTRES 2006Nîmes mai 2006 CENTRE DE RECHERCHE LGI2P 1- Doctorante Ecole des mines de Paris, 2- Maitre de Conférences.
Structuration & Organisation de Données Complexes Workshop « Fouille de données complexes » Clermont-ferrand, 20 Janvier 2004 O. Boussaid, F. Masseglia.
Dossier informatisé EPSMR.
Database B2 2 MIP Paris.
Applications du perceptron multicouche
Plan du Cours Définition de la BI Objectif de la BI Fonctionnement d’une plateforme BI Technologies de la BI Composantes de la BI Les caractéristiques.
Suppression des Itemsets Clés Non- Essentiels en Classification V. Phan-Luong Université Aix-Marseille Laboratoire d'Informatique Fondamentale de Marseille.
Les systèmes d'information géographique servent principalement à :
Analyse de similarité de trajectoires
Administration de bases de données spatiales avec SavGIS
COPIL SINP 28/03/2014 PRÉSENTATION DES APPLICATIONS OGAM (WEB ET NOMADE)
La segmentation
La Classification
Développement d’un réseau social professionnel
Gestion des réserves naturelles
RECHERCHE QUALITATIVE
Base de données multimédia Cordelia Schmid
PROJET DE DÉPISTAGE DE LA RÉTINOPATHIE DIABÉTIQUE CHEZ LES COMMUNAUTÉS DES PREMIÈRES NATIONS DU QUÉBEC.
MODELE CONCEPTUEL POUR L’ANALYSE MULTIDIMENSIONELLE DE DOCUMENTS
GIS363, été Thème 2 : Systèmes d'information et performance u Systèmes d'information et performance individuelle u Systèmes d'information et productivité.
Management des Systèmes d’Information (MSI)
Hatainville Les Moitiers d’Allonne – Tel : Website : stratic.online.com La démarche projet Mars 2001.
Fadi BADRA Juillet 2005 Encadrants : Omar BOUSSAID (ERIC Lyon)
1 Alain Casali Christian Ernst Extraction de Règles de Corrélation Décisionnelles 29 Janvier 2009.
1 Registration Physique Séminaire du Master Davide Bazzi Université de Fribourg
Fouille de données issues de capteurs : problématique et méthodes Journée “Les Capteurs en Agriculture” Paris 18 avril 2014 Pascal Poncelet
Rôle des CI dans la démarche qualité
Les réseaux de neurones à réservoir en traitement d’images
Institut de sciences et technologies Département d’informatique
Un processus pour la prise de décision spatiale.
Nicolas Rageul, Yvan Bédard, Jacynthe Pouliot, Michel Fortin
Olivier Leclair, Université Laval Un algorithme de fouille dans une représentation des données par objets: une application médicale SIMON, Arnaud.
Les réseaux de neurones à réservoir en traitement d’images
Mémoire de Master 2ème année
Vers une intégration plus poussée de la recherche Web avec les Systèmes d’Information Géographiques Adapté de «Toward Tighter Integration of Web Search.
Knowledge discovery in Databases (KDD)
Services en Text Mining. Introduction : Qui est Mentis ? Mentis a été fondée en 2005 comme une société spin-off du Laboratoire d'I ntelligence Artificielle.
TEXT MINING Fouille de textes
Data Mining: Concepts et Techniques
GPA-779 Application des systèmes experts et des réseaux de neurones.
1 Structure en MC Principes Stockage des données dans la mémoire volatile d’un ordinateur Problèmes Stockage temporaire «Petits» volumes de données Langages.
MINISTÈRE DE L’ENSEIGNEMENT SUPÉRIEUR ET DE LA RECHERCHE SCIENTIFIQUE
Raisons de la réussite en sciences Formation universitaire élevée des professeurs Formation continue étendue Bonnes conditions de passation des épreuves.
Suivi d’Horizons Sismiques
Vers l’exploitation de grandes masses de données Encadré par : Mme L.Lamarini Présenté par: Rhaz Yassine Smiri Safae Un article de: Raphaeil Féraud,Maroc.
Enseignement par projet. Les médias ne se contentent pas d’offrir seulement une image de la réalité. Les contenus médiatiques doivent bien plus être lus.
Système d’Information Géographique Equipe-SIG Direction Régionale de Meknès.
La localisation d’une multinationale et le savoir enraciné L’étude de cas d’un cluster industriel Dorota Leszczyńska enseignant-chercheur IPAG-Nice GREDEG.
Transcription de la présentation:

Extraction des connaissances dans les bases de données Ansaf SALLEB salleb@lifo.univ-orleans.fr Laboratoire d ’Informatique Fondamentale d ’Orléans (LIFO) en collaboration avec: Bureau des Recherches Géologiques et Minières (BRGM) & La Région Centre

Description du problème Volume de données collectées est en croissance continue Experts dépassés par les volumes Il y en a beaucoup trop ! Ansaf SALLEB Sciences en Sologne 2000

Solution Volume de données  Connaissances Extraction des connaissances dans les Bases de données Volume de données  Connaissances BD Sélection Pré traitement Transformation Fouille de données Interprétation/ Evaluation Connaissances Modèles Données transformées Données prétraitées Données sélectionnées Etapes d’un processus ECD (Fayyad et al. 1996) Ansaf SALLEB Sciences en Sologne 2000

Solution Fouille de données (Data Mining) = Extraction de connaissances implicites, non connues à l'avance dans des entrepôts de données STAT BD RN VISU ASA AD FD Ansaf SALLEB Sciences en Sologne 2000

Tâches de fouille de données Description : Généralise, résume et compare des données Classification: Catégorise les données en classes Regroupement: Identifie des groupes homogènes de données Association: Extrait des corrélations entre les données Prédiction: Prédit des données manquantes etc. Ansaf SALLEB Sciences en Sologne 2000

Extraction des Associations Définition (Agrawal et al. 1993) Découverte de relations de corrélation ou d’association parmi un ensemble d’objets (items). I = ensemble d'items, T = ensemble de transactions (BD) X  Y (s%, c%) / X et Y ensembles d'items Support s% Pourcentage des transaction de T qui contiennent X et Y Confidence c% Pourcentage de transactions de T qui contiennent Y parmi celles qui contiennent X. Ansaf SALLEB Sciences en Sologne 2000

Exemple: Analyse du panier de la ménagère Ansaf SALLEB Sciences en Sologne 2000

Systèmes d ’information géographiques SIG  Gestion données spatiales relatives à la géographie - Objets: points, lignes, polygones - Couches thématiques Ansaf SALLEB Sciences en Sologne 2000

Exemple Ansaf SALLEB Sciences en Sologne 2000 Failles Gisements Géologie Ansaf SALLEB Sciences en Sologne 2000

Extraction des associations dans les SIG Recherche de liens possibles entre couches thématiques : - Proximités spatiales (intersection, inclusion, …) - Caractéristiques non-spatiales de ces objets Exemple Gisement(x)  Geology(y)  Code(y, TertiaireVolcanique)  inclus(x,y)  SubstancePrinc(x, Ag) (4.43%, 40.56%) Ansaf SALLEB Sciences en Sologne 2000

Conclusion et perspectives Intêret du Data Mining et des associations: Marketing Systèmes bancaires SIG Bio-Informatique Médecine Télécommunication … Plusieurs systèmes existent déjà tels que: Kefir, Skicat, Quest, Clementine, … Travaux en cours: Data Mining dans BD Spatiales, Temporelles, MultiMédia, WebMining, TextMining, ... Ansaf SALLEB Sciences en Sologne 2000