La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Extraction des connaissances dans les bases de données Ansaf SALLEB Laboratoire d Informatique Fondamentale d Orléans ( LIFO)

Présentations similaires


Présentation au sujet: "Extraction des connaissances dans les bases de données Ansaf SALLEB Laboratoire d Informatique Fondamentale d Orléans ( LIFO)"— Transcription de la présentation:

1 Extraction des connaissances dans les bases de données Ansaf SALLEB Laboratoire d Informatique Fondamentale d Orléans ( LIFO) en collaboration avec: Bureau des Recherches Géologiques et Minières ( BRGM) & La Région Centre

2 Ansaf SALLEBSciences en Sologne Description du problème Volume de données collectées est en croissance continue Experts dépassés par les volumes Il y en a beaucoup trop ! trop !

3 Ansaf SALLEBSciences en Sologne Solution Extraction des connaissances dans les Bases de données Volume de données Connaissances BD Sélection Pré traitement Transformation Fouille de données Interprétation/ Evaluation Connaissances Modèles Données transformées Données prétraitées Données sélectionnées Etapes dun processus ECD (Fayyad et al. 1996)

4 Ansaf SALLEBSciences en Sologne Solution Fouille de données (Data Mining) = Extraction de connaissances implicites, non connues à l'avance dans des entrepôts de données STAT BD RN VISU ASA AD FD

5 Ansaf SALLEBSciences en Sologne Tâches de fouille de données Description : Généralise, résume et compare des données Classification: Catégorise les données en classes Regroupement: Identifie des groupes homogènes de données Association: Extrait des corrélations entre les données Prédiction: Prédit des données manquantes etc.

6 Ansaf SALLEBSciences en Sologne Extraction des Associations Définition (Agrawal et al. 1993) Découverte de relations de corrélation ou dassociation parmi un ensemble dobjets (items). I = ensemble d'items, T = ensemble de transactions (BD) X Y (s%, c%) / X et Y ensembles d'items Support s% Pourcentage des transaction de T qui contiennent X et Y Confidence c% Pourcentage de transactions de T qui contiennent Y parmi celles qui contiennent X.

7 Ansaf SALLEBSciences en Sologne Exemple: Analyse du panier de la ménagère

8 Ansaf SALLEBSciences en Sologne SIG Gestion données spatiales relatives à la géographie - Objets: points, lignes, polygones - Couches thématiques Systèmes d information géographiques

9 Ansaf SALLEBSciences en Sologne Exemple Failles Gisements Géologie

10 Ansaf SALLEBSciences en Sologne Extraction des associations dans les SIG Recherche de liens possibles entre couches thématiques : - Proximités spatiales (intersection, inclusion, …) - Caractéristiques non-spatiales de ces objets Exemple Gisement(x) Geology(y) Code(y, TertiaireVolcanique) inclus(x,y) SubstancePrinc(x, Ag) (4.43%, 40.56%)

11 Ansaf SALLEBSciences en Sologne Conclusion et perspectives Intêret du Data Mining et des associations: »Marketing »Systèmes bancaires »SIG »Bio-Informatique »Médecine »Télécommunication »… Plusieurs systèmes existent déjà tels que: Kefir, Skicat, Quest, Clementine, … Travaux en cours: Data Mining dans BD Spatiales, Temporelles, MultiMédia, WebMining, TextMining,...


Télécharger ppt "Extraction des connaissances dans les bases de données Ansaf SALLEB Laboratoire d Informatique Fondamentale d Orléans ( LIFO)"

Présentations similaires


Annonces Google