Data Mining: Définition

Slides:



Advertisements
Présentations similaires
MANAGEMENT et GESTION d’une entreprise
Advertisements

Les présentateurs doivent souvent transmettre des informations techniques à des auditeurs qui connaissent moins bien le sujet et le vocabulaire spécifique.
E-CRM (E-GRC) Mieux vaut fidéliser que conquérir
Présentation du module Projet Professionnel Personnel (P3)
La formation intellectuelle par l’apprentissage par problèmes
1 Fouille de Données (Data Mining) Gestion et lexploitation de grandes bases de données – Culture statistique et maîtrise de techniques danalyse de données.
De lanalyse des données … … au Datamining Aide à la prise de décision.
Appréciation du contrôle interne
Introduction Pour concrétiser l’enseignement assisté par ordinateur
Serveur NAS storex.
INTRODUCTION Grande quantité de données
Académie de la Martinique
Toute démarche marketing nécessite:
Présentation générale "Information et gestion" Présentation générale des programmes d « Information et gestion » en première STG.
CH18 LES SYSTEMES DECISIONNELS
INDICATIONS METHODOLOGIQUES Classe de Première « Information et gestion »
PRESENTATION Du NOUVEAU PROGRAMME De 6ème
1 Je jure quà ma connaissance (qui est trés limitée et peut être révisée dans lavenir), le comptes de ma société sont (plus ou moins) exacts. Jai vérifié
Christelle Scharff IFI Juin 2004
Time Series Séries Chronologiques Georges GARDARIN.
introduction à la sociologie générale, cours 3
Alain Bourdelle Michèle Nouaille
Chapitre n°2 : Architecture d'un ordinateur
1. Spécialisation de GeoConcept
Plan du Cours Définition de la BI Objectif de la BI Fonctionnement d’une plateforme BI Technologies de la BI Composantes de la BI Les caractéristiques.
RÉSOLUTION DE PROBLÈMES
Etapes vers la Certification - Préparation de groupe –
intelligence économique au quotidien
28/04/2003 ©PEPITe S.A.
Sciences et Technologies de la Gestion 1ère série STG.
Thème 8 : l'observation et l'expérimentation
Universté de la Manouba
1 IFT 6800 Atelier en Technologies dinformation Chapitre 1 Introduction.
Marketing Electronique Cours 2
Le forage de données ou data mining
Les unités de stockage amovibles
La résolution de problèmes grâce à la technologie de l'information
Systèmes d’informations : Définition, Composantes, Rôles et Approches.
La théorie de la communication de C. Shannon
Biostatistiques Quand on souhaite étudier une (ou des) caractéristique(s) sur un ensemble d’individus ou d’objets, il est difficile, voir impossible, d’observer.
B.Shishedjiev - Informatique
Lotfi Hrizi Ingénieur statisticien Atelier régional sur l’évaluation des recensements Tunis – Tunisie décembre 2009.
La série STMG…pourquoi pas vous ?
Initiation à la conception des systèmes d'informations
Méthodes et techniques
Présentation et discipline
SYSTEMES d’INFORMATION séance 1 : Introduction et définitions
Recherche d ’ information: application à la veille stratégique J.Link-Pezet Janvier 2001 DESS Siad.
Knowledge discovery in Databases (KDD)
TEXT MINING Fouille de textes
Data Mining: Concepts et Techniques
systèmes d’information géographique
Le Marketing Prédictif
La gestion des bases de données
INTRODUCTION A L’ANALYSE FINANCIERE
Vers l’exploitation de grandes masses de données Encadré par : Mme L.Lamarini Présenté par: Rhaz Yassine Smiri Safae Un article de: Raphaeil Féraud,Maroc.
Atelier Régional de renforcement des capacités en matière de collecte et d’utilisation des données sur les migrations pour le développement Système d’Information.
LES EXPO-SCIENCES UNE EXPÉRIENCE PALPITANTE. Pourquoi participer à l’Expo-Sciences ? Explorer le monde de la science et de la technologie; Proposer des.
ECOLE DES HAUTES ETUDES COMMERCIALES RECHERCHE MARKETING Dr. KHERRI Abdenacer Mai
Bilan du cours Information Spécialisée M1 RETIC. Objectifs du cours (annoncés) Acquérir une culture informationnelle en SIC ; Acquérir une culture informationnelle.
Claude Matricon ("le marketing du réel") propose une classification qui permet de distinguer les 4 différents marchés dont dépend l'entreprise :  marché.
Proposition de possibilité d’évolution de nos spécialités Deux projets (liés) : Projet 1 : Informatique Computationnelle – Etudiants 4 e et 5 e IR Projet.
Analyse, élaboration et exploitation d’une Base de Données
Traitement des données et probabilité
De quoi parle t’on. Pour aller plus loin
Réalisé par : Ibrahimi salma Elharnouny chaimae.
TSTC développement de clientèles 1 Le système d'information mercatique (SIM)
Comptabilité générale I  DEFINITION GÉNÉRALE ET UTILITÉ DE LA COMPTABILITÉ  DIFFÉRENTS TYPES DE COMPTABILITÉ ET RÔLE SPÉCIFIQUE.
VEILLE ET PREVISION  les différents types de veille et leur utilité  les 4 étapes dans le processus de veille  importance et principaux objets de la.
L’intelligence économique et le knowledge management
Transcription de la présentation:

Data Mining: Définition C’est l’exploitation et l’analyse de grands volumes de données en vue d’en tirer l’information pertinente pour la compréhension du phénomène étudié , la formulation de jugements et la prise de décision.

Le Data Mining ou Extraction de Connaissance à partir de Données (ECD), a pour objet l’extraction d’un savoir ou d’une connaissance à partir de grandes quantités de données par des méthodes automatiques. On dit aussi: - Extraction de données; - fouille de données; - forage de données

Le Data Mining se distingue de l’analyse des données et de la statistique: Pas d’hypothèses à vérifier; L’intégration des connaissances obtenues dans le schéma organisationnel de l’entité étudié; Les données utilisées sont tirées des systèmes de stockage de l’entité et ne sont pas à priori destinées au Data Mining, sauf dans le cas des entrepôts de données.

Le Data Mining se situe à la croisée de la statistique et l’ analyse des données, de l’intelligence artificielle et des bases de données. Il utilise donc des algorithmes venant de ces disciplines.

Que permet le Data Mining ? Le Data Mining permet de découvrir des pépites d’informations enfouies dans une mine de données.

Qu’est ce qui est à la base du développement du Data Mining ?

1.L’augmentation des capacités de stockage des données: Les disques durs permettent aujourd’hui de stocker plusieurs Giga octets.

2. L’accroissement des capacités de traitement des données du fait de la facilité et de la vitesse d’accès aux données grâce à l’accès direct (plus de bandes magnétique)

Ecouter de la musique avec un lecteur de CD ou avec un magnétophone. Exemple Ecouter de la musique avec un lecteur de CD ou avec un magnétophone. - Pour accéder à un morceau stocké sur la bande magnétique, il faut dérouler la bande jusqu’à la zone de stockage du morceau. - Par contre, on accède directement au morceau stocké sur le CD.

3. Le développement des techniques de base de données: Le concept de base de données relationnelles permet une meilleure organisation et exploitation des bases de données.

4. La croissance exponentielle des bases de données: Les capacités des base de données sont de l’ordre de terabits (10 puissance 12 bits): Apparition d’entrepôts de données impossible à exploiter manuellement.

5. Existence de moyens de plus en plus efficaces de collecte des données (scanner dans les supermarchés, internet)

Quel est l’interet du Data Mining ?

1. Il rend possible l’exploration des entrepôts de données par les entreprises cherchant à améliorer leur rentabilité, grâce par exemple à une meilleure connaissance de la clientèle

2. Il rentabilise les systèmes d’information qui d’habitude ont été conçus et installés par des investissements coûteux.

Que permet le Data Mining ?

1. Comprendre le phénomène étudié: Savoir 2. Avoir ensuite une visibilité pour prendre des décisions: prévoir pour décider

Quel est le public Concerné ?

1. Les scientifiques: comprendre certains phénomènes 2 1.Les scientifiques: comprendre certains phénomènes 2.Les analystes: produire des rapports pour les décideurs 3.Les décideurs: prévoir pour décider

Les principaux secteurs utilisant le Data Mining Banques: 13% Télécommunications: 9% E-Commerce: 9% Détection des fraudes: 8% Etudes scientifiques: 8% Marketing: 7% Assurance: 6% Distribution: 6% Biologie: 5% Industrie pharmaceutique: 5%

Que vise le Data Mining ? 1. Classer 2. Prédire L’essentiel des techniques utilisées pour cela se trouve dans les grandes composantes de l’analyse des données: - La classification automatique L’analyse factorielle Les techniques de régression.