METHODE DESCPIPTIVE : ASSOCIATION

Slides:



Advertisements
Présentations similaires
SEDIT MARIANNE Groupe Berger-Levrault
Advertisements

Gestion de portefeuille
Data Mining.
Utiliser autrement des données de Base Elèves 1) Choisir les données Base Élèves propose 3 sortes de listes, par exemple dans le menu : Elèves : Liste.
Collecte de données F. Kohler.
Inférence statistique
Vocabulaire pour la passage du modèle conceptuel des données au modèle relationnel des données. MCDMRD EntitéTable PropriétésChamps, attribut IdentifiantClé
PROCESSUS REPRESENTATION
Les requêtes Manière de dialoguer avec une base de donnée pour :
Règles significatives
INTRODUCTION.
Probabilités et statistique en TS
Christelle Scharff IFI Juin 2004
Pourquoi et comment développer la relation client ?
Comment créer et animer votre page Entreprise Facebook ?
JLMVPC Saisir une commande.
LES OUTILS POUR LA GOUVERNANCE DES DONNÉES LA PASSION DES DONNÉES LA PRÉCISION DES RÉSULTATS.
L’outil de présentation
PROJET DATELIEU 20 MARS 2012LCP SALLE B105 création du site internet avec Weebly.
Les méthodes en java Une méthode est un regroupement d’instructions ayant pour but de faire un traitement bien précis. Une méthode pour être utilisée.
Tableau croisé dynamique sous Excel (TCD).
La méthode d’Euler Objectif : résoudre une équation différentielle de façon numérique Applications en physique (en Terminale S): Résoudre une équation.
La création de sinistre, la sélection à des fins de consultation, modification ou impression sont accessibles grâce à la barre de menu à gauche de l'écran.
Chap 4 Les bases de données et le modèle relationnel
Méthode des k plus proches voisins
Publispostage Menu Outils / Lettres et publipostage
La segmentation
DataLab® Toute la connaissance client en quelques minutes
La segmentation ° I – Définition ° II – Intérêts ° III – Les critères
Comprendre la variation dans les données: Notions de base
FICHIERS : Définition : Algorithme général:
Evaluation des activités interdisciplinaires
Projet d’ingénerie Naissance Design Exécution Exploitation.
Module 3 : Analyse des performances du serveur
Mise en oeuvre des MMCs L'utilisation des MMCs en reconnaissance des formes s'effectue en trois étapes : définition de la topologie de la chaîne de Markov,
Travaux de thèse de Julien FRANCOIS
Contrôle de la qualité à la réception
Application d’algorithmes d’extraction de la couleur et des textures à partir d’images aériennes dans le contexte de l’extraction de bâtiments pour supporter.
Les formulaires personnalisés  Fenêtre appelée à partir de la fiche patient en cliquant sur l'icône " Ardoise"
Comment renseigner un document à partir de données contenues dans une autre source ?
La fenêtre principale  S'ouvre lors du lancement de la comptabilité  Donne un accès simple et homogène à tous les traitements et à tous les documents.
Modélisation de l’élève en algèbre dans un contexte technologique
Biologie – Biochimie - Chimie
Présenté par : NEHAR Attia Université Ziane Achour Djelfa
Jour 4: Management & Information System (MIS). Objectives de la session Introduire le thème MIS: définition, les différents éléments, construire le système.
Réaliser par : Moh Fakhri Slama
DataSet Pro DataSet Pro Vous présente Introduction.
Indications Géographiques
Présentation de l’outil
Module 8 : Surveillance des performances de SQL Server
PHP 5° PARTIE : LES COOKIES
LE RAPPORT ET LES ONGLETS Pour les personnes qui remplissent le rapport « papier » ou sous forme Excel Pour celles qui saisissent directement les données.
Une pédagogie de l’activité pour développer des compétences transversales Claire Herviou Alain Taurisson Juin 2003.
Biostatistiques Quand on souhaite étudier une (ou des) caractéristique(s) sur un ensemble d’individus ou d’objets, il est difficile, voir impossible, d’observer.
Atelier technique SAS – 19 juin 2001
LE STAGE : UN PROJET PERSONNEL
Initiation aux bases de données
ANALYSE DE DONNEES TESTS D’ASSOCIATION
1 Alain Casali Christian Ernst Extraction de Règles de Corrélation Décisionnelles 29 Janvier 2009.
Micro-intro aux stats.
 Formulaires HTML : traiter les entrées utilisateur
LES SUPPORTS INDIVIDUELS D ’AIDE A LA DECISION UNE PRESENTATION DE : DIALLO, OUSMANE B UNE PRESENTATION DE : DIALLO, OUSMANE B.
1 Mondial Manager Paramétrage du scénario. 2 Le paramétrage du scénario Pour paramètrer un scénario, vous pouvez: utiliser le scénario existant et le.
TD 2: La gestion des stocks avec le logiciel Odyssée
Tutoriel V_Stage Cliquez pour continuer.
Importations et exportations On peut transférer les données vers 40 logiciels de comptabilité. Cela génère des fichiers d’écritures. Cette partie permet.
Détecter les groupes à hauts risques cardiaques à partir de caractéristiques telles que l’alimentation, le fait de fumer ou pas, les antécédents familiaux.
BIOSTATISTIQUES Définitions.
1 Tableur Excel. 2 Introduction Un tableur est un logiciel permettant de manipuler des données numériques et d'effectuer automatiquement des calculs sur.
Transcription de la présentation:

METHODE DESCPIPTIVE : ASSOCIATION Exposé DATAMINING METHODE DESCPIPTIVE : ASSOCIATION

Les régles d’association : OBJECTIF : Approche automatique pour découvrir des relations / corrélations intéressantes entre des objets. Transcrire la connaissance sous forme de règles d’association Applications: Utilisé pour analyser le panier de la ménagère Détection des fraudes Gestion des stocks

Tableau de transactions tableau binaire 0/1 Contenu du caddie trans-actions confiture fromage pain clt1 clt2 Lait clt3 clt4 lait formage clt5 clt6 L’analyse du panier de la Ménagère : lait confiture fromage pain 1 Clt1 Clt2 clt3 Clt4 Clt5 Clt6 Mettre en évidence les produits achetés ensemble, pour avoir une régle sous forme: Par exemple : Si pain alors lait ; Si antécédent Alors conséquent

Critères d’évaluation des règles d’association : Ces règles d’association seront sous forme : (R) : Si conditions Alors resultants Si pain alors lait SUPPORT : Un indicateur de « fiabilité » de la règle , recherche des ensemble de produits fréquents, c’est le nombre de transactions d’apparition simultanée des produits le nombre d’apparition (ex. sup{pain et lait} = 2) CONFIANCE : Un indicateur de « précision » de la règle, c’est à partir des ensemble de produit fréquents, produire les règles, (Conf = sup{pain,lait} / sup( pain ) = 2/4 = 50% Bonne règle = règle avec un support et une confiance élevée SUP (condition et résultat). CONF= sup (condition et résultat) / sup (condition).

Extraction des règles d’association : Paramètres : Fixer un degré d’exigence sur les règles à extraire >> Support-min. <.ex 2 transactions) >> Confiance-min < ex. 75%) l’idée est surtout de contrôler (limiter) le nombre de règles produites

Recheche des fréquence et production desrégles: >> recherche des ensemble produit fréquents (support >= support min.) >> à partir des ensemble produit fréquents, produire les règles (conf. >= conf. min.), {p;f} p f conf: ¾= 0,75 (accepter) f p conf : 3/5= 0,6 ( refuser) {p;f} {p;c} {p;l} {f;c} {f;l} {c;l} 2 3 2 1 2 3 Card {p,f}= 2

• Lift d’une règle : mesure son intérêt LIFT : L’amélioration apportée par une règle, par rapport à une réponse au hasard est appelée « lift » et vaut (EX = conf (pain et lait) /p (lait) = 0,5/(3/6)= 1) • Quand le lift est < 1, la règle n’apporte rien. • Exemples : • lift (C ⇒ B) = 5/6 < 1(règle inutile) • lift (B ⇒ E) = 5/4 (règle utile). lift (règle) = confiance (règle) / p (résultat)

Cas pratique Avec le logiciel TANAGRA: Cas d’une base de donnée d’un banque (population), Construire des règles d’association à partir d’un fichier EXCEL« individus x variables ». qui recense les caractéristiques d’un ensemble de clients ayant déposé un dossier de demande de crédits.

Des variables discréts On a 9 attributte , ayant tous Des variables discréts Charger le fichier BANQUE.BDM

Sélectionne les attributs Insérer le composant « Define Status» Sélectionne les attributs

• Le nombre d’items ayant un support supérieur à SUPPORT_MIN ; Ces paramètres sont donné Par Défaut, et dès lors possible de lancer les calculs , et voir les resultats On glissa, le composant A PRIORI dans la filière Le nombre d’items • Le nombre d’items ayant un support supérieur à SUPPORT_MIN ; • Le nombre d’itemsets de cardinal égal à 2, 3, …

Les resultats sont triées par ordre décroissant selon le LIFT Pour chaque règle, Affichera son antécédent, son conséquent, le lift, le support et la confiance associés.

Merci pour votre attention