Projet Acquisition de connaissances Réalisé par Anne-Laure B ERRÉE, Andra Maria B LAJ, Stéphanie C HARLET, Diana D RAGUSIN, Daphné D USSAUD, Emeline E.

Slides:



Advertisements
Présentations similaires
Tris.
Advertisements

Simulation d’un réseau avec correspondances
Data Mining.
Classification et prédiction
Règles d’association.
Affichage interactif, bidimensionnel et incrémental de formules mathématiques Hanane Naciri et Laurence Rideau INRIA Sophia Antipolis CARI'2000.
Introduction à l’Algorithmique
Sensibilisation à l’Algorithmique et structure de données
Etudiants : Benjamin BLANC Cyrille KLUZEK Encadreur :
GEF 435 Principes des systèmes d’exploitation
Problème de 8 dames: Sachant que dans un jeu des échecs, une dame peut pendre toute pièce se trouvant sur la colonne ou sur la ligne ou sur les diagonales.
Conception de Programmes Evolutifs Pré Soutenance de TER Année Encadrants : Cathy Escazut et Michel Gautero Auteurs: Paul-Kenji Cahier Sylvain.
Approfondissement du langage
Yann Chevaleyre et Jean-Daniel Zucker
C.
MIKHAYLOVA Vera Exposé Java principe de fonctionnement Lundi 17 mai 2004 DEUG 1ère année Science du langage Paris III.
Les sous-programmes Chapitre n° 5: Objectifs : Activité:
Christelle Scharff IFI Juin 2004
Traitement Co-Séquentiel: Appariment et Fusion de Plusieurs Listes
1 Statistiques Séance 5 – 9 Nov Résumé séance précédente Lécart-type σ ou s. Comment le calculer? Les propriétés numériques de la courbe normale.
Apprentissage du jeu de morpion
Structures collectives en Java
Algo-Prog en Ada TD1 2 MIC Romaric GUILLERM
Prise de décision dans les shooters TER 08/09 Sandrine Buendia
Démarche de résolution de problèmes
Algorithmique et Programmation
Principes de persistance dans les applications orienté objet
Projet Acquisition de connaissances Réalisé par Anne-Laure B ERRÉE, Andra Maria B LAJ, Stéphanie C HARLET, Diana D RAGUSIN, Daphné D USSAUD, Emeline E.
Methode de Tri efficace
Méthode des k plus proches voisins
Python La programmation objet
Master 1 SIGLIS Java Lecteur Stéphane Tallard Chapitre 5 – Héritage, Interfaces et Listes génériques.
Structures de données IFT-2000 Abder Alikacem Standard Template library Édition Septembre 2009 Département dinformatique et de génie logiciel.
Projet Acquisition de connaissances
Projet Acquisition de connaissances Réalisé par Anne-Laure B ERRÉE, Andra Maria B LAJ, Stéphanie C HARLET, Diana D RAGUSIN, Daphné D USSAUD, Emeline E.
Projet Acquisition de connaissances Réalisé par Anne-Laure B ERRÉE, Andra Maria B LAJ, Stéphanie C HARLET, Diana D RAGUSIN, Daphné D USSAUD, Emeline E.
Projet Acquisition de connaissances Réalisé par Anne-Laure B ERRÉE, Andra Maria B LAJ, Stéphanie C HARLET, Diana D RAGUSIN, Daphné D USSAUD, Emeline E.
Rappels Java.
Contrôle de types Les types en programmation Expressions de types Un contrôleur de types Equivalence de types Conversions de types Généricité.
LIFI-Java 2004 Séance du Jeudi 9 sept. Cours 1. La notion de langage Décrire une tâche à effectuer –programme Écrire à un haut niveau –facile pour lutilisateur.
Gestion de Fichiers GF-10: Traitement Co-Sequentiel: Appariment et Fusion de Plusieures Listes (Base sur les sections de Folk, Zoellick & Riccardi,
Les Algorithmes de Tri Introduction Tri par Sélection
Additions et soustractions
Présenté par : Attia Hamza Merzouk Abdelkrim 2003/2004
EXIGE Un avenir dans le web....
Initiation MS Access 2010 Requêtes - Sélection (travail en autonomie)
Projet Acquisition de connaissances Réalisé par Anne-Laure B ERRÉE, Andra Maria B LAJ, Stéphanie C HARLET, Diana D RAGUSIN, Daphné D USSAUD, Emeline E.
Chapitre 6 Les traitements avancés
Méthodes de tri.
1 Alain Casali Christian Ernst Extraction de Règles de Corrélation Décisionnelles 29 Janvier 2009.
Arbre GénéalogiqueDiagramme de Classes Comment la visualisation d’une hiérarchie de classes facilitera le travail de notre client ?
Cours 4 - Trois algorithmes de recherche dans un tableau
Le Taquin Mathieu Bernou Laurent Robin.
1 Monopalme Projet 4 Info Spécifications LE LAY Olivier MAHE Jocelyn FORM Nicolas HENRY Gurvan BONNIN Thomas BASSAND Guillaume Décembre 2009 MONNIER Laurent.
Simulation du rôle de la communication dans l’établissement d’un réseau de liens sociaux Projet GPL :
1 Initiation aux bases de données et à la programmation événementielle Responsable : Souheib BAARIR. (le sujet de votre .
2005/2006 Structures de Données Introduction à la complexité des algorithmes.
Projet Acquisition de connaissances Réalisé par Anne-Laure B ERRÉE, Andra Maria B LAJ, Stéphanie C HARLET, Diana D RAGUSIN, Daphné D USSAUD, Emeline E.
Cours 5 - Trois algorithmes de tri d'un tableau
Visualisation des flots optiques en 3D
Mathieu Martin Thomas Rovayaz Natacha Laborde Nathanaël Couret
31/05/2007Projet Master 11 Présentation ludique de la recherche opérationnelle à la fête de la science Année universitaire 2006/2007 Sylvain FIX Julien.
Projet Acquisition de connaissances Réalisé par Anne-Laure B ERRÉE, Andra Maria B LAJ, Stéphanie C HARLET, Diana D RAGUSIN, Daphné D USSAUD, Emeline E.
CALCUL STRATÉGIQUE Calcule vite et bien ! Ajouter 1, faire +1.
LES TABLEAUX Définition: Création d’un tableau:
Introduction Module 1.
IFT 703 Informatique cognitive ACT-R Modèle symbolique et perceptuel
L'exécution d'un programme nécessite l'utilisation des ressources de l'ordinateur : temps de calcul pour exécuter les opérations, et l'occupation de la.
1 Initiation aux bases de données et à la programmation événementielle VBA sous ACCESS Cours N° 4 Support de cours rédigé par Bernard COFFIN Université.
الهيئة العامة لحماية المستهلك أساليب الترويج وتأثيراتها على المستهلك خليفة التونكتي - مستشار المنافسة - 1.
Transcription de la présentation:

Projet Acquisition de connaissances Réalisé par Anne-Laure B ERRÉE, Andra Maria B LAJ, Stéphanie C HARLET, Diana D RAGUSIN, Daphné D USSAUD, Emeline E SCOLIVET, Nolwenn P OIRIER & Fanny T OLLEC Encadré par Peggy CELLIER INSA de Rennes Département INFO 4 ième année – G2.1

Plan I.Contexte et objectifs II.Choix effectués III.Description de l’outil IV.Comparaison avec Weka 2

I.Contexte et objectifs WekaWeka Notre outil Règles d’associations  Règles d’associations SI condition(s) ALORS fait(s) Quelques rappels Objectif général  Objectif général Extraire des règles d’associations à partir de données de la forme Item 1Item 2 Transaction 10/1 Transaction 20/1 3

I.Contexte et objectifs Objectif n°2  Objectif n°2 Implémenter un algorithme from scratch effectuant un travail semblable à Apriori Objectifs Objectif n°3  Objectif n°3 Implémenter différents calculs d’indice statistique Objectif n°4  Objectif n°4 Implémenter différents types d’itemsets Objectif n°5  Objectif n°5 Comparer les performances de l’outil avec Weka Objectif n°1  Objectif n°1 Transformer deux types de jeux de données en la matrice Transaction/Items 4

II. Choix effectués Langage Pourquoi Java ?  Langage orienté objet permettant une modélisation simple et rapide  Présence de structures de données facilement manipulables  Import des fichiers relativement aisé  Facilité de mise en place d’une interface graphique  Multiplateforme 5

II. Choix effectués Algorithme 6 Algorithme Apriori Algorithme FP-Growth  Algorithme d’exploration des données dans le domaine de l’apprentissage des règles d’association  Permet de reconnaître des propriétés qui reviennent fréquemment dans un ensemble des données  Algorithme très proche d’Apriori, basé sur des recherches sur la génération d’itemsets et leur fréquence  Utilise une structure de données appélée Frequent- Pattern tree qui permet de trouver des itemsets fréquents dans une grande base de données

II. Choix effectués Algorithme 7 Comparaison des algorithmes  Apriori nécessite de multiples parcours de la base de données, génère un nombre considérable d'itemsets et calcule leur support à chaque fois  Très coûteux de gérer cette quantité d'itemsets, car il faut tester la fréquence de chacun des itemsets  FP-Growth réduit le nombre de parcours de la base de données à effectuer, diminue considérablement le nombre de génération d'itemsets et facilite le calcul du support  Plus adapté aux grandes bases de données  Mise en œuvre assez difficile

- premisse : Integer [] - but : int -valeurCritere : double - premisse : Integer [] - but : int -valeurCritere : double -Transactions : Vector > - unItems : Vector - itemsFreq : Vector -Transactions : Vector > - unItems : Vector - itemsFreq : Vector - matrix : boolean[][] - seuilSupportMin : double - seuilCritereMin : double - matrix : boolean[][] - seuilSupportMin : double - seuilCritereMin : double II. Choix effectués Modélisation RègleAssociation Attribut Indice Moteur AlgoApriori IndiceConfiance IndiceSupport IndiceLift 8 APrioriMaximaux APriorisClos ItemSet -itemset : Vector - support : double -itemset : Vector - support : double algoSelectionne listeRegles items indice

III. Description de l’outil 9 Import et mise en forme des données Attributs : Mots sous forme de liste Attributs : Mots sous forme de liste Objets : Articles de journaux Objets : Articles de journaux + = ChiracJospin Article 101 Article 211  Données non structurées : articles de journaux Discrétisation d’attributs nominaux -Homme -Femme Discrétisation d’attributs nominaux -Homme -Femme  Données structurées : tickets de caisse Attributs et objets : Tickets de caisse Attributs et objets : Tickets de caisse Phase de discrétisation des données Discrétisation d’attributs continus - Âge < < Âge < < Âge < 60 Discrétisation d’attributs continus - Âge < < Âge < < Âge < 60 HommeFemme Ticket 101 Ticket 210 =

III. Description de l’outil 10 Implémentation de l’algorithme 1. Transformation des données de matrice booléenne en transactions 2. Génération des un-imtemsets fréquents 3. Génération de 2-itemsets fréquents

III. Description de l’outil 11 Implémentation de l’algorithme 4. Génération de k-itemsets fréquents constructionkItemsSets ( entier k, entier supportMin ) si ( il y a eu des k-1 - i t emsets générés) alors pour chaque i temset i de taille k-1 faire pour chaque itemset j de taille k-1 différent de i faire si ( i et j sont différents que par le dernier élément) alors kItem = i+dernier élément de j tri de kItem en ordre croissant des items supportItem = support de kItem si ( supportItem>=supportMin ) alors ajouter kItem et son support dans la liste des itemsets fréquents finsi fin pour si ( k+1 est inférieur au cardinal de la liste de 1- itemsets fréquents ) alors constructionkItemsSets ( k+1, support ) ; finsi fin

12 Stratégie  Stratégie modifier l’algorithme Apriori pour supprimer les itemsets fréquents non fermés ou non maximaux lors de leur génération Au moment où on construit un (k+1)-itemset J à partir de 2 k-itemsets, Si J est fréquent alors Pour chaque k-itemset I, Si I est inclus dans J et I est de même support que J alors I n’est pas clos, donc on le supprime Fin si Fin Pour Fin Si  Comparaison des résultats Génération des itemsets fréquents maximaux ou fermés certaines règles pertinentes non générées en utilisant les itemsets fréquents maximaux ou fermés MAIS  Implémentation similaire pour les itemsets fréquents maximaux moins de redondance III. Description de l’outil

13 Exécution et affichage des résultats  Anne-Laure (on pourrait inclure la démo là!)

IV. Comparaison avec Weka 14  Fanny

Bilan 15  Difficultés rencontrées  Atouts de l’outil - Implémentation de FP-Growth - Choix de la modélisation - Implémentation de FP-Growth - Choix de la modélisation - Choix de modélisation - Mise en commun - Choix de modélisation - Mise en commun