Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parRaphaël Paré Modifié depuis plus de 9 années
1
Projet Acquisition de connaissances Réalisé par Anne-Laure B ERRÉE, Andra Maria B LAJ, Stéphanie C HARLET, Diana D RAGUSIN, Daphné D USSAUD, Emeline E SCOLIVET, Nolwenn P OIRIER & Fanny T OLLEC Encadré par Peggy CELLIER INSA de Rennes Département INFO 4 ième année – G2.1 1
2
Plan I.Contexte et objectifs II.Choix effectués III.Description de l’outil IV.Comparaison avec Weka 2
3
I.Contexte et objectifs WekaWeka Notre outil Règles d’associations Règles d’associations SI condition(s) ALORS fait(s) Quelques rappels Objectif général Objectif général Extraire des règles d’associations à partir de données de la forme Item 1Item 2 Transaction 10/1 Transaction 20/1 3
4
I.Contexte et objectifs Objectif n°2 Objectif n°2 Implémenter un algorithme from scratch effectuant un travail semblable à Apriori Objectifs Objectif n°3 Objectif n°3 Implémenter différents calculs d’indice statistique Objectif n°4 Objectif n°4 Implémenter différents types d’itemsets Objectif n°5 Objectif n°5 Comparer les performances de l’outil avec Weka Objectif n°1 Objectif n°1 Transformer deux types de jeux de données en la matrice Transaction/Items 4
5
II. Choix effectués Langage Pourquoi Java ? Langage orienté objet permettant une modélisation simple et rapide Présence de structures de données facilement manipulables Import des fichiers relativement aisé Facilité de mise en place d’une interface graphique Multiplateforme 5 Emeline
6
II. Choix effectués Algorithme 6 Algorithme Apriori Algorithme FP-Growth Emeline/Andra
7
II. Choix effectués Algorithme 7 Comparaison des algorithmes Emeline/Andra
8
- String attribut - Integer premisse[] - int but - double valeurCritere - Integer premisse[] - int but - double valeurCritere -Vector > transactions - Vector unItems - Vector itemsFreq -Vector > transactions - Vector unItems - Vector itemsFreq - boolean[][] matrix - double seuilSupportMin - double seuilCritereMin - boolean[][] matrix - double seuilSupportMin - double seuilCritereMin II. Choix effectués Modélisation RègleAssociation Attribut Indice Moteur AlgoApriori IndiceLift IndiceSupport IndiceConfiance 8
9
III. Description de l’outil 9 Import et mise en forme des données Attributs : Mots sous forme de liste Attributs : Mots sous forme de liste Objets : Articles de journaux Objets : Articles de journaux + = ChiracJospin Article 101 Article 211 Données non structurées : articles de journaux Discrétisation d’attributs nominaux -Homme -Femme Discrétisation d’attributs nominaux -Homme -Femme Données structurées : tickets de caisse Attributs et objets : Tickets de caisse Attributs et objets : Tickets de caisse Phase de discrétisation des données Discrétisation d’attributs continus - Âge < 20 - 20 < Âge < 40 - 40 < Âge < 60 Discrétisation d’attributs continus - Âge < 20 - 20 < Âge < 40 - 40 < Âge < 60 HommeFemme Ticket 101 Ticket 210 =
10
III. Description de l’outil 10 Implémentation de l’algorithme 1. Transformation des données de matrice booléenne en transactions 2. Génération des un-imtemsets fréquents 3. Génération de 2-itemsets fréquents 4. Génération de k-itemsets fréquents Gestion des différents types d’itemsets 1. Itemsets fréquents clos 2. Itemsets maximaux 3.Comparaison des itemsets obtenus pour les différents types d’itemsets choisis par l’utilisateur Diana
11
11 III. Description de l’outil Génération des itemsets Anne-Laure
12
III. Description de l’outil 12 Exécution et affichage des résultats Anne-Laure (on pourrait inclure la démo là!)
13
IV. Comparaison avec Weka 13 Fanny
14
Bilan 14 Difficultés rencontrées Atouts de l’outil - Choix de modélisation - Mise en commun - Choix de modélisation - Mise en commun - Choix de modélisation - Mise en commun - Choix de modélisation - Mise en commun
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.