La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Une approche de construction despaces de représentation multidimensionnels dédiés à la visualisation Riadh Ben Messaoud Kamel Aouiche Cécile Favre Laboratoire.

Présentations similaires


Présentation au sujet: "Une approche de construction despaces de représentation multidimensionnels dédiés à la visualisation Riadh Ben Messaoud Kamel Aouiche Cécile Favre Laboratoire."— Transcription de la présentation:

1 Une approche de construction despaces de représentation multidimensionnels dédiés à la visualisation Riadh Ben Messaoud Kamel Aouiche Cécile Favre Laboratoire ERIC – Université Lyon 2 5 avenue Pierre Mendès–France 69676, Bron Cedex – France

2 R. Ben Messaoud, K. Aouiche et C. Favre 2/20 Contexte et problématique OLAP : navigation et exploration des données pour extraire des informations pertinentes Forte composante visuelle dans lOLAP La représentation multidimensionnelle des données Eparsité dans la représentation des données La forte dimensionnalité Eparsité plus importante Ordre classique des modalités Distribution aléatoire du nuage des faits

3 R. Ben Messaoud, K. Aouiche et C. Favre 3/20 Contexte et problématique Améliorer la visualisation des données : Regrouper les faits dans lespace de représentation Arranger lordre des modalités

4 R. Ben Messaoud, K. Aouiche et C. Favre 4/20 Plan Travaux connexes Notre approche : méthode de construction de représentations multidimensionnelles Critère dévaluation des représentations des données multidimensionnelles Étude de cas : application aux données bancaires Expérimentations Conclusion et perspectives

5 R. Ben Messaoud, K. Aouiche et C. Favre 5/20 Travaux connexes Deux points de vue : Administrateur Optimiser le stockage Vitter et al., Barbará et Sullivan, Schanmugasundaram et al., Sismanis et al., Feng et al., Lakshmanan et al., Li et al. Améliorer le temps de réponse aux requêtes Ross et Srivastava Utilisateur Améliorer la visualisation et la navigation dans le cube de données Choong et al.

6 R. Ben Messaoud, K. Aouiche et C. Favre 6/20 Notre approche Arranger lordre des modalités des dimensions du cube de données pour améliorer sa visualisation Utiliser les résultats de lAnalyse des Correspondances Multiples (ACM) Pourquoi lACM ? Principe de lACM : Entrée : tableau individus/variables (faits/modalités des dimensions) Sortie : axes danalyse composites Construction dun plan propice à lanalyse dans lequel sont projetés les individus LACM est une méthode factorielle adaptée aux grands volumes de données qualitatives

7 R. Ben Messaoud, K. Aouiche et C. Favre 7/20 Notre approche Dimensions Mesures Choix des dimensions et des mesures par lutilisateur selon les besoins de son analyse 1 Aplatissement du cube de données sous forme dun tableau disjonctif complet 1

8 R. Ben Messaoud, K. Aouiche et C. Favre 8/20 Notre approche Aplatissement du cube de données sous forme dun tableau disjonctif complet A A B B C C D D E E F F D1 A A B B C C D D E E F F G G D2

9 R. Ben Messaoud, K. Aouiche et C. Favre 9/20 Notre approche Dimensions Mesures 2 Application de lACM 2

10 R. Ben Messaoud, K. Aouiche et C. Favre 10/20 Notre approche Construction daxes factoriels ajustant au mieux le nuage des individus (faits) et des variables (modalités) Chaque axe factoriel est associé à une valeur propre représente la part de laxe dans linertie totale du nuage des individus Chaque variable (modalité) a une contribution relative dans la construction de laxe Contribution dune dimension dans la construction de laxe Application de lACM 2

11 R. Ben Messaoud, K. Aouiche et C. Favre 11/20 Notre approche Dimensions Mesures Arrangement des modalités 3

12 R. Ben Messaoud, K. Aouiche et C. Favre 12/20 Notre approche Associer à chaque dimension un axe factoriel Pour chaque dimension, choisir laxe qui a été le mieux expliqué par ses modalités Maximiser Chercher lindice qui vérifie léquation : Trier les projections des modalités de sur laxe Utiliser ce tri pour ordonner les modalités de la dimension Arrangement des modalités 3

13 R. Ben Messaoud, K. Aouiche et C. Favre 13/20 Notre approche Dimensions Mesures

14 R. Ben Messaoud, K. Aouiche et C. Favre 14/20 Critère dévaluation Mesurer la qualité de la représentation des données Homogénéité de la répartition des cellules dans un cube Voisinage géométrique des cellules Mesure de similarité entre les cellules A A Voisinage de la cellule A Δ(A) = = 4 Calculer le gain en homogénéité fourni par la méthode Similarité de deux cellules voisines Similarité = 1, si les 2 cellules sont pleines Similarité = 0, sinon Indice dhomogénéité :

15 R. Ben Messaoud, K. Aouiche et C. Favre 15/20 Étude de cas Jeu de données bancaires fourni par le Crédit Lyonnais Le cube contient n= faits Un fait correspond au comportement dachats des clients

16 R. Ben Messaoud, K. Aouiche et C. Favre 16/20 Cube arrangé (IH=20,60%)Cube initial (IH=17,75%) Études de cas D1 : Catégorie socio-professionnelle, D2 : Produit Taux déparsité = 64% Gain en homogénéité = 16,38% D1 D2

17 R. Ben Messaoud, K. Aouiche et C. Favre 17/20 Expérimentations Évolution de l'indice d'homogénéité en fonction de l'éparsité Décroissance de lindice dhomogénéité en fonction de léparsité Lindice dhomogénéité du cube arrangé est toujours supérieur à celui du cube initial Éparsité Indice dhomogénéité

18 R. Ben Messaoud, K. Aouiche et C. Favre 18/20 Expérimentations Évolution du gain en homogénéité en fonction de l'éparsité Gain en homogénéité toujours positif Tendance croissante du gain en homogénéité en fonction de léparsité Fléchissements possibles dus à la nature des données Gain en homogénéité Éparsité

19 R. Ben Messaoud, K. Aouiche et C. Favre 19/20 Conclusion Solution au problème de la visualisation des données dans un cube éparse basée sur lexploitation des résultats dune analyse factorielle Organisation des modalités des dimensions en fonction des résultats dune ACM Pas de diminution de léparsité mais organisation de celle-ci Indice de qualité des représentations multidimensionnelles Plus léparsité est importante, plus notre approche est pertinente

20 R. Ben Messaoud, K. Aouiche et C. Favre 20/20 Perspectives Étude de complexité de notre approche Étude de la possibilité de rendre la méthode incrémentale Introduction des valeurs des mesures Dans la méthode Dans lindice dhomogénéité Utilisation de notre méthode pour détecter les parties du cube à matérialiser Exploitation de notre approche dans le cadre de lentreposage virtuel de données

21 R. Ben Messaoud, K. Aouiche et C. Favre 21/20 Merci de votre attention


Télécharger ppt "Une approche de construction despaces de représentation multidimensionnels dédiés à la visualisation Riadh Ben Messaoud Kamel Aouiche Cécile Favre Laboratoire."

Présentations similaires


Annonces Google