La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

La visualisation. Survol historique très bref 6200 ans avant J. C. : Çatalhöyük (en Turquie) Premier plan de ville.

Présentations similaires


Présentation au sujet: "La visualisation. Survol historique très bref 6200 ans avant J. C. : Çatalhöyük (en Turquie) Premier plan de ville."— Transcription de la présentation:

1 La visualisation

2 Survol historique très bref

3 6200 ans avant J. C. : Çatalhöyük (en Turquie) Premier plan de ville

4 1000 après J. C. Premier graphique sur un plan cartésien avec le temps en axe horizontal (et ce, quelques siècles avant René Descartes (nom Latin: Renatus Cartesius), pour qui on a nommé le plan cartésien)

5 William Playfair, 1786 Le premier à publier beaucoup de graphiques de données statistiques. À droit: le premier diagramme en rectangle (« bar chart »), quoiquil nétait pas un histogramme.

6 William Playfair, 1801 Le premier camembert (« pie chart »)

7 Charles Joseph Minard, 1869 Larmée de Napoléon hommes sont partis de la Pologne en Arrivés à Moscou en septembre, ils ont vu que la ville était pillée et desertée. Seulement homes sont revenus, les autres tués ou morts de fain ou froid. 5 variables sont montrées dans le diagramme: -Position de larmée (latitude et longitude) -Temps et température (voir le petit graphique en dessous de la carte) -Taille de larmée (épaisseur de la bande brune ou noire)

8 Deux sortes de données Les données multidimensionnelles Les graphes (y compris les arborescences)

9 Les données multidimensionnelles (relations, fonctions, tableaux)

10 Rappel de mathématiques de secondaire Étant donné deux ensembles, un domaine (exemple: R) et un codomaine (exemple: R), on peut former le produit cartésien (RxR=R 2 ) qui est lensemble de tous les pairs (x,y) possibles Une relation est un sous ensemble du produit cartésien – Exemple: léquation x = y 2 correspond à un sous-ensemble de R 2 Une relation sappelle une fonction si chaque member x du domain a au plus un membre y correspondant dans le codomaine – x=y 2 nest pas une fonction car (4,2) et (4,-2) sont tous les deux des membres de la relation définie par léquation Une façon simple de représenter une relation (ou une fonction) est simplement dénumérer les pairs de la relation dans un tableau

11 La fonction y = x^0.5: x y La relation dans un tableau d'une base de données relationnelles: Nom_de_client Produit_acheté Prix Date Robert G. Trombone mars 7. Robert G. Partitions vol mars 7. Lucie M. Flute nov 11. Cynthia S. Partitions vol juin 16 Jules T. Piano jan 10 Jules T. Partitions vol jan Une vidéo (par exemple, fichier.avi): x y temps rouge vert bleu Exemples de relations (c.-à-d. de données multidimensionnelles)

12 Données multidimensionnelles Ce que jentends par « données multidimensionelles » est une relation quelconque On peut distinguer entre trois sortes de « dimensions » dans ces données: – 1. Les dimensions associées avec le domaine (ou variables indépendantes) – 2. Les dimensions associées avec le codomaine (ou variables dépendantes) – 3. Les dimensions physiques de lespace et/ou de temps utilisés pour visualiser les données (il y a au plus 3 dimensions spatiales et 1 dimension temporelle) – Exemple: dans du piétage vidéo, il y a 3 dimensions (x,y, et temps) associées avec le domaine, 3 dimensions associées avec le codomaine (rouge, vert, bleu), et habituellement pour visualiser la vidéo on va « mapper » x et y dans la vidéo aux dimensions spatiales physiques de notre écran, et « mapper » le temps dans la vidéo au temps physique. – Mais, on pourrait aussi « mapper » les variables rouge, vert, bleu au x, y, z physique, pour donner une nuage de points (« scatter plot ») de la vidéo

13 Input data: independent dimensions, dependent dimensions Output graphical representation: at most 3D space × 1D time

14 Rouge Bleu Vert Une vidéo

15 Gareth Daniel et Min Chen, 2003

16 Hilpoltsteiner

17 Les videograms (Marc Davis 1995)

18 Visualisation de fluide

19 Visualisation de musique (Martin Wattenberg, 2001) Beethoven, Clair de luneTalking Heads, As She Was

20 Les visages de Chernoff (1973) (un exemple dun « glyph ») Avantage: mieux que du texte pour avoir une impression globale des données et trouver des éléments intéressants Désavantage: le mapping entre les variables et le visage a un effet sur la saillance de chaque variable. Désavantage(?): redondance dun visage symétrique

21 Autres exemples de glyphs M. Ward (2002), A Taxonomy of Glyph Placement Strategies for Multidimensional Data Visualization, Information Visualization.

22 Autres exemples de glyphs Wittenbrink, Pang, Lodha (1996) Glyphs for Visualizing Uncertainty in Vector Fields, IEEE TVCG.

23 Présentation interactive de lONU (United Nations Development Programme, Human Development Report) Voir la présentation de Hans Rosling sur Remarque: les points sont des glyphs!

24 Dynamic Queries: HomeFinder (Ben Shneiderman, 1993)

25 Dynamic Queries: FilmFinder (Ben Shneiderman)

26 Dynamic Queries: TimeSearcher (Hochheiser et Shneiderman 2004)

27 Tableau: logiciel pour visualiser des bases de données (Mackinlay et al. 2007, tableausoftware.com)

28

29

30

31

32

33

34 Tableau Pour plus dinformations:

35 x y b a x y x y x y Rows: b, y Columns: a, x

36 Sortes de dimensions Quantitatives (ou continues ou métriques) – Exemple: x, y, temps, température Ordinales – On peut mettre les valeurs en ordre, mais on ne peut pas dire quune telle valeur est N fois plus grande quune autre valeur – Exemple: nom de client (en ordre alphabétique) – Exemple: D.E.S., D.E.C., Baccalauréat (en ordre dannées de scolarité) Nominales (ou catégoriques) – Il ny a pas dordre naturel – Exemple: groupe daliments (viandes, lait, légumes et fruits, produits céréaliers) – Exemple: bacc en génie mécanique, bacc en génie de construction, etc. – Exemple: Honda, Toyota, GM, Chrysler, etc. Binaires – Une sorte de dimension nominale ayant deux valeurs possibles

37 Input data: dimensions can be {independent, dependent} and {continuous, ordinal, nominal} Output graphical representation: at most 3D space × 1D time

38 Hiérarchie des variables graphiques

39 Hiérarchie des variables graphiques (Mackinlay 1986)

40 Tableau Détermine de façon automatique quelles colonnes dans la base de données sont des « dimensions » (variables indépendantes), quelles sont des « mesures » (variables dépendantes), et quelles sont « quantitatives » (continues) ou « catégoriques » (nominales) Choisit une sorte de graphique de façon automatique, selon la nature des données

41 Tableau Continuous variable as a function of a nominal variable Bar chart Continuous variable as a function of a continuous variable Line graph Continuous variable as a function of (nominal) time Two dependent continuous variables Scatter plot Nominal variable as a function of a continuous variable Gantt chart Nominal independent variable with continuous independent variable Two independent nominal variablesCross tabulation (cross tab) Des exemples résultants de lapplication des règles sur le diapo précédent:

42

43

44 Diagramme à barres vs diagramme en ligne brisée (Bar chart vs line graph)

45 Tufte (1983) Longueur vs aire (Length vs area)

46

47

48

49 Rogowitz and Treinish, Why Should Engineers and Scientists Be Worried About Color?

50 Borland and Taylor, Rainbow Color Map (Still) Considered Harmful, IEEE CG&A, 27(2):14-17, 2007

51

52

53 Autres exemples …

54 Class exercise: Design one or more graphs to visualize a data set with the following dimensions: Car model: {Accord, AMC Pacer, Audi 5000, BMW 320i, Champ, Chev Nova, …} (19 models in total) Car price: [$0, $13500] Car mileage: [0,40] Repair record: {Great, Good, OK, Bad, Terrible} Car weight: [0,5500] Most important dimensions

55 Exercise en classe: Concevoir un ou des graphiques pour visualiser un jeu de données ayant les dimensions suivantes: Modèle dauto: {Accord, AMC Pacer, Audi 5000, BMW 320i, Champ, Chev Nova, …} (19 modèles en tout) Prix dauto: [$0, $13500] kilométrage: [0,40] Historique de réparations: {Excellent, Bon, OK, Mauvais, Affreux} Poids: [0,5500] Dimensions les plus importantes

56 Coordonnées parallèles

57

58 Matrice de nuages de points (scatter plot matrix ou SPLOM)

59

60 Matrice de coéfficients de corrélation

61 ScatterDice (Elmqvist et al. 2008)

62 (voir vidéo)

63 Question: Dans le survol historique au début des diapos, est-ce que les données visualisées sont toutes des données multidimensionelles ? Réponse: oui

64 Les graphes / réseaux (y compris les arborescences)

65 Visualisation de liens sur linternet Munzner et al., 1996

66 Structure de lONU Tiré de New Internationalist issue Jan/Feb

67 Ishkurs Guide to Electronic Music

68

69 Regroupements hiéarchiques des liens dans un graphe (Danny Holten, 2006)

70 H3 (Munzner 1998) On calcul la disposition dun graphe dans un espace hyperbolique 3D, ensuite on calcul une projection vers un espace euclidien 3D (voir vidéo)

71 How to compute layout of a graph? Many algorithms are available – See Graph Drawing annual conference proceedings – See book Graph Drawing: Algorithms for the Visualization of Graphs by Di Battista et al. (1999) – Examples: Reingold-Tilford (1981) for binary trees, Sugiyama et al. (1981) for directed acyclic graphs (DAGs) Most of these algorithms are not easy to implement One class of algorithms that are easy to implement (in their naïve form) and that are applicable to any graph: force-directed layout

72 Placement par force dun graphe en 3D Simulation pseudo- physique des masses et de ressorts qui mène à un layout final Les noeuds sont des masses mutuellement repoussées par une force électrique Les arêtes sont des ressorts

73 Un graphe: en diagramme nœud- lien, et en matrice dadjacence ABCDE A11 B111 C11 D11 E1 A BC DE Remarque: la matrice est symétrique, car le graphe nest pas orienté

74 Diagramme nœud-lien vs matrice dadjacence

75 MatLink (Nathalie Henry et Jean- Daniel Fekete 2007)

76 Les arborescences

77

78

79

80

81 Filelight

82

83 Treemaps (Ben Shneiderman et autres) Martin Wattenberg, 1998 et Marc Smith et Andrew Fiore, 2001

84 Treemap dans Konqueror

85 Treemaps (Shneiderman 1992; ) Un Treemap « slice-and-dice » (algorithme original, produit beaucoup de rectangles longs et minces):

86 Treemaps Un Treemap « squarified » (algorithme glouton, temps linéaire*, améliore la proportion (« aspect ratios ») des noeuds): * Sans compter le temps pour trier les enfants de chaque noeud

87 Aire de chaque feuille proportionnelle à la superficie de lîle Aire de chaque feuille égale « Squarified Treemaps » « Icicle diagrams » (diagrammes à glaçons)

88 Evaluating the Space-Efficiency of Tree Representations Key ideas: Impose a 1×1 bounding square on all representations Evaluate size of smallest nodes, not just total area Evaluate size of labels as a function of their aspect ratio L Examine limits of these sizes as depth D M. McGuffin and J.-M. Robert, in press as of 2009, Information Visualization

89 Question: Est-il possible davoir des données à la fois multidimensionnelles et ayant la structure dun graphe ? Réponse: oui. Exemple: un ensemble de tableaux dans une base de données relationnelle, liés par des clés étrangères.

90 Quelques questions de conception et de recherche, et des possibilités pour lavenir

91 Comment montrer plus dinformations sur lécran …

92 Vue en oeil de poisson ("fisheye")

93 Le zooming et les ZUIs (« Zooming User Interfaces ») …

94 Le zooming : Seadragon (Vidéo: présentation de Blaise Aguera y Arcas à TED )

95 Lanimation pour montrer des transitions fluides …

96 Les animations entre les vues: Jeff Heer et George Robertson, 2007

97 Des techniques dinteraction rapide …

98 Techniques dinteraction: Michael McGuffin et Ravin Balakrishnan, 2005

99 Le 3D…

100 Visualisation en 3D : une arborescence Est-ce vraiment mieux de visualiser des graphes en 3D quen 2D ? Ça implique souvent une navigation et une interface plus compliqué, et des problèmes docclusion. (Par contre, avec les données multidimensionnelles qui ont 3 dimensions spatiales, on a pas vraiment le choix; on doit visualiser en 3D.)

101 3D + interaction + animations : Christopher Collins et Sheelagh Carpendale, 2007

102 3D + interaction + animations : Michael McGuffin et al., 2003

103

104 Des visualisations hybrides …

105 Elastic Hierarchies: un hybride de diagramme nœud- lien et de Treemaps, pour visualiser des arborescences (Zhao, McGuffin, et Chignell 2005)

106 Elastic Hierarchies: un hybride de diagramme nœud- lien et de Treemaps (Zhao, McGuffin, et Chignell 2005) Taxonomie des hybrides possibles Capture décran du prototype logiciel

107 NodeTrix: un hybride de diagramme nœud-lien et de matrices, pour visualiser des graphes (Henry, Fekete, et McGuffin 2007)

108 Tendances futures? Des ensembles de données toujours plus grands (exemple: données bioinformatiques) Les utilisateurs vont vouloir regarder leurs données via plusieurs moyens différents, parfois avec plusieurs vues simultanées et coordonnées Plus danimation Plus de zooming Une interaction rapide (gestuelle, etc.) Le 3D, lorsque cest approprié (exemple: avec des données multidimensionnelles ayant 3 dimensions spatiales) Travail collaboratif, en équipes, à distance Un grand défit actuel: comment visualiser lincertitude dans les données Un autre grand défit: comment visualiser des différences entre deux ensembles de données qui sont semblables, et/ou comment visualiser lévolution dun ensemble de données à travers le temps (exemples: graphes, code source, etc.)

109 Quelques entreprises pour lesquelles la visualisation est un aspect important, ou bien leur activité principale Autodesk (Montréal et ailleurs) CAE et PRESAGIS (Montréal et ailleurs) IVS (Montréal) Softimage (Montréal) Oculus (Toronto) Inxight (USA) ILOG (USA / France) Kitware (USA) SpotFire (USA) Tableau Software (USA)

110 Further reading …


Télécharger ppt "La visualisation. Survol historique très bref 6200 ans avant J. C. : Çatalhöyük (en Turquie) Premier plan de ville."

Présentations similaires


Annonces Google