Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parBernard Nedelec Modifié depuis plus de 10 années
1
Brit Anne-Cécile Dufeil Elodie Emzivat Audrey
iPlots Brit Anne-Cécile Dufeil Elodie Emzivat Audrey
2
Introduction Les représentations de données sur R :
La fonction plot: fonction générique de R qui permet de représenter tous les types de données Exemple : plot(maxO3~T15, data=ozone)
3
Introduction Les représentations de données sur R :
La fonction plot: fonction générique de R qui permet de représenter tous les types de données Exemple : boxplot(maxO3~vent, data=ozone)
4
Introduction Les représentations de données sur R :
La fonction plot: fonction générique de R qui permet de représenter tous les types de données. Avec cette fonction, on peut : Modifier la taille et la forme des points Ajouter des lignes au graphique, des symboles, des légendes … Il existe d’autres packages avec des fonctions pour représenter les données : iplots : permet de créer des graphiques interactifs.
5
Sommaire Présentation du package iplots
Les graphiques et les différentes options Application sur un jeu de données Conclusion
6
I. Présentation générale du package
Création Quand ? En 2003, au 3e congrès international ‘Distributed Statistical Computing’ (DSC 2003) puis en 2006 à la conférence useR!2006, pour la version 2.0 Où ? RoSuDa, Université d’Augsburg en Allemagne (Dept. Of Computer Oriented Statistics and Data Analysis) Qui ? Simon Urbanek Martin Theus Tobias Wichtrey Alex Gouberman
7
I. Présentation générale du package
Fonctionnement général iplots fournit des graphes interactifs liés entre eux Tous les graphes issus d’une même jeu de données sont automatiquement liés Un groupe identifié par une couleur dans un graphe est mis en évidence par la même couleur dans tous les autres graphes
8
I. Présentation générale du package
Fonctionnement général iplots fournit des graphes interactifs liés entre eux Tous les graphes issus d’une même jeu de données sont automatiquement liés Un groupe identifié par une couleur dans un graphe est mis en évidence par la même couleur dans tous les autres graphes
9
II - Les Graphiques et les différentes options
10
Représentation d’une variable quantitative
Histogramme : > ihist(association) De nombreuses actions sont possibles en utilisant le clique-bouton, pour une utilisation simplifiée
11
Représentation d’une variable quantitative
Estimateur à noyau : > iplot(density(sand[,"association"]))
12
Représentation d’une variable qualitative
Diagramme en barres (compte les effectifs pour chaque modalité) >ibar(Sexe)
13
Représentation de deux variables qualitatives
Représentation d’un nuage de points : >iplot(appetance,attrait)
14
Variable quantitative en fonction d’une variable qualitative
Graphique avec une boîte à moustache par modalité de la variable qualitative >ibox(Sepal.length,species)
15
Représentation de variables quantitatives et qualitatives
Graphique qui permet de voir toutes les associations des modalités de plusieurs variables qualitatives. >ipcp(Produit,association) #Interactive parallel coordinates plot
16
Représentation de deux variables
17
Représentation de plusieurs variables qualitatives
On observe l’association de 2 variables qualitatives, à chaque intersection, on trouve les individus qui possèdent les 2 modalités. Imosaic(Produit,achat) Observation des données Données attendues
18
Représentation de plusieurs variables
En sélectionnant Multiple barcharts on peut obtenir un graphique avec à la fois les résultats attendus et observés >Multiple barcharts
19
Gestion courante des graphiques
Comment modifier les graphiques ? iplot.opt() iplot.opt(..., plot=iplot.cur()) Arguments : … paramètres à modifier, plot : graphique qui va subir les modifications Que peut-on modifier ? title : titre du graphique (attention le titre n’apparaît pas sur le graphique) xlim, ylim : limites des axes col : couleur ptDiam : diamètre des points anchor ou binw : modification de la longueur et la largeur d’un histogramme Trier les variables qualitatives en fonction de leur effectif (histogramme) Voir l’aide de la fonction iplot.opt() Remarque : la plupart des modifications peuvent être effectuées à partir de l’onglet « View »
20
Gestion courante des graphiques
Exemples : Modifier la taille des points >iplot(appetance,attrait) >iplot.opt(ptDiam=10) Changer la forme de l'histogramme >ihist(association) >iplot.opt(anchor=1, binw=1,title= "histogramme association sandwich")
21
Gestion courante des graphiques : ajouter de la couleur
Plusieurs façons de procéder : Sélectionner l’onglet« View », puis « Set Colors CB» ou « Rainbow» Appliquer une couleur par produit de manière permanente >ibar(Produit) >iset.col(Produit) #iset.brush(Produit) >iplot.opt(title="essai fonction ") Autre façon d’attribuer une couleur à chaque produit >ibar(Produit) >iplot.opt(col=unclass(Produit),title="Analyse sensorielle sandwich")
22
Gestion courante des graphiques : ajouter de la couleur
Interaction entre les graphiques Appel des graphiques à l’aide de l’onglet « Windows »
23
Gestion courante des graphiques : selectionner
Plusieurs façons de procéder : Peut aussi se faire à l’aide de la souris en sélectionnant simplement ce qui nous intéresse Sélectionner les notes supérieures à 5 (attention, ne pas oublier d’enlever les couleurs ) >iset.select(association >= 5) Elements concernant la sélection Quel est le pourcentage d'éléments sélectionnés? >sum(sign(iset.selected()))/length(association) 0,8819 : il y a 88% des notes concernant la variable association qui sont > à 5 Tous les graphiques associés à cette sélection vont l’afficher
25
Ajout d’information sur un graphique : iObjects
iabline colorier les lignes Créer le scatterplot et y ajouter une droite > iplot(association, attrait) Droite de régression > z <- lm(association ~ attrait, data = sand) > iabline(z,col="blue") ilines Créer le scatterplot et y ajouter une droite > iplot(association,attrait) Utiliser la fonction lowess > m<- lowess(attrait, association) > ilines(m,col=blue)
26
Autres fonctions : iplot.cur()
Donne l’indice du graphique sur lequel on travaille iplot.data() Donne les données du graphique iplot.list() Donne la liste de tous les graphiques iplot.off() Ferme les graphiques qui sont ouverts iplot.opt() Change les paramètres du graphique correspondant iplot.prev() Donne l’indice du tableau précédent iplot.set() Sélectionne le graphique sur lequel on souhaite travailler
27
III -Application sur un jeu de données
28
Application : sandwish
Charger les packages : rJava puis Iplots Attach (sand) : The database is attached to the R search path. This means that the database is searched by R when evaluating a variable, so objects in the database can be accessed by simply giving their names. Importation du jeu de donnée >sand=read.table("sand.txt",header=T, dec=".", sep="\t") >summary(sand) Recoder les variables >sand[,"Produit"]=as.factor(sand[,"Produit"]) >sand[,"Juge"]=as.factor(sand[,"Juge"]) >sand[,"Seance"]=as.factor(sand[,"Seance"]) >sand[,"Ordre"]=as.factor(sand[,"Ordre"]) >names(sand) Préciser que les variables sont dans la base de donnée R, ensuite il suffit de les appeler en donnant leurs noms >attach(sand)
29
Conclusion
30
Conclusion L’intérêt de ce package: Mais …
Outil intéressant pour l’aide à la compréhension des jeux de données Complément aux graphes classiques, support visuel intéressant Facilité d’utilisation Variables qualitatives faciles à visualiser Mais … Visualisation des variables quantitatives moins évidente Certaines fonctions ne fonctionnent pas Attention aux données manquantes Exportation des graphiques compliquée
31
Bibliographie Article dans r-bloggers consacré au package avec quelques exemples : package-from-%E2%80%9Cr-in-action%E2%80%9D/ Site consacré au package iplots, comprenant des exemples et les derniers ajouts : Proceedings of the 3rd International Workshop on Distributed Statistical Computing 2003/Proceedings/UrbanekTheus.pdf Présentation du package iplots 2.0 par ses créateurs:
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.