La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Brit Anne-Cécile Dufeil Elodie Emzivat Audrey. Les représentations de données sur R : La fonction plot: fonction générique de R qui permet de représenter.

Présentations similaires


Présentation au sujet: "Brit Anne-Cécile Dufeil Elodie Emzivat Audrey. Les représentations de données sur R : La fonction plot: fonction générique de R qui permet de représenter."— Transcription de la présentation:

1 Brit Anne-Cécile Dufeil Elodie Emzivat Audrey

2 Les représentations de données sur R : La fonction plot: fonction générique de R qui permet de représenter tous les types de données Exemple : plot(maxO3~T15, data=ozone) 2

3 Les représentations de données sur R : La fonction plot: fonction générique de R qui permet de représenter tous les types de données Exemple : boxplot(maxO3~vent, data=ozone) 3

4 Les représentations de données sur R : La fonction plot: fonction générique de R qui permet de représenter tous les types de données. Avec cette fonction, on peut : Modifier la taille et la forme des points Ajouter des lignes au graphique, des symboles, des légendes … Il existe dautres packages avec des fonctions pour représenter les données : iplots : permet de créer des graphiques interactifs. 4

5 Présentation du package iplots Les graphiques et les différentes options Application sur un jeu de données Conclusion 5

6 Quand ? En 2003, au 3 e congrès international Distributed Statistical Computing (DSC 2003) puis en 2006 à la conférence useR!2006, pour la version 2.0 Où ? RoSuDa, Université dAugsburg en Allemagne (Dept. Of Computer Oriented Statistics and Data Analysis) Qui ? Simon Urbanek Martin Theus Tobias Wichtrey Alex Gouberman Création 6

7 7 Fonctionnement général iplots fournit des graphes interactifs liés entre eux Tous les graphes issus dune même jeu de données sont automatiquement liés Un groupe identifié par une couleur dans un graphe est mis en évidence par la même couleur dans tous les autres graphes

8 iplots fournit des graphes interactifs liés entre eux Tous les graphes issus dune même jeu de données sont automatiquement liés Un groupe identifié par une couleur dans un graphe est mis en évidence par la même couleur dans tous les autres graphes Fonctionnement général 8

9

10 Histogramme : > ihist(association) De nombreuses actions sont possibles en utilisant le clique-bouton, pour une utilisation simplifiée 10

11 Estimateur à noyau : > iplot(density(sand[,"association"])) 11

12 Diagramme en barres (compte les effectifs pour chaque modalité) >ibar(Sexe) 12

13 Représentation dun nuage de points : >iplot(appetance,attrait) 13

14 Graphique avec une boîte à moustache par modalité de la variable qualitative >ibox(Sepal.length,species) 14

15 Graphique qui permet de voir toutes les associations des modalités de plusieurs variables qualitatives. >ipcp(Produit,association) #Interactive parallel coordinates plot 15

16 16

17 On observe lassociation de 2 variables qualitatives, à chaque intersection, on trouve les individus qui possèdent les 2 modalités. Imosaic(Produit,achat) Observation des données Données attendues 17

18 En sélectionnant Multiple barcharts on peut obtenir un graphique avec à la fois les résultats attendus et observés >Multiple barcharts 18

19 Comment modifier les graphiques ? iplot.opt() iplot.opt(..., plot=iplot.cur()) Arguments : … paramètres à modifier, plot : graphique qui va subir les modifications Que peut-on modifier ? title : titre du graphique (attention le titre napparaît pas sur le graphique) xlim, ylim : limites des axes col : couleur ptDiam : diamètre des points anchor ou binw : modification de la longueur et la largeur dun histogramme Trier les variables qualitatives en fonction de leur effectif (histogramme) Voir laide de la fonction iplot.opt() Remarque : la plupart des modifications peuvent être effectuées à partir de longlet « View » 19

20 Changer la forme de l'histogramme >ihist(association) >iplot.opt(anchor=1, binw=1,title= "histogramme association sandwich") Exemples : Modifier la taille des points >iplot(appetance,attrait) >iplot.opt(ptDiam=10) 20

21 Plusieurs façons de procéder : Sélectionner longlet« View », puis « Set Colors CB» ou « Rainbow» Appliquer une couleur par produit de manière permanente >ibar(Produit) >iset.col(Produit) #iset.brush(Produit) >iplot.opt(title="essai fonction ") Autre façon dattribuer une couleur à chaque produit >ibar(Produit) >iplot.opt(col=unclass(Produit),title="Analyse sensorielle sandwich") 21

22 Interaction entre les graphiques Appel des graphiques à laide de longlet « Windows » 22

23 Plusieurs façons de procéder : Peut aussi se faire à laide de la souris en sélectionnant simplement ce qui nous intéresse Sélectionner les notes supérieures à 5 (attention, ne pas oublier denlever les couleurs ) >iset.select(association >= 5) Elements concernant la sélection Quel est le pourcentage d'éléments sélectionnés? >sum(sign(iset.selected()))/length(association) 0,8819 : il y a 88% des notes concernant la variable association qui sont > à 5 Tous les graphiques associés à cette sélection vont lafficher 23

24 24

25 iabline colorier les lignes Créer le scatterplot et y ajouter une droite > iplot(association, attrait) Droite de régression > z <- lm(association ~ attrait, data = sand) > iabline(z,col="blue") ilines Créer le scatterplot et y ajouter une droite > iplot(association,attrait) Utiliser la fonction lowess > m<- lowess(attrait, association) > ilines(m,col=blue) 25

26 iplot.cur()Donne lindice du graphique sur lequel on travaille iplot.data()Donne les données du graphique iplot.list()Donne la liste de tous les graphiques iplot.off()Ferme les graphiques qui sont ouverts iplot.opt()Change les paramètres du graphique correspondant iplot.prev()Donne lindice du tableau précédent iplot.set()Sélectionne le graphique sur lequel on souhaite travailler 26

27

28 Charger les packages : rJava puis Iplots Attach (sand) : The database is attached to the R search path. This means that the database is searched by R when evaluating a variable, so objects in the database can be accessed by simply giving their names. Importation du jeu de donnée >sand=read.table("sand.txt",header=T, dec=".", sep="\t") >summary(sand) Recoder les variables >sand[,"Produit"]=as.factor(sand[,"Produit"]) >sand[,"Juge"]=as.factor(sand[,"Juge"]) >sand[,"Seance"]=as.factor(sand[,"Seance"]) >sand[,"Ordre"]=as.factor(sand[,"Ordre"]) >summary(sand) >names(sand) Préciser que les variables sont dans la base de donnée R, ensuite il suffit de les appeler en donnant leurs noms >attach(sand) 28

29

30 Lintérêt de ce package: Outil intéressant pour laide à la compréhension des jeux de données Complément aux graphes classiques, support visuel intéressant Facilité dutilisation Variables qualitatives faciles à visualiser Mais … Visualisation des variables quantitatives moins évidente Certaines fonctions ne fonctionnent pas Attention aux données manquantes Exportation des graphiques compliquée 30

31 Article dans r-bloggers consacré au package avec quelques exemples : package-from-%E2%80%9Cr-in-action%E2%80%9D/ Site consacré au package iplots, comprenant des exemples et les derniers ajouts : Proceedings of the 3rd International Workshop on Distributed Statistical Computing 2003/Proceedings/UrbanekTheus.pdf Présentation du package iplots 2.0 par ses créateurs: 31


Télécharger ppt "Brit Anne-Cécile Dufeil Elodie Emzivat Audrey. Les représentations de données sur R : La fonction plot: fonction générique de R qui permet de représenter."

Présentations similaires


Annonces Google