Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parJehane Tissier Modifié depuis plus de 10 années
1
Présentation et utilisation du logiciel R Komi Sodoké Université du Québec à Montréal Février 2007
2
R - présentation générale R est un langage de programmation et un environnement mathématique utilisé pour l'analyse statistique. Le site web de référence sur le logiciel R est : www.r-project.org. www.r-project.org
3
Pourquoi choisir dutiliser R? Le logiciel R est un programme entièrement gratuit et librement diffusé; il peut être installé sans aucune licence sur votre ordinateur. Facilité d'apprentissage. Le laboratoire de ce soir va vous le prouver !!! Multi plate-forme : R fonctionne de la même façon sous Windows, Linux ou Macintosh. Peut être installé sur un serveur auquel les étudiants peuvent avoir accès en utilisant un terminal ou une interface web (Rweb). Des sites miroirs proposent des centaines de librairies R sous licence libre. R dispose de nombreuses fonctions graphiques. Très modulaire et adaptable à ses propres besoins (e xemple du menu du cours ). Une FAQ destinée aux utilisateurs. Site de comparaison des logiciels statistiques : en.wikipedia.org/wiki/Comparison_of_statistical_packages R offre les mêmes fonctionnalités et, dans certains cas, plus que les logiciels bien connus (SPSS, Minitab) qui coûtent plus de 1 000$.
4
Préparatifs pour débuter le laboratoire Téléchargement du logiciel R et installation sur un poste de travail : Site : http://cran.r-project.org/. Version la plus récente( 2006-12-18 ) 2.6.2http://cran.r-project.org/ Information dinstallation disponible sur le site : http://pages.usherbrooke.ca/asaubin/r_project/section_00/index.php http://pages.usherbrooke.ca/asaubin/r_project/section_00/index.php
5
Quelques commandes simples Créer un vecteur de données (par exemple, note finale à un cours) : Note <- c(80,92,83,96,85,77,98,92,87,90,88,91,67,72,86,82) Si un vecteur a été défini, on peut afficher son contenu en tapant tout simplement son nom : Note Les fonctions min() et max() fournissent la plus petite (resp. grande) valeur dun vecteur : min(Note), max(Note) La fonction range() fournit simultanément la plus petite et la plus grande valeur dun vecteur : noteRange <- range(Note); après taper noteRange Les fonctions sum() et prod() calculent la somme et le produit des composantes dun vecteur : sum(Note) length() rend le nombre de composantes du vecteur sort() ordonne par ordre croissant les valeurs du vecteur help() fournit de laide sur la fonction help.search("...") recherche dans le système daide pour les aides contetant …
6
Quelques commandes statistiques mean(x) fournit la moyenne des éléments de x. mean(Note) median(x) fournit la valeur médiane des éléments de x. median(Note) sd(x) fournit la valeur de lécart type des éléments de x. sd(Note) summary(x) fournit un sommaire des statistiques (Min, 1 e quartile, médiane, moyenne, 3 e quartile, Max) des éléments de x. summary(Note)
7
Introduction aux graphiques La fonction plot() permet de réaliser des graphiques de base à lécran. Considérons par exemple que nous disposons de 8 personnes dont nous connaissons le poids en kg et la taille en cm. Poids <- c(59,60,65,73,82,45,89,96) taille <- c(155,160,156,180,175,156,182,190) plot(poids,taille); plot(poids,taille,type='o') pour créer un histogramme de données, on utilise la fonction hist(). hist(Note, col="gray") Essayer la commande suivante : hist(Note, col="gray", main="Histogramme des notes", xlab="Note des étudiants",ylab=" Fréquence des notes",sub="Fig.1").
8
Introduction aux graphiques (suite) Pour tracer une boîte à moustaches : boxplot(x) Pour tracer un diagramme en secteurs, on utilise la fonction pie() Ecole.nom <- c("Vanier","St-Laurent","Vieux-Montreal", "Outremont") Ecole.effectif <- c(400,150,250,1000) Ecole.couleur <- c("gray99","blue","gray87","magenta") pie(Ecole.effectif,labels=Ecole.nom,col=Ecole.couleur) Lors de la rédaction dun rapport, il se peut que vous désiriez placer plusieurs graphiques les uns à côté des autres. Pour ce faire, utilisez la fonction par() : par(mfrow=c(2,2)) suivi de quatre instructions réalisant des graphiques. par(mfrow=c(2,2)) Ecole.nom <- c("Vanier","St-Laurent","Vieux-Montreal", "Outremont") Ecole.effectif <- c(400,150,250,1000) Ecole.couleur <- c("gray99","blue","gray87","magenta") pie(Ecole.effectif,labels=Ecole.nom,col=Ecole.couleur) hist(Note, col="gray", main="Histogramme des notes", xlab="Note des étudiants",ylab=" Fréquence des notes",sub="Fig.1") hist(Note,col="gray") plot(poids,taille,type='o')
9
Installation et manipulation du menu Menu du cours réalisé par Raîche (2007) pour vous faciliter les manipulations. Changement de répertoire : Fichier changer le répertoire courant. Sourçage du menu MAE 7020 : Fichier Sourcer du code R MENU_INITIALISATION.R Sélectionner un site miroir : Canada ON Linstallation de plusieurs librairies (packages) se fera automatiquement. Ce qui fait que le processus dinstallation du menu peut prendre quelques minutes. Lors de la première installation, cela peut même prendre jusquà 15 minutes selon la puissance de votre ordinateur. Ne pas trop tenir compte des divers messages qui saffichent.
10
Manipulation du menu Menu File permet de faire les traitements relatifs aux fichiers : ouverture, enregistrement, nom des variables. Également, vous pouvez accéder directement à différents fichiers où sont disponibles des données (tel que TIMMS, PISA, PIRLS, HOWEL) ou quitter le logiciel. Télécharger le fichier : BSGCQUm3.sav dans votre répertoire de travail. Il sagit dun fichier SPSS, louvrir à partir du menu de R. Afficher le nom des variables : File Variable name. Éditer les données : File Edit data. Ouvrir le fichier, préalablement téléchargé, de données de Howell : Tab2-1 (fichier R sans entête)
11
Manipulation du menu Permet de faire la sélection des variables qui nous intéressent. Menu Data
12
Manipulation du menu Permet de faire différentes analyses sur les variables. Seule lanalyse descriptive nous intéresse pour linstant. Les éléments du menus ne sont pas encore tous développés. Menu Analyse Fermer R et ouvrir de nouveau
13
Manipulation des fichiers de données Téléchargement de fichiers à partir du menu MAE 7020 : TEIMS, PIRLS, HOWELL Lecture de fichiers qui ont été préalablement téléchargés : exemple du TEIMS Sélection de variables (dans le but se simplifier la manipulation des données et sauvegarder ensuite un fichier moins volumineux) Sauvegarde d'un fichier de données : fichier avec entête
14
Analyses statistiques sommaires Il est suggéré d'effectuer ces analyses séparément avec deux variables. Une proviendra du tableau 2.1 de Howell, l'autre de variables de votre choix du TEIMS ou du PIRLS. Statistiques sommaires obtenues à partir du menu : Analyse –> Descriptive analysis Graphiques de variables sélectionnées : hist(variable); stem(variable); boxplot(variable)
15
Sauvegarde des résultats Sauvegarde des résultats (output) texte : Sélectionner la sortie désirée Edition Copier; ensuite coller dans le document voulu. Sauvegarde des résultats (output) Graphiques : Clic droit de la souris Copier en tant que bitmap Insérer (Édition coller) à l'intérieur de Word ou d'un autre logiciel.
16
Fin du cours Merci de votre attention
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.