TD/TP Modélisation: Introduction au langage R Dr Lilia ROMDHANE Faculté des Sciences de Bizerte Institut Pasteur de Tunis lilia.romdhane@yahoo.fr Login: sv.bioinformatique@yahoo.fr Mot de passe: bioinformatique2015
Bienvenu Pourquoi cet enseignement ? Initiation à un langage de programmation et un outil d’analyse statistique utile pour vos recherches Présentation du cours: une partie théorique et une partie pratique La présence est obligatoire Contrôle continu (au moins deux tests) Adresse mail obligatoire
Plan de l’enseignement Présentation de R, quelques concepts et principaux attributs de R Installation et manipulation des objets de données Les fonctions de statistique et les graphiques
Présentation de R, quelques concepts et principaux attributs de R
Qu’est ce que R? Présentation de R Logiciel de traitement de données et d’analyse statistique Créé en 1996 par Ross Ihaka et Robert Gentleman, département de statistique d’Auckland Evolution rapide et continue assurée par un noyau de statisticiens (Core team) et la contribution de personnes du monde entier (contributors) Logiciel qui utilise le langage S (langage développé pour la statistique et commercialisé sous le terme de d’environnement S-plus) R = logiciel R ou environnement R
Succès de R Présentation de R Gratuit (http://www.r-project.org ) Compatible avec les systèmes d’exploitation les plus utilisés Disponibilité de la documentation en ligne Puissant: la plus part des fonctions statistiques de calcul et de graphique disponibles dans la version de base Extensible: existence de fonctions supplémentaires dans les packages (compilation d’outils qui ne se trouvent pas dans la compilation de base)
Obtenir R sous Windows Présentation de R Installation de R: http://www.r-project.org Download CRAN (Comprehensive R Archive Network)
Présentation de R Obtenir R sous Windows Choisir un serveur ftp
Obtenir R sous Windows Présentation de R Choisir la version pour Windows
Présentation de R Obtenir R sous Windows Choisir « base »
Obtenir R sous Windows Présentation de R Cliquer sur Download R for Windows et enregistrement du fichier « .exe » sur le disque dur de votre ordinateur puis cliquez dessus pour l’installer
Obtenir R sous Windows Présentation de R Installation de package: choisir « contrib »
Présentation de R La documentation de R
Le prompt: invite à saisir les commandes Présentation de R R: La console Menu Le prompt: invite à saisir les commandes
R: La console: les menus Présentation de R R: La console: les menus
R: La console: les menus Présentation de R R: La console: les menus
R: La console: les menus Présentation de R R: La console: les menus
R: La console: les menus Présentation de R R: La console: les menus
R: La console: les menus Présentation de R R: La console: les menus
Présentation de R Le répertoire courant
Comment R travaille? Présentation de R R langage « facile » à manipuler: R est un langage interprété à la différence des langages compilés (C, Fortran, Pascal….) Syntaxe de R très simple et intuitive. Par exemple, pour établir une moyenne, la commande mean(x) peut être saisie. Les commandes sont écrites en anglais. Une fonction s’écrit toujours avec des parenthèses pour être exécutée même si elles ne contiennent rien (exemple: ls() ) Quand R est utilisé, les variables, les données, les résultats etc sont stockés dans la mémoire vive de l’ordinateur sous forme d’objets qui ont chacun un nom. L’utilisateur agit sur ces objets avec des opérateurs (arithmétiques , logiques, de comparaison) et des fonctions (qui sont elles mêmes des objets).
Comment R travaille ? Présentation de R Vue schématique du fonctionnement de R
L’instruction Quelques concepts L’instruction = N’importe quelle succession de caractères, chiffres et symboles tapés dans la console = ligne de commande = ligne de code = expression Le symbole « > » est le prompt, c’est l’invitation à écrire les instructions Si le prompt devient « + » , c’est que l’instruction n’est pas finie, il faut rajouter quelques éléments Le point-virgule sert à séparer deux instructions La virgules sert à séparer les instructions à l’intérieur des fonctions Les décimales sont séparées par un point et non une virgule Le symbole « # » indique une ligne de commentaire
Quelques concepts L’instruction
L’évaluation Quelques concepts Quand une expression complète est saisie, elle est évaluée et le résultat de l’expression évaluée est retournée. Le résultat peut être automatiquement imprimé.
Premiers pas: R est une calculatrice Quelques concepts Premiers pas: R est une calculatrice
Les variables: définition Quelques concepts Les variables: définition R ne sert pas qu’à effectuer des opérations aussi simples, la plus part du temps, R est utilisé pour des analyses plus complexes Donc, il est indispensable de stocker les résultats quelques part pour pouvoir les utiliser plus tard les variables Les variables sont des cases mémoires qui permettent de stocker des valeurs. Les variables les plus simples permettent de stocker des valeurs numériques (nombres) ou des chaines de caractères (du texte). Des variables plus complexes peuvent stocker des structures de données plus complexes Quand on créé une variable, on dit qu’on la déclare (déclaration) Quand on lui donne une valeur, on parle d’assignation
Les variables: exemples Quelques concepts Les variables: exemples
Les variables: règles d’écriture Quelques concepts Les variables: règles d’écriture Créer une variable est simple, certes il existe des règles à respecter: Le nom des variables doit impérativement commencer par une lettre La casse est importante. La variable a est différente de la variable A Le nom des variables peut contenir des caractères spéciaux et des nombres (mais pas comme premier caractère) Les variables ne peuvent pas être appelées avec des noms déjà utilisées par le langage R. Si un objet existe, sa valeur précédente est effacée (la modification n’affecte que les objets en mémoire vive, pas les données sur le disque dur)
Les variables: règles d’écriture (1) Quelques concepts Les variables: règles d’écriture (1) Créer une variable numérique: enregistre un nombre
Les Variables: règles d’écriture (2) Quelques concepts Les Variables: règles d’écriture (2) Créer une variable qui enregistre du texte
Lister les objets en mémoires: la fonction ls() Quelques concepts Lister les objets en mémoires: la fonction ls() Effacer les objets en mémoires: la fonction rm()
Quelques concepts L’aide en ligne
Questions (1) Créer une variable nommée « x » et lui attribuer la valeur 13 Créer une variable « X » et lui attribuer la valeur 25 Que se passe-t'il à la variable « x » ? Affectez la chaine de caractère « hello » à la variable hello Quelles sont les expressions justes ? justifier >Formation = " doctorat " >ADN <- acide nucleique >ADN -<- " acide nucleique " >ADN ->- " acide nucleique >ADN = " acide nucleique " > #independence <- 1956 >2014revolution <- 2014 >Revolution = " 2014 >revolution <- 2014 >Revolution = " 2014" Est-ce que les deux dernières instructions sont identiques ?
Réponses
Questions (2) Que donne l’instruction: >leçon = ‘j’apprends à programmer et j’adore ça’ Comment la corriger ? Quelle est la valeur de la variable Z et z? > A <- 25 > B <- 15 > Z <- A + B >Z * 2 > z= Z*2 + 1
Réponses 2
Questions (3) Créer les variables x, y et z contenant les valeurs 20, 23 et 45 respectivement. Imprimer chacune des valeurs Faire l’addition puis la multiplication de ces variables. En une seule instruction, chercher la moitié de la valeur de x élevée au carré stockée dans une variable nommée W.
Réponses 3
Les principaux attributs de R Objets de données Fonctions Opérateurs Attributs spéciaux
Les principaux attributs de R Les objets
Les objets: Définition Les principaux attributs de R Les objets: Définition R est un langage orienté objet: il fonctionne avec des objets Un objet, c’est comme une boite qui peut être remplie par n’importe quoi Un objet est caractérisé par: son nom, son contenu et ses attributs qui vont spécifier le type de données représenté par un objet. Les attributs sont les propriétés d’un objet. Ce sont des informations communes à tous les objets d’un même type. Les attributs peuvent êtres récupérés et modifiés. L’action d’une fonction sur un objet va dépendre des attributs de celui-ci Il existe les objets de données et les objets de fonctions
L’utilité des attributs Les principaux attributs de R L’utilité des attributs Pour comprendre l’utilité des attributs: On considère une variable qui prend les valeurs 1, 2 ou 3. représenter une variable quantitative (nombre d’œufs dans un nid) ou représenter le codage d’une variable catégorique ( le génotype d’une personne: homozygote sain, hétérozygote, homozygote malade) Donc, le traitement statistique ne sera pas le même dans les deux cas.
Les objets: le mode et la longueur Les principaux attributs de R Les objets: le mode et la longueur Les objets de données ont tous 2 attributs intrinsèques: le mode et la longueur: Le mode caractérise la nature d’éléments d’un objet, donc définit les opérations susceptibles d’être appliquées à cet objet. On a 4 modes: Numérique (Numeric), Caractère (Character), Complexe (Complex) et Logique (Logical) La longueur est le nombre d’éléments de l’objet. Pour connaitre le mode et la longueur: mode() et length()
Déterminer le mode d’un objet: la fonction mode() Les principaux attributs de R Déterminer le mode d’un objet: la fonction mode() Déterminer la taille d’un objet: la fonction length()
Tester le type d’une variable Les principaux attributs de R Tester le type d’une variable Pour tester le type d’une variable, on utilise les fonctions is.character(), is.logical(), is.numeric()
Créer des variables typées Les principaux attributs de R Créer des variables typées R utilise un typage implicite Des fois, il est préférable de spécifier le type de variables qu’on veut créer : utilise les fonctions as.character() as.numeric() as.logical()
Les principaux attributs de R Créer des variables typées: exemple (1)
Les principaux attributs de R Créer des variables typées: exemple (2)
Les principaux attributs de R Créer des variables typées: exemple (3)
Questions (1) Soient les variables suivantes: > mot= "bonjour " > nombre= "12 " > nombre_2=123 > mot_2= " logique " Que retourne les fonctions suivantes: > is.character(mot) ; is.numeric(nombre) ; is.numeric(nombre_2) ; is.logical(mot_2)
Réponses 1
Questions (2) Quel est le mode des variables suivantes: >X = 32 > w= TRUE > A <- "FALSE" Quel est le résultat de chacune conversion suivante: > as.numeric(34) >as.character(34) >as.integer(24.5) >as.character(24.5) >as.integer(24,5) >As.integer(24.5) >as.logical(0) > as.character(" doctorat " )
Les principaux attributs de R Les objets: la classe La classe d’un objet de données définit le comportement de l’objet, c’est-à-dire les opérations de manipulation de cet objet Les classes d’objets: les Vecteurs (Vectors), les facteurs (Factors), les tables (Tables), les tableaux de données (Data frames) Pour connaitre la classe: class()
Les objets de données: Traitement sous R Les principaux attributs de R Les objets de données: Traitement sous R Les objets de données peuvent subir 3 actions: Description, Modification et utilisation Name Length Mode Name: Hauteur Length: 3 Mode: Numeric Création / importation 300 130 170 Description (Nombre d’éléments) Modification (nom changé, 300 retiré) 3 Name: Hauteur.faible Length: 2 Mode: Numeric Utilisation (Moyenne) 130 170 200
Les principaux attributs de R Les fonctions
Les fonctions: définition (1) Les principaux attributs de R Les fonctions: définition (1) Quand on effectue des analyses statistiques ou simplement de la programmation, on est souvent amené à utiliser les mêmes outils. Ces outils peuvent être mathématiques (faire la moyenne d’une série de nombres, la somme d’une colonne d’un tableau,….), pratiques (sauvegarder un tableau) ou encore propres au fonctionnement du programme Plutôt que de devoir à chaque fois écrire beaucoup de lignes de code pour des choses assez simples et répétitives, on fait appel à des fonctions
Les fonctions: définition (2) Les principaux attributs de R Les fonctions: définition (2) La fonction est caractérisée par 2 composantes: Son nom: indispensable pour l’appeler Une liste d’arguments: les informations dont a besoin la fonction pour fonctionner et renvoyer son résultat Syntaxe: nom_de_la_fonction(arguments) Le résultat renvoyé par une fonction s’appelle le retour. Quand on écrit sqrt(9), on dit que la fonction retourne 3 ou retourne la valeur de 3
Exemples d’utilisation de la fonction sqrt() Les principaux attributs de R Exemples d’utilisation de la fonction sqrt()
Les principaux attributs de R Les opérateurs
Les principaux attributs de R Les opérateurs Les opérateurs sont une autre façon d’agir sur les objets de données, mais à la différence des fonctions, ce ne sont pas des objets. Il existe différents types d’opérateurs: arithmétiques, logiques, de comparaison, d’ extraction et d’assignation.
Les opérateurs arithmétiques Les principaux attributs de R Les opérateurs arithmétiques Ils servent aux calculs simples: + addition - soustraction * multiplication / division
Les opérateurs arithmétiques Les principaux attributs de R Les opérateurs arithmétiques
Les opérateurs de comparaison Les principaux attributs de R Les opérateurs de comparaison Ils comparent des objets de données ou éléments d’objets de données < Inférieur <= Inférieur ou égal > Supérieur >= Supérieur ou égal == Egal (à ne pas confondre avec = ) ! = Différent La valeur de la comparaison est un booléen
Les opérateurs logiques Les principaux attributs de R Les opérateurs logiques Ils sont les outils de comparaison & ET | OU
Les principaux attributs de R Les booléens Les booléens = les éléments logiques sous R Ne prend que 2 valeurs : TRUE (pouvant s’écrire T) ou FALSE (pouvant s’écrire F). Majuscule obligatoire
Les opérateurs d’extraction Les principaux attributs de R Les opérateurs d’extraction Les opérateurs d’extraction [], [:], [, ] et $ permettent d’extraire une partie des éléments d’un objet de données
Les attributs spéciaux Les principaux attributs de R Les attributs spéciaux
Les attributs spéciaux Les principaux attributs de R Les attributs spéciaux Certains mots sont réservés à des emplois particuliers. Ce ne sont ni des objets ni des opérateurs. Ceux qui n’exécutent rien: NA: Valeur manquante (Not Available) Inf: infin (-Inf pour moins l’infini) NULL: désigne l’objet vide Ceux qui peuvent exécuter des instruction: (attributs de condition et de répétitions) R possède également quelques constantes: letters : désigne les 26 lettres de l’alphabet en minuscule pi: désigne la valeur de π =3,141593
Les classes des objets de données
Les vecteurs (Vectors)
Les vecteurs (Vectors) Les principaux attributs de R Les vecteurs (Vectors) L’objet le plus basique du langage R Un vecteur contient des objets de même mode Un vecteur est une structure qui permet de stocker plusieurs nombres par exemples dans une même variable Un vecteur peut être crée par la fonction vector() ou par la fonction c()
Création d’un vecteur avec la fonction c() Les principaux attributs de R Création d’un vecteur avec la fonction c()
Création d’un vecteur avec la fonction rep() Les principaux attributs de R Création d’un vecteur avec la fonction rep() La fonction rep() permet des répétitions de n fois le chiffre indiqué dans le vecteur en deuxième position
Création d’un vecteur avec la fonction seq() Les principaux attributs de R Création d’un vecteur avec la fonction seq() La fonction seq() permet de générer des séries de nombres équidistants :
Création d’un vecteur avec l’opération double point « : » Les principaux attributs de R Création d’un vecteur avec l’opération double point « : » L’opérateur double point : permet de générer des séries d’entiers, ascendantes ou descendantes:
Les principaux attributs de R Mélanger les objets Quand différents objets sont mélangés dans un vecteur, une contrainte s’applique de telle sorte que tous les objets soient du même mode
Les principaux attributs de R Contrainte explicite Les objets peuvent subir une contrainte explicite pour passer d’un mode à un autre en utilisant les fonctions qui commencent par « as » quand cela est possible
Questions Créer un vecteur de mode numérique nommé « nombre » contenant les valeurs suivantes: 12, 13, 14, 10 Créer un vecteur numérique contenant les 5 premiers chiffres dans une variable nommée « vec_nombre » de 3 manières Créer un vecteur de mode caractère nommé « mot » contenant les valeurs suivantes : a, b, c, d Créer un vecteur contenant 2 fois 35 et 4 fois 79 (sans à avoir saisir les nombres cités) Convertir le mode de « nombre » en mode caractères Créer une variable nommée « moyenne » à laquelle vous assigner la valeur de la moyenne du vecteur «nombre ». Procéder de differentes manières.
Réponses
Description avec la fonction summary() Vecteurs: Description Description avec la fonction summary()
Vecteurs: Analyse et modification L’indexation: L’indexation se fait par l’opérateur [] par des entiers positifs ou négatifs ou par des vecteurs logiques
Vecteurs: Analyse et modification L’indexation: L’indexation se fait par l’opérateur [] aussi par des opérateurs logiques
Opérations arithmétiques Vecteurs: Analyse et modification Opérations arithmétiques
Trouver la position d’un élément: la fonction which() Vecteurs : Analyse et modification Trouver la position d’un élément: la fonction which()
Concaténer des vecteurs Vecteurs: Analyse et modification Concaténer des vecteurs
Exercice 1 Créer le vecteur x=(101;102;...;112). Créer un vecteur de longueur 12 formé de 4 fois la suite de nombres (4;6;3) nommé « Répétition ». Créer un vecteur composé de huit 4, de sept 6 et de cinq 3 nommé « Répétition.2 ». Extraire le deuxième élément du vecteur x. Extraire le 4ième et le 5ième élément du vecteur Répétition Extraire les éléments du vecteur Répétition.2 inférieur à 6 Remplacer l’élément du vecteur x à la position 3 par la valeur 113
Exercice 2 Saisir la variable poids contenant les 15 valeurs suivantes : 28; 27.5; 27; 28; 30.5; 30; 31; 29.5; 30; 31; 31; 31.5; 32; 30; 30.5. Saisir la variable poids1 contenant les 5 valeurs suivantes : 40; 39; 41; 37.5; 43. Sans refaire de saisie, créer la variable nouveau.poids contenant 20 valeurs (les 5 valeurs de poids1 répétées 2 fois et les 10 premières valeurs de poids). Etablir les valeurs minimale, maximale, mediane et moyenne ainsi que les quantiles du vecteur « nouveau.poids »
Les facteurs (Factors)
Les facteurs (Factors) Les principaux attributs de R Les facteurs (Factors) Le facteur est un type de vecteur adapté aux variables qualitatives. Il est créé à partir vecteur de mode caractère. Un facteur est un vecteur qui contient toutes les valeurs qui peuvent être prises par les éléments du vecteur attribut (Level) Sa création se fait par la fonction factor() La fonction factor() considère les caractères comme les classes d’une variable qualitative. Dans « Levels », elle indique les différentes classes (par ordre alphabétique quand appliquée sur un vecteur de caractères)
Les facteurs (Factors) Les principaux attributs de R Les facteurs (Factors)
Les facteurs (Factors) Les principaux attributs de R Les facteurs (Factors) Très pratique pour la contingence, c’est-à-dire l’étude des effectifs dans les différentes classes d’une variable qualitative Les éléments peuvent être enregistrées en tant que chiffre de sorte qu’un chiffre corresponde à une classe de « Levels » en précisant à quelle classe est associé chaque chiffre à l’aide des arguments levels et labels
Création avec la fonction factor() Les principaux attributs de R Création avec la fonction factor()
Création avec la fonction factor() Les principaux attributs de R Création avec la fonction factor() Signaler un ordre dans le facteur: argument « ordered »
Questions Soit le vecteur suivant: couleur=c("bleu", "rouge", "rouge", "jaune", "bleu", "bleu", "jaune") Créer un facteur nommé « couleur_fac » à partir de ce vecteur. Créer un facteur nommé « fac_niveau » à partir du vecteur niveau=c(0,2,3,1,2,0,1) de telle façon que 0 correspond à faible, 1 à moyen, 2 à fort et 3 à très fort
Décrire un facteur avec la fonction summary() Facteur: Description Décrire un facteur avec la fonction summary()
Indexation Facteurs: Analyse et modification Les facteurs: Opérations et sélections Indexation
Facteurs : Analyse et modification Les facteurs: Opérations et sélections Afficher et modifier les classes d’un facteur
Question Soit le vecteur suivant: couleur=c("bleu", "rouge", "rouge", "jaune", "bleu", "bleu", "jaune") Créer un facteur nommé « couleur_fac » à partir de ce vecteur. Créer un facteur nommé « fac_niveau » à partir du vecteur niveau=c(0,2,3,1,2,0,1) de telle façon que 0 correspond à faible, 1 à moyen, 2 à fort et 3 à très fort Afficher les niveaux (Levels) du facteur fac_niveau Extraire le deuxième niveau. Le modifier en « MOYEN » Afficher le fac_niveau modifié.
Les tableaux de données (data frames)
Les tableaux de données: Data frames Les principaux attributs de R Les tableaux de données: Data frames Les data frames (série de valeurs en colonnes) peuvent être créées à partir de vecteurs ou à partir d’un fichier de données. Ce sont des objets à 2 dimensions (lignes et colonnes) . Toutes les colonnes doivent avoir la même longueur, de même toutes les lignes doivent avoir la même longueur. Les lignes et les colonnes peuvent avoir des longueurs différentes Les data frames ont pour vocation de stocker les différentes variables pour différents individus ou observations d’une population ou expériences Les colonnes sont systématiquement des variables et les individus sont représentées dans les lignes Une colonne porte par défaut un nom en X ou V suivi du numéro de colonne
Les tableaux de données: Data frames Les principaux attributs de R Les tableaux de données: Data frames Le mode reste le même dans une colonne. Il peut changer entre les colonnes Les caractères ne sont plus indiqués entre guillemets car une colonne de caractères est considérée par défaut comme une variable qualitative. La colonne est de type « facteur » Sa création se fait par la fonction data.frame(), ou bien par read.table(), ou bien read.csv() Les data frames ont un attribut nommé row.names
Aperçu d’un tableau de données sous R Les objets de données: Les tableaux de données Aperçu d’un tableau de données sous R Les variables Individu Hauteur Masse Couleur 1 NA Rouge 2 199 1431 Jaune 4 205 1468 5 173 1398 6 233 1622 Les individus
Créer un data frame avec la fonction data.frame() Les principaux attributs de R Créer un data frame avec la fonction data.frame()
Création à partir de vecteurs Les principaux attributs de R Création à partir de vecteurs
Renommer les lignes: attribut « row.names » ou la fonction rownames() Les principaux attributs de R Renommer les lignes: attribut « row.names » ou la fonction rownames()
Création à partir de read.table() Les principaux attributs de R Création à partir de read.table()
Questions Quelles sont les méthodes pour créer les tableaux de données sous R ? Créer un tableau de données à partir de 3 vecteurs contenant chacun 3 éléments: Un vecteur numérique nommé « nombre ». Un vecteur logique nommé « logique ». Un vecteur nommé « texte » et contenant les valeurs « a », «b », « c ». Renommer les lignes en « ligne1 », « lign2 », « ligne3 »
Description d’un tableau de données: summary() Tableaux de données: Description Description d’un tableau de données: summary()
Les tableaux de données: Analyse et modification Description : dim(), names(), dimnames()
Les tableaux de données: Analyse et modification Renommer les colonnes: colnames()
Les tableaux de données: Analyse et modification Renommer les lignes: rownames()
Les tableaux de données: Analyse et modification Extraction avec l’opérateur [,] Syntaxe: nom_de_l’objet[ligne,colonne]
Les tableaux de données: Analyse et modification Extraction avec l’opérateur []
Les tableaux de données: Analyse et modification Extraction avec l’opérateur $ Syntxe: nom_de_l’objet$colonne
Les tableaux de données: Analyse et modification Extraire selon une condition
Les tableaux de données: Analyse et modification Modification des données
Les tableaux de données: Analyse et modification
Question Créer un tableau de données à partir de 3 vecteurs: Un vecteur numérique contenant 10 valeurs numériques de 1 à 10 Un vecteur numérique contenant les valeurs 1 et 2 répétées 5 fois Un vecteur caractère contenant les 10 premières lettres de l’alphabet Renommer les colonnes comme suit: Vec10, Vec_Rep, Alapha Extraire les valeurs de la deuxième variable Extraire les éléments de la première ligne Extraire le deuxième élément de la 3ième variable Modifier cette valeur en majuscule
Récapituler
Les principaux attributs de R Récapituler
Lire les données dans un fichier Importer des données Lire les données dans un fichier Pour les lectures et les écritures dans des fichiers, R utilise le répertoire de travail Pour connaitre le répertoire courant: getwd() (get working directory) Pour modifier le répertoire courant: setwd() et connaitre le chemin d’accès Exemple: setwd(« C:/data ») ou setwd(« home/user/R ») Pour lire les données stockées dans des fichiers: read.table()
Règles d’écriture des données dans les fichiers Ecrire dans un fichier Règles d’écriture des données dans les fichiers Ecriture de données avec les variables en colonnes, et les individus en lignes Respecter des règles d’écriture dans le fichier. Eviter les entêtes compliquées, les caractères spéciaux dans les noms de colonnes ainsi que dans les données (les slashs, les accents, les espaces, les virgules) Sous Excel, remplacer les virgules par des points, mais aussi: Réserver la première ligne aux noms des variables Chaque ligne suivante est un individu Si les individus possèdent un nom, écrire ce nom dans la première colonne Les données manquantes doivent être notées NA (Not available) et c’est le mot de R réservé aux données manquantes. Enregistrer votre fichier au format « texte » avec comme séparateur la tabulation (*.txt)
Règles d’écriture des données dans les fichiers Ecrire dans un fichier Règles d’écriture des données dans les fichiers
Règles d’écriture des données dans les fichiers Ecrire dans un fichier Règles d’écriture des données dans les fichiers Avec un éditeur de texte: Mêmes recommandations que précédemment Séparer les éléments de chaque ligne par une tabulation et une seule
Règles d’écriture des données dans les fichiers Ecrire dans un fichier Règles d’écriture des données dans les fichiers
Ecrire dans un fichier Read.table() read.table(file, header = FALSE, sep = "", quote = "\"'", dec = ".", row.names, col.names, as.is = FALSE, na.strings = "NA" , colClasses = NA, nrows = -1, skip = 0, check.names = TRUE, fill = !blank.lines.skip, strip.white = FALSE, blank.lines.skip = TRUE, comment.char = "#")
Enregistrer des données Ecrire dans un fichier Enregistrer des données La fonction write.table() écrit dans un fichier un tableau de données ou autres types de données write.table(x, file = "", append = FALSE, quote = TRUE, sep = " " ,eol = "\n", na = "NA", dec = ".", row.names = TRUE, col.names = TRUE, qmethod = c("escape", "double"))
Petit glossaire