La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

TD/TP Modélisation: Introduction au langage R

Présentations similaires


Présentation au sujet: "TD/TP Modélisation: Introduction au langage R"— Transcription de la présentation:

1 TD/TP Modélisation: Introduction au langage R
Dr Lilia ROMDHANE Faculté des Sciences de Bizerte Institut Pasteur de Tunis Login: Mot de passe: bioinformatique2015

2 Bienvenu  Pourquoi cet enseignement ?
Initiation à un langage de programmation et un outil d’analyse statistique utile pour vos recherches Présentation du cours: une partie théorique et une partie pratique La présence est obligatoire Contrôle continu (au moins deux tests) Adresse mail obligatoire

3 Plan de l’enseignement
Présentation de R, quelques concepts et principaux attributs de R Installation et manipulation des objets de données Les fonctions de statistique et les graphiques

4 Présentation de R, quelques concepts et principaux attributs de R

5 Qu’est ce que R? Présentation de R
Logiciel de traitement de données et d’analyse statistique Créé en 1996 par Ross Ihaka et Robert Gentleman, département de statistique d’Auckland Evolution rapide et continue assurée par un noyau de statisticiens (Core team) et la contribution de personnes du monde entier (contributors) Logiciel qui utilise le langage S (langage développé pour la statistique et commercialisé sous le terme de d’environnement S-plus) R = logiciel R ou environnement R

6 Succès de R Présentation de R Gratuit (http://www.r-project.org )
Compatible avec les systèmes d’exploitation les plus utilisés Disponibilité de la documentation en ligne Puissant: la plus part des fonctions statistiques de calcul et de graphique disponibles dans la version de base Extensible: existence de fonctions supplémentaires dans les packages (compilation d’outils qui ne se trouvent pas dans la compilation de base)

7 Obtenir R sous Windows Présentation de R Installation de R:
Download CRAN (Comprehensive R Archive Network)

8 Présentation de R Obtenir R sous Windows Choisir un serveur ftp

9 Obtenir R sous Windows Présentation de R
Choisir la version pour Windows

10 Présentation de R Obtenir R sous Windows Choisir « base »

11 Obtenir R sous Windows Présentation de R
Cliquer sur Download R for Windows et enregistrement du fichier « .exe » sur le disque dur de votre ordinateur puis cliquez dessus pour l’installer

12 Obtenir R sous Windows Présentation de R
Installation de package: choisir « contrib »

13 Présentation de R La documentation de R

14 Le prompt: invite à saisir les commandes
Présentation de R R: La console Menu Le prompt: invite à saisir les commandes

15 R: La console: les menus
Présentation de R R: La console: les menus

16 R: La console: les menus
Présentation de R R: La console: les menus

17 R: La console: les menus
Présentation de R R: La console: les menus

18 R: La console: les menus
Présentation de R R: La console: les menus

19 R: La console: les menus
Présentation de R R: La console: les menus

20 Présentation de R Le répertoire courant

21 Comment R travaille? Présentation de R
R langage « facile » à manipuler: R est un langage interprété à la différence des langages compilés (C, Fortran, Pascal….) Syntaxe de R très simple et intuitive. Par exemple, pour établir une moyenne, la commande mean(x) peut être saisie. Les commandes sont écrites en anglais. Une fonction s’écrit toujours avec des parenthèses pour être exécutée même si elles ne contiennent rien (exemple: ls() ) Quand R est utilisé, les variables, les données, les résultats etc sont stockés dans la mémoire vive de l’ordinateur sous forme d’objets qui ont chacun un nom. L’utilisateur agit sur ces objets avec des opérateurs (arithmétiques , logiques, de comparaison) et des fonctions (qui sont elles mêmes des objets).

22 Comment R travaille ? Présentation de R
Vue schématique du fonctionnement de R

23 L’instruction Quelques concepts
L’instruction = N’importe quelle succession de caractères, chiffres et symboles tapés dans la console = ligne de commande = ligne de code = expression Le symbole « > » est le prompt, c’est l’invitation à écrire les instructions Si le prompt devient « + » , c’est que l’instruction n’est pas finie, il faut rajouter quelques éléments Le point-virgule sert à séparer deux instructions La virgules sert à séparer les instructions à l’intérieur des fonctions Les décimales sont séparées par un point et non une virgule Le symbole « # » indique une ligne de commentaire

24 Quelques concepts L’instruction

25 L’évaluation Quelques concepts
Quand une expression complète est saisie, elle est évaluée et le résultat de l’expression évaluée est retournée. Le résultat peut être automatiquement imprimé.

26 Premiers pas: R est une calculatrice
Quelques concepts Premiers pas: R est une calculatrice

27 Les variables: définition
Quelques concepts Les variables: définition R ne sert pas qu’à effectuer des opérations aussi simples, la plus part du temps, R est utilisé pour des analyses plus complexes Donc, il est indispensable de stocker les résultats quelques part pour pouvoir les utiliser plus tard les variables Les variables sont des cases mémoires qui permettent de stocker des valeurs. Les variables les plus simples permettent de stocker des valeurs numériques (nombres) ou des chaines de caractères (du texte). Des variables plus complexes peuvent stocker des structures de données plus complexes Quand on créé une variable, on dit qu’on la déclare (déclaration) Quand on lui donne une valeur, on parle d’assignation

28 Les variables: exemples
Quelques concepts Les variables: exemples

29 Les variables: règles d’écriture
Quelques concepts Les variables: règles d’écriture Créer une variable est simple, certes il existe des règles à respecter: Le nom des variables doit impérativement commencer par une lettre La casse est importante. La variable a est différente de la variable A Le nom des variables peut contenir des caractères spéciaux et des nombres (mais pas comme premier caractère) Les variables ne peuvent pas être appelées avec des noms déjà utilisées par le langage R. Si un objet existe, sa valeur précédente est effacée (la modification n’affecte que les objets en mémoire vive, pas les données sur le disque dur)

30 Les variables: règles d’écriture (1)
Quelques concepts Les variables: règles d’écriture (1) Créer une variable numérique: enregistre un nombre

31 Les Variables: règles d’écriture (2)
Quelques concepts Les Variables: règles d’écriture (2) Créer une variable qui enregistre du texte

32 Lister les objets en mémoires: la fonction ls()
Quelques concepts Lister les objets en mémoires: la fonction ls() Effacer les objets en mémoires: la fonction rm()

33 Quelques concepts L’aide en ligne

34 Questions (1) Créer une variable nommée « x » et lui attribuer la valeur 13 Créer une variable « X » et lui attribuer la valeur 25 Que se passe-t'il à la variable « x » ? Affectez la chaine de caractère « hello » à la variable hello Quelles sont les expressions justes ? justifier >Formation = " doctorat " >ADN <- acide nucleique >ADN -<- " acide nucleique " >ADN ->- " acide nucleique >ADN = " acide nucleique " > #independence <- 1956 >2014revolution <- 2014 >Revolution = " 2014 >revolution <- 2014 >Revolution = " 2014" Est-ce que les deux dernières instructions sont identiques ?

35 Réponses

36 Questions (2) Que donne l’instruction:
>leçon = ‘j’apprends à programmer et j’adore ça’ Comment la corriger ? Quelle est la valeur de la variable Z et z? > A <- 25 > B <- 15 > Z <- A + B >Z * 2 > z= Z*2 + 1

37 Réponses 2

38 Questions (3) Créer les variables x, y et z contenant les valeurs 20, 23 et 45 respectivement. Imprimer chacune des valeurs Faire l’addition puis la multiplication de ces variables. En une seule instruction, chercher la moitié de la valeur de x élevée au carré stockée dans une variable nommée W.

39 Réponses 3

40 Les principaux attributs de R
Objets de données Fonctions Opérateurs Attributs spéciaux

41 Les principaux attributs de R
Les objets

42 Les objets: Définition
Les principaux attributs de R Les objets: Définition R est un langage orienté objet: il fonctionne avec des objets Un objet, c’est comme une boite qui peut être remplie par n’importe quoi Un objet est caractérisé par: son nom, son contenu et ses attributs qui vont spécifier le type de données représenté par un objet. Les attributs sont les propriétés d’un objet. Ce sont des informations communes à tous les objets d’un même type. Les attributs peuvent êtres récupérés et modifiés. L’action d’une fonction sur un objet va dépendre des attributs de celui-ci Il existe les objets de données et les objets de fonctions

43 L’utilité des attributs
Les principaux attributs de R L’utilité des attributs Pour comprendre l’utilité des attributs: On considère une variable qui prend les valeurs 1, 2 ou 3.  représenter une variable quantitative (nombre d’œufs dans un nid)  ou représenter le codage d’une variable catégorique ( le génotype d’une personne: homozygote sain, hétérozygote, homozygote malade) Donc, le traitement statistique ne sera pas le même dans les deux cas.

44 Les objets: le mode et la longueur
Les principaux attributs de R Les objets: le mode et la longueur Les objets de données ont tous 2 attributs intrinsèques: le mode et la longueur: Le mode caractérise la nature d’éléments d’un objet, donc définit les opérations susceptibles d’être appliquées à cet objet. On a 4 modes: Numérique (Numeric), Caractère (Character), Complexe (Complex) et Logique (Logical) La longueur est le nombre d’éléments de l’objet. Pour connaitre le mode et la longueur: mode() et length()

45 Déterminer le mode d’un objet: la fonction mode()
Les principaux attributs de R Déterminer le mode d’un objet: la fonction mode() Déterminer la taille d’un objet: la fonction length()

46 Tester le type d’une variable
Les principaux attributs de R Tester le type d’une variable Pour tester le type d’une variable, on utilise les fonctions is.character(), is.logical(), is.numeric()

47 Créer des variables typées
Les principaux attributs de R Créer des variables typées R utilise un typage implicite Des fois, il est préférable de spécifier le type de variables qu’on veut créer : utilise les fonctions as.character() as.numeric() as.logical()

48 Les principaux attributs de R
Créer des variables typées: exemple (1)

49 Les principaux attributs de R
Créer des variables typées: exemple (2)

50 Les principaux attributs de R
Créer des variables typées: exemple (3)

51 Questions (1) Soient les variables suivantes: > mot= "bonjour "
> nombre= "12 " > nombre_2=123 > mot_2= " logique " Que retourne les fonctions suivantes: > is.character(mot) ; is.numeric(nombre) ; is.numeric(nombre_2) ; is.logical(mot_2)

52 Réponses 1

53 Questions (2) Quel est le mode des variables suivantes: >X = 32
> w= TRUE > A <- "FALSE" Quel est le résultat de chacune conversion suivante: > as.numeric(34) >as.character(34) >as.integer(24.5) >as.character(24.5) >as.integer(24,5) >As.integer(24.5) >as.logical(0) > as.character(" doctorat " )

54 Les principaux attributs de R
Les objets: la classe La classe d’un objet de données définit le comportement de l’objet, c’est-à-dire les opérations de manipulation de cet objet Les classes d’objets: les Vecteurs (Vectors), les facteurs (Factors), les tables (Tables), les tableaux de données (Data frames) Pour connaitre la classe: class()

55 Les objets de données: Traitement sous R
Les principaux attributs de R Les objets de données: Traitement sous R Les objets de données peuvent subir 3 actions: Description, Modification et utilisation Name Length Mode Name: Hauteur Length: 3 Mode: Numeric Création / importation 300 130 170 Description (Nombre d’éléments) Modification (nom changé, 300 retiré) 3 Name: Hauteur.faible Length: 2 Mode: Numeric Utilisation (Moyenne) 130 170 200

56 Les principaux attributs de R
Les fonctions

57 Les fonctions: définition (1)
Les principaux attributs de R Les fonctions: définition (1) Quand on effectue des analyses statistiques ou simplement de la programmation, on est souvent amené à utiliser les mêmes outils. Ces outils peuvent être mathématiques (faire la moyenne d’une série de nombres, la somme d’une colonne d’un tableau,….), pratiques (sauvegarder un tableau) ou encore propres au fonctionnement du programme Plutôt que de devoir à chaque fois écrire beaucoup de lignes de code pour des choses assez simples et répétitives, on fait appel à des fonctions

58 Les fonctions: définition (2)
Les principaux attributs de R Les fonctions: définition (2) La fonction est caractérisée par 2 composantes: Son nom: indispensable pour l’appeler Une liste d’arguments: les informations dont a besoin la fonction pour fonctionner et renvoyer son résultat Syntaxe: nom_de_la_fonction(arguments) Le résultat renvoyé par une fonction s’appelle le retour. Quand on écrit sqrt(9), on dit que la fonction retourne 3 ou retourne la valeur de 3

59 Exemples d’utilisation de la fonction sqrt()
Les principaux attributs de R Exemples d’utilisation de la fonction sqrt()

60 Les principaux attributs de R
Les opérateurs

61 Les principaux attributs de R
Les opérateurs Les opérateurs sont une autre façon d’agir sur les objets de données, mais à la différence des fonctions, ce ne sont pas des objets. Il existe différents types d’opérateurs: arithmétiques, logiques, de comparaison, d’ extraction et d’assignation.

62 Les opérateurs arithmétiques
Les principaux attributs de R Les opérateurs arithmétiques Ils servent aux calculs simples: + addition - soustraction * multiplication / division

63 Les opérateurs arithmétiques
Les principaux attributs de R Les opérateurs arithmétiques

64 Les opérateurs de comparaison
Les principaux attributs de R Les opérateurs de comparaison Ils comparent des objets de données ou éléments d’objets de données < Inférieur <= Inférieur ou égal > Supérieur >= Supérieur ou égal == Egal (à ne pas confondre avec = ) ! = Différent La valeur de la comparaison est un booléen

65 Les opérateurs logiques
Les principaux attributs de R Les opérateurs logiques Ils sont les outils de comparaison & ET | OU

66 Les principaux attributs de R
Les booléens Les booléens = les éléments logiques sous R Ne prend que 2 valeurs : TRUE (pouvant s’écrire T) ou FALSE (pouvant s’écrire F). Majuscule obligatoire

67 Les opérateurs d’extraction
Les principaux attributs de R Les opérateurs d’extraction Les opérateurs d’extraction [], [:], [, ] et $ permettent d’extraire une partie des éléments d’un objet de données

68 Les attributs spéciaux
Les principaux attributs de R Les attributs spéciaux

69 Les attributs spéciaux
Les principaux attributs de R Les attributs spéciaux Certains mots sont réservés à des emplois particuliers. Ce ne sont ni des objets ni des opérateurs. Ceux qui n’exécutent rien: NA: Valeur manquante (Not Available) Inf: infin (-Inf pour moins l’infini) NULL: désigne l’objet vide Ceux qui peuvent exécuter des instruction: (attributs de condition et de répétitions) R possède également quelques constantes: letters : désigne les 26 lettres de l’alphabet en minuscule pi: désigne la valeur de π =3,141593

70 Les classes des objets de données

71 Les vecteurs (Vectors)

72 Les vecteurs (Vectors)
Les principaux attributs de R Les vecteurs (Vectors) L’objet le plus basique du langage R Un vecteur contient des objets de même mode Un vecteur est une structure qui permet de stocker plusieurs nombres par exemples dans une même variable Un vecteur peut être crée par la fonction vector() ou par la fonction c()

73 Création d’un vecteur avec la fonction c()
Les principaux attributs de R Création d’un vecteur avec la fonction c()

74 Création d’un vecteur avec la fonction rep()
Les principaux attributs de R Création d’un vecteur avec la fonction rep() La fonction rep() permet des répétitions de n fois le chiffre indiqué dans le vecteur en deuxième position

75 Création d’un vecteur avec la fonction seq()
Les principaux attributs de R Création d’un vecteur avec la fonction seq() La fonction seq() permet de générer des séries de nombres équidistants :

76 Création d’un vecteur avec l’opération double point « : »
Les principaux attributs de R Création d’un vecteur avec l’opération double point « : » L’opérateur double point : permet de générer des séries d’entiers, ascendantes ou descendantes:

77 Les principaux attributs de R
Mélanger les objets Quand différents objets sont mélangés dans un vecteur, une contrainte s’applique de telle sorte que tous les objets soient du même mode

78 Les principaux attributs de R
Contrainte explicite Les objets peuvent subir une contrainte explicite pour passer d’un mode à un autre en utilisant les fonctions qui commencent par « as » quand cela est possible

79 Questions Créer un vecteur de mode numérique nommé « nombre » contenant les valeurs suivantes: 12, 13, 14, 10 Créer un vecteur numérique contenant les 5 premiers chiffres dans une variable nommée « vec_nombre » de 3 manières Créer un vecteur de mode caractère nommé « mot » contenant les valeurs suivantes : a, b, c, d Créer un vecteur contenant 2 fois 35 et 4 fois 79 (sans à avoir saisir les nombres cités) Convertir le mode de « nombre » en mode caractères Créer une variable nommée « moyenne » à laquelle vous assigner la valeur de la moyenne du vecteur «nombre ». Procéder de differentes manières.

80 Réponses

81 Description avec la fonction summary()
Vecteurs: Description Description avec la fonction summary()

82 Vecteurs: Analyse et modification
L’indexation: L’indexation se fait par l’opérateur [] par des entiers positifs ou négatifs ou par des vecteurs logiques

83 Vecteurs: Analyse et modification
L’indexation: L’indexation se fait par l’opérateur [] aussi par des opérateurs logiques

84 Opérations arithmétiques
Vecteurs: Analyse et modification Opérations arithmétiques

85 Trouver la position d’un élément: la fonction which()
Vecteurs : Analyse et modification Trouver la position d’un élément: la fonction which()

86 Concaténer des vecteurs
Vecteurs: Analyse et modification Concaténer des vecteurs

87 Exercice 1 Créer le vecteur x=(101;102;...;112).
Créer un vecteur de longueur 12 formé de 4 fois la suite de nombres (4;6;3) nommé « Répétition ». Créer un vecteur composé de huit 4, de sept 6 et de cinq 3 nommé « Répétition.2 ». Extraire le deuxième élément du vecteur x. Extraire le 4ième et le 5ième élément du vecteur Répétition Extraire les éléments du vecteur Répétition.2 inférieur à 6 Remplacer l’élément du vecteur x à la position 3 par la valeur 113

88 Exercice 2 Saisir la variable poids contenant les 15 valeurs suivantes : 28; 27.5; 27; 28; 30.5; 30; 31; 29.5; 30; 31; 31; 31.5; 32; 30; 30.5. Saisir la variable poids1 contenant les 5 valeurs suivantes : 40; 39; 41; 37.5; 43. Sans refaire de saisie, créer la variable nouveau.poids contenant 20 valeurs (les 5 valeurs de poids1 répétées 2 fois et les 10 premières valeurs de poids). Etablir les valeurs minimale, maximale, mediane et moyenne ainsi que les quantiles du vecteur « nouveau.poids »

89 Les facteurs (Factors)

90 Les facteurs (Factors)
Les principaux attributs de R Les facteurs (Factors) Le facteur est un type de vecteur adapté aux variables qualitatives. Il est créé à partir vecteur de mode caractère. Un facteur est un vecteur qui contient toutes les valeurs qui peuvent être prises par les éléments du vecteur attribut (Level) Sa création se fait par la fonction factor() La fonction factor() considère les caractères comme les classes d’une variable qualitative. Dans « Levels », elle indique les différentes classes (par ordre alphabétique quand appliquée sur un vecteur de caractères)

91 Les facteurs (Factors)
Les principaux attributs de R Les facteurs (Factors)

92 Les facteurs (Factors)
Les principaux attributs de R Les facteurs (Factors) Très pratique pour la contingence, c’est-à-dire l’étude des effectifs dans les différentes classes d’une variable qualitative Les éléments peuvent être enregistrées en tant que chiffre de sorte qu’un chiffre corresponde à une classe de « Levels » en précisant à quelle classe est associé chaque chiffre à l’aide des arguments levels et labels

93 Création avec la fonction factor()
Les principaux attributs de R Création avec la fonction factor()

94 Création avec la fonction factor()
Les principaux attributs de R Création avec la fonction factor() Signaler un ordre dans le facteur: argument « ordered »

95 Questions Soit le vecteur suivant: couleur=c("bleu", "rouge", "rouge", "jaune", "bleu", "bleu", "jaune") Créer un facteur nommé « couleur_fac » à partir de ce vecteur. Créer un facteur nommé « fac_niveau » à partir du vecteur niveau=c(0,2,3,1,2,0,1) de telle façon que 0 correspond à faible, 1 à moyen, 2 à fort et 3 à très fort

96 Décrire un facteur avec la fonction summary()
Facteur: Description Décrire un facteur avec la fonction summary()

97 Indexation Facteurs: Analyse et modification
Les facteurs: Opérations et sélections Indexation

98 Facteurs : Analyse et modification
Les facteurs: Opérations et sélections Afficher et modifier les classes d’un facteur

99 Question Soit le vecteur suivant: couleur=c("bleu", "rouge", "rouge", "jaune", "bleu", "bleu", "jaune") Créer un facteur nommé « couleur_fac » à partir de ce vecteur. Créer un facteur nommé « fac_niveau » à partir du vecteur niveau=c(0,2,3,1,2,0,1) de telle façon que 0 correspond à faible, 1 à moyen, 2 à fort et 3 à très fort Afficher les niveaux (Levels) du facteur fac_niveau Extraire le deuxième niveau. Le modifier en « MOYEN » Afficher le fac_niveau modifié.

100 Les tableaux de données (data frames)

101 Les tableaux de données: Data frames
Les principaux attributs de R Les tableaux de données: Data frames Les data frames (série de valeurs en colonnes) peuvent être créées à partir de vecteurs ou à partir d’un fichier de données. Ce sont des objets à 2 dimensions (lignes et colonnes) . Toutes les colonnes doivent avoir la même longueur, de même toutes les lignes doivent avoir la même longueur. Les lignes et les colonnes peuvent avoir des longueurs différentes Les data frames ont pour vocation de stocker les différentes variables pour différents individus ou observations d’une population ou expériences Les colonnes sont systématiquement des variables et les individus sont représentées dans les lignes Une colonne porte par défaut un nom en X ou V suivi du numéro de colonne

102 Les tableaux de données: Data frames
Les principaux attributs de R Les tableaux de données: Data frames Le mode reste le même dans une colonne. Il peut changer entre les colonnes Les caractères ne sont plus indiqués entre guillemets car une colonne de caractères est considérée par défaut comme une variable qualitative. La colonne est de type « facteur » Sa création se fait par la fonction data.frame(), ou bien par read.table(), ou bien read.csv() Les data frames ont un attribut nommé row.names

103 Aperçu d’un tableau de données sous R
Les objets de données: Les tableaux de données Aperçu d’un tableau de données sous R Les variables Individu Hauteur Masse Couleur 1 NA Rouge 2 199 1431 Jaune 4 205 1468 5 173 1398 6 233 1622 Les individus

104 Créer un data frame avec la fonction data.frame()
Les principaux attributs de R Créer un data frame avec la fonction data.frame()

105 Création à partir de vecteurs
Les principaux attributs de R Création à partir de vecteurs

106 Renommer les lignes: attribut « row.names » ou la fonction rownames()
Les principaux attributs de R Renommer les lignes: attribut « row.names » ou la fonction rownames()

107 Création à partir de read.table()
Les principaux attributs de R Création à partir de read.table()

108 Questions Quelles sont les méthodes pour créer les tableaux de données sous R ? Créer un tableau de données à partir de 3 vecteurs contenant chacun 3 éléments: Un vecteur numérique nommé « nombre ». Un vecteur logique nommé « logique ». Un vecteur nommé « texte » et contenant les valeurs « a », «b », « c ». Renommer les lignes en « ligne1 », « lign2 », « ligne3 »

109 Description d’un tableau de données: summary()
Tableaux de données: Description Description d’un tableau de données: summary()

110 Les tableaux de données: Analyse et modification
Description : dim(), names(), dimnames()

111 Les tableaux de données: Analyse et modification
Renommer les colonnes: colnames()

112 Les tableaux de données: Analyse et modification
Renommer les lignes: rownames()

113 Les tableaux de données: Analyse et modification
Extraction avec l’opérateur [,] Syntaxe: nom_de_l’objet[ligne,colonne]

114 Les tableaux de données: Analyse et modification
Extraction avec l’opérateur []

115 Les tableaux de données: Analyse et modification
Extraction avec l’opérateur $ Syntxe: nom_de_l’objet$colonne

116 Les tableaux de données: Analyse et modification
Extraire selon une condition

117 Les tableaux de données: Analyse et modification
Modification des données

118 Les tableaux de données: Analyse et modification

119 Question Créer un tableau de données à partir de 3 vecteurs:
Un vecteur numérique contenant 10 valeurs numériques de 1 à 10 Un vecteur numérique contenant les valeurs 1 et 2 répétées 5 fois Un vecteur caractère contenant les 10 premières lettres de l’alphabet Renommer les colonnes comme suit: Vec10, Vec_Rep, Alapha Extraire les valeurs de la deuxième variable Extraire les éléments de la première ligne Extraire le deuxième élément de la 3ième variable Modifier cette valeur en majuscule

120 Récapituler

121 Les principaux attributs de R
Récapituler

122 Lire les données dans un fichier
Importer des données Lire les données dans un fichier Pour les lectures et les écritures dans des fichiers, R utilise le répertoire de travail Pour connaitre le répertoire courant: getwd() (get working directory) Pour modifier le répertoire courant: setwd() et connaitre le chemin d’accès Exemple: setwd(« C:/data ») ou setwd(« home/user/R ») Pour lire les données stockées dans des fichiers: read.table()

123 Règles d’écriture des données dans les fichiers
Ecrire dans un fichier Règles d’écriture des données dans les fichiers Ecriture de données avec les variables en colonnes, et les individus en lignes Respecter des règles d’écriture dans le fichier. Eviter les entêtes compliquées, les caractères spéciaux dans les noms de colonnes ainsi que dans les données (les slashs, les accents, les espaces, les virgules) Sous Excel, remplacer les virgules par des points, mais aussi: Réserver la première ligne aux noms des variables Chaque ligne suivante est un individu Si les individus possèdent un nom, écrire ce nom dans la première colonne Les données manquantes doivent être notées NA (Not available) et c’est le mot de R réservé aux données manquantes. Enregistrer votre fichier au format « texte » avec comme séparateur la tabulation (*.txt)

124 Règles d’écriture des données dans les fichiers
Ecrire dans un fichier Règles d’écriture des données dans les fichiers

125 Règles d’écriture des données dans les fichiers
Ecrire dans un fichier Règles d’écriture des données dans les fichiers Avec un éditeur de texte: Mêmes recommandations que précédemment Séparer les éléments de chaque ligne par une tabulation et une seule

126 Règles d’écriture des données dans les fichiers
Ecrire dans un fichier Règles d’écriture des données dans les fichiers

127 Ecrire dans un fichier Read.table()
read.table(file, header = FALSE, sep = "", quote = "\"'", dec = ".", row.names, col.names, as.is = FALSE, na.strings = "NA" , colClasses = NA, nrows = -1, skip = 0, check.names = TRUE, fill = !blank.lines.skip, strip.white = FALSE, blank.lines.skip = TRUE, comment.char = "#")

128 Enregistrer des données
Ecrire dans un fichier Enregistrer des données La fonction write.table() écrit dans un fichier un tableau de données ou autres types de données write.table(x, file = "", append = FALSE, quote = TRUE, sep = " " ,eol = "\n", na = "NA", dec = ".", row.names = TRUE, col.names = TRUE, qmethod = c("escape", "double"))

129 Petit glossaire


Télécharger ppt "TD/TP Modélisation: Introduction au langage R"

Présentations similaires


Annonces Google