8PRO107 Éléments de programmation Les chaînes de caractères
Les caractères En informatique, les caractères sont très importants puisqu’ils sont utilisés pour la communication personne-machine. Puisque les ordinateurs ne peuvent manipuler que des séquences de bits, les caractères doivent être encodés en binaire. Un des codes les plus utilisés est le code ASCII. Chaque caractère est encodé à l'aide de 8 bits : ce qui donne 256 possibilités.
Code ASCII
Code ASCII étendu
Les constantes de type caractère En C++, une constante de type caractère est un nombre entier écrit sous la forme d’un caractère entre apostrophes, comme 'a'. La valeur d’une constante de type caractère est égale à la valeur du caractère d’après le jeu de caractère de la machine (ex. ASCII). Exemples: 'a' vaut 97 'A' vaut 65 'B' vaut 66 '0' vaut 48 (le chiffre zéro)
Les séquences d’échappement '\a' caractère d’alerte (sonnerie, bell) '\b' retour en arrière (backspace) '\f' saut de page (formfeed) '\n' fin de ligne (newline) '\r' retour de chariot (carriage return) '\t' tabulation horizontale '\v' tabulation verticale '\\' backslash '\?' point d’interrogation '\'' apostrophe '\"' guillemet '\0oo' nombre octal '\xhh' nombre hexadécimal
Les constantes de type chaîne Une constante de type chaîne est une séquence de caractères, éventuellement vide, placée entre guillemets. Exemple: "Je suis une chaîne" "Bonjour groupe!\n" Note: Les guillemets ne font pas partie de la chaîne. "\"Je suis une chaîne\"" (lorsque l’on veut les guillemets)
Les variables de type caractère Pour déclarer une variable de type caractère (char), on procède de la façon suivante: char c1; /* c1 est une variable de type caractère */ char c2 = 'a'; /* c2 est une variable de type caractère initialisée à 'a' */
Les entrées et sorties #include <iostream> int main () { char c ; std::cin >> c ; std::cout << c ; return 0 ; } #include <stdio.h> /* en C */ int main () { char c ; c = getchar() ; putchar(c) ; return 0 ; }
Les entrées et sorties Le fichier d’en-tête stdio.h: Contient la déclaration des fonctions standards d’entrée et de sortie (en C) Contient aussi la définition de EOF (End Of File). int getchar(void) Retourne le caractère suivant (converti en un int). retourne EOF si la fin du fichier est atteinte ou si une erreur survient. int putchar(char c) Écrit le caractère c. Retourne le caractère écrit ou bien EOF en cas d’erreur.
Exemple 1: Copier des fichiers #include <stdio.h> /* copie l’entrée sur la sortie, première version */ int main() { int c ; c = getchar() ; while (c != EOF) putchar(c) ; }
Exemple 1: Copier des fichiers #include <stdio.h> /* copie l’entrée sur la sortie, première version */ int main() { int c ; c = getchar() ; while (c != EOF) putchar(c) ; c = getchar(); } #include <iostream> /* version C++ */ int main() { char c ; c = std::cin.get() ; while (c != EOF) std::cout << c; c = std::cin.get(); }
Exemple 1: Copier des fichiers #include <stdio.h> /* copie l’entrée sur la sortie, première version */ int main() { int c ; c = getchar() ; while (c != EOF) putchar(c) ; } #include <iostream> /* version C++ */ int main() { char c ; c = std::cin.get() ; while (c != EOF) std::cout << c; c = std::cin.get(); } #include <iostream> int main() { char c ; std::cin.get(c) ; while (! std::cin.eof()) std::cout.put(c) ; }
Exemple 1: Copier des fichiers #include <stdio.h> /* copie l’entrée sur la sortie, première version */ int main() { int c ; c = getchar() ; while (c != EOF) putchar(c) ; } Pourquoi un int?
Qu'est-ce que EOF? Supposons que le fichier contienne trois entiers : 32 8 15
Qu'est-ce que EOF? Supposons que le fichier contienne trois entiers : 32 8 15
Qu'est-ce que EOF? Supposons que le fichier contienne trois entiers : 32 8 15
Qu'est-ce que EOF? Supposons que le fichier contienne trois entiers : 32 8 15
Exemple 1: Copier des fichiers La valeur retourné par getchar() peut être un des 256 caractères ASCII OU la valeur EOF La fonction getchar() peut donc retourner 257 valeurs possibles. Mais un char est un entier de 8 bits et ne peut donc représenter que 256 valeurs possibles. On doit donc utiliser plus de bits (et donc un int) pour faire la différence entre un caractère et EOF.
Exemple 1: Copier des fichiers Sur SUNENS un int est un entier de 32 bits et EOF s’écrit en binaire de la façon suivante: 11111111111111111111111111111111 32 bits Losrque l’on met EOF dans une variable de type char on ne met que les 8 premiers bits, c’est-à-dire 11111111 = 255 Le caractère dont la valeur est 255 est: ÿ
Exemple 1: Copier des fichiers #include <stdio.h> /* copie l’entrée sur la sortie, seconde version */ int main () { int c ; while ( (c = getchar()) != EOF ) putchar(c) ; } #include <iostream> int main () { char c ; while ( std::cin.get(c) ) std::cout.put(c) ; }
Exemple 2: Compter les caractères #include <stdio.h> /* La fonction nbCar compte les caractères en entrée */ int nbCar () { int nc ; nc = 0 ; while ( getchar() != EOF ) nc = nc + 1 ; return nc ; } #include <iostream> int nbCar () { int nc = 0 ; while ( std::cin.get() ) nc = nc + 1 ; return nc ; }
Exemple 3: Compter les lignes #include <stdio.h> /* La fonction nbLignes compte les lignes en entrée */ int nbLignes () { int c, nl ; nl = 0 ; while ( (c = getchar()) != EOF ) if ( c == '\n' ) /* En fait, on compte le nombre de */ nl = nl + 1 ; /* changements de ligne */ return nl ; }
Exemple 3: Compter les lignes #include <stdio.h> /* La fonction nbLignes compte les lignes en entrée */ int nbLignes () { int c, nl ; nl = 0 ; while ( (c = getchar()) != EOF ) if ( c == '\n' ) /* En fait, on compte le nombre de */ nl = nl + 1 ; /* changements de ligne */ return nl ; } #include <iostream> int nbLignes () { int c, nl = 0 ; while ( std::cin.get(c) ) if ( c == '\n' ) nl = nl + 1 ; return nl ; }
Exemple 4: Compter les mots #include <stdio.h> #define DEDANS 1 /* à l’intérieur d’un mot */ #define DEHORS 0 /* à l’extérieur d’un mot */ /* La fonction nbMots compte les mots en entrée */ int nbMots () { int c, nm, etat; nm = 0; etat = DEHORS; while ( (c=getchar()) != EOF ) if ( (c == '\n') || (c == ' ') || (c == '\t') ) else if (etat == DEHORS) etat = DEDANS; nm = nm + 1; } return nm;
ctype.h Le fichier d’en-tête ctype.h contient la déclaration de fonctions destinées à tester les caractères: isdigit(char c) retourne 1 si c est un chiffre, 0 sinon islower(char c) retourne 1 si c est une lettre minuscule, 0 sinon isupper(char c) retourne 1 si c est une lettre majuscule, 0 sinon isalpha(char c) retourne 1 si c est une lettre, o sinon isspace(char c) retourne 1 si c est un character d'espacement, 0 sinon isalnum (char c) retourne 1 si c est un chiffre ou une lettre, 0 sinon isprint (char c) retourne 1 si c est un caractère imprimable, 0 sinon ispunct (char c) retourne 1 si c est un caractère de ponctuation, 0 sinon iscntrl (char c) retourne 1 si c est un caractère de contrôle, 0 sinon isgraph (char c) retourne 1 si c est un caractère graphique, 0 sinon et plusieurs autres.
Exemple 5: isdigit(c) int isdigit(char c) { return ( (c >= '0') && (c <='9') ) ; }
Exemple 6: islower(c) int islower(char c) { return ( (c >= 'a') && (c <='z') ) ; }
Exemple 7: isupper(c) int isupper(char c) { return ( (c >= 'A') && (c <='Z') ) ; }
Exemple 8: isalpha(c) int isalpha(char c) { return ( islower(c) || isupper(c) ) ; }
Remarques Les exemples 5 à 8 pourraient ne pas fonctionner correctement sur un système utilisant un code autre que ASCII Dans ctype.h, ces fonctions prennent un int comme paramètre.
Les chaînes de caractères En C il n’y a pas de variable de type chaîne de caractères. Une chaîne de caractère est un tableau de caractères se terminant par le caractère \0 (le caractère nul ayant la valeur 0) Ainsi la chaîne “Bonjour groupe!” serait représentée de la façon suivante: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 B o n j o u r g r o u p e ! \0
Exemple 9: Lire une ligne /* lireLigne: lit une ligne, la met dans s et retourne sa longueur qui doit être au plus lim-1 */ int lireLigne( char s[], int lim ) { int c, i; for ( i=0; i< lim-1 && (c=getchar())!=EOF && c!='\n'; i=i+1 ) s[i] = c; if ( c == '\n' ) s[i]='\0'; i = i + 1; } return i;
Exemple 10: Copier une chaîne /* copier: copie le tableau ‘de’ dans le tableau ‘vers’ ; on supose que le tableau vers est assez long */ void copie( char de[], char vers[]) { int i; i = 0; while ( (vers[i] = de[i]) != '\0‘ ) i = i + 1; }
Exemple 11: Comparer 2 chaînes /* compare: Retourne -1, 0, ou 1 selon que chaine1 est lexicographiquement plus petite, égale ou plus grande que chaine2. void compare( char chaine1[], char chaine2[]) { int i; i = differe_ou(chaine1, chaine2); /* differe_ou retourne la première position où chaine1 et chaîne2 diffèrent. */ if ( chaine1[i] < chaine2[i] ) return -1; else if ( chaine1[i] > chaine2[i] ) return 1; else return 0; }
Exemple 11: Comparer 2 chaînes /* differe_ou: Retourne la première position où chaine1 et chaîne2 diffèrent. Retourne la position du caractère '\0' si les deux chaînes sont égales. */ int differe_ou ( char chaine1[], char chaine2[] ) { int i = 0; while ( chaine1[i] != '\0' && chaine1[i] == chaine2[i] ) i = i + 1; return i; }
Exemple 12: Initialiser une chaîne char mot1[80]="bonjour"; char mot2[80]={'b', 'o', 'n', 'j', 'o', 'u', 'r', '\0'}; for ( i=0; mot1[i]; i++ ) putchar(mot1[i]); for ( i=0; mot2[i]; putchar(mot2[i++]) ) ;
string.h Le fichier d’en-tête string.h contient des déclarations de fonctions permettant de manipuler des chaînes de caractères. char* strcpy(char[], char[]) copie la première chaine dans la seconde char* strcat (char[], char[]) concatène les deux chaînes int strcmp (char[], char[]) compare deux chaînes int strlen (char[]) retourne la longueur d’une chaîne et beaucoup d’autres.
Exemple 13: Chercher un mot