La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Gestion de Fichiers Stockage Secondaire: Bandes Magnétiques et CD-ROMs.

Présentations similaires


Présentation au sujet: "Gestion de Fichiers Stockage Secondaire: Bandes Magnétiques et CD-ROMs."— Transcription de la présentation:

1 Gestion de Fichiers Stockage Secondaire: Bandes Magnétiques et CD-ROMs

2 2 Plan du cours daujourdhui Description des systèmes à bande magnétique Organisation des données sur bandes à neuf pistes Estimation de la longueur de bande requise Estimation du temps de transmission des données Disques versus bandes magnétiques Organisation physique des CD-ROMs Avantages et désavantages des CD-ROMs Le voyage dun octet Gestion de la mémoire tampon Entrée/sortie en unix (voir tutorial)

3 3 Systèmes à bande magnétique Pas daccès direct, mais accès séquentiel rapide Compactes, résistantes aux conditions environementales difficiles, facile à sauvegarder et transporter, meilleur marché que les disques Autrefois utilisees pour données dapplications Désormais tout dabord utilisées comme stockage darchives StorageTek (http://www.storagetek.com) est un leader mondial en système de BMshttp://www.storagetek.com

4 4 Systèmes à bande magnétique (suite) Exemples de cartouches (cartridge) de BMs: Modèle Capacité Taux de transfers StorageTek Redwood SD3 50 GB 10 MB/sec StorageTek SDLTP 110 GB 11 MB/sec StorageTek VOLSER 200 GB ?? MB/sec Exemples de lecteurs (tape drive) de cartouches: - TimberLine T9840B - T9840A - T9940B Plus de détails disponibles sur le site de StorageTek

5 5 Utilité des systèmes à BMs Une grande proportion dinformation critiques dune entreprise est stockée dans des sytèmes de messagerie électronique. Un systèmes de messagerie typique de 3000 utilisateurs génère jusquà un teraoctet de données par an ! Un admistrateur de sytème peut prendre jusquà 5-6 heures par semaines juste pour retrouver de vieux courriels, et environ 8 heures pour sauvegarder les couriels courants. Ainsi donc des systèmes darchivage performant sont requis pour résoudre ce problème de flots de courriels. Et les BMs sont souvent utiles ici.

6 6 Organisation des données sur BMs à neuf pistes Sur une bande la position logique dun octet dans le fichier correspond directement à sa position physique relative au début du fichier. La surface dune bande typique est un ensemble de piste paralleles (Fig. 3.11). Chaque piste représente une séquence de bits. Ces bits correspondent à 1 octet, plus un bit de parité. Un octet est une tranche de BM de largeur 1 bit appelée cadre (frame).

7 7 Organisation des données sur BMs à neuf pistes (suite) En parité impaire, le bit supplémentaire prend la valeur qui rend le nombre total de bits égal à 1 dans le cadre impair. Ceci est fait afin de vérifier la validité des données. Les cadres sont organisés en des blocs de données de taille variable et séparés par des espaces inter-blocs (qui sont assez long pour permettre au système à bande de sarreter et repartir).

8 8 Estimer la longueur de bande requise Soit b = longueur physique dun bloc de données g = longueur dun espace interbloc n = nombre de blocs de données s = montant despace requis pour stocker un fichier avec un nombre donnée denregistrements Nou avons: s = n X (b + g) b est calculé comme suit: b = (taille dun bloc (octets par bloc))/ (densité de la bande (octets par pouce))

9 9 Estimer la longueur de bande requise (suite) Le nombre denregistrements sauvegardés dans un bloc physique sappelle le facteur de bloc (blocking factor -- bf). La densité denregistrement effective est une mesure générale calculant leffet dun choix de taille de blocs différents: erd = (# octets par bloc) / (# pouces requis pour stocker un bloc) Conséquence: lutilisation de lespace (erd) dépend de la taille relative des blocs de données et des espaces interblocs: plus grand est le bf, et plus grand sera le erd.

10 10 Estimer le temps de transmission Taux de transmission nominal des données: nr = (densité de la bande (bpi)) X (vitesse de la bande (ips)) En prenant aussi les espaces interblocs en consideration, on obtient le taux de transmission effective: er = (erd (bpi)) X (vitesse de la bande (ips)) Autres facteurs influant sur la performance: taille de lespace interbloc, vitesse de la bande, densité de stockage, etc. Cependant, la taille du bloc est le facteur majeur car il est sous contrôle de lutilisateur

11 11 Disque versus bande magnétique Autrefois: aussi bien les disques que les BMs étaient utilisés pour le stockage secondaire. Les disques étaient préferés pour laccès direct et les BMs étaient meilleures pour laccès séquentiel. Maintenant (1): Les disques sont principalement utilisés pour le stockage secondaire, à cause du coût décroissant des disques et de la mémoire primaire. Maintenant (2): Les BMs sont utilisées pour le stockage tertiaire car elles sont très bon marché et car il est facile de transferer de large fichiers ou ensembles de fichier entre une BM et un disque.

12 12 Introduction aux CD-ROMs Un seul disque peut contenir plus de 18 gigabytes de données (~ livres de la taille de note manuel). Un CD-ROM est un disque optique de lecture seule. Cest-à-dire, cest un medium de publication plutôt quun pour stockage de données pour entrée et sortie comme les disques magnétiques. Avantages des CD-ROMs: grande capacité de stockage, bon marché, durée. Désavantages des CD-ROMs: performance de recherche (seek) très lente (entre ½ seconde et 1 seconde). Doù des structures de fichiers intelligentes sont absolument indispensables ici.

13 13 Organisation physique des CD-ROMs Les CD-ROMs sont des descendants des disques compacts audio. Comme écouter de la musique est une tâche séquentielle, elle ne demande pas daccès au hazard (random accès) aux données rapide. Lire les creux et les plateaux (pits and lands): Les CD-ROMs sont reproduits a partir dun disque maître en verre dont la couverture peut être changée par un rayon laser. Lorsque la couverture est developpée, les regions touchees par le rayon laser deviennent des creux (pits) tout au long de la piste suivie par le rayon. Les régions inchangées entre les creux sont des plateaux (lands).

14 14 Organisation physique des CD-ROMs (suite) Pour lire la copie imprimée du disque, un rayon laser est projetée sur la piste qui se déplace sous le rayon. Les creux dispersent le laser, mais les plateaux le réflettent presque entièrement jusquà sa source. Lalternance de réflection de grande et petite intensité est utilisée comme signal pour reconstruire linfo. digitale originale. Les 1s sont representés par la transition dun creux à un plateau et vice-versa. Les 0s sont representés par le lapse de temps entre les transitions. Plus il y a de temps entre deux transitions, plus il y a de 0s à cet endroit précis des données.

15 15 Organisation physique des CD-ROMs (suite) Dans ce procedé, il nest jamais possible davoir deux 1s adjacents: les 1s sont toujours séparés par des 0s. En fait, à cause des limitations physiques du procedés, il doit toujours y avoir au moins deux 0s entre une paire de 1s. Les motifs non traités de 1s et 0s doivent être traduits afin dobtenir des motifs de huit bits (un motif de 1s et de 0s) qui forment les octets des données originales.

16 16 Organisation physique des CD-ROMs (suite) Lencodage EFM (Eight to Fourteen Modulations) transforment les octets de données originaux en des motifs étendus de 14 bits qui peuvent être représentes dans les creux et les plateaux du CD (Voir Fig pour un exemple – look up table). Puisque les 0s sont representés par la longueur de temps entre deux transitions, le disque doit revolver à une vitesse précise et constante. Ceci affecte négativement le temps de recherche dun CD-ROM.

17 17 CLV versus CAV Les données sur un CD-ROM sont sauvegardées dans une seule piste organisée en spirale. Ceci permet aux données dêtre rangées de façon aussi serrée que possible puisque tous les secteurs ont la même taille (quils soient au centre ou sur les bords du disque). Dans larrangement regulier (sur un disque magnétique), les données sont rangées de manière plus dense au centre que sur les bords. De lespace est ainsi perdu sur les bords. Puisque la lecture des données nécessite un passage de la piste sous le systeme optique à une vitesse constante, le disque doit tourner plus lentement lorsque le bord du disque est lu que lorsque son centre est lu.

18 18 CLV versus CAV (suite) Le format CLV a une part importante de responsabilité dans la mauvaise performance de recherche des unités de CD-ROMs: il ny a pas de moyen direct de saute dun endroit à un autre. Une partie de ce problème est la nécessite de changer de vitesse de rotation. Afin de lire les informations sur les addresses qui sont sauvegardées sur le disque avec les données de lusager, il faut faire tourner la piste sous loeil optique à la bonne vitesse. Mais afin dajuster la vitesse, on doit être capable de lire linformation sur les addresses pour savoir où ces données sont placées. Comment se debarasser de ce cercle vicieux? Par essais et erreurs Ceci ralentit la performance du disque.

19 19 LAddressage Différent de la méthode de disque magnétique. Chaque seconde du temps découte dun CD est divisé en 75 secteurs. Chaque secteur contient 2 Kilooctets de données. Chaque CD-ROM contient au moins une heure découte. Le disque est capable de contenir 60 min * 60 sec/min * 75 secteurs/sec * 2 KiloOctet/secteur = 540,000 KiloOctets. Il est, en fait, souvent possible de sauvegarder plus de 600,000 Kilooctets. Les secteurs sont addressés par min:sec:secteur. Par exemple: 16:23:34.

20 20 Avantages/désavantages des CD-ROMs Performance de recherche: três mauvaise Taux de transfer des donnees: pas trop mauvais, pas excellent non plus; acceptable Capacité stockage: excellente Bénéfice: cela nous permet de construire des indexes et dautres structures de support qui peuvent nous aider à surmonter certaines des limitations associées avec la mauvaise performance des CD-ROMs Accès de lecture seulement: la structure du fichier ne changeant pas, il est facile doptimiser la gestion des fichiers Pas besoin dinteraction avec lusager

21 21 Le Voyage dun Octet Que se passe-t-il lorsque une instruction de programme comme write(textfile, P, 1) est executée? Comment un octet destiné être tocké sur un disque magnétique passe-t-il du programme à son emplacement définitif sur le disque? Linstruction appelle le système dexploitation (OS) qui surveille lopération. Le gestionnaire de fichiers (soccuppe de lentrée/sortie): vérifie que lopération est permise trouve la location physique à laquelle loctet sera mis en stockage (lunité de disque, le cylindre, la piste, le secteur) regarde si le secteur contenant le P est déjà en mémoire (sinon, appelle la mémoire tampon Entrée/Sortie). met P dans la mémoire tampon Entrée/Sortie garde le secteur en mémoire pour voir si dautres octets vont aller dans le même secteur.

22 22 Le Voyage dun Octet (suite) Le processeur dentrée/sortie attend quun chemin de données externe se libère (lunité centrale est plus rapide que les chemins de données, il y aura des delais) Controlleur de disque: Le processeur dentrée/sortie demande au controleur de disques si lunité de disque est prête à lécriture. Le controleur de disque donne des directives à lunité de disque pour quelle déplace sa tête de lecture/écriture jusquà la bonne piste et le bon secteur. Le disque révolve jusquau bon endroit et loctet est écrit.

23 23 Gestion de la mémoire tampon Quarrive-t-il aux données voyageant entre la région des données dun programme et le stockage secondaire? Lutilisation de mémoire tampon: La mémoire tampon permet de travailler avec une large quantité de données en mémoire primaire de manière à ce que le nombre daccès au stockage secondaire puisse être réduit.

24 24 Limitations de la mémoire tampon Supposons que le système a une seule mémoire tampon et alterne entre une opération décriture et une opération de lecture. Dans ce cas, le secteur contenant le caractère à lire est constamment effacé par le secteur contennant lemplacement dans lequel le caractère sera ècrit et vice- versa. Dans un cas pareil, le système a besoin de plus dune mémoire tampon: au moins une pour lentrée et lautre pour la sortie. Déplacer les données jusquau disque ou du disque à la mémoire prend beaucoup de temps et les programmes peuvent devenir limités par lentrée/sortie (IO Bound). Il faut donc trouver de meilleures stratégies afin déviter ce problème.

25 25 Strategies pour les mémoires tampon Mémoires tampon multiples Mémoires tampon double (Fig. 3.22) Mise en commun (pooling) de mémoires tampon Mode de déplacement (move mode): copier les données de lespace de données du programme dans le tampon Mode de répérage (locate mode): manipuler directement lespace tampon Disperse/regroupe Entrée/Sortie (scatter/gather)


Télécharger ppt "Gestion de Fichiers Stockage Secondaire: Bandes Magnétiques et CD-ROMs."

Présentations similaires


Annonces Google