2 Gestion des données en mémoire secondaire

Slides:



Advertisements
Présentations similaires
Module Systèmes d’exploitation
Advertisements

La Gestion de Fichiers 1. Concepts de base
Mémoire périphérique Stockage primaire: Mémoire principale (RAM)
Allocation de mémoire Allocation de mémoire.
8 Organisations unidimentionnelles : indexage et hachage
1 Organisations unidimentionnelles : indexage et hachage  Sélection basée sur une clé d'accès  recherche associative  Ex: Chercher le plant dont le.
Hachage et Indexation 1. Concepts de base
La Gestion des fichiers
22/04/2015© Robert Godin. Tous droits réservés.1 10 Évaluation des requêtes relationnelles n SQL – QUOI n Évaluateur de requêtes du SGBD – COMMENT – en.
7 Gestion des données en mémoire secondaire
Système de gestion fichiers
Chap 111 Chapitre 11 (suivi par Chap. 12) Systèmes de fichiers
Le système Raid 5 Table des matières Qu'est ce que le RAID ? Les objectifs Le raid 5 Les avantages et les inconvénients Les composants d’un Raid.
Adressage IP Page 1 L’adressage IP.
Les mémoires de l’ordinateur
Les Bases de données Définition Architecture d’un SGBD
Cours Initiation aux Bases De Données
Ce videoclip produit par l’Ecole Polytechnique Fédérale de Lausanne
Module de gestion des tournées de livraison
Construire des requêtes
Gestion de mémoire: objectifs
Ce videoclip produit par l’Ecole Polytechnique Fédérale de Lausanne
Ce videoclip produit par l’Ecole Polytechnique Fédérale de Lausanne
Les commandes du système de fichiers
Pointeurs et langage C.
Langage de manipulation de données (LMD)
Sous menu de l’application «micro» (‘IHM’)
Base de données: Généralité IFT6800 Jian-Yun Nie.
5 – PARALLELISME , ORDONNANCEMENT
Ce videoclip produit par l’Ecole Polytechnique Fédérale de Lausanne
Installation et Configuration Internet Information Server (IIS 5)
Accès aux fichiers en C.
Les bases de données et le modèle relationnel
Format des fichiers TIFF
Mini synthèse accès fichier en C
LE SYSTEME DE GESTION DE FICHIERS ISET KAIROUAN – /01/20181.
Révision finale GIF-1001 Ordinateurs: Structure et Applications, Hiver 2015 Jean-François Lalonde.
Module 1 : Introduction à l'infrastructure Active Directory.
13 Conception dans un contexte relationnel
4. IMPLEMENTATION DES STRUCTURES DE DONNEES
9 Méthodes multidimentionnelles et représentation d'associations
Dépendances entre les chapitre du Volume I et II
02- Evaluation Access 2003 Cette évaluation comporte des QCM (1 seule réponse) et des Zones à déterminer dans des copies d’écran.
Introduction en systèmes d’information et bases de données B.Shishedjiev -Introduction en BD 1.
Bases de données sous Access. Initiation aux bases de données  Structure d’une base de données.
6. CONCEPTION PHYSIQUE RELATIONNELLE
Chapitre 11 (suivi par Chap. 12)
Gestion des photos Organisation du disque dur, Navigation
5 Analyse avec Designer d'Oracle
Gestion de la mémoire GIF-1001 Ordinateurs: Structure et Applications, Hiver 2015 Jean-François Lalonde.
MPR - Le concept de réseau - 06
© Robert Godin. Tous droits réservés.
7 Gestion des données en mémoire secondaire
4 Méthodes multidimentionnelles et représentation d'associations
1. LE LANGAGE SQL DDL Version 2 - Janvier Le langage SQL-DDL
SyncoTM 200 Fonctionnement et mise en service
18 Bases de données parallèles et réparties
Introduction aux Bases de Données SGBDR Microsoft Access.
PRESENTATION ACCESS Editeur : Microsoft Environnement Windows (SE)
9 Méthodes multidimentionnelles et représentation d'associations
9 Méthodes multidimentionnelles et représentation d'associations
Les liaisons des données Sommaire Principe Les couches de liaison –LLC (Contrôle de Liaison Logique) –MAC (Contrôle d’Acces au Support) Mode de Communication.
Piles et files.
© Robert Godin. Tous droits réservés.
Listes Chaînées.
© Robert Godin. Tous droits réservés.
COURS ADMINISTRATION DE BASES DE DONNÉES IMPORT/EXPORT Karim LABIDI ISET Ch
1. LE LANGAGE SQL DDL Version 1 - Mai 2009 corrigé le 11/2/2011
DONNÉE DE BASE QM Manuel de formation. Agenda 2  Introduction  Objectif de la formation  Données de base QM: Caractéristique de contrôle Catalogue.
Les Commandes de base Linux. 1 L’aide sur les commandes Linux ◦ help : obtenir de l’aide pour une commande interne du shell. Elle permet aussi d'afficher.
Transcription de la présentation:

2 Gestion des données en mémoire secondaire Données persistantes en mémoire secondaire principalement le disque Organisation physique des données façon dont les données sont structurées en mémoire secondaire Méthode d'organisation des données structure de données particulière utilisée pour organiser les données en mémoire secondaire 17/11/2018 © Robert Godin. Tous droits réservés.

Critères d'évaluation des méthodes d'organisation Temps d'accès aux données par rapport à différentes méthodes d'accès Délai d'insertion et de suppression Occupation mémoire 17/11/2018 © Robert Godin. Tous droits réservés.

© Robert Godin. Tous droits réservés. Conception physique Choix des méthodes d ’organisation organisation sérielle organisation séquentielle indexage hachage organisation par grappe ... Schéma interne de la BD 17/11/2018 © Robert Godin. Tous droits réservés.

2.1 Principales caractéristiques des disques Unité de disque (disk pack ) ou disque 17/11/2018 © Robert Godin. Tous droits réservés.

© Robert Godin. Tous droits réservés. Capacité de Superbit capacitéDisque = nbSurfaces  nbCylindres  nbSecteursParPiste  tailleSecteur = 20 surfaces  1000 cylindres  50 secteurs par piste  512 octets = 512,000,000 octets  500,000 kilooctets(K)  500 mégaoctets (M) 17/11/2018 © Robert Godin. Tous droits réservés.

Transfert d ’un secteur unité d'adressage et de transfert minimal Adresse physique de secteur numéro de surface (noSurface), numéro de cylindre (noCylindre), numéro de secteur dans la piste (noSecteur) Adresse relative de secteur (noSecteurRelatif) dans l'intervalle [0..n-1] Tampon (buffer ) zone de la mémoire centrale où transitent les données de la mémoire secondaire 17/11/2018 © Robert Godin. Tous droits réservés.

© Robert Godin. Tous droits réservés. 2.1.1 Modèle simple d'estimation du coût d'une entrée/sortie (transfert) sur disque Temps de transfert (entrée/sortie) de n octets TempsESDisque(n) = TempsPosDébut + TempsTrans (n) TempsPosDébut = TempsDépBras + TempsRotation (10ms) TempsDépBras : 6-25 ms (6ms) TempsRotation : 4.18 à 8.35 ms = 60 à 120 tours/sec (4ms) TempsTrans(n) = n / TauxTransVrac TauxTransVrac = NombreOctetsPiste / TempsRotationComplète (2M/sec) ex: TempsTrans(2K) = 2K / 2M/sec = 1ms ex: TempsESDisque(2K) = 10ms + 1ms = 11ms Minimiser le nombre d'entrées/sorties en mémoire secondaire 17/11/2018 © Robert Godin. Tous droits réservés.

Importance de la contiguïté physique Ex: transfert de 2000 secteurs de 512 octets (1M) Secteurs consécutifs TempsESDisque(1M) = 10ms + 500ms = 510ms Secteurs dispersés aléatoirement TempsESDisque(un secteur) = 10ms + 0.25ms = 10.25ms Total = 2000  10.25 = 20500 ms = 20.5 secs Effet de grappe (clustering) regrouper physiquement selon patrons d ’accès logiques 17/11/2018 © Robert Godin. Tous droits réservés.

© Robert Godin. Tous droits réservés. 2.1.2 Contrôleur de disque Contrôleur de disque (disk controller ) processeur simple et indépendant de l'unité centrale de traitement DMA (« Direct Memory Access ») Interface du contrôleur : type de transfert (lecture ou écriture) adresse du premier secteur nombre de secteurs à transférer adresse du tampon Standards pour PC IDE/ATA, SCSI 17/11/2018 © Robert Godin. Tous droits réservés.

2.1.3 Autres types d'unité de mémoire secondaire Tableau comparatif des types de mémoire 17/11/2018 © Robert Godin. Tous droits réservés.

2.2 Fichiers et répertoires Système de gestion de fichier (SGF, file system) abstraction des mémoires secondaires sous forme d'un ensemble de fichiers Hiérarchie des répertoires (directory hierarchy) ou répertoire structure d ’arbre dossier, catalogue 17/11/2018 © Robert Godin. Tous droits réservés.

© Robert Godin. Tous droits réservés. Cas de UNIX Chemin du fichier (“ file path ”) /usr/degas/travaux/fibonacci.cpp Volume racine 17/11/2018 © Robert Godin. Tous droits réservés.

Descripteur de fichier (file descriptor ) Ensemble d ’attributs du fichier Nom du fichier Type de fichier Propriétaire Date de création Date de dernière modification Paramètres de protection Taille actuelle Taille maximale Référence à la table d'allocation des fichiers 17/11/2018 © Robert Godin. Tous droits réservés.

Descripteur de répertoire Ensemble d ’attributs du répertoire Nom du répertoire Type de répertoire Propriétaire Date de création Paramètres de protection Taille Collection de références aux sous-répertoires Collection de références aux fichiers sous ce répertoire 17/11/2018 © Robert Godin. Tous droits réservés.

Unité de mémoire secondaire logique /physique Partition du disque (“ disk partition ”) découper un disque en plusieurs partitions unité logique de mémoire secondaire Descripteur de disque partitions, hiérarchie des répertoires et fichiers maintenu sur disque 17/11/2018 © Robert Godin. Tous droits réservés.

© Robert Godin. Tous droits réservés. Services de base Ouvrir (IN cheminFichier, OUT idInterne,…) SGF crée une entrée dans la table des fichiers ouverts idInterne : référence à la table des fichiers ouverts mode d ’accès : lecture/écriture, accès direct/séquentiel, création ou fichier existe déjà ,… allocation d ’espace exceptions Fermer (IN idInterne, …) libère l ’entrée de la table des fichiers ouverts évacuer tampons 17/11/2018 © Robert Godin. Tous droits réservés.

© Robert Godin. Tous droits réservés. 2.3 Organisation par bloc Fichier ~ tableau de blocs (taille variable) LireBloc(IN idInterne, IN numéroBloc, OUT tamponApplication,…) ÉcrireBloc(IN idInterne, IN numéroBloc, IN tamponApplication,…) 17/11/2018 © Robert Godin. Tous droits réservés.

Bloc, page ou enregistrement physique Ensemble de bits d'une taille fixe habituellement n secteurs (1, 2, 4, 8,…) traduction bloc => secteur Unité de base de transfert de données Unité minimale d'allocation d'espace 17/11/2018 © Robert Godin. Tous droits réservés.

Allocation des secteurs aux blocs de Superbit Allocation par cylindre pour minimiser déplacement du bras 17/11/2018 © Robert Godin. Tous droits réservés.

Calcul d ’adresse relative du premier secteur d ’un bloc noSecteurRelatif (105) = noBloc (21)  nbSecteursParBloc (5) 17/11/2018 © Robert Godin. Tous droits réservés.

Calcul de l ’adresse physique du premier secteur du bloc noCylindre (0) = noSecteurRelatif (105) DIV nbSecteursParCylindre (1000) où nbSecteursParCylindre (1000) = nbSecteursParPiste (50)  nbSurfaces (20) noSurface (2) = (noSecteurRelatif (105) MOD nbSecteursParCylindre (1000)) DIV nbSecteursParPiste (50) noSecteur (5) = (noSecteurRelatif (105) MOD nbSecteursParCylindre (1000)) MOD nbSecteursParPiste (50) 17/11/2018 © Robert Godin. Tous droits réservés.

2.3.1 Allocation d'espace contigu au fichier Allocation en vrac à la création du fichier Croissance de la taille du fichier ??? Fragmentation externe 17/11/2018 © Robert Godin. Tous droits réservés.

2.3.2 Allocation dynamique d'espace par granule Granule d'allocation d'espace (segment, cluster, extent) unité d'allocation d'espace ensemble de blocs consécutifs Fragmentation du fichier (“file fragmentation ”) Défragmentation 17/11/2018 © Robert Godin. Tous droits réservés.

Table d'allocation des fichiers ( “fille allocation table - FAT ”) Ex: granule = 1 bloc Style DOS Allocation d ’espace chaînée Chargée en mémoire centrale 17/11/2018 © Robert Godin. Tous droits réservés.

Organisations plus sophistiquées pour la table d ’allocation UNIX arborescence de I-node Stratégie des frères jumeaux (“buddy system”) granules d'allocation d'espace de taille 2n fusion/division de granules voisins (jumeaux) 17/11/2018 © Robert Godin. Tous droits réservés.

© Robert Godin. Tous droits réservés. Couches de base 17/11/2018 © Robert Godin. Tous droits réservés.

2.3.3 Optimisation du déplacement du bras de lecture/écriture Algorithme de l'ascenseur (“SCAN”) Algorithme de balayage circulaire (“ C-SCAN ”) 17/11/2018 © Robert Godin. Tous droits réservés.

2.3.4 Taille optimale de bloc Grande taille => effet de grappe données transférées inutilement gaspillage d ’espace pour petits fichiers Compromis 512 octets à 4K pour applications traditionnelles >> pour entrepôt de données, multimédia 17/11/2018 © Robert Godin. Tous droits réservés.

2.3.5 Antémémoire (cache memory ) Mémoire intermédiaire Données fréquemment utilisées Réduire le temps moyen Antémémoire disque (disk cache) réalisée en mémoire centrale afin d'accélérer les entrées/sorties sur un disque 17/11/2018 © Robert Godin. Tous droits réservés.

Principe de l ’ antémémoire 17/11/2018 © Robert Godin. Tous droits réservés.

© Robert Godin. Tous droits réservés. Antémémoire Gestionnaire de l'antémémoire disque (“disk cache manager ”) 17/11/2018 © Robert Godin. Tous droits réservés.

Écriture en antémémoire 17/11/2018 © Robert Godin. Tous droits réservés.

Sélection d ’une victime Processus #1: lire Bloc 3 et antémémoire pleine ! Choix d ’une victime pour remplacement: Bloc 2 ’ qui est sale (s = 1) Évacuation de la victime 17/11/2018 © Robert Godin. Tous droits réservés.

Remplacement de la victime 17/11/2018 © Robert Godin. Tous droits réservés.

Stratégie de remplacement Maximiser la probabilité d ’accès en antémémoire Remplacer le tampon le moins récemment utilisé (Least Recently Used (LRU)) Remplacer le tampon le moins fréquemment utilisé (Least Frequently Used (LFU)) 17/11/2018 © Robert Godin. Tous droits réservés.

© Robert Godin. Tous droits réservés. Hiérarchie de mémoire Hierarchical Storage Management migration automatique entre niveaux contrôlée par paramètres de configuration 17/11/2018 © Robert Godin. Tous droits réservés.

2.4 Organisation par enregistrements Enregistrement (record ), champ (field ) 17/11/2018 © Robert Godin. Tous droits réservés.

Niveau 4 : enregistrement 17/11/2018 © Robert Godin. Tous droits réservés.

Méthode et chemin d ’accès Méthode d'accès (“ access method ”) ou mode d'accès manière d'accéder d'un point de vue logique sériel, séquentiel, sélection par clé, par intervalle Chemin d'accès (“ access path ”) chemin dans les structures de données 17/11/2018 © Robert Godin. Tous droits réservés.

© Robert Godin. Tous droits réservés. Méthode d'accès sériel Patron d ’itérateur Ordre => séquentiel 17/11/2018 © Robert Godin. Tous droits réservés.

© Robert Godin. Tous droits réservés. Méthode d'accès par sélection basée sur un identifiant d'enregistrement Identifiant d ’enregistrement (IDE) accès rapide 17/11/2018 © Robert Godin. Tous droits réservés.

Méthode d'accès par sélection basée sur une clé d'accès Clé d'accès (“ access key ”) champ ou combinaison de champs utilisés comme critère de sélection Clé simple/composée Clé unique (“ unique key ”) Sélection par intervalle Méthode d ’accès multidimensionnelle 17/11/2018 © Robert Godin. Tous droits réservés.

2.4.1 Organisation primaire et secondaire Organisation primaire (primary organization) placement des enregistrements sériel, séquentiel, index primaire, hachage, grappe, ... gestion des IDE Organisation secondaire (secondary organization ) liste , arbre, index secondaire, etc. référence aux IDE 17/11/2018 © Robert Godin. Tous droits réservés.

© Robert Godin. Tous droits réservés. 2.4.2 Fichier homogène (homogeneous) ou hétérogène (heterogeneous) 2.4.3 Niveau 4 : SGF ou SGBD 17/11/2018 © Robert Godin. Tous droits réservés.

2.4.4 Alternatives de réalisation de l'IDE idFichier, NER l'adressage relatif (e.g. organisation “relative” de NON STOP SQL) l'indexage (e.g. organisation “key sequenced” sur “SYSKEY” de NON STOP SQL) idFfichier, #bloc, #séquence (e.g. DBKEY DBMS-32 (CODASYL), ROWID ORACLE). idFichier, #bloc, #octet (e.g. “entry-sequenced” de NON STOP SQL) idFichier, clé unique (e.g. “key-sequenced” de NON STOP SQL) IDE logique (e.g. OID dans les SGBDO) 17/11/2018 © Robert Godin. Tous droits réservés.

2.4.5 Représentation interne des enregistrements Enregistrements => blocs Séquence consécutive d ’octets Taille fixe ou variable 17/11/2018 © Robert Godin. Tous droits réservés.

2.4.5.1 Enregistrements de taille fixe Chaque champ => nombre fixe d ’octets Remplissage par caractère neutre 17/11/2018 © Robert Godin. Tous droits réservés.

2.4.5.2 Enregistrements de taille variable Frontières de champs et d ’enregistrements indicateur de taille en entête de chaque champ (descripteur de champ) délimiteur (code réservé) index en entête de l'enregistrement (descripteur d'enregistrement) 17/11/2018 © Robert Godin. Tous droits réservés.

© Robert Godin. Tous droits réservés. 2.5 Allocation sérielle d'espace pour les enregistrements de taille fixe et l'adressage relatif Allocation d'espace sérielle (serial space allocation) avec/sans chevauchement de bloc Facteur de blocage (FB, blocking factor) nombre d'enregistrements par bloc Numéro de bloc = NER / FB Position relative dans le bloc = NER MOD FB  taille d'un enregistrement NER = champ ? IDE = idFichier, NER Gros enregistrement : chevauchement 17/11/2018 © Robert Godin. Tous droits réservés.

Liste des espaces libres (free list) 17/11/2018 © Robert Godin. Tous droits réservés.

2.6 Allocation d'espace pour les enregistrements de taille variable Analogue à l ’allocation d ’espace pour les fichiers Granularité plus fine 17/11/2018 © Robert Godin. Tous droits réservés.

2.6.1 Allocation sérielle pour enregistrements de taille variable Gestion d ’espace libre ne pas récupérer liste libre mieux ajusté premier ajusté Fragmentation interne au fichier IDE = idFichier, #bloc, #octet enregistrement cloué 17/11/2018 © Robert Godin. Tous droits réservés.

2.6.2 Récupération d'espace et adressage structuré par bloc IDE = idFichier, #bloc, #séquence (clouage partiel) Suppression de #2 17/11/2018 © Robert Godin. Tous droits réservés.

2.6.3 Gestion des débordements Même IDE Oracle : PCTFREE 17/11/2018 © Robert Godin. Tous droits réservés.

Découpage de l ’enregistrement Cas particulier : adresse de suivi (forwarding address) 17/11/2018 © Robert Godin. Tous droits réservés.

© Robert Godin. Tous droits réservés. 2.6.4 Adressage logique IDE découplé de sa position physique Souplesse d ’allocation d ’espace Ex: OID dans les BD objet 17/11/2018 © Robert Godin. Tous droits réservés.

2.6.5 Découpage en morceaux de taille fixe Découper un enregistrement de taille variable en morceaux de taille fixe Allocation des morceaux par adressage relatif 17/11/2018 © Robert Godin. Tous droits réservés.

2.6.6 Allocation d'espace pour gros enregistrements de taille variable Allocation chevauchante blocs consécutifs diminuer le nombre de positionnements Réalisation de l ’IDE adressage logique adresse de suivi 17/11/2018 © Robert Godin. Tous droits réservés.

2.6.7 Allocation hybride pour les enregistrements de taille variable Organisations spécialisées selon la taille des champs un mécanisme pour petits champs un autre pour les gros champs référence externe (e.g. chemin, URL) 17/11/2018 © Robert Godin. Tous droits réservés.

2.7 Allocation sérielle par grappe homogène Grappe (cluster) ensemble d ’enregistrements regroupés physiquement Clé de la grappe (cluster key) critère de regroupement ensemble de champs Identifiant de grappe (IDG, cluster identifier) IDG = #bloc, valeur de la clé de grappe 17/11/2018 © Robert Godin. Tous droits réservés.

Exemple : insertion avec idMembre = 2 17/11/2018 © Robert Godin. Tous droits réservés.

Exemple : insertion avec idMembre = 1 17/11/2018 © Robert Godin. Tous droits réservés.

Exemple : insertion avec idMembre = 3 17/11/2018 © Robert Godin. Tous droits réservés.

2.7.1 Réservation d'espace pour les grappes Limiter débordements ex: SIZE (Cluster Oracle) Sans réservation d ’espace Avec réservation d ’espace 17/11/2018 © Robert Godin. Tous droits réservés.

© Robert Godin. Tous droits réservés. Résultat final Sans réservation d ’espace Avec réservation d ’espace 17/11/2018 © Robert Godin. Tous droits réservés.

© Robert Godin. Tous droits réservés. 2.8 Fichiers séquentiels Enregistrements ordonnés (clé de tri) Mise à jour difficile 17/11/2018 © Robert Godin. Tous droits réservés.