Structures de données avancées : Principales structures de fichiers

Slides:



Advertisements
Présentations similaires
Structures de données avancées : MLH (Multidimensional linear hashing)
Advertisements

Module Systèmes d’exploitation
Optimisation des requêtes
Structures de données avancées : Principales structures de fichiers
Structures de données avancées : B arbres
Structures de données avancées : Principales structures de données
Structures de données avancées : MBT ( Multidimensional B-trees )
Structures de données avancées : MTH ( Multidimensional trie hashing )
Structures de données avancées : Introduction
Chap. 4 Recherche en Table
Witold Litwin Structures physiques Witold Litwin
Chap. 1 Structures séquentielles : listes linéaires
Cours 8 Arbres équilibrés
Structures collectives en Java
Cours 7 - Les pointeurs, l'allocation dynamique, les listes chaînées
Structures de données linéaires
Chapitre V. Tables de hachage
Algorithmes Branch & Bound
II. Chaînage, SDD séquentielles
Bases de données lexicales
Indexation 1. Concepts de base 2. Arbre B 3. Indexes secondaires.
Sections sélectionnées du Chapitre 11
Les fichiers indexés (Les B-arbres)
LA STRUCTURE D'ARBRE-B Institut National des Sciences Appliquées – Rouen Département Architecture des Systèmes d’Information.
LES ARBRES IUP 2 Génie Informatique
Structures de données IFT-2000 Abder Alikacem Standard Template library Édition Septembre 2009 Département dinformatique et de génie logiciel.
Structures de données IFT-10541
Gestion de Fichiers Indexes basés sur les structures d’arbres binaires et indexes à niveaux multiples.
Indexes à Arbres et Indexes à Hachage
Gestion de Fichiers Tri Interne Efficace et Tri Externe.
Gestion de Fichiers Hachage Extensible.
1 Survol du Stockage et de lIndexage Chapitre 8. 2 Objectifs Stockage persistant Organisation des fichiers Fichiers de données Fichiers dindexes Operations.
Indexes à Arbres et Indexes à Hachage
Database Management Systems 3ed, R. Ramakrishnan and J. Gehrke1 Survol du Stockage et de lIndexage Chapitre 8.
Organisation des Fichiers pour la Performance
IFT-2000: Structures de données Piles et files Dominic Genest, 2009.
Index multi-niveaux dynamiques (les B-arbres et les B-arbres+)
Structures de données avancées : Hachage dynamique
Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Structures de données avancées : Introduction
Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Gestion de Fichiers GF-8: Organisation des Fichiers pour l’Amelioration de la Performance (Base sur la section de Folk, Zoellick & Riccardi, File.
Arbres binaires et tables de hachage
II. Chaînage, SDD séquentielles
Structures de données avancées : Fichiers uni-dimensionnels Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
GF-11: Tri Interne Efficace et Tri Externe
Structures de données avancées : MBT ( Multidimensional B-trees )
Structures de données avancées : Concepts du Multidimensionnel D. E ZEGOUR Institut National d ’Informatique.
Structures de données avancées : Fichiers multidimensionnels Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI) zegour.esi.dz
La Gestion des fichiers
Structures de données avancées : LH (Hachage linéaire) D. E ZEGOUR Institut National d ’Informatique.
B.Shishedjiev - Modèle relationnel
1 Survol du Stockage et de l’Indexage Chapitre 8.
Structures de données avancées : B arbres
Les vues Une vue: c’est une relation virtuelle. Définie par:
Structures de données avancées : Variantes des B arbres
1 UMLV  FICHIERS Mémoire de masse découpée en blocs Fichier :liste chaînée de blocs, ou arbre de blocs (répertoires - fichiers)‏ Bloc d’éléments Bloc.
Structures de données avancées TH ( Hachage digital ) D. E ZEGOUR Institut National d ’Informatique.
06/04/06 LES BASES DE DONNEES INTRODUCTION CogniTIC – Bruxelles Formation - Cepegra.
Structures de données avancées : LH* D. E ZEGOUR Institut National d ’Informatique.
Structures de données avancées : Arbres B+ avec expansion partielle D. E ZEGOUR Institut National d ’Informatique.
Structures de données avancées : MLH (Multidimensional linear hashing) D. E ZEGOUR Institut National d ’Informatique.
Structures de données avancées : Introduction D. E ZEGOUR Institut National d ’Informatique.
Structures de données avancées : Principales structures de données
Structures de données avancées : Hachage dynamique
Gestion de Fichiers Construction d’Indexes. 2 Plan du cours de la semaine Vue Générale Un indexe pour les fichiers à entrées séquentielles Opérations.
Structures de données avancées : MTH ( Multidimensional trie hashing ) D. E ZEGOUR Institut National d ’Informatique.
 Chaînage et LSC : motivation et principe Manipuler la LSC : exemples Variantes : LDC, liste circulaire, … Etude de cas : réalisation d’un buffer clavier.
Raison d'être de la structure de fichiers : Les premiers travaux : Début des années 1960 : En 1963 : Près de 10 ans plus tard... (à peu près 1973) : Durant.
Ali walid A-2002 Plan: Fichier d’organisation séquentielle indexée (index statique)... 1 – Introduction 2 - La technique de l’accès indexé : 2 – 1 - Les.
Transcription de la présentation:

Structures de données avancées : Principales structures de fichiers ZEGOUR Institut National d ’Informatique

Les principales structures de fichiers Structures simples de fichiers . Tableau de blocs . Liste linéaire chaînée de blocs Remarques L'organisation du fichier est quelconque (format fixe ou variable) Si fichier ordonné : chargement initial à 60-70%. ==> économiser les décalages intra-blocs. limitées à des petits fichiers. ( < 6 accès disque)

Les principales structures de fichiers Structures simples de fichiers Vue macroscopique Tableau Liste Ordre Sans Ordre Vue microscopique Variable Fixe Chevauchement Sans Chevauchement Structures de fichiers : TOF, L^OVC, T^OV^C, …..

Les principales structures de fichiers Les méthodes d'index Utilise un index(recherche dichotomique en mémoire). 2 fichiers sont utilisés : fichier d'index et fichier au données. En règle générale, le fichier de données n'est pas trié. Il peut être un tableau ou une liste linéaire chaînée de blocs sur le disque. Le fichier d'index est supposé en mémoire et est trié selon les clés des articles.

Les principales structures de fichiers Les méthodes d'index Index à un niveau Table de couples(clé, adresse) en mémoire centrale. Recherche : a) Recherche dichotomique sur l'index. b) Si clé trouvée, ramener le bloc en mémoire centrale c) Si article à cheval sur deux blocs, ramener le deuxième bloc Insertion a) Si clé non trouvée dans l'index, il y a insertion avec décalages. b) l'article est inséré en fin de fichier.

Les principales structures de fichiers Les méthodes d'index Index à un niveau Suppression Généralement logique ==> extrêmement rapide. Réorganisation Éliminer physiquement les articles supprimés. Généralement, on construit un autre fichier.

Les principales structures de fichiers Index à un niveau

Les principales structures de fichiers Les méthodes d'index Index à 2 niveaux Principe . Accélérer la recherche en mémoire centrale . Deux tables ( niveaux 1 et 2) . Dans l'index du niveau 1, on range certaines clés : 100-ième, 200-ième,... . Dans le niveau 2, on range toutes les clés. Recherche : . Niveau 1 donne un intervalle de l'index du niveau 2. . Recherche dichotomique sur l'intervalle sélectionné.

Les principales structures de fichiers Les méthodes d'index Remarque : deux recherches dichotomiques sur petits vecteurs sont beaucoup plus rapides qu'une seule recherche dichotomique sur un seul grand vecteur. Autres Opérations: analogues à celles définies sur l'index à un niveau

Les principales structures de fichiers Index à deux niveaux

Les principales structures de fichiers Accès séquentiel indexé Définition a) pour localiser un article on utilise un index. b) pour avoir le suivant, on ne repasse pas par l'index.

Les principales structures de fichiers Les méthodes d'index Limitation Si l'index est large pour être contenu en mémoire (i) recherche binaire chère et (ii) réarrangement coûteux à cause des décalages) on a recours à d'autres techniques : Hachage : extrêmement rapide (entre 1 et 2 accès disque) efficaces que pour les fichiers statiques et non ordonnés. Arbres : rapides (3 accès disque ) ordonnés Certaines sont très adaptées pour les fichiers dynamiques.

Les principales structures de fichiers Accès multicritères Concepts Un article = (cle1, cle2 ...cléd) Une clé primaire et d-1 clés secondaires Récupérer l'article par plusieurs clés Exemples de requêtes : Livres parus en 1973, Livres parus en 1973 de l'auteur X donné. Solution Créer des indexes secondaires pour chaque attribut Passer toujours par l'index primaire.

Les principales structures de fichiers Accès multicritères Organisation d'un index secondaire "listes inversées". ( clé secondaire ==> clé primaire ==> article )

Les principales structures de fichiers Accès multicritères Algorithme qui Récupère les articles possédant l'attribut X l'attribut Y. Il existe donc des indexes sur X et Y L' index sur X donne l'ensemble des clés primaires avec l'attribut X. L'index sur Y donne l'ensemble des clés primaires avec l'attribut Y. L'intersection donne l'ensemble des clés primaires ayant l'attribut X et Y. Pour chaque élément de cet ensemble, on fait alors un accès disque.

Les principales structures de fichiers Accès multicritères Suppression : ===> Ne pas toucher aux indexes secondaires (CAR les clés secondaires référencent les clés primaires) Recherche : C'est dans l'index primaire qu'on s'aperçoit que l'article à été supprimé.

Les principales structures de fichiers Les méthodes d'arbres Si le fichier est très volumineux, on ne peut garder l'index en RAM. Garder l'index en mémoire secondaire coûte chère car : 1) la recherche dichotomique exige beaucoup d'accès disque 2) il faut maintenir l'index ordonné  Trouver une meilleure façon de faire les insertions et les suppressions d'articles avec seulement une réorganisation locale.

Les principales structures de fichiers Les méthodes d'arbres Utilisation d'un arm comme méthode d'accès L'arbre de recherche m-aire est surtout utilisé pour le stockage en mémoire externe Un nœud de l'arbre est alors un bloc sur le disque. A un moment donné seule une page est ramenée en mémoire. Nécessite des buffers de taille très grande( ordre de 200).

Les principales structures de fichiers Les méthodes d'arbres Implémentation Utilisation des fils explicites Deux façons de ranger les articles : (i) dans les nœuds avec les clés, (fichier = arm) (ii) séparément. pointeur additionnel vers l'information. (fichier = index vers un fichiers de données ) Si le fichier est grand on préfère de loin utiliser (ii) même si on fait une lecture supplémentaire pour retrouver l'article.

Les principales structures de fichiers Les méthodes d'arbres Le problème de taille ne se pose plus Inconvénient : déséquilibre de l’arm Pas de solution  Réorganisation périodique Destinés pour les fichiers statiques