Structures de données avancées : Principales structures de fichiers

Slides:



Advertisements
Présentations similaires
Structures de données avancées : MLH (Multidimensional linear hashing)
Advertisements

Module Systèmes d’exploitation
Structures de données avancées : B arbres
Structures de données avancées : Principales structures de données
Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure dInformatique (ESI)
Structures de données avancées : MBT ( Multidimensional B-trees )
Structures de données avancées : MTH ( Multidimensional trie hashing )
Structures de données avancées : Introduction
Chap. 4 Recherche en Table
Le langage Z Pr ZEGOUR DJAMEL EDDINE
Sémantique des déclarations pour le langage Z minimal
Arbre-B+ Hypothèse initiale : clé simple et unique Nœud = bloc.
Implémentation des SGBD
Witold Litwin Structures physiques Witold Litwin
Chap. 1 Structures séquentielles : listes linéaires
Traitement Co-Séquentiel: Appariment et Fusion de Plusieurs Listes
PBST*: une nouvelle variante des SDDS
Structures de données linéaires
LOGO Responsable du cours Mlle Amina GHRAB : 1 ère année IAG Institut Supérieur de Gestion de Tunis.
II. Chaînage, SDD séquentielles
Gestion de Fichiers Arbres B.
Indexation 1. Concepts de base 2. Arbre B 3. Indexes secondaires.
Sections sélectionnées du Chapitre 11
Les fichiers indexés (Les B-arbres)
LA STRUCTURE D'ARBRE-B Institut National des Sciences Appliquées – Rouen Département Architecture des Systèmes d’Information.
Structures de données IFT-10541
Structures de données IFT-2000
Gestion de Fichiers Tri Interne Efficace et Tri Externe.

1 Organisations unidimentionnelles : indexage et hachage  Sélection basée sur une clé d'accès  recherche associative  Ex: Chercher le plant dont le.

Structures de données avancées : Arbres AVL & Arbres Rouge et Noir
Structures de données avancées : Hachage dynamique
Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Structures de données avancées : Arbres Red-Black
Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Structures de données avancées : Introduction
Procédures et fonctions Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Listes linéaires chaînées Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Tables de compilation pour le langage Z minimal Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Le langage Z minimal Pr ZEGOUR DJAMEL EDDINE
II. Chaînage, SDD séquentielles
Structures de données avancées : Fichiers uni-dimensionnels Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Structures de données avancées : Arbres ‘Left Leaning Red-Black’
Structures de données avancées : MBT ( Multidimensional B-trees )
L’analyse lexicale Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Structures de données avancées : Concepts du Multidimensionnel D. E ZEGOUR Institut National d ’Informatique.
Structures de données avancées : Arbres AA
Structures simples et tableaux Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Structures de données avancées : Fichiers multidimensionnels Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI) zegour.esi.dz
Interprétation/Génération de code pour le langage Z minimal Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Expressions sur les chaînes de caractères Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Structures de données avancées : LH (Hachage linéaire) D. E ZEGOUR Institut National d ’Informatique.
Structures de données avancées : B arbres
Structures de données avancées : Variantes des B arbres
1 UMLV  FICHIERS Mémoire de masse découpée en blocs Fichier :liste chaînée de blocs, ou arbre de blocs (répertoires - fichiers)‏ Bloc d’éléments Bloc.
Structures de données avancées : Principales structures de fichiers
Structures de données avancées : Arbres B+ avec expansion partielle D. E ZEGOUR Institut National d ’Informatique.
Structures de données avancées : Introduction D. E ZEGOUR Institut National d ’Informatique.
Structures de données avancées : Principales structures de données
Structures de données avancées : Hachage dynamique
Structures de données avancées : MTH ( Multidimensional trie hashing ) D. E ZEGOUR Institut National d ’Informatique.
 Chaînage et LSC : motivation et principe Manipuler la LSC : exemples Variantes : LDC, liste circulaire, … Etude de cas : réalisation d’un buffer clavier.
Organisation de la mémoire pour le langage minimal Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Raison d'être de la structure de fichiers : Les premiers travaux : Début des années 1960 : En 1963 : Près de 10 ans plus tard... (à peu près 1973) : Durant.
Transcription de la présentation:

Structures de données avancées : Principales structures de fichiers Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI) www.zegour.uuuq.com email: d_zegour@esi.dz

Les principales structures de fichiers Structures simples de fichiers Fichier = Tableau de blocs Fichier = Liste linéaire chaînée de blocs Remarques L'organisation du fichier est quelconque (format fixe ou variable) Si fichier ordonné : chargement initial à 60-70%. ==> économiser les décalages intra-blocs. limitées à des petits fichiers. ( < 6 accès disque)

Vue macroscopique Tableau Liste Structures simples de fichiers Ordre Sans Ordre Vue microscopique Variable Fixe Chevauchement Sans Chevauchement Structures de fichier : TOF, LÔVC, TÔVĈ, …..

Les principales structures de fichiers Les méthodes simples d'index (Variante 1) 2 fichiers sont utilisés : fichier d'index et fichier de données. En règle générale, le fichier de données n'est pas trié. Fichier de données = Structure simple de fichier non ordonné (tableau ou une liste linéaire chainée). Fichier d'index = Tableau ordonné (selon les clés) en mémoire. (recherche dichotomique en mémoire).

Les principales structures de fichiers Les méthodes simples d'index (Variante 1) Index à un niveau Index à deux niveaux

Les principales structures de fichiers Les méthodes simples d'index (Variante 1) Opérations Recherche : a) Recherche dichotomique sur l'index. b) Si clé trouvée, ramener le bloc en mémoire centrale c) Si article à cheval sur deux blocs, ramener le deuxième bloc Insertion a) Si clé non trouvée dans l'index, il y a insertion avec décalages. b) l'article est inséré en fin de fichier.

Les principales structures de fichiers Les méthodes simples d'index (Variante 1) Suppression Généralement logique ==> extrêmement rapide. Réorganisation Éliminer physiquement les articles supprimés. Généralement, on construit un autre fichier.

Les principales structures de fichiers Les méthodes simples d'index (Variante 2) Fichier de données non ordonné. Fichier d’index ordonné maintenu sur le disque (contient toutes les clés) [ Dense index ] Fichier d’index 43 15 18 32 65 12 22 55 58 35 72 78 99 19 93 (12, .) (15,.) (18,.) (19,.) (22, .) (32,.) (35,.) ….. Fichier de données

Les principales structures de fichiers Les méthodes simples d'index (Variante 3) Fichier de données ordonné. Fichier d’index ordonné maintenu sur le disque (ne contient pas toutes les clés) [ Sparse index ] Fichier d’index 13 15 18 32 35 38 53 55 58 68 72 78 93 96 99 (13,.) (32,.) (53,.) (68,.) (93,.) Fichier de données

Les principales structures de fichiers Accès séquentiel indexé Définition - pour localiser un article on utilise un index. - pour avoir le suivant, on ne repasse pas par l'index.

Les principales structures de fichiers Accès multicritères Concepts Un article = (cle1, cle2 ...cléd) Une clé primaire et d-1 clés secondaires Récupérer l'article par plusieurs clés Exemples de requêtes : Livres parus en 1973, Livres parus en 1973 de l'auteur X donné. Solution Créer des indexes secondaires pour chaque attribut Passer toujours par l'index primaire.

Les principales structures de fichiers Accès multicritères Organisation d'un index secondaire "listes inversées". ( clé secondaire ==> clé primaire ==> article )

Les principales structures de fichiers Accès multicritères Algorithme qui Récupère les articles possédant l'attribut X et l'attribut Y. Il existe donc des indexes sur X et Y L' index sur X donne l'ensemble des clés primaires avec l'attribut X. L'index sur Y donne l'ensemble des clés primaires avec l'attribut Y. L'intersection donne l'ensemble des clés primaires ayant l'attribut X et Y. Pour chaque élément de cet ensemble, on fait alors un accès disque.

Les principales structures de fichiers Accès multicritères Suppression : ===> Ne pas toucher aux indexes secondaires (car les clés secondaires référencent les clés primaires) Recherche : C'est dans l'index primaire qu'on s'aperçoit que l'article à été supprimé.

Les principales structures de fichiers Les méthodes d'arbres Si le fichier est très volumineux, on ne peut garder l'index en RAM. Garder l'index en mémoire secondaire coûte chère car : 1) la recherche dichotomique exige beaucoup d'accès disque 2) il faut maintenir l'index ordonné  Trouver une meilleure façon de faire les insertions et les suppressions d'articles avec seulement une réorganisation locale.

Les principales structures de fichiers Les méthodes d'arbres Utilisation d'un arbre de recherche m-aire (ARM) comme méthode d'accès. Un ARM est surtout utilisé pour le stockage en mémoire externe. Un nœud de l'arbre est alors un bloc sur le disque. A un moment donné seule un bloc est ramené en mémoire. Nécessite des blocs de très grande taille ( ordre de 200).

Les principales structures de fichiers Les méthodes d'arbres Implémentation des ARM Deux façons de ranger les articles : (i) dans les nœuds avec les clés, (fichier de données = ARM) (ii) séparément. pointeur additionnel vers l'information. (fichier = index vers un fichier de données ) Si le fichier est grand : utilisation de (ii)

Les principales structures de fichiers Les méthodes d'arbres Utilisation des ARM Avantages Le problème de taille ne se pose plus Fichier ordonné Inconvénients Destinés pour les fichiers statiques Déséquilibre de l’ ARM Pas de solution  Réorganisation périodique