Raison d'être de la structure de fichiers : Les premiers travaux : Début des années 1960 : En 1963 : Près de 10 ans plus tard... (à peu près 1973) : Durant les 10 ans qui suivirent... : Récemment... : Approche "traitement de fichiers" vs "base de données" : Plan…
Un fichier (en anglais : File) : un ensemble d’informations stockées sur une mémoire secondaire (un support de stockage externe). Les fichiers ont une structure bien déterminée selon laquelle leurs données sont organisées. Définition…
. Ordinateur Mémoire vive (interne) (variables) Structure de données Mémoire externe (fichiers) Gestion de fichiers Raison d'être de la structure de fichiers…
- Coût de stockage : le stockage dans la mémoire externe coûte moins cher que celui de la mémoire interne. - Durabilité de l'information (hors tension) : les données dans la mémoire externe sont persistantes. Avantages de la mémoire secondaire…
Les premiers travaux sur les fichiers supposaient que ces derniers étaient sur bande magnétique => accès séquentiel. Donc, le coût d'accès est proportionnel à la taille du fichier considéré. Avec l’apparition des disques magnétiques (supports adressables), beaucoup de choses ont changé. Les disques magnétiques utilisent la notion d’index. Un fichier index est un fichier séparé du fichier de données. Le fichier index est caractérisé par : - une plus petite taille - il est constitué d'une liste de couples : Les fichiers d'index simples allaient vite s'avérer inefficaces (mêmes inconvénients que les fichiers de données) : évolution dynamique du fichier de données et donc de l'index (changement des valeurs de clé). Les principaux travaux…
L'idée => utiliser des structures d'arbres comme une solution potentielle pour structurer les fichiers index. Cette solution s’est avérée rapidement inefficace vue l'évolution dynamique des arbres. L’arbre devient trop vite hétérogène et déséquilibrée résultant en une détérioration du temps d'accès. Début des années 60…
Introduction du concept d'arbre AVL (arbre binaire possédant la propriété de s'auto-équilibrer). Ce concept est utilisé pour l'accès à des données en RAM. La tentative était l'application des arbres AVL comme structures d'accès à des fichiers de données sur périphériques secondaires. Cette solution d’arbres équilibrés a eu plusieurs autres inconvénients parmi lesquels : - on a toujours des douzaines d'accès sont encore nécessaires même pour des fichiers de taille moyenne; - chaque nœud d'un seul arbre binaire ne contient qu'un seul enregistrement logique plutôt qu'un bloc physique (plusieurs enregistrements logiques). En 1963…
Apparition du concept de B-arbre comme structure d'accès aux fichiers. - Avantage: performances excellentes en matière de temps d'accès. - Inconvénient: perte de la possibilité d'accès séquentiel efficace. Ce problème allait très rapidement être réglé par l'ajout d'une structure de liste chaînée au plus bas niveau du B-arbre : B-arbre + liste chaînée séquentielle = Concept de B-arbre + Près de 10 ans plus tard…
Les B-arbres et les B-arbres + allaient devenir des structures d'accès à la base de la plupart des systèmes de gestion de fichiers commercialisés. Temps d'accès proportionnel à Log k N N =nombre d'entrées du fichier (i.e. de blocs) k =nombre d'entrées indexées dans un nœud du B-arbre En pratique, ceci signifie que la recherche d'un enregistrement dans un fichier qui en contient près d'un million peut être effectuée (à l'aide d'un B- arbre et B-arbre + ) en 2 ou 3 accès. Autre avantage : pas de dégradation des performances suite aux ajouts et aux suppressions d'enregistrements. Durant les 10 ans qui suivent…
Avec l’apparition des méthode de hashing dynamique qui s'adaptant à l'évolution dynamique des fichiers (hashing dynamique, extensible, linéaire), il est devenu possible d’accéder à un enregistrement en un seul, ou au plus, deux accès quelle que soit la taille du fichier. Récemment…
Les fichiers et les bases de données constituent deux concepts liés au stockage de données dans la mémoire externe. Il y’a trois caractéristiques essentielles qui distinguent les fichiers des bases de données: - vues différentes des mêmes données - indépendance données/traitements - redondance des données Fichiers vs base de données…
. Programme d’application 1 Programme d’application 2 … Programme d’application n Vue externe 1 Vue externe 2 …. Vue externe p Description logique de la BD Hiérarchique Réseau Relationnel Description physique de la BD Système d’exploitation Différents niveaux de perception des mêmes données SGBD : Système de gestion de bases de données Base de données…
. Vertical : Applications + Horizontal : Données Programmes + Données Applicati ons informatis ées Données de la base Données des fichiers Découpage orthogonal Organisation CLIENTSCLIENTS FOURNISSEURSFOURNISSEURS INVENTAIREINVENTAIRE …COMPTABILITECOMPTABILITE … F1F2F3, F4F6 Organisation CLIENTSCLIENTS FOURNISSEURSFOURNISSEURS INVENTAIREINVENTAIRE …COMPTABILITECOMPTABILITE … Base de données Découpage vertical Fichiers spécialisés Redondance élevée Dépendance Données -Traitement Redondance fortement diminuée Indépendance Données –Traitement (Logique et physique) APPROCHEFICHIERAPPROCHEFICHIER APPROCHE BASE DE DONNÉESAPPROCHE BASE DE DONNÉES Fichiers…
.