Gestion de Fichiers GF-1: Introduction a la Gestion des Fichiers et Operations de Base.

Slides:



Advertisements
Présentations similaires
Module Systèmes d’exploitation
Advertisements

GEF 243B Programmation informatique appliquée Listes chaînées I – Tableaux de structures §15.1 – 15.2.
Structures de données avancées : Principales structures de fichiers
Structures de données avancées : B arbres
Structures de données avancées : Introduction
Cours de l’OACI sur les Systèmes de Gestion de la Sécurité (SMS)
LES MEMOIRES INTRODUCTION UN PEU D ’HISTOIRE LES DIFFERENTES MEMOIRES
Chap. 4 Recherche en Table
Cours Présenté par …………..
Traitement Co-Séquentiel: Appariment et Fusion de Plusieurs Listes
1.2 COMPOSANTES DES VECTEURS
Bienvenue! INF3723: Systèmes d’exploitation Luigi Logrippo
Gestion de Fichiers GF-15: Addressage Disperse (Hashcoding) (Base sur le Chapitre 11 de Folk, Zoellick & Riccardi, File Structures, An Object-Oriented.
Gestion de Fichiers Arbres B.
Indexation 1. Concepts de base 2. Arbre B 3. Indexes secondaires.
Sections sélectionnées du Chapitre 11
Les fichiers indexés (Les B-arbres)
LA STRUCTURE D'ARBRE-B Institut National des Sciences Appliquées – Rouen Département Architecture des Systèmes d’Information.
Structures de données IFT-10541
Stockage Secondaire: Disques
1 Tri Externe Chapitre 13: Pourquoi Trier? Problème classique en informatique (Voir Knuth, v.3)! Données requises en ordre trié P.ex.: Trouver.
Introduction et Motivation
Gestion de Fichiers Indexes basés sur les structures d’arbres binaires et indexes à niveaux multiples.
1 Tri Externe Chapitre 13: Pourquoi Trier? Problème classique en informatique (Voir Knuth, v.3)! Données requises en ordre trié P.ex.: Trouver.
Gestion de Fichiers Tri Interne Efficace et Tri Externe.
Gestion de Fichiers Hachage Extensible.
Gestion de Fichiers GF-1: Introduction à la Géstion des Fichiers et Opérations de Base.
CSI 4506: Introduction à l’Intelligence Artificielle
CSI 3520 Concepts des langages de programmation
Indexes à Arbres et Indexes à Hachage
Module 2 : Préparation de l'analyse des performances du serveur
Chapitre 4 L’inertie et le mouvement à deux dimensions
SEG2505 – Introduction au Génie Logiciel Plan de cours – Automne 2012.
Organisation des Fichiers pour la Performance
Gestion de Fichiers GF-12: Comment Gerer les Indexes qui ne tiennent pas en Memoire de Maniere Efficace?: I. Indexes Bases sur les Structures dArbres Binaires.
Gestion de Fichiers GF-5: Storage Secondaire: Bandes Magnetiques (Base sur Chapitres 3 de Folk, Zoellick & Riccardi, File Structures, An Object-Oriented.
Gestion de Fichiers GF-10: Traitement Co-Sequentiel: Appariment et Fusion de Plusieures Listes (Base sur les sections de Folk, Zoellick & Riccardi,
2.2 PRODUIT SCALAIRE ET CALCUL D’ANGLES
Réalisé par Mr CALVO du Lycée Bon Secours à PERPIGNAN
EPID-CPI-ISAIP Philippe Bancquart - mise à jour 24/02/ page 1 Gestion des transactions SQLServer.
Les fichiers texte en C++
‘‘Open Data base Connectivity‘‘
Gestion de Fichiers GF-3: Structures d’Enregistrements, Acces Sequentiel et Direct, Manipulation de classes en C++ (Base sur des segments des Chapitres.
Management de la qualité
Paradigmes des Langages de Programmation
Introduction aux systèmes d’exploitation
Outil de gestion des cartes grises
Gestion de Fichiers GF-14: Acces Sequentiel et Indexe aux Fichiers et Arbres B+ Prefixes (Base sur le Chapitre 10 de Folk, Zoellick & Riccardi, File Structures,
EXIGE Un avenir dans le web....
Gestion des fichiers et dossiers
Gestion de Fichiers GF-16: Addressage Disperse Extensible (Extendible Hashcoding) (Base sur le Chapitre 12 de Folk, Zoellick & Riccardi, File Structures,
Les principes de la modélisation de systèmes
Gestion de Fichiers GF-12: Comment Gerer les Indexes qui ne tiennent pas en Memoire de Maniere Efficace?: II. Arbres B (Base sur les Sections de.
Mémoire périphérique Stockage primaire: Mémoire principale (RAM)
Gestion de Fichiers GF-6: Storage Secondaire: CD-ROMs & 2 Questions sur la Gestion des Donnees (Base sur Chapitres 3 de Folk, Zoellick & Riccardi, File.
Gestion de Fichiers GF-9: Construction d’Indexes (Base sur le Chapitre 7 de Folk, Zoellick & Riccardi, File Structures, An Object-Oriented Approach with.
I - Caractéristiques principales de GI
Gestion de Fichiers GF-8: Organisation des Fichiers pour l’Amelioration de la Performance (Base sur la section de Folk, Zoellick & Riccardi, File.
Structures de données avancées : Fichiers uni-dimensionnels Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
GF-11: Tri Interne Efficace et Tri Externe
CSI 4506: Introduction à l’Intelligence Artificielle
Les fichiers 1ère partie
L'unité centrale est composé en générale de :
GF-4: Storage Secondaire: Disques
CSI 3525, Survol, page 1 CSI 3525 Concepts des langages de programmation.
Structures de données avancées : B arbres
Structures de données avancées : Principales structures de fichiers
Gestion de Fichiers Construction d’Indexes. 2 Plan du cours de la semaine Vue Générale Un indexe pour les fichiers à entrées séquentielles Opérations.
INFO 2014 Fichiers et base de données Philippe Fournier-Viger Département d’informatique, U.de Moncton Bureau D216
Raison d'être de la structure de fichiers : Les premiers travaux : Début des années 1960 : En 1963 : Près de 10 ans plus tard... (à peu près 1973) : Durant.
Transcription de la présentation:

Gestion de Fichiers GF-1: Introduction a la Gestion des Fichiers et Operations de Base

2 Organisation du Cours Professeur: Dr. Nathalie Japkowicz, MCD-325C, x6693, Heures de Consultation: Mardi 13h30-14h30. Jeudi 16h30-17h30 Heures de Cours: Mardi, 14h30-16h00 (SCS E 218) Jeudi, 17h30-19h00 (SCS E 218)  Heures de Laboratoire: Jeudi, 13h00-14h30 (CBE 203)  Manuel de Cours: File Structures, An Object- Oriented Approach with C++, by Michael J. Folk, Bill Zoellick & Greg Riccardi, Addison Wesley

3 Objectifs du Cours L’Etude des Structures de Fichiers avec le but d’ameliorer l’efficacite de l’acces aux donnees en memoire secondaire. L’etude des outils les plus importants pour l’organisation des fichiers, tels que les indexes, les processus co-sequentiels, les arbres B et B+ et l’addressage disperse (HashCoding). L’acquisition de bonnes bases de programmation en C++.

4 Evaluation 30%  Devoirs (D) 3 Devoirs (quelques questions ecrites et quelques questions de programmation) 25%  Examen de Mi-Session (M) 45%  Examen Final (F) ( M + F Note Finale = 10 * ( M + F ) / 7 ( M + F >= 35 ) => Note Finale = D + M + F Retard dans la remise des devoirs: penalite de 10% par jour (ou portion de jour) ouvrable; aucun devoir ne sera accepte apres 11h00 le deuxieme jour suivant la date de remise du devoir.

5 Plan du Cours d’Aujourd’hui Que sont les Structures de Fichiers? Pourquoi etudier la Gestion de Fichiers? Une vue generale de la Conception des Structures de Fichiers. Histoire de la Discipline. Une Introduction au C++ D’apres Folk, Zoellick and Riccardi, Chapitre 1.

6 Definition Une structure de Fichier est une combinaison 1. de representations pour les donnees sauvegardees dans des fichiers, et 2. d’operations pour acceder a ces donnees.  Une structure de Fichier permets aux applications de lire, ecrire et modifier les donnees. Elle peut aussi permettre de trouver les donnees correspondant a certains criteres de recherche ou de lire les donnees dans un ordre particulier.  Les Structures de Donnees s’addressent a l’organisation de donnees en memoire principale. Les Structures de Fichiers s’addressent a l’organisation des donnees en memoire secondaire.

7 Storage des Donnees Les donnees sur ordinateur peuvent etre sauvegardees dans trois types de location differents: En Storage Primaire: Memoire de l’ordinateur (RAM) En Storage Secondaire: Disque Dur, Disquette, Cassette Magnetique, CD-ROM  qui peuvent etre accedes par l’ordinateur. En Storage Tertiaire ou Donnees d’Archives: Disque Dur, Disquette, Cassette Magnetique, CD-ROM  qui ne peuvent pas etre accede directement par l’ordinateur. Notre sujet

8 Difference entre le Storage Primaire et Secondaire Le storage secondaire tel que les disques peuvent accumuler des milliers de megabytes en utilisant tres peu d’espace physique. Le storage primaire (i.e., la memoire, le RAM), au contraire, est tres limite. Cependant, l’acces au storage secondaire est tres lent par rapport a l’acces au storage primaire: [Example: l’acces aux donnees sauvegardees en RAM lente prend 120 nanosecondes. Il prend 30 millisecondes lorsque les donnees sont sauvegardees sur disque.]

9 Pourquoi Etudier les Structures de Fichiers? L’etude de structures de fichiers est entreprise afin d’ameliorer le temps d’acces au storage secondaire. Etant donne que les details de la representation des donnees et des operations associees a ces donnees determinent l’efficacite des structures de fichiers (en fonction de l’application consideree), l’amelioration de ces details peut ameliorer le temps d’acces au storage secondaire.

10 Une Vue Generale de la Conception des Structures de Fichiers I But General: Obtention de l’information requise avec un seul acces au disque. Si cela n’est pas possible: Obtention de l’information requise avec aussi peu d’acces au disque que possible. En general, nous allons essayer de grouper toutes les informations requises par les utilisateurs du systeme de facon a pouvoir y acceder avec un seul acces au disque.

11 Une Vue Generale de la Conception des Structures de Fichiers II Fichiers Fixes et Fichiers Dynamiques Il est assez simple de trouver des structures de fichiers efficaces (qui adherent aux buts generaux de la discipline) lorsque les fichiers ne changent pas pendant l’execution du systeme. Par contre, si les fichiers peuvent s’aggrandir ou rapetisser, il est beaucoup plus difficile d’atteindre ces buts.

12 Histoire de la Discipline I: Au Debut, l’Acces Sequentiel L’histoire de la discipline est tres intimement liee au developpements techniques associes aux ordinateurs et a leur usage pratique. Au debut, les fichiers etaient sauvegardes seulement sur cassettes magnetiques. L’acces etait donc sequentiel et son cout grandissait proportionellement avec la taille du fichier.

13 Histoire de la Discipline II: l’Emergence des Disques et des Indexes Lorsque les fichiers ont commence a grandir de facon demesuree, l’acces sequentiel pur n’etait plus une solution. Les disques ont permis l’acces direct. Les indexes ont donne la possibilite de sauvegarder des petits fichiers ne contenant qu’une liste de cles associees a des pointeurs. La recherche sequentielle dans ces petits fichiers pouvaient etre faite tres rapidement. La cle et le pointeur donnait l’acces direct au tres grand fichier principal contennant les donnees.

14 Histoire de la Discipline III: l’Emergence des d’Arbres de Recherche Les indexes ont eux aussi commence a grandir de maniere demesuree. Comme ils avaient une structure sequentielle, ils sont eux aussi devenu difficile a gerer. L’idee d’utiliser des structures d’arbres de recherche afin de gerer l’index est apparue au debut des annees 60. Cependant, les arbres de recherches peuvent grandir de facon tres inegale lorsque les enregistrements sont ajoutes ou effaces. Ceci resultait en des recherches tres longues necessitant plusieurs acces au disque avant de trouver l’enregistrement requis.

15 Histoire de la Discipline IV: l’Emergence des d’Arbres Equilibres En 1963, l’idee des arbres AVL a emergee pour les donnees sauvegardees en storage primaire. Cette ideee, cependant, ne s’appliquait pas au storage secondaire car les arbres AVL sont utiles lorsque les noeuds d’arbres sont composes d’enregistrements simples plutot que de douzaines ou centaines. Dans les annees 70, l’idee des arbres B a emergee. Ces arbres ont un temps d’acces de O(log k N) ou N est le nombre d’enregistrements dans le fichier et k, le nombre d’enregistrements indexes dans un simple bloc de l’arbre B. => Les arbres B peuvent garantir une recherche ne necessitant que 3 ou 4 acces au disque pour un fichier de millions d’enregistrements.

16 Histoire de la Discipline V: L’Addressage Disperse Bien que la possibilite de trouver des donnees sauvegardees en storage secondaire avec 3 ou 4 acces au disque est impressionante, elle n’atteint pas le but fixe de trouver des donnees en un simple acces. Depuis tres longtemps, l’addressage disperse (ou HashCoding) etait un moyen connu d’atteindre ce but dans les fichiers don’t la taille ne changeait pas beaucoup pendant l’utilisation du systeme. Plus recemment, le HashCoding dynamique extensible garantit un ou au plus deux acces au disque quelle que soit la taille du fichier.

17 Une Introduction au C++ Le C++ a ete cree par Bjarne Stroustrup. C++ a conserve l’efficacite du C tout en y ajoutant la puissance de l’heritage d’objets. C++ vs. Java: Java est base sur le C++ mais est un langage plus simple. Neanmoins, Java n’a pas autant de flexibilite que le C++ car il repose sur des concepts de plus haut niveau. Par example, Java n’a pas de pointeurs.