Gestion de Fichiers GF-1: Introduction à la Géstion des Fichiers et Opérations de Base.

Slides:



Advertisements
Présentations similaires
Un environnement de développement éducatif
Advertisements

Module Systèmes d’exploitation
GEF 243B Programmation informatique appliquée Listes chaînées I – Tableaux de structures §15.1 – 15.2.
GEF 435 Principes des systèmes d’exploitation
Structures de données avancées : Principales structures de fichiers
Structures de données avancées : B arbres
GEF 435 Principes des systèmes dexploitation Structure du logiciel dE/S Partie II (Tanenbaum & 5.3.4)
Cours de l’OACI sur les Systèmes de Gestion de la Sécurité (SMS)
Chap. 4 Recherche en Table
GEF 243B Programmation informatique appliquée
GEF 435 Principes des systèmes d’exploitation
Chapitre I : Systèmes d’exploitation
Introduction Pour concrétiser l’enseignement assisté par ordinateur
Cours Présenté par …………..
Traitement Co-Séquentiel: Appariment et Fusion de Plusieurs Listes
Vue générale de Sharpdesk
Bienvenue! INF3723: Systèmes d’exploitation Luigi Logrippo
Gestion de Fichiers GF-15: Addressage Disperse (Hashcoding) (Base sur le Chapitre 11 de Folk, Zoellick & Riccardi, File Structures, An Object-Oriented.
Gestion de Fichiers Arbres B.
Indexation 1. Concepts de base 2. Arbre B 3. Indexes secondaires.
Sections sélectionnées du Chapitre 11
Les fichiers indexés (Les B-arbres)
Informatique 2 Structure de données en programmation orientée objet
Les pointeurs Modes d’adressage de variables. Définition d’un pointeur. Opérateurs de base. Opérations élémentaires. Pointeurs et tableaux. Pointeurs et.
Structures de données IFT-10541
Stockage Secondaire: Disques
Un patron de conception
1 Tri Externe Chapitre 13: Pourquoi Trier? Problème classique en informatique (Voir Knuth, v.3)! Données requises en ordre trié P.ex.: Trouver.
Introduction et Motivation
Gestion de Fichiers Indexes basés sur les structures d’arbres binaires et indexes à niveaux multiples.
Indexes à Arbres et Indexes à Hachage
1 Tri Externe Chapitre 13: Pourquoi Trier? Problème classique en informatique (Voir Knuth, v.3)! Données requises en ordre trié P.ex.: Trouver.
Gestion de Fichiers Tri Interne Efficace et Tri Externe.
Gestion de Fichiers Hachage Extensible.
CSI 4506: Introduction à l’Intelligence Artificielle
Indexes à Arbres et Indexes à Hachage
Universté de la Manouba
Module 2 : Préparation de l'analyse des performances du serveur
SEG2505 – Introduction au Génie Logiciel Plan de cours – Automne 2012.
Organisation des Fichiers pour la Performance
Gestion de Fichiers GF-12: Comment Gerer les Indexes qui ne tiennent pas en Memoire de Maniere Efficace?: I. Indexes Bases sur les Structures dArbres Binaires.
Gestion de Fichiers GF-5: Storage Secondaire: Bandes Magnetiques (Base sur Chapitres 3 de Folk, Zoellick & Riccardi, File Structures, An Object-Oriented.
Gestion de Fichiers GF-10: Traitement Co-Sequentiel: Appariment et Fusion de Plusieures Listes (Base sur les sections de Folk, Zoellick & Riccardi,
Systèmes d’informations : Définition, Composantes, Rôles et Approches.
EPID-CPI-ISAIP Philippe Bancquart - mise à jour 24/02/ page 1 Gestion des transactions SQLServer.
Gestion de Fichiers GF-3: Structures d’Enregistrements, Acces Sequentiel et Direct, Manipulation de classes en C++ (Base sur des segments des Chapitres.
Gestion de Fichiers GF-14: Acces Sequentiel et Indexe aux Fichiers et Arbres B+ Prefixes (Base sur le Chapitre 10 de Folk, Zoellick & Riccardi, File Structures,
Gestion de Fichiers GF-16: Addressage Disperse Extensible (Extendible Hashcoding) (Base sur le Chapitre 12 de Folk, Zoellick & Riccardi, File Structures,
Gestion de Fichiers GF-1: Introduction a la Gestion des Fichiers et Operations de Base.
Gestion de Fichiers GF-12: Comment Gerer les Indexes qui ne tiennent pas en Memoire de Maniere Efficace?: II. Arbres B (Base sur les Sections de.
Gestion de Fichiers GF-9: Construction d’Indexes (Base sur le Chapitre 7 de Folk, Zoellick & Riccardi, File Structures, An Object-Oriented Approach with.
Gestion de Fichiers GF-8: Organisation des Fichiers pour l’Amelioration de la Performance (Base sur la section de Folk, Zoellick & Riccardi, File.
Structures de données avancées : Fichiers uni-dimensionnels Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
GF-11: Tri Interne Efficace et Tri Externe
CSI 4506: Introduction à l’Intelligence Artificielle
Présentation et discipline
CSI 4506: Introduction à l’Intelligence Artificielle
Les fichiers 1ère partie
GF-4: Storage Secondaire: Disques
CSI 3525, Survol, page 1 CSI 3525 Concepts des langages de programmation.
Structures de données avancées : B arbres
Structures de données avancées : Principales structures de fichiers
Structures de données avancées : Arbres B+ avec expansion partielle D. E ZEGOUR Institut National d ’Informatique.
Gestion de Fichiers Construction d’Indexes. 2 Plan du cours de la semaine Vue Générale Un indexe pour les fichiers à entrées séquentielles Opérations.
INFO 2014 Fichiers et base de données Philippe Fournier-Viger Département d’informatique, U.de Moncton Bureau D216
CSI25101 Tri Plus efficace. CSI25102 Tri récursif Le tri récursif divise les données de grande taille en deux presque moitiés et est appelé récursivement.
Raison d'être de la structure de fichiers : Les premiers travaux : Début des années 1960 : En 1963 : Près de 10 ans plus tard... (à peu près 1973) : Durant.
Les mémoires la préparation de: chaimaa hamdou.
Chapitre 12 Surveillance des ressources et des performances Module S41.
CSI 3531 Systèmes d’exploitation Nathalie Japkowicz 1.
Transcription de la présentation:

Gestion de Fichiers GF-1: Introduction à la Géstion des Fichiers et Opérations de Base

2 Organisation du Cours Professeur: Dr. Nathalie Japkowicz, STE 5-029, x6693, Heures de Consultation: Lundi 13h15-14h15. Jeudi 14h45-15h45 Heures de Cours: Lundi, 14h30-15h50 (Morisset 221) Jeudi, 16h00-17h30 (Morisset 221) Heures de Laboratoire: Mercredi, 8h30-10h00 (STE 0130) Manuel de Cours: File Structures, An Object-Oriented Approach with C++, by Michael J. Folk, Bill Zoellick & Greg Riccardi, Addison Wesley

3 Objéctifs du Cours LEtude des Structures de Fichiers avec le but daméliorer lefficacité de laccès aux données en mémoire secondaire. L étude des outils les plus importants pour lorganisation des fichiers, tels que les indexes, les processus co-séquentiels, les arbres B et B+ et laddressage dispersé (HashCoding). Lacquisition de bonnes bases de programmation en C++.

4 Evaluation 30% Devoirs (D) 3 Devoirs (quelques questions écrites et quelques questions de programmation) 25% Examen de Mi-Session (M) 45% Examen Final (F) If (.25 M +.45 F)/.7 < 50% then Note Finale = (.25 M +.45 F) /.7 If (.25 M +.45 F)/.7 50% then Note Finale = (.25 M +.45 F +.3 D) Retard dans la remise des devoirs: penalité de 10% pour tout retard; aucun devoir ne sera accepté apres 24h00 de la date et heure de remise des devoir.

5 Plan du Cours dAujourdhui Que sont les Structures de Fichiers? Pourquoi étudier la Gestion de Fichiers? Une vue générale de la conception des Structures de Fichiers. Histoire de la Discipline. Une Introduction au C++ Daprès Folk, Zoellick and Riccardi, Chapitre 1.

6 Définition Une structure de Fichier est une combinaison 1. de représentations pour les données sauvegardées dans des fichiers, et 2. dopérations pour accéder a ces données. Une structure de Fichier permet aux applications de lire, écrire et modifier les données. Elle peut aussi permettre de trouver les données correspondant a certains critères de recherche ou de lire les données dans un ordre particulier. Les Structures de Données saddressent a lorganisation de données en mémoire principale. Les Structures de Fichiers saddressent a lorganisation des données en mémoire secondaire.

7 Storage des Données Les données sur ordinateur peuvent etre sauvegardées dans trois types de location differents: En Storage Primaire: Mémoire de lordinateur (RAM) En Storage Secondaire: Cassette Magnétique, Disque Dur, Disquette, CD-ROM, ZipDrive, USB Drive qui peuvent etre accédés par lordinateur. En Storage Tertiaire ou Données dArchives: Cassette Magnétique, Disque Dur, Disquette, CD-ROM, ZipDrive, USB qui ne peuvent pas etre accédés directement par lordinateur. Notre sujet

8 Différence entre le Storage Primaire et Secondaire Le storage secondaire tel que les disques peuvent accumuler des milliers de mégabytes en utilisant tres peu despace physique. Le storage primaire (i.e., la mémoire, le RAM), au contraire, est très limitée. Cependant, laccès au storage secondaire est très lent par rapport a laccès au storage primaire: [Example: laccès aux données sauvegardées en RAM lente prend 60 nanosecondes. Il prend 15 millisecondes lorsque les données sont sauvegardées sur disque.]

9 Pourquoi Etudier les Structures de Fichiers? L étude des structures de fichiers est entreprise afin daméliorer le temps daccès au storage secondaire. Etant donné que les détails de la représentation des données et des opérations associées a ces données déterminent lefficacité des structures de fichiers (en fonction de lapplication considerée), lamélioration de ces détails peut améliorer le temps daccès au storage secondaire.

10 Une Vue Générale de la Concéption des Structures de Fichiers I But General: Obtention de linformation requise avec un seul accès au disque. Si cela nest pas possible: Obtention de linformation requise avec aussi peu daccès au disque que possible. En général, nous allons essayer de grouper toutes les informations requises par les utilisateurs du système de facon a pouvoir y accéder avec un seul accès au disque.

11 Une Vue Générale de la Concéption des Structures de Fichiers II Fichiers Fixes et Fichiers Dynamiques Il est assez simple de trouver des structures de fichiers efficaces (qui adhèrent aux buts généraux de la discipline) lorsque les fichiers ne changent pas pendant lexecution du système. Par contre, si les fichiers peuvent saggrandir ou rapetisser, il est beaucoup plus difficile datteindre ces buts.

12 Histoire de la Discipline I: Au Début, lAccès Séquentiel Lhistoire de la discipline est très intimement liée au développements téchniques associés aux ordinateurs et a leur usage pratique. Au début, les fichiers étaient sauvegardés seulement sur cassettes magnétiques. Laccès etait donc séquentiel et son cout grandissait proportionellement avec la taille du fichier.

13 Histoire de la Discipline II: lEmergence des Disques et des Indexes Lorsque les fichiers ont commencé a grandir de facon demesurée, laccès sequentiel pur nétait plus une solution. Les disques ont permis laccès direct. Les indexes ont donné la possibilité de sauvegarder des petits fichiers ne contenant quune liste de clés associées a des pointeurs. La recherche séquentielle dans ces petits fichiers pouvaient etre faite très rapidement. La clé et le pointeur donnait laccès direct au très grand fichier principal contennant les données.

14 Histoire de la Discipline III: lEmergence des dArbres de Recherche Les indexes ont eux aussi commencé a grandir de manière demesurée. Comme ils avaient une structure séquentielle, ils sont eux aussi devenu difficile a gérer. Lidée dutiliser des structures darbres de recherche afin de gérer lindex est apparue au début des années 60. Cependant, les arbres de recherches peuvent grandir de facon tres inégale lorsque les enregistrements sont ajoutés ou effacés. Ceci resultait en des recherches tres longues nécéssitant plusieurs accès au disque avant de trouver lenregistrement requis.

15 Histoire de la Discipline IV: lEmergence des dArbres Equilibrés En 1963, lidée des arbres AVL a émergé pour les données sauvegardées en storage primaire. Cette idée, cependant, ne sappliquait pas au storage secondaire car les arbres AVL sont utiles lorsque les noeuds darbres sont composés denregistrements simples plutot que de douzaines ou centaines denregistrements. Dans les années 70, lidée des arbres B a émergé. Ces arbres ont un temps daccès de O(log k N) ou N est le nombre denregistrements dans le fichier et k, le nombre denregistrements indexés dans un simple bloc de larbre B. => Les arbres B peuvent garantir une recherche ne nécéssitant que 3 ou 4 acces au disque pour un fichier de millions denregistrements.

16 Histoire de la Discipline V: LAddressage Dispersé Bien que la possibilité de trouver des données sauvegardées en storage secondaire avec 3 ou 4 accès au disque est impressionante, elle natteint pas le but fixé de trouver des données en un simple accès. Depuis très longtemps, laddressage dispersé (ou HashCoding) était un moyen connu datteindre ce but dans les fichiers dont la taille ne changeait pas beaucoup pendant lutilisation du systeme. Plus récemment, le HashCoding dynamique extensible garantit un ou, au plus, deux accès au disque quelle que soit la taille du fichier.

17 Une Introduction au C++ Le C++ a été créé par Bjarne Stroustrup. C++ a conservé lefficacité du C tout en y ajoutant la puissance de lhéritage dobjets. C++ vs. Java: Java est basé sur le C++ mais est un langage plus simple. Néanmoins, Java na pas autant de flexibilité que le C++ car il repose sur des concepts de plus haut niveau. Par example, Java na pas de pointeurs.