Bases de données Introduction Witold Litwin.

Slides:



Advertisements
Présentations similaires
Mais vous comprenez qu’il s’agit d’une « tromperie ».
Advertisements

Le Marché Publicitaire de la Presse Professionnelle
Le Nom L’adjectif Le verbe Objectif: Orthogram
ORTHOGRAM PM 3 ou 4 Ecrire: « a » ou « à » Référentiel page 6
Ispirer Systems Présentation de la Société Copyright (c) Ispirer Systems Ltd. Tous Droits Réservés.
Les Systèmes de Gestion de Bases de Données (SGBD) PL-SQL.
Additions soustractions
Distance inter-locuteur
1 Plus loin dans lutilisation de Windows Vista ©Yves Roger Cornil - 2 août
Les numéros 70 –
Les numéros
Les identités remarquables
Le, la, les words Possessive Adjectives MINE!!. 2 My in french is mon, ma,mes... Le word/ begins with a vowel: Mon La word: Ma Les word: Mes.
Directeur de Thèse : Pr. Witold Litwin
Witold Litwin Structures physiques Witold Litwin
Manipulations multibases et distribuées Partie 1
Introduction à la logique
LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.

TP 3-4 BD21.
La législation formation, les aides des pouvoirs publics
1 7 Langues niveaux débutant à avancé. 2 Allemand.
1 5 octobre 2011 / paw Présentation du 7 octobre 2011.
La méthodologie………………………………………………………….. p3 Les résultats
1 ARCHITECTURE DACCÈS la méthode générale modèle de données définitions module daccès / modules métiers construction des modèles les modules daccès, les.
Développement d’applications web
Contrôles d'accès aux données
Le soccer & les turbans Sondage mené par lAssociation détudes canadiennes 14 juin 2013.
Présentation générale
1 Guide de lenseignant-concepteur Vincent Riff 27 mai 2003.
Le drapeau canadien comme symbole de fierté nationale : une question de valeurs partagées Jack Jedwab Association détudes canadiennes 28 novembre 2012.
Le Concours de Conaissance Francais I novembre 2012.
Si le Diaporama ne s'ouvre pas en plein écran Faites F5 sur votre clavier.
Projet poker 1/56. Introduction Présentation de léquipe Cadre du projet Enjeux Choix du sujet 2.
Gestion des bases de données
LES NOMBRES PREMIERS ET COMPOSÉS
Logiciel gratuit à télécharger à cette adresse :
Les chiffres & les nombres
@SSR – Installation des applications eduscol.education.fr/securite - février 2007 © Ministère de l'Éducation nationale, de l'Enseignement supérieur et.
Dépendances entre les chapitres
RACINES CARREES Définition Développer avec la distributivité Produit 1
DUMP GAUCHE INTERFERENCES AVEC BOITIERS IFS D.G. – Le – 1/56.
Année universitaire Réalisé par: Dr. Aymen Ayari Cours Réseaux étendus LATRI 3 1.
Bases de données ? Witold Litwin.
1 Witold Litwin ? 2 Gardarin, G. Bases de Données. Eyrolles Delmal, P. SQL2. De Boeck MsAccess 2007 cest facile (ou tout livre à titre similaire)
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
1 INETOP
Aire d’une figure par encadrement
Copyright Serge Miranda
P.A. MARQUES S.A.S Z.I. de la Moussière F DROUE Tél.: + 33 (0) Fax + 33 (0)
Les fondements constitutionnels
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
Le workflow Encadré par: M . BAIDADA Réalisé par: ATRASSI Najoua
1/65 微距摄影 美丽的微距摄影 Encore une belle leçon de Macrophotographies venant du Soleil Levant Louis.
Introduction.
Nom:____________ Prénom: ___________
1 Architecture orientée service SOA Architecture orientée service SOA (Service Oriented Architecture)
Annexe Résultats provinciaux comparés à la moyenne canadienne
Cours n°4M2. ESCE (S. Sidhom) Séminaire ( 6-12 Février 2007 ) Promo. M2 ESCE-Tunis 2006/07 Conception d’un système d'information sur Internet Architecture.
Présentation Session RPSI
La formation des maîtres et la manifestation de la compétence professionnelle à intégrer les technologies de l'information et des communications (TIC)
Réalisé par : Mr IRZIM Hédi Mr JRAD Firas
1 BDs Orientées Objets Witold LITWIN. 2 Pourquoi ? F Les BDs relationnelles ne sont pas adaptées aux applications CAD/CAM, cartes géo... F le problème.
D. E ZEGOUR Institut National d ’Informatique
Le Langage SQL Introduction. 2 Historique du Langage SQL E. F. CODD : premiers articles dans les années 70 IBM crée le langage SEQUEL (Structured English.
DB2. Universal Database. D. Chamberlin, Morgan-Kaufman Delmal, P. SQL2. INPRES, * A First Course in Database Syst. Ullman, J., Widom, J.,
Dr Mohamed Anis BACH TOBJI
1 Structure en MC Principes Stockage des données dans la mémoire volatile d’un ordinateur Problèmes Stockage temporaire «Petits» volumes de données Langages.
Séance /10/2004 SGBD - Approches & Principes.
Transcription de la présentation:

Bases de données Introduction Witold Litwin

Livres de Support Niveau Introductif : Gardarin, G. Bases de Données. Eyrolles Delmal, P. SQL2. De Boeck MsAccess c’est facile (ou tout livre à titre similaire) Date, Ch. Introduction to Database Systems. Prentice Hall. Nombreux exercices et solutions. Ullman, J., Widom, J. A First Course in Database Syst. Prentice Hall, 468. (Cours de Stanford Univ.) Lewis, P., M., Berstein, A., Kifer, M. Database and Transaction Processing. Addison Wesley

Livres de Support Niveau Avancé : Garcia, H., Ullman, J., Widom, J., Database Syst. Prentice Hall,, 468. (Cours de Stanford Univ.) Ramakrishnan, R. Database Management Syst. McGraw Hill, 740. (Cours de Wisconsin Univ.) D. Chamberlin. DB2. Universal Database. Morgan-Kaufman P. Litwin & al. Access2000 Developper's Edition. Vol. 1 et Vol 2 (Entreprise Ed.). Sybex.

Support des Cours Internet & Powerpoint http://ceria.dauphine.fr/cours98/BD-wl-98.html Visionneuse PPT 2000 libre sur le site Microsoft Les cours peuvent être imprimés par la visionneuse en plusieurs formats & en couleur Format recommandé : 3 diapos / page, Polies N/B imprimées par la Fac pour les ayant droit

SGBD Support MsAccess 2003 Disponible sur mon portable Sera utilisé durant les exposés Vendu + que tous les autres SGBD ensemble 11M licences / mois = 132 M / an La plus amicale interface usager sur le marché Très complet 4 GL, SQL2, QBE, OLE, ODBC, Multimédia, Multibase, « Web-enabled »… Le 1er SGBD pour tout un chacun

SGBD Support SQL Server 2005 Disponible sur mon portable Sera utilisé durant les exposés Grand frère de l’autre Fonctions plus étendues Taille de la BD, répartition, transactions, notifications, analyse de données… Une version gratuite sur le site MS

Contrôle de connaissances Selon le cas Examen Projet Questions durant les cours Questions ? Witold.Litwin@dauphine.fr Bureau B019 http://ceria.dauphine.fr

Base de Données Une collection de données qui supporte les définitions de Données de la base Structure intégrée Lien sémantiques Contraintes d’intégrité Contraintes de sécurité Vues de la base

Base de Données Une collection de données qui supporte les manipulations de Recherche de données Interactive Assertionnelle 4-GL Logiquement et physiquement performante Insertion, Mise à jour, Suppression de données Cohérente Partagée Fiable

SGBD Système de Gestion de Base de Données (SGBD) Système logiciel gérant une BD Peut avoir des composantes matériel Mono ou multiordinateur En général, peut gérer plusieurs BDs Peux aussi accéder aux BDs d’autres SGBDs

MsAccess 95

Une autre vue de Nancy (sous MsAccess 2000)

Une autre vue des employés A travers une requête SQL Select * From Employes

Pourquoi une Base de Données ? Intégration de données Moins de duplications Partage de données Fiabilité de données Transactions, Reprises sur pannes, Tolérance de pannes Sécurité de données Langages assertionnels de requêtes SQL, QBE Interfaces conviviales 4-GL & Web

Pourquoi une Base de Données ? En pratique, il est impossible de concevoir ces fonctions soi-même Théorie complexe Conception d’une BD Formes normales… Langages de définition et de manipulation d’une BD Optimisation de requêtes assertionnelles Transactions et partage de données …. Logiciel complexe des centaines de milliers ou des millions de lignes de programmation

Différentes BDs Il y en a pour tous les goûts BDs personnelles MsAccess etc. 10 KO – 100 KO BDs professionnelles typiques 100 KO – 100 GO BDs professionnelles très grandes Very Large Databases (VLDB) > 100 GO

VLDB-05 par taille http://www.wintercorp.com/VLDB/2005_TopTen_Survey/TopTenWinners_2005.asp

VLDB-05 par taille http://www.wintercorp.com/VLDB/2005_TopTen_Survey/TopTenWinners_2005.asp

VLDB-05 par taille http://www.wintercorp.com/VLDB/2005_TopTen_Survey/TopTenWinners_2005.asp

VLDB-05 par taille http://www.wintercorp.com/VLDB/2005_TopTen_Survey/TopTenWinners_2005.asp

VLDB-98 par taille UPS contient aussi 6 TB d ’indexes

VLDB-98 par nombre de tuples

Composantes d’une BD Logiciel SGBD Gère le niveau logique et physique de la base Selon l’architecture ANSI-SPARC Les outils frontaux (4-GL) Générateurs : de formes, de rapports, des applications Intégrés au SGBD ou externes Powerbuilder, Borland… Interfaces WEB : HTML, XML… Interfaces OLAP & Data Mining Intelligent Data Miner (IBM) Utilitaires: chargement, statistiques, aide à la conception…

Composantes d’une BD Matériel Ordinateur générique avec son CPU, RAM, disque pour la BD, bandes pour la sauvegarde RAM est considéré traditionnellement trop petite pour une BD Ce n’est plus toujours vrai Problème classique d’organisation d’E/S pour une BD

Composantes d’une BD Matériel Machine spécialisée (MBD) Ne supporte que la BD En général multiprocesseur à partage de rien Teradata avec jusqu’au 1024 Pentiums Les applications sont sur d’autres ordinateurs Liaison par LAN

Usagers Interactifs (ad-hoc) Programmeurs d’application DBA Cherchent les infos, sans connaître la BD Interfaces visuelles: 4-GL, Web… A la rigueur peuvent utiliser le langage QBE Programmeurs d’application Construisent les interfaces pour les usagers interactifs Spécialistes de SQL DBA Définit et maintient la BD A la priorité sur tous les autres usagers Peut être payé en France 120 K€/an

Types de SGBD Par modèle de données 1ère génération 1950 – 65 SGF, SGF généralisés avec les langages booléens de manip. 2ème génération 1965 - 70 SGBD navigationnel Hierarchique (IMS), Réseau (Codasyl), Pseudo-relationnel 3ème génération 1969 - … SGBD relationnel (DB2, Oracle, Informix, MsAcess… SGBD OO 1990 - 1999 En pratique : une impasse (O2, Objectstore, Objectivity..) O2 a fait faillite en 1999

Types de SGBD Par modèle de données SGBD relationnel 1969 - … Proposé par E. Codd (IBM) SGBD relationnel – objet (RO) 1995 - … SGBD relationnel – XML … Évolution probable de tout SGBD relationnel Autres Documentaires, XML ?

Types de SGBD Par capacité « Mainframe ou cluster de mainframes» DB2, Adabas… Machine base de données Teradata Serveurs Unix & Windows 2000 DB2, Informix, Oracle, Sybase, Unify, SQL Server, MsAccess… Personnels MsAccess, Paradox… Carte de Crédit CQL

SGBD Relationnel et sa Base Max.: 64 KO Carte Vital ? Dossier Personnel Monnaie Électronique ….

Architecture ANSI-SPARC ES CS IS

Architecture ANSI-SPARC Un standard pour tout SGBD digne de ce nom Proposé vers 1965 ans par Charles Bachman Auteur du concept de la BD Concepteur de IDMS-2 Le 1er SGBD moderne Créateur du modèle de données réseau (Codasyl) Plus tard de l’architecture Open System Interconnection (OSI) Prix Turing La plus haute récompense scientifique en informatique en USA

Architecture ANSI-SPARC Schéma Conceptuel (CS) ES CS IS D’une manière abstraite: un modèle conceptuel de l’univers réel de la BD Dit aussi entreprise L’Université Paris 9 Au Printemps Mes vins préférés Dieux et Démons chez les Grecs L’analyse du réel est le domaine des méthodes de conception de la BD Rôle pionnier de Prof. Colette Rolland (Sorbonne)

Architecture ANSI-SPARC Schéma Conceptuel (CS) ES CS IS D’une manière appliquée : la définition logique de la BD Une et une seule Les données logiques, leurs structures et types Relations, attributs, domains Entités… Objets, Types, Classes Leur manipulations procédures, fonctions, méthodes…

Architecture ANSI-SPARC Schéma Conceptuel (CS) ES CS IS La définition logique de la BD (suite) Les liens sémantiques Données d’un même objet réel Les contraintes d’intégrité Mono-valeur Référentielles Variées Les contraintes de sécurité Qui peut manipuler quoi

Architecture ANSI-SPARC Schéma Conceptuel (CS) ES CS IS Le CS est définit par le DBA seul Complexité Sécurité Par l’intégration de données des différentes applications de la BD Plusieurs méthodes de conception, plus ou moins formelles Entité-Relations Objets & Fonctions Merise Normalisation relationnelle

Architecture ANSI-SPARC Schéma Conceptuel (CS) ES CS IS La BD (donc le CS) est définit en utilisant : Le langage de définition de données La BD est manipulée au niveau de CS à travers: Le langage de manipulation de données Les deux sous-langages forment: Le langage de base de données En général incomplet au sens de la machine de Turing SQL pour une BD relationnelle

Architecture ANSI-SPARC Schémas Externes (ESs) Un ES = un sous-schéma d’une BD Dérivé du CS La dérivation est définie dans le ES Définit une vue de la BD Une sous-base virtuelle En général partielle Pour des usagers ad-hoc Vues 4-GL, orientés Web notamment (HTML, XML…) Pour des programmeurs d’application Vues SQL, pour SQL imbriqué ou Vbasic, ou procédures stockées…

Architecture ANSI-SPARC Schémas Externes (ESs) Une BD est en général munie de plusieurs différentes ESs Mais tous ont le CS comme racine commune Donc tous doivent être accepté par le DBA Perte d’autonomie de l’usager

MsAccess 95

Une autre vue de Nancy (sous MsAccess 2000)

Une autre vue des employés A travers une requête SQL Select * From Employes Typiquement, pour les programmeurs d'application Schéma Externe

Architecture ANSI-SPARC Schéma Interne (IS) ES CS IS Définit la représentation interne de la BD Niveau interne ou physique Les disques, fichiers hachés, arbres-B… contenant la BD La représentation physique de valeurs de données Réel, entier, texte, OLE… Encodage… Définit l’application du CS sur le IS Selon le principe de l’indépendance de niveaux logique et physique Assez d ’ANSI-SPARC

Architecture fonctionnelle d’un SGBD relationnel XQuery Requêtes XML Requêtes HTML Requêtes 4-GL XPath JDBC, CGI Requêtes QBE Requêtes SQL ODBC Requêtes SQL Requêtes algébriques Gestionnaire des transactions et de la concurrence Gestionnaire de mémoires Gestionnaire de reprises Base

Architecture BD Centralisée Usagers Mainframe

Architecture BD Personnelle

Architecture Client-Serveur LAN Serveur 2 Défauts majeurs

Architecture Client-Serveur LAN Serveur 2 Défauts majeurs

Architecture Client-Serveurs (Multiples) LAN Serveurs

Architecture Client-Serveurs Base de Données Répartie ou Parallèle (BDR/BDP) Une BD avec les fragments dans les SGBDs sur différents sites d’un réseau Si c’est un réseau local et la répartition est une partition au niveau physique, alors c’est une BD parallèle (BDP) Multibase Une collection de bases de données munie d’un langage multibase Sur différents sites ou le même On les appelle aussi BDs intéroperables En général ces BDs sont autonomes et hétérogènes

Fragmentation BDP / BDR Fragmentation type BDP par hachage statique par intervalles pré-définis d’un attribut ordonné Serveur 1 : Ville = A*..D*, Serveur 2 Ville = E*..I* etc Fragmentation type BDR par prédicat SQL Serveur 1: SELECT * FROM HOTELS WHERE VILLE = ‘PARIS’ AND CAT < > ‘**’ ; Serveur 2: SELECT * FROM HOTELS WHERE VILLE = ‘PARIS’ AND CAT = ‘**’ Fragmentation BDR est plus générale mais moins usitée

Architecture BDR / BDP (exemples) SQL Server 256 serveurs (2006) Sybase 64 serveurs DB2 16 (gros ?) serveurs ? Oracle parallèle non-BDR (CPUs partagent les disques)

Architecture WEB DB IE Client Firefox App. WEB HTML HTML HTML Scripts Serveur de Cache Serveur de Cache HTML Scripts Serveur Web SGBD SGBD SGBD ODBC ou JDBC

Architecture WEB DB Client Cache server Envoie et réceptionne les pages HTML et XML Notamment avec la balise FORM avec l’attribut ACTION Qui indique le nom du fichier HTML à lancer sur le serveur FORM ACTION = “http://www....host/Achat Cache server cache les pages souvent usitées Inktomi

Architecture WEB DB Web server gère les données arrivant en HTML & XML transforme les données et les requêtes CGI & PHP… SQL imbriqué les instruction du php sont dans les balises <? PHP …. ? > les instructions SQL sont imbriquées dans les messages ODBC ou JDBC ou .Net distribue la charge Netscape, Inktomi... DBMS contient la base DB2, SQL Server...

Architecture BDS LAN

Multiordinateur Réseau Appelé aussi Paire à Paire (P2P) ou grille (grid) Peut contenir des milliers de sites (PCs & WSs) La BD utilise les ressources cumulées GOs de RAM, TOs de disques Les données et les traitements de la BD se répartissent sur autant de sites qu’il faut La nombre de sites serveurs de la BD peut croître dynamiquement avec sa taille D’une manière transparente pour les applications La BD deviendrait scalable (BDS)

Structures de Données Distribuées et Scalables Partitionnement dynamique transparent au client par hachage (LH*…) par intervalles (RP*) : SDDS-2005 au B019 multi-attribut (k-RP*…) à tolérance de pannes (LH*sa) Accès par clé par le client Peut subir des renvois entre les serveurs Idem pour l’accès parallèle (scans) Voir les cours sur les SDDSs Une application récente : systèmes P2P structurés

SD-SQL Server 1er SGBD Scalable Distribué Utilise le principe des SDDS Les tables relationnelles se répartissent automatiquement par éclatements sur autant de SD SQL Servers qu’il faut La répartition est invisible aux applications A jouer avec au B019 Thèse Doctorat de Soror Sahri (2006)

SD-SQL Server 1er SGBD Scalable Distribué

BD Relationnelle Données structurées en relations (tables) Manipulations relationnelles, en général exprimées en SQL, transforment des tables en une table Algèbre Relationnelle

BD Relationnelle Le Rapport de Recherche qui a lancé les SGBDs Relationnels (publié uniquement en interne à IBM Almaden Research Center (CA)

BD Relationnelle Le Rapport de Recherche qui a lancé les SGBDs Relationnels (Résumé)

BD Relationnelle Le Rapport de Recherche qui a lancé les SGBDs Relationnels (Table des Matières)

Exemple S Select S#, SNAME, STATUS FROM S WHERE CITY = ‘Paris’

Exemple de SGBD Relationnel MsAccess Le plus vendu au monde Dizaines de millions de copies / mois Bases  3 GO Limite d’adressage en 32 bits de Windows En multibase : taille illimitée Langages SQL & QBE Excellente interfaces 4-GL & OLE notamment multimedia incluse Un langage de programmation BD Visual Basic Adapté à l’architecture client-serveur Gestion de concurrence et (limitée) de transactions ODBC Bonne compatibilité avec SQL Server

Exemple d’utilisation de MsAccess A partir du portable en cours Ouverture de bases exemple Analyse de schémas Manipulations 4-GL Manipulations QBE Manipulations SQL

Exercices En quelques mots: avantages d’une BD par rapport à un fichier Deux définitions du concept d’une BD Les principales possibilités d’une BD et d’un SGBD Commentez le concept de schéma intégré Que veut dire « le langage de manipulation non-procedural « ? Différentes typologies de BDs Les principes de l’architecture ANSI-SPARC Limitations du concept de la vue d’une BD Raisons de la popularité de l’architecture client-serveur Ses principales limitations Commentez les concepts de BDR, BDP, MBD, SDB Le rôle du cache serveur dans l’architecture WEB DB Caractéristiques de MsAccess Auto-familiarisation pratique avec MsAccess

FIN