1 Manipulations multibases et distribuées Partie 1 Witold Litwin 2009 - 10.

Slides:



Advertisements
Présentations similaires
Ispirer Systems Présentation de la Société Copyright (c) Ispirer Systems Ltd. Tous Droits Réservés.
Advertisements

Informatique appliquée à la gestion Bases de données www. labri
Material/Sources: Daniel Bardou, Julie Dugdale &
« Les Mercredis du développement » Introduction Office « 12 » Présenté par Bernard Fedotoff Microsoft Regional Director Agilcom.
Xavier Blanc Web Services Xavier Blanc
Introduction Pour concrétiser l’enseignement assisté par ordinateur
Fonctionnalités des SGBD
Directeur de Thèse : Pr. Witold Litwin
Witold Litwin Structures physiques Witold Litwin
Manipulations multibases et distribuées Partie 1
TP 3-4 BD21.
Principes des Bases de Données Relationnelles
NFE 107 : Urbanisation et architecture des systèmes d'information
Introduction aux CMS.
Initiation au système d’information et aux bases de données
1 ARCHITECTURE DACCÈS la méthode générale modèle de données définitions module daccès / modules métiers construction des modèles les modules daccès, les.
Les contraintes d’integrité
Les BDAs (Les bases de données réparties)
Initiation au système d’information et aux bases de données
Contrôles d'accès aux données
Introduction à la conception de Bases de Données Relationnelles
Accès aux données généralisé SQL est presque une solution! Le problème: Le SQL n'est pas une langue complète, et doit être intégré dans un langage de programmation.
Chap 4 Les bases de données et le modèle relationnel
1 Bases de Données Distribuées Chapitre 22, Sections 22.6–22.14.
Bases de Données Réparties
Modèle Logique de Données
Gestion des bases de données
Services fournis par le SI et technologies associées
Staf 2x Cours de bases de données
Cours de Base de Données & Langage SQL
Bases de données ? Witold Litwin.
Les concepts et les méthodes des bases de données
Manipulations multibases et distribuées Partie 1
1 SQL Manipulations Avancées (08-09) Witold Litwin.
1 Witold Litwin ? 2 Gardarin, G. Bases de Données. Eyrolles Delmal, P. SQL2. De Boeck MsAccess 2007 cest facile (ou tout livre à titre similaire)
Gestion de données distribuées Intégration - Médiation
Introduction.
E-Technology lab Plateformes, Technologies et Architectures pour les systèmes eGouvernement Par: Dr Mamadou Koné Université Laval, Québec, Canada et Houda.
Bases de données Introduction Witold Litwin.
1 BDs Orientées Objets Witold LITWIN. 2 Pourquoi ? F Les BDs relationnelles ne sont pas adaptées aux applications CAD/CAM, cartes géo... F le problème.
Les systèmes de gestion de base de données (SGBD)
Mastère Professionnel Systèmes de Communication et Réseaux
Sélection de colonnes (la projection)
ATELIER GENIE LOGICIEL
Le Langage SQL Introduction. 2 Historique du Langage SQL E. F. CODD : premiers articles dans les années 70 IBM crée le langage SEQUEL (Structured English.
SYSTEMES d’INFORMATION séance 1 : Introduction et définitions
1 Initiation aux bases de données et à la programmation événementielle Responsable : Souheib BAARIR. (le sujet de votre .
21/04/2015© Robert Godin. Tous droits réservés.1 6Gestion des contraintes d’intégrité en SQL n Contrainte d'intégrité statique – respectée pour chacun.
DB2. Universal Database. D. Chamberlin, Morgan-Kaufman Delmal, P. SQL2. INPRES, * A First Course in Database Syst. Ullman, J., Widom, J.,
Module 1 : Vue d'ensemble de Microsoft SQL Server
Les vues Une vue: c’est une relation virtuelle. Définie par:
Web Services 17/01/2009.
Initiation aux SGBD Frédéric Gava (MCF)
Cours Access TuanLoc NGUYEN. Contact Nguyen TuanLoc Tél: Web:
Dr Mohamed Anis BACH TOBJI
Le Langage SQL Introduction
1 Structure en MC Principes Stockage des données dans la mémoire volatile d’un ordinateur Problèmes Stockage temporaire «Petits» volumes de données Langages.
Les bases de données Séance 8 Jointures.
Séance /10/2004 SGBD - Approches & Principes.
Apéro Techno Stephen Rousset. Plan : 1.Discussion autour du concept NoSQL 2.Utilisation côté code (C#) 3.Du concret 4.Questions ?
Introduction aux Bases de Données et au langage SQL
Initiation aux bases de données et à la programmation événementielle
Cours n°2 Implémentation et exploitation
Introduction Module 1.
Analyse, élaboration et exploitation d’une Base de Données
Cours 11 Entrepôts de données
Introduction SGDBOO Sommaire Définition d’un SGBD (6 services)
Schéma de base de données Présentation. Conception du schéma logique  Transformation du schéma conceptuel en structures de données supportées par les.
ARIANE : Interopérabilité sémantique et accès aux sources d'information sur Internet Sylvain Aymard, Michel Joubert, Dominique Fieschi, Marius Fieschi.
module SIE depuis 2011 et IAMD depuis l’an dernier ! Gestion de Masse de Données (GMD) Introduction Adrien Coulet
Transcription de la présentation:

1 Manipulations multibases et distribuées Partie 1 Witold Litwin

2 2 * Principles of Distributed Databases. 2 ed. Tamer Ozsu, Patrick Valduriez, 2009 Prentice Hall & Web (download) Livres de Support

3 3  Visionneuse PPT libre sur le site Microsoft  Chaque cours est une union de tous les cours sur le sujet que je donne à Dauphine  Les cours peuvent être imprimés par la visionneuse en plusieurs formats & en couleur  Format recommandé : 3 diapos / page, Internet & Powerpoint Support des Cours  Polies N/B imprimées par la Fac pour les ayant droit

4 4 SGBD Support : MsAccess 2007 Disponible à Dauphine par MSDN Voir CRIO InterUFR (2 ème étage, Nouvelle Aile) Vendu + que tous les autres SGBD ensemble 11M licences / mois = 132 M / an La plus amicale interface usager sur le marché ht=540&startindex=0&CTT=11&Origin=HA # ht=540&startindex=0&CTT=11&Origin=HA # (Pub. MS) Très complet 4 GL, SQL2, QBE, OLE, ODBC, Multimédia, Multibase, « Web-enabled »… 1er SGBD pour tout un chacun

5 5 Contrôle de connaissances  Selon le cours  Examen ?  Projet  Après le vote populaire au 1èr cours  Questions ? Bureau B640

6 Plan u Introduction u Problèmes techniques à résoudre u Origines du concept –Approche Base Centralisée (ANSI-SPARC) –Approche BDR (top-down) –Approche Schéma Global (bottom-up) u Architectures de référence –Architecture multibase –Architecture Fédérée u Autonomie, Hétérogénéité sémantique, Modèle commun

7 Modèle multibase u Modèle base unique ANSI-SPARC : –L'univers réel doit être modelé par une base de données u L'univers réel sera modelé par plusieurs bases de données –autonomes –sémantiquement hétérogènes –munies d'un langage multibases  "Multidatabase Interoperability". Litwin, W. Abdellatif, A. Multidatabase Systems: An Advanced Solution for Global Information Sharing. Hurson, A., R., Bright, M., W., Pakzad, S., H., (ed.). IEEE Press, 1993

8 Modèle multibase Cours & étudiants Bibliothèque Employés Rest. Mes-amis Autres BDs sur Internet Paris 9 Privé Teletel Folio Cine

9 Problèmes majeurs u Architecture de référence u Hétérogénéité sémantique en présence d'autonomie locale u Modèle de données commun u Fonctions de langage multibases u Transactions u Protocoles & standards u Performances

10 Architecture de référence u Architecture multibase –Généralisation de l'architecture BD de ANSI-SPARC u Architecture bases fédérées –Généralisation de l'architecture BD fédérée u Autres

11 Architecture BD de ANSI-SPARC Une BD centralisée intégrée (Années ) ES - Schéma Externe CS - Schéma Conceptuel PS - Schéma Physique ou Interne

12 Base de données Répartie u Origine du concept (années 1970) –Développement de réseaux (lents : 20 Kb/s) –Surcharge d'une BD centralisée

13 Base de données Répartie u Idée : distribution de fonctions autres que la communication locale (approche "top-down") u Lesquelles ?  Exécution répartie (OS)  Accès aux fichiers La base u Alors quel modèle de données pour le CS ?  Hiérarchique & réseau Relationnel

14 Fragmentation de relations Hotels (H#, Ville, Cat, #Chambres) (H#, Ville) (H#, Cat, #Chambres) Un fragment

15 Problèmes u Scalabilité du schéma global u Utilité du schéma global pour un usager local u Performances de requêtes (mauvais cas) u Nécessité de migration de données existantes dans de bases multiples d'une même entreprise »IMS, IDMS, Socrate...

16 LAN Serveurs Clients

17 u Fragmentation type BDP –Par hachage » En général statique u Teradata, IBM… » Adr = Hash(Clé) mod N_Serveurs u Hash est une signature de la clé – Par SHA, MD5, SA… u Teradata, DB2 Fragmentation BDP/P2P/GRID

18 u Fragmentation type BDP –Par intervalles pré-définis d’un attribut ordonné »Serveur 1 : Ville = A*..D*, Serveur 2 Ville = E*..I* etc u SQL Server, Oracle u Fragmentation « par colonne » u Utile pour les systèmes OLAP u Monet, Vertica Fragmentation BDP/P2P/GRID

19 Architecture BDP/P2P (exemples) u SQL Server – 256 serveurs (2006) u Sybase –64 serveurs u DB2 –16 (gros ?) serveurs ? u Oracle –parallèle non-BDR (CPUs partagent les disques)

20 ¶Un usager peut avoir les données dans plusieurs BDs compatibles ANSI- SPARC et hétérogènes u Un GS présente toutes les données comme une seule BD classique –relationnelle ou fonctionnelle (DAPLEX) u les ES sont dérivés de GS ¶Un usager peut avoir les données dans plusieurs BDs compatibles ANSI- SPARC et hétérogènes u Un GS présente toutes les données comme une seule BD classique –relationnelle ou fonctionnelle (DAPLEX) u les ES sont dérivés de GS Architecture "bottom-up" à Schéma Conceptuel Global (GS) CS GS ES PS Approche GS ("bottom-up")

21 Problèmes avec l'approche "bottom-up" u Création du schéma global u Hétérogénéité sémantique de données u Temps d'intégration / autonomie de restructuration locale u Mises à jour u Performances u Vues hétérogènes u Création du schéma global u Hétérogénéité sémantique de données u Temps d'intégration / autonomie de restructuration locale u Mises à jour u Performances u Vues hétérogènes CS GS ES PS Approche GS ("bottom-up")

22 ¶Un usager peut avoir les données dans plusieurs BDs compatibles ANSI- SPARC u En général il sera impossible de créer un Schéma Global (GS) u L'usager peut être en face de plusieurs CSs ¶Un usager peut avoir les données dans plusieurs BDs compatibles ANSI- SPARC u En général il sera impossible de créer un Schéma Global (GS) u L'usager peut être en face de plusieurs CSs Architecture MBD (Multibase) Absence de Schéma Conceptuel Global (GS) CS PS

23 Architecture multibase (W. Litwin & al, années 1980) ES multibase Req. MDB

24 Architecture MBD (Multibase) Fonctions du Langage Multibase ·Un langage de définition et de manipulation de collections de BDs (multibases) au niveau conceptuel MDB »Formulation de requêtes (explicitement) multibases u se referant aux noms de BDs u avec des jointures multibases...  Trouver dans la base Michelin et dans la base Gaumont tous les restaurants '**' et cinémas sur une même rue ·Un langage de définition et de manipulation de collections de BDs (multibases) au niveau conceptuel MDB »Formulation de requêtes (explicitement) multibases u se referant aux noms de BDs u avec des jointures multibases...  Trouver dans la base Michelin et dans la base Gaumont tous les restaurants '**' et cinémas sur une même rue

25 Architecture MBD (Multibase) Concept de Langage Multibase ·Définition de ES multibases (MES) »Présentant quelques bases comme une seule BD »Pouvant intégrer des CSs ou des ES ou des MES ·Définition de ES multibases (MES) »Présentant quelques bases comme une seule BD »Pouvant intégrer des CSs ou des ES ou des MES

26 Architecture MBD (Multibase) Concept de Langage Multibase u Définition de dépendances multibases entre les CSs –sémantiques (ontologies), p.ex. en RDF » City Is Ville ; Town Is Ville ; Township Is Ville –intégrité »Intégrité référentielle multibase »Aucun SGBD ne permet de déclarer comme pour celle monobase » Pourquoi ? u Bonne question u Définition de dépendances multibases entre les CSs –sémantiques (ontologies), p.ex. en RDF » City Is Ville ; Town Is Ville ; Township Is Ville –intégrité »Intégrité référentielle multibase »Aucun SGBD ne permet de déclarer comme pour celle monobase » Pourquoi ? u Bonne question

27 Architecture MBD (Multibase) Concept de Langage Multibase u Définition de dépendances multibases entre les CSs –Sécurité »Un usage ne peut pas sélectionner une donnée D1 de la base B1 et la donnée D2 de la base B2 – manipulation... » Déclencheurs multibases u Create Trigger … »Flux de diffusion u RSS…. u Définition de dépendances multibases entre les CSs –Sécurité »Un usage ne peut pas sélectionner une donnée D1 de la base B1 et la donnée D2 de la base B2 – manipulation... » Déclencheurs multibases u Create Trigger … »Flux de diffusion u RSS….

28 Architecture MBD (Multibase) Concept de Multibase u Une multibase (MBD) est une collection de BDs munie d'un langage multibase –par exemple le langage MSQL que l'on verra u Une collection de BDs sans langage multibase n'est pas une MDB, mais juste une collection de BDs –d'une même manière qu'une collection de fichiers plats (tables) sans langage de base de données, SQL par exemple, n'est pas une BD

29 Quelques multibases potentielles Cours & étudiants Bibliothèque Employés Rest. Mes-amis Autres BDs sur Internet Paris 9 Privé Teletel Folio Cine MSQL: Create MDB Paris 9 Include Employés Include Bibliothèque.....

30 Architecture MBD Concept de Sous-niveau Interne Logique ¸Les modèles de données de BDs existantes peuvent être hétérogènes –différent dialectes de SQL –Relationnel –XML –CCS u Il est préférable d'avoir un seul modèle au niveau multibase –Il faut avoir une possibilité d'un sous-niveau de traduction

31 Architecture MBD Concept de Sous-niveau Interne Logique ¹Par ailleurs un DBA peut ne pas vouloir montrer son CS local au niveau multibase u Solution générale –ILS - Schéma Interne Logique »inconnu de ANSI-SPARC »appelé par la passerelle (Gateway) ou médiateur u terminologie populaire u Origine: G. Wiederhold (Stanford)

32 Système de Gestion Multibases (SGMB)  Un système offrant l’interface multibase 1. Sans être SGBD lui-même  Gère le niveau CS et ES de l’arch. MBD 1. Appelé souvent:  Médiateur  « Wrapper »  Intégrateur  « Meta – Engine »  Méta-SGBD….

33 Système de Gestion Multibases (SGMB)  Exemples  Historiques relationnels:  UniSQL/M, EDASQL…  Actuels:  Relationnel QBE d’Excell,  Web par mots Clés:  MetaCrawler, DogPile, IBoogie…  Web documentaire (CCS)  MetaPhys, Folio (Stanford U.)…  XML & XQuery: BEA AquaLogic

34 Système de Gestion Multibases (SGMB ) 2. SGMB = SGBD muni du langage multibase  Relationnels : SQL et QBE  Principaux SGBDs  MsAccess SQL et QBE multibases  SQL multibase:  SQL Server, Oracle, MySQL, DB2, Sybase, Interbase…  SQL (encore) monobase: PostgreSQL…  XML : Aucun SGMB connu

35 Interopérabilité u Les bases d’un SGMB sont dites interopérables u Elles peuvent ne pas ne pas être a priori conçues pour u Néanmoins en général, il faut une coopération entre les DBA u Dans les limites pratiques de compromis entre – Autonomie locale / Autonomie MBD

36 Architecture Fédérée (Hambiger & McLeod, années 1980) u Toute BD doit être autonome u En général il n'y aura pas d'un GS –L'intégration globale est contraire à l'autonomie u Les BDs utilisées en commun doivent former une fédération de BDs autonomes u Toute BD doit être autonome u En général il n'y aura pas d'un GS –L'intégration globale est contraire à l'autonomie u Les BDs utilisées en commun doivent former une fédération de BDs autonomes

37 Architecture Fédérée (Hambiger & McLeod, années 1980) u Toute BD d'une fédération doit avoir trois schémas: –ES: Schéma d'Exportation: pour les données permises à l'exportation –IS: Schéma d'Importation: pour les données importées –PS: Schéma Privé: pour l'ensemble de données privées, ES et IS inclus u Il doit y avoir un Dictionnaire de Fédération (FD) u Toute BD d'une fédération doit avoir trois schémas: –ES: Schéma d'Exportation: pour les données permises à l'exportation –IS: Schéma d'Importation: pour les données importées –PS: Schéma Privé: pour l'ensemble de données privées, ES et IS inclus u Il doit y avoir un Dictionnaire de Fédération (FD)

38 Architecture Fédérée (Hambiger & McLeod, années 1980)

39 Comparaison u Architecture MDB axée sur le concept de langage multibase u Architecture Fédérée axée sur le concept d'autonomie –pas de notion de langage multibase –mais il y a une notion d'autonomie aussi dans l'arch. MDB

40 Comparaison u Architecture MDB est + décentralisée –pas d'équivalent de Dictionnaire de Fédération –plusieurs DSs pour ce rôle u Les deux architectures sont populaires –Contrairement aux nombreuses autres propositions »aujourd'hui oubliées en pratique

41 Comparaison MDB Féd

42 Autonomie d'une base ( autonomie locale) u Faculté de contrôle de données d'une base locale par le DBA 1.Noms de données 2.Type de valeurs 3.Structures de données 4.Structures physiques 5.Exécution de requêtes 6.Sécurité 7.Priorité aux requêtes locales

43 Autonomie multibase u Choix des aspects multibases –Par un MBA (souvent une Comité) u Mêmes facettes que de l'autonomie locale –Modèle commun, Certains nom de données... u Peut générer un conflit avec l'autonomie locale B1 B2 B3

44 Autonomie multibase u Si conflit: u Priorité à l'autonomie locale u Ou priorité à l’autonomie mbd u Emploi d’un médiateur – HTML au niveau MBD (CS), SQL-Server, MySQL… au niveau BD (ILS) -> Sharepoint etc entre les deux B1 B2 B3

45 Autonomie: solutions u On n’a pas de baguette magique u Probablement on n’aura jamais u On propose des solutions limitées – Pour cas particuliers de chaque facette u C’est d’ailleurs la démarche générale en BDs

46 Hétérogénéité sémantique u Différences dans les représentations de mêmes propriétés réelles  Noms André  Andrew u Types de valeurs –type de représentation –unité de mesure cm/s  pied/h –précision 1 g  1 Kg u Structures de données une table en 2 NF  plusieurs tables en 3 NF

47 Hétérogénéité sémantique u Différences dans les représentations de mêmes propriétés réelles  Noms André  Andrew u Types de valeurs –type de représentation –unité de mesure cm/s  pied/h –précision 1 g  1 Kg u Structures de données une table en 2 NF  plusieurs tables en 3 NF

48 Solutions (partielles) u Schémas + descriptifs u Protocoles + descriptifs u Dictionnaires de données u Thesaurus u Conversion automatique de représentations u Conversion automatique d'unités u Equijointures de valeurs à précision diff. u Jointures implicites

49 Modèle commun u Relationnel –SQL –MSQL et SchemaSQL (recherche) –Federated Database (IBM) –ODBC Microsoft & al u CCS langage pour les bases documentaires u Nombreuses passerelles (gateways) vers SQL u Web 2 dit aussi Web Sémantique – Extended Web Services –XML & XQuery –RDF & SQL or RDQL

50 UniSQL/M (approche historique) UniSQL/M DB2 Oracle UniSQL IMS UniSQL/ était un SGMB, mais pas un SGBD EDA-SQL était un autre SGMB populaire

51 Aujourd’hui (par exemple) MsAccess Oracle MsAccess Sybase DB2

52 Le présent et l’avenir proche ODBC x

53 Conclusion 2009 u Les bases de principaux SGBD ne sont pas BDRs, mais peuvent être distribuées et parallèles –Oracle Grid –Sybase –DB2 –Teradata –SQL Server

54 Conclusion 2009 u Les principaux SGBD sont désormais en en général des systèmes multibases –MsAccess –Oracle –Sybase –DB2 –MySQL –Interbase...

55 Conclusion 2009 u Certains sont aussi fédérés –DB2 –MsAccess » Une tables dite Attachée est une vue importée u Il y a aussi des SGMB « wrappers » – Déjà cités

56 Conclusion 2009 u L'accès multibase nécessite néanmoins (toujours) de nouvelles fonctions au niveau de SGBD pour gérer –l'autonomie en général –l'hétérogénéité sémantique en particulier –la distribution physique de données u On n’a toujours pas de baguette magique u Mais on progresse

57 Conclusion u Les solutions techniques sont basées sur: –nouvelles architectures de référence »architecture multibase »architecture fédérée –modèles communs de données »ODBC, XML ou RDF –Passerelles directes de traduction de dialectes SQL MsAccess -> SQL Server, Paradox… »Oracle -> SQL Server, Sybase…

58 Conclusion u Langages multibases –Dialectes SQL – MSQL, SchemaSQL (recherche) u Nouveaux modèles de transaction u Protocoles et Standards –ODBC, DCE, EWS u Tout ça à voir + en détail –dans la suite du cours –dans les livres présentés durant le cours

59 Exercices u Différence entre les notions d’une BD, BDR, MBD et FBDs. u Que est ce que c’est « une architecture de référence », ANSI-SPARC par exemple ? u Différences entre l’architecture « top-down », « bottom-up », multibase et fédérée.  Commentez la notion de bases fédérées dans DB2 V. 6 à travers la description dans le Help de ce système, de RedBooks sur le site web d’IBM. Et sous Google en général. P. ex.  aas.html aas.html

60 Exercices u Concevoir les ordres SQL réalisant la fragmentation de la base des hôtels du cours. De deux manières: 1. Les fragments sous forme de commande Create Fragment as Select … Into Base.Fragment From Hotels Where… 2. Définir vue globale des fragments sous forme CREATE VIEW Hotels AS SELECT… u Commentez le concept d’ILS, de passerelle et de médiateur u Quel est le modèle multibase le plus répandu aujourd’hui ?

61 Exercices u Commentez le concept d’autonomie locale (quoi, pourquoi, comment) u Donnez des exemples de divers types d’hétérogénéité sémantique  Prouvez que l’associativité d’équijointures n’existe plus si les valeurs à joindre peuvent être de précision différente u Les conséquences pour les SGBDs relationnels ? P Proposez une extension de SQL introduisant les unités de mesure et le traitement de requêtes correspondant (sujet de Thèse).

FIN