La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 Manipulations multibases et distribuées Partie 1 Witold Litwin

Présentations similaires


Présentation au sujet: "1 Manipulations multibases et distribuées Partie 1 Witold Litwin"— Transcription de la présentation:

1 1 Manipulations multibases et distribuées Partie 1 Witold Litwin

2 2 Plan u Introduction u Problèmes techniques à résoudre u Origines du concept –Approche Base Centralisée (ANSI-SPARC) –Approche BDR (top-down) –Approche Schéma Global (bottom-up) u Architectures de référence –Architecture multibase –Architecture Fédérée u Concepts d'autonomie, d'hétérogénéité sémantique et du modèle commun

3 3 Modèle multibase u Modèle base unique ANSI-SPARC : –L'univers réel doit être modelé par une base de données u L'univers réel sera modelé par plusieurs bases de données –autonomes –sémantiquement hétérogènes –munies d'un langage multibases "Multidatabase Interoperability". Litwin, W. Abdellatif, A. Multidatabase Systems: An Advanced Solution for Global Information Sharing. Hurson, A., R., Bright, M., W., Pakzad, S., H., (ed.). IEEE Press, 1993

4 4 Modèle multibase Cours & étudiants Bibliothèque Employés Rest. Mes-amis Autres BDs sur Internet Paris 9 Privé Teletel Folio Cine

5 5 Problèmes majeurs u Architecture de référence u Hétérogénéité sémantique en présence d'autonomie locale u Modèle de données commun u Fonctions de langage multibases u Transactions u Protocoles & standards u Performances

6 6 Architecture de référence u Architecture multibase –Généralisation de l'architecture BD de ANSI-SPARC u Architecture bases fédérées –Généralisation de l'architecture BD fédérée u Autres

7 7 Architecture BD de ANSI-SPARC Une BD centralisée intégrée (Années ) ES - Schéma Externe CS - Schéma Conceptuel PS - Schéma Physique ou Interne

8 8 Base de données Répartie u Origine du concept (années 1970) –Développement de réseaux (lents : 20 Kb/s) –Surcharge d'une BD centralisée

9 9 Base de données Répartie u Idée : distribution de fonctions autres que la communication locale (approche "top-down") u Lesquelles ? Exécution répartie (OS) Accès aux fichiers La base u Alors quel modèle de données pour le CS ? Hiérarchique & réseau Relationnel

10 10 Fragmentation de relations Hotels (H#, Ville, Cat, #Chambres) (H#, Ville) (H#, Cat, #Chambres) Un fragment

11 11 Problèmes u Scalabilité du schéma global u Utilité du schéma global pour un usager local u Performances de requêtes (mauvais cas) u Nécessité de migration de données existantes dans de bases multiples d'une même entreprise »IMS, IDMS, Socrate...

12 12 ¶Un usager peut avoir les données dans plusieurs BDs compatibles ANSI- SPARC et hétérogènes u Un GS présente toutes les données comme une seule BD classique –relationnelle ou fonctionnelle (DAPLEX) u les ES sont dérivés de GS ¶Un usager peut avoir les données dans plusieurs BDs compatibles ANSI- SPARC et hétérogènes u Un GS présente toutes les données comme une seule BD classique –relationnelle ou fonctionnelle (DAPLEX) u les ES sont dérivés de GS Architecture "bottom-up" à Schéma Conceptuel Global (GS) CS GS ES PS Approche GS ("bottom-up")

13 13 Problèmes avec l'approche "bottom-up" u Création du schéma global u Hétérogénéité sémantique de données u Temps d'intégration / autonomie de restructuration locale u Mises à jour u Performances u Vues hétérogènes u Création du schéma global u Hétérogénéité sémantique de données u Temps d'intégration / autonomie de restructuration locale u Mises à jour u Performances u Vues hétérogènes CS GS ES PS Approche GS ("bottom-up")

14 14 ¶Un usager peut avoir les données dans plusieurs BDs compatibles ANSI- SPARC u En général il sera impossible de créer un Schéma Global (GS) u L'usager peut être en face de plusieurs CSs ¶Un usager peut avoir les données dans plusieurs BDs compatibles ANSI- SPARC u En général il sera impossible de créer un Schéma Global (GS) u L'usager peut être en face de plusieurs CSs Architecture MBD (Multibase) Absence de Schéma Conceptuel Global (GS) CS PS

15 15 Architecture multibase (W. Litwin & al, années 1980) ES multibase Req. MDB

16 16 Architecture MBD (Multibase) Concept de Langage Multibase ·Un langage de définition et de manipulation de collections de BDs (multibases) au niveau conceptuel MDB »Définition de ES multibases u Présentant quelques bases comme une seule BD u Peut-être des GSs, si peu de BDs à intégrer »Définition de dépendances multibases entre les CSs u dépendances sémantiques, intégrité, sécurité, manipulation... »Formulation de requêtes (explicitement) multibases u se referant aux noms de BDs u avec des jointures multibases... Trouver dans la base Michelin et dans la base Gaumont tous les restaurants '**' et cinémas sur une même rue ·Un langage de définition et de manipulation de collections de BDs (multibases) au niveau conceptuel MDB »Définition de ES multibases u Présentant quelques bases comme une seule BD u Peut-être des GSs, si peu de BDs à intégrer »Définition de dépendances multibases entre les CSs u dépendances sémantiques, intégrité, sécurité, manipulation... »Formulation de requêtes (explicitement) multibases u se referant aux noms de BDs u avec des jointures multibases... Trouver dans la base Michelin et dans la base Gaumont tous les restaurants '**' et cinémas sur une même rue

17 17 Architecture MBD (Multibase) Concept de Multibase u Une multibase (MBD) est une collection de BDs munie d'un langage multibase –par exemple le langage MSQL que l'on verra u Une collection de BDs sans langage multibase n'est pas une MDB, mais juste une collection de BDs –d'une même manière qu'une collection de fichiers plats (tables) sans langage de base de données, SQL par exemple, n'est pas une BD

18 18 Quelques multibases potentielles Cours & étudiants Bibliothèque Employés Rest. Mes-amis Autres BDs sur Internet Paris 9 Privé Teletel Folio Cine MSQL: Create MDB Paris 9 Include Employés Include Bibliothèque.....

19 19 Architecture MBD Concept de Sous-niveau Interne Logique ¸Les modèles de données de BDs existantes peuvent être hétérogènes –différent dialectes de SQL –Relationnel, hiérarchique, réseau –OO et Relationnel-Objet –OO comme-ceci et OO comme-cela u Il est préférable d'avoir un seul modèle au niveau multibase –Il faut avoir une possibilité d'un sous-niveau de traduction ¹Par ailleurs un DBA peut ne pas vouloir montrer son CS local au niveau multibase u Solution: ILS - Schéma Interne Logique »inconnu de ANSI-SPARC »appelé par la passerelle (Gateway) ou médiateur u terminologie industrielle

20 20 Architecture multibase (W. Litwin & al, années 1980) ES multibase Req. MDB

21 21 Architecture Fédérée (Hambiger & McLeod, années 1980) u Toute BD doit être autonome u En général il n'y aura pas d'un GS –L'intégration globale est contraire à l'autonomie u Les BDs utilisées en commun doivent former une fédération de BDs autonomes u Toute BD d'une fédération doit avoir trois schémas: –ES: Schéma d'Exportation: pour les données permises à l'exportation –IS: Schéma d'Importation: pour les données importées –PS: Schéma Privé: pour l'ensemble de données privées, ES et IS inclus u Il doit y avoir un Dictionnaire de Fédération (FD) u Toute BD doit être autonome u En général il n'y aura pas d'un GS –L'intégration globale est contraire à l'autonomie u Les BDs utilisées en commun doivent former une fédération de BDs autonomes u Toute BD d'une fédération doit avoir trois schémas: –ES: Schéma d'Exportation: pour les données permises à l'exportation –IS: Schéma d'Importation: pour les données importées –PS: Schéma Privé: pour l'ensemble de données privées, ES et IS inclus u Il doit y avoir un Dictionnaire de Fédération (FD)

22 22 Architecture Fédérée (Hambiger & McLeod, années 1980)

23 23 Comparaison u Architecture MDB axée sur le concept de langage multibase u Architecture Fédérée axée sur le concept d'autonomie –pas de notion de langage multibase –mais il y a une notion d'autonomie aussi dans l'arch. MDB u Architecture MDB est + décentralisée –pas d'équivalent de Dictionnaire de Fédération –plusieurs DSs pour ce rôle u Les deux architectures sont populaires –Contrairement aux nombreuses autres propositions »aujourd'hui oubliées en pratique

24 24 Comparaison MDB Féd

25 25 Autonomie d'une base ( autonomie locale) u Faculté de contrôle de données d'une base locale par le DBA –Noms de données –Type de valeurs –Structures de données –Structures physiques –Exécution de requêtes –Sécurité –Priorité aux requêtes locales

26 26 Autonomie multibase u Faculté de contrôle de bases multiples par un DBA u Mêmes aspects que pour l'autonomie locale –Nom de données... u Peut générer un conflit avec l'autonomie d'une base u Priorité à l'autonomie locale B1 B2 B3

27 27 Hétérogénéité sémantique u Différences dans les représentations de mêmes propriétés réelles Noms André Andrew u Types de valeurs –type de représentation –unité de mesure cm/s pied/h –précision 1 g 1 Kg u Structures de données une table en 2 NF plusieurs tables en 3 NF

28 28 Solutions (partielles) u Schémas + descriptifs u Protocoles + descriptifs u Dictionnaires de données u Thesaurus u Conversion automatique de représentations u Conversion automatique d'unités u Equijointures de valeurs à précision diff. u Jointures implicites

29 29 Modèle commun u Relationnel étendu –EDA-SQL –MSQL (recherche) –ODBC Microsoft SQL u Relationnel-Objet –UniSql/M, DB2, le standard SQL 3 u CCS langage pour les bases documentaires u Nombreuses passerelles (gateways) vers SQL –IMS SQL –Codasyl SQL u XML pour le Web

30 30 UniSQL/M DB2 Oracle UniSQL IMS

31 31 Autres passerelles UniSQL/M Oracle UniSQL IMS DB2

32 32 Encore autres passerelles UniSQL/M Oracle UniSQL IMS EDA-SQL DB2

33 33 L'avenir ODBC x

34 34 Conclusion u Les SGBD modernes sont désormais en général des systèmes multibases –UniSQL/M, Oracle, Sybase, MsAccess... u L'accès multibase nécessite de nouvelles fonctions au niveau de SGBD pour gérer –l'autonomie –l'hétérogénéité sémantique –la distribution physique de données

35 35 Conclusion u Les solutions techniques sont basées sur: –nouvelles architectures de référence »architecture multibase »architecture fédérée –modèles communs de données »relationnel et relationnel-objet –Passerelles de traduction de modèles, en développent rapide »UniSQL/M -> IMS, Oracle, Sybase »Oracle -> IMS, Sybase »Tout SGBD vers tout autre SGBD à travers ODBC

36 36 Conclusion u Langages multibases –MSQL et SQL-x ; x > 2 u Nouveaux modèles de transaction u Protocoles et Standards –RDA, SQL-Access, ODBC u Tout ça à voir + en détail –dans la suite du cours –dans les livres présentés durant le cours

37 37 Exercices u Tous ceux déjà dans le texte u Différence entre les notions dune BD, BDR, MBD et FBDs. u Que est ce que cest « une architecture de référence », ANSI-SPARC par exemple ? u Différences entre larchitecture « top-down », « bottom-up », multibase et fédérée. Commentez la notion de bases fédérées dans DB2 V. 6 à travers la description dans le Help de ce système et de RedBooks sur le site web dIBM. u Concevoir les ordres SQL réalisant la fragmentation de la base des hôtels du cours. u Commentez le concept dILS, de passerelle et de médiateur u Quel est le modèle multibase commun le plus répandu aujourdhui ? u Commentez le concept dautonomie locale (quoi, pourquoi, comment) u Observez des exemples de divers types dhétérogénéité sémantique Prouvez que lassociativité habituelle déquijointures nexiste plus si les unités de valeurs à joindre peuvent être de précisions différentes u Les conséquences pour les SGBDs relationnels ? P Proposez une extension de SQL introduisant les unités de mesure et le traitement de requêtes correspondant (sujet de Thèse).

38 FIN

39


Télécharger ppt "1 Manipulations multibases et distribuées Partie 1 Witold Litwin"

Présentations similaires


Annonces Google