Manipulations multibases et distribuées Partie 1

Slides:



Advertisements
Présentations similaires
Mais vous comprenez qu’il s’agit d’une « tromperie ».
Advertisements

Le Nom L’adjectif Le verbe Objectif: Orthogram
ORTHOGRAM PM 3 ou 4 Ecrire: « a » ou « à » Référentiel page 6
Licence pro MPCQ : Cours
Additions soustractions
Distance inter-locuteur
1 Plus loin dans lutilisation de Windows Vista ©Yves Roger Cornil - 2 août
Proposition de recherches sur ABI (Pro Quest) Lise Herzhaft (Urfist de Lyon) et MH Prévoteau (Bibliothèque Université Paris 2) Mise en forme par Nolwenn.
Les numéros 70 –
Les numéros
Les identités remarquables
Le, la, les words Possessive Adjectives MINE!!. 2 My in french is mon, ma,mes... Le word/ begins with a vowel: Mon La word: Ma Les word: Mes.
SQL - Subtilités.
Le Modèle Logique de Données
Directeur de Thèse : Pr. Witold Litwin
Witold Litwin Structures physiques Witold Litwin
Manipulations multibases et distribuées Partie 1
Algèbre relationnelle
LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.
Programme Introduction aux BD et aux SGBD Le modèle relationnel
User management pour les entreprises et les organisations Auteur / section: Gestion des accès.
1 7 Langues niveaux débutant à avancé. 2 Allemand.
Le Concours de Conaissance II Francais I decembre 2012.
COTE DIVOIRE IMAGES DES ATROCITES COMMISES PAR ALASSANE DRAMANE OUATARA, SORO GUILAUMES ET LEURS HOMMES 1.
Mr: Lamloum Med LES NOMBRES PREMIERS ET COMPOSÉS Mr: Lamloum Med.
SERABEC Simulation sauvetage aérien avec un Hercule C130. Départ de St-Honoré le 4 octobre Durée de vol 3 heures. Premier vol en Hercule pour les.
1 5 octobre 2011 / paw Présentation du 7 octobre 2011.
La méthodologie………………………………………………………….. p3 Les résultats
Développement d’applications web
Interagir avec un objet mixte Propriétés physiques et numériques Céline Coutrix, Laurence Nigay Équipe Ingénierie de lInteraction Homme-Machine (IIHM)
Contrôles d'accès aux données
Jack Jedwab Association détudes canadiennes Le 27 septembre 2008 Sondage post-Olympique.
Le soccer & les turbans Sondage mené par lAssociation détudes canadiennes 14 juin 2013.
Présentation générale
1 Guide de lenseignant-concepteur Vincent Riff 27 mai 2003.
GRAM 1 CE2 Je sais transformer une phrase affirmative en phrase négative.
Le drapeau canadien comme symbole de fierté nationale : une question de valeurs partagées Jack Jedwab Association détudes canadiennes 28 novembre 2012.
Chap 4 Les bases de données et le modèle relationnel
Bases de Données Réparties
Le Concours de Conaissance Francais I novembre 2012.
Si le Diaporama ne s'ouvre pas en plein écran Faites F5 sur votre clavier.
Titre : Implémentation des éléments finis sous Matlab
Projet poker 1/56. Introduction Présentation de léquipe Cadre du projet Enjeux Choix du sujet 2.
Gestion des bases de données
F Copyright © Oracle Corporation, Tous droits réservés. Créer des programmes avec Procedure Builder.
LES NOMBRES PREMIERS ET COMPOSÉS
Logiciel gratuit à télécharger à cette adresse :
Les chiffres & les nombres
RACINES CARREES Définition Développer avec la distributivité Produit 1
Représentation des systèmes dynamiques dans l’espace d’état
DUMP GAUCHE INTERFERENCES AVEC BOITIERS IFS D.G. – Le – 1/56.
Année universitaire Réalisé par: Dr. Aymen Ayari Cours Réseaux étendus LATRI 3 1.
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
1 INETOP
Michel Tollenaere SQL et relationnel ENSGI Cours MSI 2A Relationnel et SQL version 1.4 du 25 septembre 2007 (ajout jointures) 1 Modèle relationnel Historique.
Aire d’une figure par encadrement
P.A. MARQUES S.A.S Z.I. de la Moussière F DROUE Tél.: + 33 (0) Fax + 33 (0)
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
1/65 微距摄影 美丽的微距摄影 Encore une belle leçon de Macrophotographies venant du Soleil Levant Louis.
Introduction.
Nom:____________ Prénom: ___________
Direction de santé publique de la Montérégie PORTFOLIO THÉMATIQUE EXPÉRIENCE DE SOINS DES ANGLOPHONES DE LA MONTÉRÉGIE Direction de santé publique Surveillance.
Discussion autour du référentiel
La formation des maîtres et la manifestation de la compétence professionnelle à intégrer les technologies de l'information et des communications (TIC)
Réalisé par : Mr IRZIM Hédi Mr JRAD Firas
1 BDs Orientées Objets Witold LITWIN. 2 Pourquoi ? F Les BDs relationnelles ne sont pas adaptées aux applications CAD/CAM, cartes géo... F le problème.
DB2. Universal Database. D. Chamberlin, Morgan-Kaufman Delmal, P. SQL2. INPRES, * A First Course in Database Syst. Ullman, J., Widom, J.,
1 Manipulations multibases et distribuées Partie 1 Witold Litwin
1 Structure en MC Principes Stockage des données dans la mémoire volatile d’un ordinateur Problèmes Stockage temporaire «Petits» volumes de données Langages.
Transcription de la présentation:

Manipulations multibases et distribuées Partie 1 Witold Litwin Witold.Litwin@dauphine.fr 2011 - 12

Livres de Support Management of Heterogeneous and Autonomous Database Systems. Elmagarmid A. Rusinkiewicz, M. Sheth, A. Morgan Kaufmann

Livres de Support Principles of Distributed Databases . 2 ed. Tamer Ozsu, Patrick Valduriez, Prentice Hall & Web (download)

Support des Cours Internet & Powerpoint http://ceria.dauphine.fr/cours98/BD-wl-98.html Visionneuse PPT libre sur le site Microsoft Chaque cours est une union de tous les cours sur le sujet que je donne à Dauphine Les cours peuvent être imprimés par la visionneuse en plusieurs formats & en couleur Format recommandé : 3 diapos / page, Polies N/B imprimées par la Fac pour les ayant droit

SGBD Support : MsAccess 2007 Disponible à Dauphine par MSDN Voir CRIO InterUFR (2ème étage, Nouvelle Aile) Vendu + que tous les autres SGBD ensemble 11M licences / mois = 132 M / an La plus amicale interface usager sur le marché http://office.microsoft.com/home/video.aspx?assetid=ES102552011033&width=884&height=540&startindex=0&CTT=11&Origin=HA102552031033# (Pub. MS) Très complet 4 GL, SQL2, QBE, OLE, ODBC, Multimédia, Multibase, « Web-enabled »… 1er SGBD pour tout un chacun

Contrôle de connaissances Selon le cours Examen ? Projet Après le vote populaire au 1èr cours Questions ? Witold.Litwin@dauphine.fr Bureau B209 http://ceria.dauphine.fr

Plan Introduction Problèmes techniques à résoudre Origines du concept Approche Base Centralisée (ANSI-SPARC) Approche BDR (top-down) Approche Schéma Global (bottom-up) Architectures de référence Architecture multibase Architecture Fédérée Autonomie, Hétérogénéité sémantique, Modèle commun

Modèle multibase Modèle base unique ANSI-SPARC : L'univers réel doit être modelé par une base de données L'univers réel sera modelé par plusieurs bases de données autonomes sémantiquement hétérogènes munies d'un langage multibases "Multidatabase Interoperability". Litwin, W. Abdellatif, A. Multidatabase Systems: An Advanced Solution for Global Information Sharing. Hurson, A., R., Bright, M., W., Pakzad, S., H., (ed.). IEEE Press, 1993

Modèle multibase Autres BDs Rest. Cours & étudiants sur Internet Mes-amis Bibliothèque Privé Paris 9 Employés Folio Cine Teletel

Problèmes majeurs Architecture de référence Hétérogénéité sémantique en présence d'autonomie locale Modèle de données commun Fonctions de langage multibases Transactions Protocoles & standards Performances

Architecture de référence Architecture multibase Généralisation de l'architecture BD de ANSI-SPARC Architecture bases fédérées Généralisation de l'architecture BD fédérée Autres

Architecture BD de ANSI-SPARC Une BD centralisée intégrée (Années 1960-70) ES - Schéma Externe CS - Schéma Conceptuel PS - Schéma Physique ou Interne

Base de données Répartie Origine du concept (années 1970) Développement de réseaux (lents : 20 Kb/s) Surcharge d'une BD centralisée

Base de données Répartie 1ère Conf Intl. sur le sujet (1980)

Base de données Répartie Idée : distribution de fonctions autres que la communication locale (approche "top-down") Lesquelles ? Exécution répartie (OS) Accès aux fichiers La base Alors quel modèle de données pour le CS ? Hiérarchique & réseau Relationnel

Fragmentation de relations Hotels (H#, Ville, Cat, #Chambres) Un fragment (H#, Ville) (H#, Cat, #Chambres)

Problèmes Scalabilité du schéma global Utilité du schéma global pour un usager local Performances de requêtes (mauvais cas) Nécessité de migration de données existantes dans de bases multiples d'une même entreprise IMS, IDMS, Socrate...

Architecture BDR/BDP/P2P Clients LAN Serveurs

Fragmentation BDP/P2P/GRID Fragmentation type BDP Par hachage En général statique Teradata, IBM… Adr = Hash(Clé) mod N_Serveurs Hash est une signature de la clé Par SHA, MD5, SA… Teradata, DB2

Fragmentation BDP/P2P/GRID Fragmentation type BDP Par intervalles pré-définis d’un attribut ordonné Serveur 1 : Ville = A*..D*, Serveur 2 Ville = E*..I* etc SQL Server, Oracle Fragmentation « par colonne » Utile pour les systèmes OLAP Monet, Vertica

Architecture BDP/P2P (exemples) SQL Server 256 serveurs (2006) Sybase 64 serveurs DB2 16 (gros ?) serveurs ? Oracle parallèle non-BDR (CPUs partagent les disques)

Architecture "bottom-up" à Schéma Conceptuel Global (GS) ES ES Un usager peut avoir les données dans plusieurs BDs compatibles ANSI-SPARC et hétérogènes Un GS présente toutes les données comme une seule BD classique relationnelle ou fonctionnelle (DAPLEX) les ES sont dérivés de GS GS CS CS CS PS PS PS Approche GS ("bottom-up")

Problèmes avec l'approche "bottom-up" Création du schéma global Hétérogénéité sémantique de données Temps d'intégration / autonomie de restructuration locale Mises à jour Performances Vues hétérogènes GS CS CS CS PS PS PS Approche GS ("bottom-up")

Architecture MBD (Multibase) Absence de Schéma Conceptuel Global (GS) Un usager peut avoir les données dans plusieurs BDs compatibles ANSI-SPARC En général il sera impossible de créer un Schéma Global (GS) L'usager peut être en face de plusieurs CSs CS CS CS PS PS PS

Architecture multibase (W. Litwin & al, années 1980) Req. MDB ES multibase

Architecture MBD (Multibase) Fonctions du Langage Multibase Un langage de définition et de manipulation de collections de BDs (multibases) au niveau conceptuel MDB Formulation de requêtes (explicitement) multibases se referant aux noms de BDs avec des jointures multibases... Trouver dans la base Michelin et dans la base Gaumont tous les restaurants '**' et cinémas sur une même rue

Architecture MBD (Multibase) Concept de Langage Multibase Définition de ES multibase (MES) Présente plusieurs bases comme une seule BD Peut intégrer des CSs ou des ES ou des MES

Architecture MBD (Multibase) Concept de Langage Multibase Définition de dépendances multibases entre les CSs (la composante DS) sémantiques (ontologies), p.ex. en RDF City Is Ville ; Town Is Ville ; Township Is Ville intégrité Intégrité référentielle multibase Aucun SGBD ne permet encore de déclarer celle- ci Pourquoi ? Bonne question sans bonne réponse

Architecture MBD (Multibase) Concept de Langage Multibase Définition de dépendances multibases entre les CSs Sécurité Un usage ne peut pas sélectionner une donnée D1 de la base B1 et la donnée D2 de la base B2 manipulation... Déclencheurs multibases Create Trigger … Flux de diffusion RSS….

Architecture MBD (Multibase) Concept de Multibase Une multibase (MBD) est une collection de BDs munie d'un langage multibase par exemple le langage MSQL que l'on verra Une collection de BDs sans langage multibase n'est pas une MDB, mais juste une collection de BDs d'une même manière qu'une collection de fichiers plats (tables) sans langage de base de données, SQL par exemple, n'est pas une BD

Quelques multibases potentielles Autres BDs sur Internet Rest. Cours & étudiants Mes-amis Bibliothèque Privé Paris 9 Employés Folio Cine MSQL: Create MDB Paris 9 Include Employés Include Bibliothèque ..... Teletel

Architecture MBD Concept de Sous-niveau Interne Logique Les modèles de données de BDs existantes peuvent être hétérogènes différent dialectes de SQL Relationnel XML CCS Il est préférable d'avoir un seul modèle au niveau multibase Il faut avoir une possibilité d'un sous-niveau de traduction

Architecture MBD Concept de Sous-niveau Interne Logique Par ailleurs un DBA peut ne pas vouloir montrer son CS local au niveau multibase Solution générale ILS - Schéma Interne Logique inconnu de ANSI-SPARC appelé par la passerelle (Gateway) ou médiateur terminologie populaire Origine: G. Wiederhold (Stanford)

Système de Gestion Multibases (SGMB) Un système offrant l’interface multibase Sans être SGBD lui-même Gère le niveau CS et ES de l’arch. MBD Appelé souvent: Médiateur « Wrapper » Intégrateur « Meta – Engine » Méta-SGBD….

Système de Gestion Multibases (SGMB) Exemples Historiques relationnels: UniSQL/M, EDASQL… Actuels: Relationnel QBE d’Excell, Web par mots Clés: MetaCrawler, DogPile, IBoogie… Web documentaire (CCS) MetaPhys, Folio (Stanford U.)… XML & XQuery: BEA AquaLogic

Système de Gestion Multibases (SGMB ) 2. SGMB = SGBD muni du langage multibase Relationnels : SQL et QBE Principaux SGBDs MsAccess SQL et QBE multibases SQL multibase: SQL Server, Oracle, MySQL, DB2, Sybase, Interbase… SQL (encore) monobase: PostgreSQL… XML : Aucun SGMB connu

Interopérabilité Les bases d’un SGMB sont dites interopérables Elles peuvent ne pas ne pas être a priori conçues pour Néanmoins en général, il faut une coopération entre les DBA Dans les limites pratiques de compromis entre Autonomie locale / Autonomie MBD

Architecture Fédérée (Hambiger & McLeod, années 1980) Toute BD doit être autonome En général il n'y aura pas d'un GS L'intégration globale est contraire à l'autonomie Les BDs utilisées en commun doivent former une fédération de BDs autonomes

Architecture Fédérée (Hambiger & McLeod, années 1980) Toute BD d'une fédération doit avoir trois schémas: ES: Schéma d'Exportation: pour les données permises à l'exportation IS: Schéma d'Importation: pour les données importées PS: Schéma Privé: pour l'ensemble de données privées, ES et IS inclus Il doit y avoir un Dictionnaire de Fédération (FD)

Architecture Fédérée (Hambiger & McLeod, années 1980)

Comparaison Architecture MDB axée sur le concept de langage multibase Architecture Fédérée axée sur le concept d'autonomie pas de notion de langage multibase mais il y a une notion d'autonomie aussi dans l'arch. MDB

Comparaison Architecture MDB est + décentralisée pas d'équivalent de Dictionnaire de Fédération plusieurs DSs pour ce rôle Les deux architectures sont populaires Contrairement aux nombreuses autres propositions aujourd'hui oubliées en pratique

Comparaison MDB <-> Féd

Autonomie d'une base ( autonomie locale) Faculté de contrôle de données d'une base locale par le DBA Noms de données Type de valeurs Structures de données Structures physiques Exécution de requêtes Sécurité Priorité aux requêtes locales

Autonomie multibase Choix des aspects multibases Par un MBA (souvent une Comité) Mêmes facettes que de l'autonomie locale Modèle commun, Certains nom de données... Peut générer un conflit avec l'autonomie locale B1 B2 B3

Autonomie multibase Si conflit: Priorité à l'autonomie locale Ou priorité à l’autonomie mbd Emploi d’un médiateur HTML au niveau MBD (CS), SQL-Server, MySQL… au niveau BD (ILS) -> Sharepoint etc entre les deux B1 B2 B3

Autonomie: solutions On n’a pas de baguette magique Probablement on n’aura jamais On propose des solutions limitées Pour cas particuliers de chaque facette C’est d’ailleurs la démarche générale en BDs

Autonomie: solutions Les solutions proposées devraient assurer intéropérabilité il est désirable que celle-ci soit scalable Cet but signifie que toute nouvelle base devenant accessible aux manipulations multibase devrait être automatiquement intéroperable

Autonomie: solutions Si l’on cherche tout « bon » restaurant sushi à Paris et une nouvelle base de restaurants est mise en service, alors la requête devrait l’adresser automatiquement aussi Un but de l’ensemble de concepts qui suivent Notamment de ceux de multibase et de requête multiple

Hétérogénéité sémantique Différences dans les représentations de mêmes propriétés réelles Noms André Andrew Types de valeurs type de représentation unité de mesure cm/s pied/h précision 1 g  1 Kg Structures de données une table en 2 NF plusieurs tables en 3 NF

Hétérogénéité sémantique Différences dans les représentations de mêmes propriétés réelles Noms André Andrew Types de valeurs type de représentation unité de mesure cm/s pied/h précision 1 g  1 Kg Structures de données une table en 2 NF plusieurs tables en 3 NF

Solutions (partielles) Schémas + descriptifs Protocoles + descriptifs Dictionnaires de données Thesaurus Conversion automatique de représentations Conversion automatique d'unités Equijointures de valeurs à précision diff. Jointures implicites

Modèle commun Relationnel CCS langage pour les bases documentaires SQL MSQL et SchemaSQL (recherche) Federated Database (IBM) ODBC Microsoft & al CCS langage pour les bases documentaires Nombreuses passerelles (gateways) vers SQL Web 2 dit aussi Web Sémantique Extended Web Services XML & XQuery RDF & SQL or RDQL

UniSQL/M (approche historique) IMS UniSQL DB2 Oracle UniSQL/ était un SGMB, mais pas un SGBD EDA-SQL était un autre SGMB populaire

Aujourd’hui (par exemple) MsAccess Sybase MsAccess DB2 Oracle

Le présent et l’avenir proche ODBC x

Conclusion Les bases de principaux SGBD ne sont pas BDRs, mais peuvent être distribuées et parallèles Oracle Grid Sybase DB2 Teradata SQL Server AsterData, Greenplum… (clouds)

Conclusion Les principaux SGBD sont désormais en en général des systèmes multibases MsAccess Oracle Sybase DB2 MySQL Interbase...

Conclusion Il y a aussi des SGMB « wrappers » Déjà cités Certains sont aussi fédérés DB2 MsAccess Une tables dite Attachée est une vue importée Il y a aussi des SGMB « wrappers » Déjà cités

Conclusion On n’a toujours pas de baguette magique Mais on progresse L'accès multibase nécessite néanmoins (toujours) de nouvelles fonctions au niveau de SGBD pour gérer l'autonomie en général l'hétérogénéité sémantique en particulier la distribution physique de données On n’a toujours pas de baguette magique Mais on progresse

Conclusion Les solutions techniques sont basées sur: nouvelles architectures de référence architecture multibase architecture fédérée modèles communs de données ODBC, XML ou RDF peut-être Passerelles directes de traduction de dialectes SQL MsAccess -> SQL Server, Paradox… Oracle -> SQL Server, Sybase…

Conclusion Langages multibases Nouveaux modèles de transaction Dialectes SQL MSQL, SchemaSQL (recherche) Nouveaux modèles de transaction Protocoles et Standards ODBC, DCE, EWS Tout ça à voir + en détail dans la suite du cours dans les livres présentés durant le cours

Exercices Différence entre les notions d’une BD, BDR, MBD et FBDs. Que est ce que c’est « une architecture de référence », ANSI-SPARC par exemple ? Différences entre l’architecture « top-down », « bottom-up », multibase et fédérée. Commentez la notion de bases fédérées dans DB2 V. 6 à travers la description dans le Help de ce système, de RedBooks sur le site web d’IBM. Et sous Google en général. P. ex. http://www.ibm.com/developerworks/data/library/techarticle/0203haas/0203haas.html

Exercices Concevoir les ordres SQL réalisant la fragmentation de la base des hôtels du cours. De deux manières: 1. Les fragments sous forme de commande Create Fragment as Select … Into Base.Fragment From Hotels Where… 2. Définir vue globale des fragments sous forme CREATE VIEW Hotels AS SELECT… Commentez le concept d’ILS, de passerelle et de médiateur Quel est le modèle multibase le plus répandu aujourd’hui ?

Exercices Commentez le concept d’autonomie locale (quoi, pourquoi, comment) Donnez des exemples de divers types d’hétérogénéité sémantique Prouvez que l’associativité d’équijointures n’existe plus si les valeurs à joindre peuvent être de précision différente Les conséquences pour les SGBDs relationnels ? Proposez une extension de SQL introduisant les unités de mesure et le traitement de requêtes correspondant (sujet de Thèse).

FIN