Intégration de schémas de bases de données J. Akoka I. Comyn-Wattiau 1 1
Sommaire Contexte Définitions Problèmes d’intégration Intégration de schémas Sommaire Contexte Définitions Problèmes d’intégration Etapes de l’intégration Exemple Outils d’intégration 2
Intégration de schémas CONTEXTE 3
Contexte Conception ascendante de bases de données Intégration de schémas Contexte Conception ascendante de bases de données Fusion de bases de données réparties Conception incrémentale Conception d’entrepôts de données 4
Conception ascendante de bases de données Intégration de schémas Conception ascendante de bases de données Principe : chaque groupe d’utilisateurs construit sa vue de la base de données Avantages : validation précoce des vues parallélisme taille des vues Inconvénients : entraîne une phase supplémentaire d’intégration 5
Fusion de bases de données réparties Intégration de schémas Fusion de bases de données réparties Principe : rassembler les différentes parties d’un système distribué en une vue unique centralisée Intérêts : fournir une vision globale de la base répartie assurer la cohérence globale de la base Problèmes : les parties peuvent être conflictuelles les systèmes existent déjà 6
Conception incrémentale Intégration de schémas Conception incrémentale Principe : on conçoit un schéma de bases de données par ajout progressif d’information Avantages : validation intermédiaire prise en compte des modifications Inconvénients : 7
Conception d’entrepôts de données Intégration de schémas Conception d’entrepôts de données Principe : on produit une vue conceptuelle d’un entrepôt par intégration des bases sources Avantages : permettre une meilleure connaissance du contenu de l’entrepôt Inconvénients : l’entrepôt n’est pas uniquement une fusion (sélection, raffinement, etc.) 8
Intégration de schémas DEFINITIONS 9
Définition Confronter différentes perceptions du réel modélisées Intégration de schémas Définition Confronter différentes perceptions du réel modélisées par des concepteurs humains 10
Modélisation conceptuelle Intégration de schémas Réel Modélisation conceptuelle Schéma conceptuel Conception logique Schéma logique Conception physique B.D. Le cycle classique de conception de base de données 11
L’intégration de vues ... Intégration une alternative à la Intégration de schémas Intégration ... Schéma conceptuel Conception logique Schéma logique Conception physique B.D. Réel M.C. Vue 1 Vue 2 Vue n L’intégration de vues une alternative à la modélisation conceptuelle classique 12
Intégration de schémas Quelques définitions Vue ou schéma local : dénomination des schémas sources Schéma résultant ou schéma global ou schéma intégré : schéma conceptuel résultant de l’intégration 13
Intégration de bases de données Intégration de schémas Intégration de bases de données C’est l’intégration de bases de données existantes Elle comprend : la conception d ’un schéma global ou intégration de schémas l ’intégration des données (problèmes de conversion, formatage, etc.) 14
LES PROBLEMES D’INTEGRATION Intégration de schémas LES PROBLEMES D’INTEGRATION 15
Les problèmes d’intégration Intégration de schémas Les problèmes d’intégration Conflits de terminologie Différentes définitions de classes Représentations équivalentes Définition de contraintes 16
Conflits de terminologie Intégration de schémas Conflits de terminologie synonymie homonymie EMPLOYE SALARIE VUE 1 VUE 2 CHERCHEUR SUJET LIVRE concerne travaille SUJET VUE 1 VUE 2 10/02/97 17 17
Conflits de terminologie Intégration de schémas Conflits de terminologie TERMES CONCEPTS Domaine de recherche Sujet Salarié Thème Employé Employé 18
Différentes définitions de classes Intégration de schémas Différentes définitions de classes inclusion de classes AUTOMOBILISTE possède VOITURE VUE 1 possède PERSONNE VOITURE VUE 2 19
Différentes définitions de classes Intégration de schémas Différentes définitions de classes intersection de classes prêt immobilier PERSONNE BANQUE VUE 1 VUE 1 prêt personnel BANQUE PERSONNE VUE 2 20
Conflits de définitions de classes Intégration de schémas Conflits de définitions de classes CONCEPTS POPULATIONS Prêts immobiliers Prêt Prêts personnels Personne Automobiliste Personnes 21
Terminologie et recouvrement de classes Intégration de schémas Terminologie et recouvrement de classes Les deux types de problèmes se présentent souvent de la même façon VUE 1 VUE 2 NSS Nom Prénom Service Numlit HOSPITALISE PATIENT NSS Nom Prénom Médecin Patient et Hospitalisé sont synonymes ? Patient et Hospitalisé sont-ils en recouvrement de classes ? 22
Equivalences de représentation (1) Intégration de schémas Equivalences de représentation (1) LIVRE titre EDITEUR nom titre LIVRE éditeur VUE 1 VUE 2 23
Equivalences de représentation (2) Intégration de schémas Equivalences de représentation (2) PERSONNE nom nom PERSONNE sexe HOMME FEMME VUE 1 VUE 2 24
Définition de contraintes Intégration de schémas Définition de contraintes EMPLOYE EMPLOYE (1,1) (1,n) (1,n) (1,n) PROJET PROJET VUE 1 VUE 2 25
LES ETAPES DE L ’INTEGRATION Intégration de schémas LES ETAPES DE L ’INTEGRATION 26
Les étapes de l ’intégration Intégration de schémas Les étapes de l ’intégration Comparaison Mise en conformité Fusion Enrichissement du schéma 27
Comparaison des vues Mise en correspondance des éléments communs Intégration de schémas Comparaison des vues Mise en correspondance des éléments communs Identification des conflits de terminologie, de représentation, de contraintes, etc. 28
Intégration de schémas Mise en conformité 29
Intégration de schémas Fusion des schémas Les concepts communs aux deux schémas sont insérés une seule fois dans le schéma global Les autres concepts sont ajoutés au schéma global Il y a enrichissement mutuel des schémas : une entité se voit dotée des attributs des deux entités d ’origine 30
Enrichissement du schéma Intégration de schémas Enrichissement du schéma Dans le schéma global, des concepts nouveaux se trouvent en commun La phase d’enrichissement permet de définir d’éventuelles relations sémantiques entre ces concepts 31
Intégration de schémas UN EXEMPLE 32
VUE 1 Personne Nom, prénom, N°SS, adresse Matricule, date-embauche, Intégration de schémas Personne Nom, prénom, N°SS, adresse Matricule, date-embauche, salaire Patient Personnel Num-dossier, date-création Hospitalisé Externe Médecin Infirmière Grade, type-contrat Spécialité, num-agrément Date-entrée Rendez-vous Convoqué Posologie Date Dose, fréquence Nom Bâtiment Rattaché Affectation Unité Code, nom, type-conditionnement, type-malade Service Médicament Nom, code, téléphone VUE 1 Fournit Nom, adresse Laboratoire 33
VUE 2 Personnel Matricule, nom, prénom, N°SS, adresse, salaire Grade, Intégration de schémas Personnel Matricule, nom, prénom, N°SS, adresse, salaire Grade, type-contrat Poste, qualification Infirmière Médecin Administratif Num-agrément Exerce Spécialité Affectation Rattaché Nom, prénom, adresse, num-dossier, date-entrée Nom, code, téléphone Patient Hospitalisé Service Prescription Dose, fréquence Code, nom, type-conditionnement, prix Médicament VUE 2 Fournit Laboratoire Nom, adresse 34
Comparaison des vues Synonymie : Posologie et Prescription Intégration de schémas Comparaison des vues Synonymie : Posologie et Prescription Homonymie : Hospitalisé Recouvrement de classes : Patient Représentations équivalentes : Spécialité Conflits de contraintes : non décrits sur les graphiques 35
Mise en conformité de la vue 1 Personne Nom, prénom, N°SS, adresse Intégration de schémas Personne Nom, prénom, N°SS, adresse Matricule, date-embauche, salaire Patient Personnel Num-dossier, date-création Hospitalisé Externe Médecin Num-agrément Infirmière Grade, type-contrat Date-entrée Exerce Date Convoqué Rendez-vous Prescription Spécialité Dose, fréquence Nom Bâtiment Rattaché Affectation Unité Code, nom, type-conditionnement, type-malade Service Médicament Nom, code, téléphone Mise en conformité de la vue 1 Fournit Nom, adresse Laboratoire 36
Mise en conformité de la vue 2 Personnel Intégration de schémas Personnel Matricule, nom, prénom, N°SS, adresse, salaire Grade, type-contrat Poste, qualification Infirmière Médecin Administratif Num-agrément Exerce Spécialité Affectation Rattaché Nom, prénom, adresse, num-dossier, date-entrée Nom, code, téléphone Hospitalisé Intégré Service Prescription Dose, fréquence Code, nom, type-conditionnement, prix Médicament Mise en conformité de la vue 2 Fournit Laboratoire Nom, adresse 37
Fusion des schémas Personne Nom, prénom, N°SS, adresse Personnel Intégration de schémas Personne Nom, prénom, N°SS, adresse Personnel Administratif Patient Num-dossier, date-création Matricule, date-embauche, salaire Poste, qualification Hospitalisé Externe Externe Médecin Num-agrément Infirmière Grade, type-contrat Date-entrée Exerce Convoqué Rendez-vous Prescription Date Spécialité Unité Dose, fréquence Rattaché Affectation Intégré Code, nom, type-conditionnement, type-malade, prix Service Médicament Nom, code, téléphone Fusion des schémas Fournit Nom, adresse Laboratoire 38
Enrichissement du schéma Personne Nom, prénom, N°SS, adresse Personnel Intégration de schémas Personne Nom, prénom, N°SS, adresse Personnel Matricule, date-embauche, salaire Administratif Patient Num-dossier, date-création Poste, qualification Affilié Hospitalisé Externe Externe Médecin Num-agrément Infirmière Grade, type-contrat Date-entrée Exerce Convoqué Rendez-vous Prescription Date Spécialité Unité Dose, fréquence Rattaché Affectation Intégré Code, nom, type-conditionnement, type-malade, prix Service Médicament Nom, code, téléphone Enrichissement du schéma Fournit Laboratoire Nom, adresse 39
LES OUTILS D ’INTEGRATION Intégration de schémas LES OUTILS D ’INTEGRATION 40
Première génération Couvre uniquement la phase de fusion des schémas Intégration de schémas Première génération Propriétés inter-schémas Règles d ’intégration Schéma intégré Couvre uniquement la phase de fusion des schémas 41
Recherche des correspondances Intégration de schémas Deuxième génération Schémas à intégrer Recherche des correspondances entre vues Règles d ’intégration Schéma intégré Couvre les phases de comparaison des vues et de fusion des schémas 42
Recherche des correspondances Intégration de schémas Troisième génération Schémas à intégrer Recherche des correspondances entre vues Dictionnaire sémantique Règles d ’intégration Schéma intégré Couvre les phases de comparaison des vues et de fusion des schémas et enrichit la comparaison 43
Un exemple d ’outil Transformation de structures Validation Intégration de schémas Un exemple d ’outil Transformation de structures Validation Héritage de propriétés Comparaison de structures Construction du schéma global Choix d ’intégration Résolution de conflits Intégration de contraintes 44
Comparaison de structures Intégration de schémas Comparaison de structures Elle est portée par un vecteur de similitude Elle est effectuée, deux à deux, pour tous les constituants des schémas Elle compare : les noms les domaines les constituants les populations,etc. 45
Similitude entre attributs Intégration de schémas Similitude entre attributs 46
Similitude entre entités Intégration de schémas Similitude entre entités Sim=(nom, structure, population) soit p le nombre d ’attributs équivalents, soient n et m le nombre d ’attributs de chaque entité : si p=n=m alors structure=1 si p=n et n<m alors structure=0.75 si p=0 alors structure=0 si p=n/2 et n=m alors structure=0.5 si p>m/2 et n<=m alors structure=0.66 si n/2<=p<=m/2 alors structure=0.33 si p<n/2 et n<=m alors structure=0.25 47
Construction du schéma global Intégration de schémas Construction du schéma global Intégration automatique 48
Construction du schéma global Intégration de schémas Construction du schéma global Intégration semi-automatique 49
Intégration de schémas CONCLUSION Les situations d ’intégration sont de plus en plus fréquentes L ’automatisation est rare L ’automatisation est difficile car les problèmes à résoudre sont d ’ordre sémantique 50