Intégration de schémas Traitement de l’hétérogénéité syntaxique Hétérogénéité des modèles de données des sources (SGBDR, XML, flat files, …) Traitement de l’hétérogénéité sémantique : Redondances Homonymes Synonymes Conflits de divergence schématique
Intégration de schémas Problématique : Conflits de terminologie Différentes définitions de classes Représentations équivalentes Définition de contraintes 16
Conflits de terminologie Intégration de schémas Conflits de terminologie Synonymie homonymie EMPLOYE SALARIE VUE 1 VUE 2 CHERCHEUR SUJET LIVRE concerne travaille SUJET VUE 1 VUE 2 10/02/97 17 17
Conflits de terminologie Intégration de schémas Conflits de terminologie TERMES CONCEPTS Domaine de recherche Sujet Salarié Thème Employé Employé 18
Différentes définitions de classes Intégration de schémas Différentes définitions de classes Inclusion de classes AUTOMOBILISTE possède VOITURE VUE 1 possède PERSONNE VOITURE VUE 2 19
Différentes définitions de classes Intégration de schémas Différentes définitions de classes Intersection de classes prêt immobilier PERSONNE BANQUE VUE 1 VUE 1 prêt personnel BANQUE PERSONNE VUE 2 20
Conflits de définitions de classes Intégration de schémas Conflits de définitions de classes CONCEPTS POPULATIONS Prêts immobiliers Prêt Prêts personnels Personne Automobiliste Personnes 21
Terminologie et recouvrement de classes Intégration de schémas Terminologie et recouvrement de classes Les deux types de problèmes se présentent souvent de la même façon VUE 1 VUE 2 NSS Nom Prénom Service Numlit HOSPITALISE PATIENT NSS Nom Prénom Médecin Patient et Hospitalisé sont synonymes ? Patient et Hospitalisé sont-ils en recouvrement de classes ? 22
Equivalences de représentation (1) Intégration de schémas Equivalences de représentation (1) LIVRE titre EDITEUR nom titre LIVRE éditeur VUE 1 VUE 2 23
Equivalences de représentation (2) Intégration de schémas Equivalences de représentation (2) PERSONNE nom nom PERSONNE sexe HOMME FEMME VUE 1 VUE 2 24
Définition de contraintes Intégration de schémas Définition de contraintes EMPLOYE EMPLOYE (1,1) (1,n) (1,n) (1,n) PROJET PROJET VUE 1 VUE 2 25
LES ETAPES DE L ’INTEGRATION Intégration de schémas LES ETAPES DE L ’INTEGRATION 26
Les étapes de l’intégration de schémas Comparaison Mise en conformité Fusion Enrichissement du schéma 27
Comparaison des vues Mise en correspondance des éléments communs Intégration de schémas Comparaison des vues Mise en correspondance des éléments communs Identification des conflits de terminologie, de représentation, de contraintes, etc. 28
Intégration de schémas Mise en conformité 29
Intégration de schémas Fusion des schémas Les concepts communs aux deux schémas sont insérés une seule fois dans le schéma global Les autres concepts sont ajoutés au schéma global Il y a enrichissement mutuel des schémas : une entité se voit dotée des attributs des deux entités d’origine 30
Enrichissement du schéma Intégration de schémas Enrichissement du schéma Dans le schéma global, des concepts nouveaux se trouvent en commun La phase d’enrichissement permet de définir d’éventuelles relations sémantiques entre ces concepts 31
Intégration de schémas UN EXEMPLE 32
VUE 1 Personne Nom, prénom, N°SS, adresse Matricule, date-embauche, Intégration de schémas Personne Nom, prénom, N°SS, adresse Matricule, date-embauche, salaire Patient Personnel Num-dossier, date-création Hospitalisé Externe Médecin Infirmière Grade, type-contrat Spécialité, num-agrément Date-entrée Rendez-vous Convoqué Posologie Date Dose, fréquence Nom Bâtiment Rattaché Affectation Unité Code, nom, type-conditionnement, type-malade Service Médicament Nom, code, téléphone VUE 1 Fournit Nom, adresse Laboratoire 33
VUE 2 Personnel Matricule, nom, prénom, N°SS, adresse, salaire Grade, Intégration de schémas Personnel Matricule, nom, prénom, N°SS, adresse, salaire Grade, type-contrat Poste, qualification Infirmière Médecin Administratif Num-agrément Exerce Spécialité Affectation Rattaché Nom, prénom, adresse, num-dossier, date-entrée Nom, code, téléphone Patient Hospitalisé Service Prescription Dose, fréquence Code, nom, type-conditionnement, prix Médicament VUE 2 Fournit Laboratoire Nom, adresse 34
Comparaison des vues Synonymie : Posologie et Prescription Intégration de schémas Comparaison des vues Synonymie : Posologie et Prescription Homonymie : Hospitalisé Recouvrement de classes : Patient Représentations équivalentes : Spécialité Conflits de contraintes : non décrits sur les graphiques 35
Mise en conformité de la vue 1 Personne Nom, prénom, N°SS, adresse Intégration de schémas Personne Nom, prénom, N°SS, adresse Matricule, date-embauche, salaire Patient Personnel Num-dossier, date-création Hospitalisé Externe Médecin Num-agrément Infirmière Grade, type-contrat Date-entrée Exerce Date Convoqué Rendez-vous Prescription Spécialité Dose, fréquence Nom Bâtiment Rattaché Affectation Unité Code, nom, type-conditionnement, type-malade Service Médicament Nom, code, téléphone Mise en conformité de la vue 1 Fournit Nom, adresse Laboratoire 36
Mise en conformité de la vue 2 Personnel Intégration de schémas Personnel Matricule, nom, prénom, N°SS, adresse, salaire Grade, type-contrat Poste, qualification Infirmière Médecin Administratif Num-agrément Exerce Spécialité Affectation Rattaché Nom, prénom, adresse, num-dossier, date-entrée Nom, code, téléphone Hospitalisé Intégré Service Prescription Dose, fréquence Code, nom, type-conditionnement, prix Médicament Mise en conformité de la vue 2 Fournit Laboratoire Nom, adresse 37
Fusion des schémas Personne Nom, prénom, N°SS, adresse Personnel Intégration de schémas Personne Nom, prénom, N°SS, adresse Personnel Administratif Patient Num-dossier, date-création Matricule, date-embauche, salaire Poste, qualification Hospitalisé Externe Externe Médecin Num-agrément Infirmière Grade, type-contrat Date-entrée Exerce Convoqué Rendez-vous Prescription Date Spécialité Unité Dose, fréquence Rattaché Affectation Intégré Code, nom, type-conditionnement, type-malade, prix Service Médicament Nom, code, téléphone Fusion des schémas Fournit Nom, adresse Laboratoire 38
Enrichissement du schéma Personne Nom, prénom, N°SS, adresse Personnel Intégration de schémas Personne Nom, prénom, N°SS, adresse Personnel Matricule, date-embauche, salaire Administratif Patient Num-dossier, date-création Poste, qualification Affilié Hospitalisé Externe Externe Médecin Num-agrément Infirmière Grade, type-contrat Date-entrée Exerce Convoqué Rendez-vous Prescription Date Spécialité Unité Dose, fréquence Rattaché Affectation Intégré Code, nom, type-conditionnement, type-malade, prix Service Médicament Nom, code, téléphone Enrichissement du schéma Fournit Laboratoire Nom, adresse 39
Différentes approches d’intégration de schémas Il existe différentes approches d’intégration de schémas : Approches classiques Approches expertes Approches sémantiques
Première génération Approches classiques Intégration de schémas Première génération Règles d ’intégration Propriétés inter-schémas Schéma intégré Couvre uniquement la phase de fusion des schémas Le concepteur établit manuellement les correspondances entre les objets des différents schémas Approches classiques 41
Recherche des correspondances Intégration de schémas Deuxième génération Schémas à intégrer Recherche des correspondances entre vues Règles d ’intégration Schéma intégré Couvre les phases de comparaison des vues et de fusion des schémas Approches expertes 42
Les approches expertes Cette génération introduit des algorithmes capables de définir des règles de correspondance automatiques entre les schémas, pour résoudre les conflits syntaxiques qui sont ensuite validés par le concepteur
les classes des schémas Les attributs des classes L’approche Ellmer & Al [95] : Approche utilisant les réseaux de neurones durant la phase de comparaison des schémas à intégrer. La quantification de la similitude entres classes est réalisée en utilisant les critères suivants : noms des classes, noms et types des attributs. Un vecteur est définit pour chaque classe en utilisant ces critères L’ensemble des vecteurs obtenus est fourni au réseaux de neurones RN RN détermine des partitions des classes en fonction des valeurs contenues dans les vecteurs associés. Chaque partition contient des classes d’objets similaires. Les classes d’objets sont ensuite comparées à l’intérieur de chaque partition. les classes des schémas Les attributs des classes Les types des attributs C1 C2 … CP A1 A2 AN T1 T2 TM 1 4
Un exemple d ’outil Transformation de structures Validation Intégration de schémas Un exemple d ’outil Transformation de structures Validation Héritage de propriétés Comparaison de structures Construction du schéma global Choix d ’intégration Résolution de conflits Intégration de contraintes 44
Comparaison de structures Intégration de schémas Comparaison de structures Elle est portée par un vecteur de similitude Elle est effectuée, deux à deux, pour tous les constituants des schémas Elle compare : les noms les domaines les constituants les populations,etc. 45
Similitude entre attributs Intégration de schémas Similitude entre attributs 46
Similitude entre entités Intégration de schémas Similitude entre entités Sim=(nom, structure, population) soit p le nombre d’attributs équivalents, soient n et m le nombre d’attributs de chaque entité : si p=n=m alors structure=1 si p=n et n<m alors structure=0.75 si p=0 alors structure=0 si p=n/2 et n=m alors structure=0.5 si p>m/2 et n<=m alors structure=0.66 si n/2<=p<=m/2 alors structure=0.33 si p<n/2 et n<=m alors structure=0.25 47
Construction du schéma global Intégration de schémas Construction du schéma global Intégration automatique Intégration semi-automatique 48