Akoka & Wattiau1 J. Akoka & I. Comyn-Wattiau. Akoka & Wattiau2 PLAN Introduction : le problème Critères de classification Techniques de classification.

Slides:



Advertisements
Présentations similaires
Sintaks : Tentative de guide de mise en œuvre Michel Hassenforder.
Advertisements

Material/Sources: Daniel Bardou, Julie Dugdale &
IREMIA : Institut de REcherche en Mathématiques et Informatique Appliquées Université de la Réunion Uniformisation des mécanismes de conception de SMA.
Regroupement (clustering)
Xavier Blanc Web Services Xavier Blanc
Regroupement (clustering)
Introduction Pour concrétiser l’enseignement assisté par ordinateur
Eric BONJOUR, Maryvonne DULMET
Didactique des Sciences de l'Ingénieur
Gestion de la persistance des objets
Modélisation des systèmes non linéaires par des SIFs
Introduction à la POO: Les classes vs les objets
Continuité Introduction Continuité Théorème des valeurs intermédiaires
UNIVERSITE DES SCIENCES ET DE LA TECHNOLOGIE D’ORAN
Principes de la technologie orientée objets
Algorithmes Branch & Bound
Initiation à la conception de systèmes d'information
Réalisée par :Samira RAHALI
DURIBREUX, Michèle & COCQUEBERT & HOURIEZ, Bernard,
Modélisation E/R des Données
Introduction à la conception de Bases de Données Relationnelles
Méthode de scénarisation
ÉVALUATION DES SCÉNARIOS POUR L’AIDE À LA CONDUITE DU PROJET
Groupe 1: Classes de même intervalle
Conception des données
La segmentation
Algorithmique et Programmation
Modèle, Méthode et Conception
SYSTEMES D’INFORMATION
Etude globale de système.
IGL301 - Spécification et vérification des exgiences 1 Chapitre 1 Introduction (ref : Bray chapitre 1)
An Introduction to distributed applications and ecommerce 1 1 Les services Web, XML et les places de marchés.
Programmation non procédurale Le projet ECOLE 2000
Sensibilisation a la modelisation
Aménagement des programmes en CPGE scientifiques
Patrons de conceptions de créations
ANALYSE METHODE & OUTILS
Les principes de la modélisation de systèmes
Hatainville Les Moitiers d’Allonne – Tel : Website : stratic.online.com La démarche projet Mars 2001.
Institut Supérieur des Sciences Appliquées et de Technologie Sousse
Le contenu est basé aux transparents du 7 ème édition de «Software Engineering» de Ian Sommerville«Software Engineering» de Ian Sommerville B.Shishedjiev.
Le contenu est basé aux transparents du 7 ème édition de «Software Engineering» de Ian Sommerville«Software Engineering» de Ian Sommerville B.Shishedjiev.
Intégration de schémas
Le langage Racket (Lisp)
LA DEMARCHE DE RECHERCHE
DESIGN MULTIMÉDIA Initiation aux bases de La scénarisation multimédia
Les réseaux de neurones à réservoir en traitement d’images
Institut de sciences et technologies Département d’informatique
Olivier Leclair, Université Laval Un algorithme de fouille dans une représentation des données par objets: une application médicale SIMON, Arnaud.
Problèmes du génie logiciel. H. Lounis Les problèmes zTaille et complexité des logiciels ; zTaille croissante des équipes ; zSpécifications peu précises.
2 Processus de conception de BD
APERCU SUR LA METHODOLOGIE Rencontre avec les APERCU SUR LA METHODOLOGIE Rencontre avec les agrégatifs Professeur Moustapha Kassé
Unified Modeling Language
Cours 1: Définition de l’équipe de projet
Hiver 2004SEG2501 Chapître 41 Chapître 4 SDL – structure d’un système et son comportement.
Nouvelles Technologies Internet & Mobile
Visualisation des flots optiques en 3D
Introduction à la Programmation Orientée Objet
INTRODUCTION AUX BASES DE DONNEES
Objets et Actions Élémentaires.
Introduction Module 1.
Classification-Segmentation
Modélisation des Actions Mécaniques Première sti2d
Chap. 3 Récursion et induction. Les définitions par récurrence consistent à construire des objets finis, à partir d'autres, selon certaines règles. Les.
Les bases de données Séance 3 Construction du Modèle Conceptuel de Données.
Les bases de données Séance 4 Construction du Modèle Physique (la BDD)
Cours de Systèmes de Gestion de Données - Licence MIAGE – 2003/20041 Cours n°2 La conception d ’un schéma relationnel (suite) Chantal Reynaud Université.
Schéma de base de données Présentation. Conception du schéma logique  Transformation du schéma conceptuel en structures de données supportées par les.
ARIANE : Interopérabilité sémantique et accès aux sources d'information sur Internet Sylvain Aymard, Michel Joubert, Dominique Fieschi, Marius Fieschi.
Transcription de la présentation:

Akoka & Wattiau1 J. Akoka & I. Comyn-Wattiau

Akoka & Wattiau2 PLAN Introduction : le problème Critères de classification Techniques de classification Classification automatique de données Un algorithme de classification automatique Classification automatique de schémas E-R Classification automatique de schémas orientés objets orientés Intégration vs classification Autres applications

Akoka & Wattiau3 I- Introduction : le problème L'efficacité et la qualité du processus de la conception de base de données dépendent principalement d'une bonne communication entre : informaticiens utilisateurs finaux managers ALe schéma conceptuel est supposé être un outil pour faciliter cette interaction.

Akoka & Wattiau4 I- Introduction : le problème F Le succès du modèle ER peut s'expliquer principalement par la simplicité de ses concepts et par son formalisme graphique, tous deux facilitant le dialogue entre ces personnes. F Toutefois, dans les applications réelles, le schéma conceptuel n'est pas suffisant pour atteindre une bonne communication parce que : F il est souvent trop grand : il est très difficile danalyser un schéma contenant une centaine d'entités. l'information est donnée seulement d'un niveau d'abstraction. Une approche descendante devrait être un moyen plus facile de lire un schéma conceptuel.

Akoka & Wattiau5 I- Introduction : le problème La classification de schémas un sous-schéma 1 un schéma conceptuel un sous-schéma 2 un sous-schéma 3 Comment découper ? sur quels critères ?

Akoka & Wattiau6 II- Les critères de regroupement Les critères doivent sappuyer sur la sémantique des données et/ou des traitements La définition des critères dépend du modèle conceptuel utilisé

Akoka & Wattiau7 Diplômé de EcoleEtudiant Sc-nom Sc- adresse St-numéro st-nom St-numéro St-nom Sc-nom Sc-adresse 1 - Critères dagrégation L'agrégation est un groupement sémantique d'entités fondé sur lexistence d'une relation II- Les critères de regroupement

Akoka & Wattiau8 2 - Critères de dominance La notion de dominance sappuie sur le concept dentité faible ProfesseurEtudiant ClasseSectionCours Professeur Cours 3.1 Etudiant n n n n n m m II- Les critères de regroupement

Akoka & Wattiau9 3 - Le groupement par abstraction Personne ProfesseurEtudiant G Personne 2.1 II- Les critères de regroupement

Akoka & Wattiau Le groupement par contrainte SociétéIndividuPersonne 3.4 Prêt Contrat X contrainte dexclusion II- Les critères de regroupement

Akoka & Wattiau11 III - Techniques de classification Une technique de classification - sappuie sur la base dun ou plusieurs critères - définit la construction des niveaux dabstraction et les schémas obtenus à chaque niveau

Akoka & Wattiau Groupement par horizon logique (Feldman & al 86 ) L'horizon logique d'une entité E : contient toutes les entités qui peuvent être identifiées de façon unique à partir de lentité E en d'autres termes, toutes les entités sont liées à l'entité E par une (ou plusieurs) 1:N relation(s) appartenant à son horizon logique Exemple : Horizon logique de l'entité Département DépartementProfesseurCours 11 nn III - Techniques de classification

Akoka & Wattiau13 Principe du groupement par horizon logique a) Définir les centres de regroupement appelées entités majeures b) Former des groupements d'entités qui sont les horizons logiques de ces entités majeures Limites a) Procédure fastidieuse parce qu'elle est manuelle b) La définition des entités majeures nest pas aisée c) La classification utilise uniquement un critère : la relation III - Techniques de classification 1 - Groupement par horizon logique (Feldman & al 86 )

Akoka & Wattiau14 Utilisation des 4 critères définis par Teorey Le facteur de cohésion définit un ordre entre les différents critères de groupes dominance abstraction contrainte relation cohésion + - Principe de la classification 1) définir des centres de regroupement à l'intérieur des domaines fonctionnels 2) former des groupes d'entités 3) valider la classification Limites a) processus manuel b) définition des centres de regroupement difficile c) l'ordre entre les différents critères est arbitraire 2 - Groupement par cohésion (Teorey & al 89) III - Techniques de classification

Akoka & Wattiau15 spécifique aux méthodes orientées objets de type OOA [Coad] OOA préconise différents niveaux dabstraction appelés couches Lune des couches, appelée sujet, définit un mécanisme pouvant servir de guide pour une lecture aisée dun grand modèle complexe Identification des sujets 1) choisir dans chaque structure (hiérarchie dagrégation, de généralisation, etc) la classe de plus haut niveau : noyau du sujet 2) les classes qui ne sont dans aucune structure constituent aussi des sujets 3) les sujets sont affinés en utilisant : les sous-domaines du problème les interdépendances (structures et connexions dinstances) les interactions (connexions de messages) Limites a) processus manuel b) fait appel à lexpérience du concepteur 3 - Groupement par sujet III - Techniques de classification

Akoka & Wattiau ESSEC16 Défini sur la base du modèle des objets naturels [Brès] Lutilisateur perçoit des objets naturels dont la sémantique est plus riche que les concepts dentité et dassociation Tout objet naturel est construit autour dune entité principale, racine, et dune grappe dentités et dassociations reliées à cette racine Limites lidentification des objets naturels est laissée à lappréciation du concepteur 4 - Groupement naturel III - Techniques de classification

Akoka & Wattiau17 La méthode OOD suggère le regroupement de classes en catégories pour des raisons de visibilité Une catégorie contient toutes les classes du même domaine Le groupement par catégorie conduit à la définition de diagrammes de classes partiels plus faciles à lire Chaque diagramme contient trois sortes de classes les classes privées nappartiennent quà une seule catégorie les classes importées appartiennent principalement à une autre catégorie les classes exportées appartiennent à cette catégorie mais sont aussi importées dans dautres Limites a) processus manuel b) repose sur lexpérience du concepteur 5 - Groupement par catégorie III - Techniques de classification

Akoka & Wattiau Conclusion sur les regroupements Dans le modèle E-R comme dans le modèle objet, le besoin de classification en plusieurs niveaux dabstraction est réel Les regroupements proposés sappuient sur la sémantique des applications Ils sont laissés à linitiative et à lexpérience du concepteur III - Techniques de classification

Akoka & Wattiau19 Les algorithmes de classification automatique permettent le regroupement en classes dun nuage de points Il existe un grand nombre dalgorithmes différents IV - Classification automatique de données x x x x x x x x x x x x x

Akoka & Wattiau20 IV - Classification automatique de données Les algorithmes de classification ascendante partent de lensemble des objets isolés et regroupe les plus proches en une classe. Puis les classes les plus proches sont regroupées et ainsi de suite. On parle de classification ascendante hiérarchique. Elle suppose la définition de deux distances: –une distance entre les points –une distance entre les classes

Akoka & Wattiau21 IV - Classification automatique de données Les algorithmes de classification descendante part de lensemble des objets considéré comme une classe, puis le coupe en deux et ainsi de suite jusquà lobtention du nombre de classes désiré et/ou jusquà lobtention du nombre de classes désiré

Akoka & Wattiau22 IV - Classification automatique de données Les algorithmes dagrégation consistent à créer des classes par agrégation –avec seuil de distance –autour de centres fixes –autour de centres mobiles : nuées dynamiques

Akoka & Wattiau23 V - Un algorithme de classification automatique Cest un algorithme de classification descendante Qui découpe lensemble de points jusquà obtention dun nombre donné k de classes Qui maximise la distance inter-classes Et minimise la distance intra-classes

Akoka & Wattiau24 V - Un algorithme de classification automatique Début Soit [i] la classe contenant lobjet i ; soit I i = d is ; soit E iq = d is Soit j=1. Les objets à classer sont tous mis ensemble dans la classe (1). Tant que j# k /* le nombre k de classes n'est pas obtenu */ Faire /* construire la (j+1)ème classe */ Choisir l'objet i tel que : I i = Max I s /* parmi tous les objets, i est le plus éloigné de sa classe */ Insérer i dans la classe (j+1). Tant que il existe i tel que : /* i est plus près de la classe [q] que de sa classe */ Faire transférer i dans la classe [q] Fin tant que j=j+1 Fin tant que Fin s [i]s [q] [i] s q

Akoka & Wattiau25 Soit E un ensemble dentités a)D éfinition : Une distance entre entités est une application d de ExE dans R+ qui vérifie les propriétés suivantes : b) Trois exemples de distances - distance visuelle - distance hiérarchique - distance cohésive d(x,y)=0 x=y d(x,y) = d(y,x) d(x,y) <= d(x,z) + d(z,y) VI - Classification automatique de schémas E-R

Akoka & Wattiau26 utilise des distances mathématiques classifie un ensemble dentités une classe contient les entités les plus proches au sens de la distance Objectif : appliquer les critères de classification de la littérature ou dautres obtenir un processus automatique de classification VI - Classification automatique de schémas E-R

Akoka & Wattiau Distance visuelle d(i,j) = 1 si i et j sont liés par une relation sinon d(i,j) = min (d(i,k) + d(k,j)) k Exemple : Cadeau Employé Enfant Situation Fournisseur Bon de commande Cadeau Centre de vacances Choix Affecté Etablissement N N N N N N N 2 classes Distance visuelle 1

Akoka & Wattiau Distance visuelle d(i,j) = 1 si i et j sont liés par une relation sinon d(i,j) = min (d(i,k) + d(k,j)) k Cadeau Employé Enfant Situation Fournisseur Bon de commande Cadeau Centre de vacances Choix Mission Etablissement N N N N N N N 1 Exemple : 3 classes Distance visuelle

Akoka & Wattiau Distance hiérarchique d(i,j) = 1 si une relation 1:N existe entre i et j d(i,j) = 2 si une relation M:N existe entre i et j sinond(i,j) = min (d(i,k) + d(k,j)) k Exemple : Client Région Entrepôt PersonnelAffectation TâcheEmployé Niveau de réapprovisionnement Produit Ligne Commande Livraison du produit Livraison Client Stock 1 N N N N N N N N N N NN N N N N N N N M M 1 M N 1

Akoka & Wattiau Distance hiérarchique d(i,j) = 1 si une relation 1:N existe entre i et j d(i,j) = 2 si une relation M:N existe entre i et j sinond(i,j) = min (d(i,k) + d(k,j)) k Exemple : Client Région Entrepôt PersonnelAffectation TâcheEmployé Niveau de réapprovionnement Produit Lignes Commande Livraison du produit Livraison Client Stock 1 N N N N N N N N N N N N N N N N N N M 1 M N 1 N M 3 classes Distance hiérarchique

Akoka & Wattiau31 Client Région Entrepôt PersonnelAffectation TâcheEmployé Niveau de réapprovisionnement Produit Ligne Commande Livraison du produit Livraison Client Stock 1 N N N N N N N N N N N N N N N N N N M 1 M N Distance hiérarchique d(i,j) = 1 si une relation 1:N existe entre i et j d(i,j) = 2 si une relation M:N existe entre i et j sinond(i,j) = min (d(i,k) + d(k,j)) k Exemple : M N 4 classes Distance hiérarchique

Akoka & Wattiau Distance cohésive d(i,j) = 1 si i est une entité faible et j son entité régulière d(i,j) = 10 si i est une classe spécialisée de j d(i,j) =100 si i et j participent exclusivement dans une relation... sinon d(i,j) = min (d(i,k) + d(k,j)) k Exemple : Adresse Editeur Historique Editeur Notes Editeur Import Editeur Note Source Règlement Source Adresses Source Facture Historique lettre CommercialDistributeurEchange négocie avec entité faible entité régulière G N N N N N N N NN N N G Lien entre entité spécialisée et générique

Akoka & Wattiau Distance cohésive d(i,j) = 1 si i est une entité faible et j son entité régulière d(i,j) = 10 si i est une classe spécialisée de j d(i,j) =100 si i et j participent exclusivement dans une relation... sinon d(i,j) = min (d(i,k) + d(k,j)) k Exemple : Adresse Editeur Historique Editeurs Notes Editeurs Editeur Import Editeur Note Source Règlement Source Adresse Source Facture Historique lettre CommercialDistributeurEchange négocie avec entité faible entité régulière G N N N N N N N NN N G Lien entre entité spécialisée et générique 2 classes Distance cohésive N M

Akoka & Wattiau 34 Adresse Editeur Historique Editeur Notes Editeur Import Editeur Note Source Règlement Source Adresse Source Facture Historique lettre CommercialDistributeurEchange négocie avec entité faible entité régulière G N N N N N N N NN N G Lien entre entité spécialisée et générique N M 3 - Distance cohésive d(i,j) = 1 si i est une entité faible et j son entité régulière d(i,j) = 10 si i est une classe spécialisée de j d(i,j) =100 si i et j participe exclusivement dans une relation... sinon d(i,j) = min (d(i,k) + d(k,j)) k Exemple : 3 classes Distance cohésive

Akoka & Wattiau35 Adresse Editeur Historique Editeur Notes Pulicitaires Editeur Import Editeur Note Source Règlement Source Adresse Source Facture Historique lettre CommercialDistributeurEchange négocie avec entité faible entité régulière G N N N N N N N NN N G Lien entre entité spécialisée et générique 3 - Distance cohésive d(i,j) = 1 si i est une entité faible et j son entité régulière d(i,j) = 10 si i est une classe spécialisée de j d(i,j) =100 si i et j participe exclusivement dans une relation... sinon d(i,j) = min (d(i,k) + d(k,j)) k Exemple : 4 classes Distance cohésive M N

Akoka & Wattiau36 VI - Classification automatique de schémas E-R La distance visuelle regroupe les objets proches sur le diagramme La distance hiérarchique permet de retrouver les horizons logiques de Feldman La distance cohésive permet de classifier en respectant la hiérarchie de critères proposée par Teorey 4 - Conclusion sur les distances E-R

Akoka & Wattiau37 On peut appliquer la même technique aux schémas orientés objets Lalgorithme utilisé est le même Il faut définir des distances spécifiques Nous décrivons ici cinq distances adaptées à différents modèles objets une distance structuro-connective une distance catégorielle une distance naturelle une distance communicative simple une distance communicative fréquente VII - Classification automatique de schémas objets

Akoka & Wattiau38 sappuie sur les concepts du modèle objet OOA [Coad], en particulier : –les liens structurels (agrégation, généralisation, composition), –les connexions dinstances, –les connexions de message. La distance entre deux objets vaut : –1 sil existe un lien hiérarchique entre eux, –10 sil existe une connexion dinstance ou de message entre deux objets, –au plus court chemin dans les autres cas 1 - Distance structuro-connective VII - Classification automatique de schémas objets

Akoka & Wattiau39 sappuie sur les concepts du modèle objet OOD, en particulier : –les liens dhéritage, –les relations uses for entre les classes. La distance entre deux objets vaut : –1 sil existe un lien dhéritage entre eux, –10 sil existe une relation uses for avec des cardinalités 1-+, 1-*, 1-? entre eux, –100 sil existe une relation uses for avec une cardinalité *+,** ou ++ –ou au plus court chemin dans les autres cas. 2 - Distance catégorielle VII - Classification automatique de schémas objets

Akoka & Wattiau40 sappuie sur les concepts du modèle des objets naturels, qui sapparente plus à un modèle E-R étendu : –les liens de généralisation, –les associations de cardinalité minimale nulle, –les dépendances dexistence, –les autres liaisons sémantiques. La distance entre deux entités vaut : –1 sil existe une association de card. min. 1 et aucune généralisation, ni dépendance dexistence ni assoc. de card. min. 0 –au plus court chemin si elles sont dans un même sous-graphe connexe, et à linfini sinon. 3 - Distance naturelle VII - Classification automatique de schémas objets

Akoka & Wattiau41 Un intérêt du modèle objet est quil intègre des caractéristiques de traitement Les distances communicatives utilisent le concept de message pour définir la proximité entre deux objets Nous utilisons le modèle POOM (Parallel Object Oriented Model) qui est un modèle objet incluant le parallélisme 4 - Distances communicatives VII - Classification automatique de schémas objets

Akoka & Wattiau42 Formalisme graphique de POOM Entité ou Relation # Attribut 1 Attribut 2... Attribut n Etape 1 Etape 2 Méthode 10Méthode 20 Méthode 30 Attributs de l'objet statique Attributs de l'objet dynamique Nom de l'objet Identifiant de l'objet Evénement interne Méthode publique Message Méthode privée

Akoka & Wattiau43 La distance communicative simple sappuie sur la communication entre deux objets : lexistence dun flux de messages entre objets traduit un lien sémantique entre ces objets. d(i,j) = 1 si un message existe entre les objets i et j sinon d(i,j) est égal au plus court chemin de messages entre i et j VII - Classification automatique de schémas objets 4 - Distances communicatives

Akoka & Wattiau44 1 d(i,j) = où f k est la fréquence du k -ème message f k entre les objets i et j sinon d(i,j) = min d(i,k) + d(k,j) k La distance communicative fréquente sappuie aussi sur la communication entre deux objets : lexistence dun flux de messages entre objets traduit un lien sémantique entre ces objets. Elle intègre de plus la notion de fréquence de messages: plus deux objets communiquent fréquemment, plus ils sont proches sémantiquement VII - Classification automatique de schémas objets 4 - Distances communicatives

Akoka & Wattiau45 La distance structuro-connective permet de retrouver les sujets dOOA La distance catégorielle repère les catégories du modèle OOD La distance naturelle isole les objets du modèle des objets naturels La distance communicative fréquente permet de regrouper dans une classe les objets appartenant au même processus VII - Classification automatique de schémas objets 5 - Conclusion

Akoka & Wattiau46 VIII - Intégration vs Classification de schémas conceptuels

Akoka & Wattiau47 La classification de schémas peut être utilisée après intégration pour valider cette dernière et retrouver les vues initiales VIII - Autres applications La classification de tuples peut être utilisée pour définir un partitionnement de B.D. relationnelles parallèles La classification dattributs peut être utilisée pour alléger le processus de comparaison avant intégration des vues