La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Akoka & Wattiau1 J. Akoka & I. Comyn-Wattiau. Akoka & Wattiau2 PLAN Introduction : le problème Critères de classification Techniques de classification.

Présentations similaires


Présentation au sujet: "Akoka & Wattiau1 J. Akoka & I. Comyn-Wattiau. Akoka & Wattiau2 PLAN Introduction : le problème Critères de classification Techniques de classification."— Transcription de la présentation:

1 Akoka & Wattiau1 J. Akoka & I. Comyn-Wattiau

2 Akoka & Wattiau2 PLAN Introduction : le problème Critères de classification Techniques de classification Classification automatique de données Un algorithme de classification automatique Classification automatique de schémas E-R Classification automatique de schémas orientés objets orientés Intégration vs classification Autres applications

3 Akoka & Wattiau3 I- Introduction : le problème L'efficacité et la qualité du processus de la conception de base de données dépendent principalement d'une bonne communication entre : informaticiens utilisateurs finaux managers ALe schéma conceptuel est supposé être un outil pour faciliter cette interaction.

4 Akoka & Wattiau4 I- Introduction : le problème F Le succès du modèle ER peut s'expliquer principalement par la simplicité de ses concepts et par son formalisme graphique, tous deux facilitant le dialogue entre ces personnes. F Toutefois, dans les applications réelles, le schéma conceptuel n'est pas suffisant pour atteindre une bonne communication parce que : F il est souvent trop grand : il est très difficile danalyser un schéma contenant une centaine d'entités. l'information est donnée seulement d'un niveau d'abstraction. Une approche descendante devrait être un moyen plus facile de lire un schéma conceptuel.

5 Akoka & Wattiau5 I- Introduction : le problème La classification de schémas un sous-schéma 1 un schéma conceptuel un sous-schéma 2 un sous-schéma 3 Comment découper ? sur quels critères ?

6 Akoka & Wattiau6 II- Les critères de regroupement Les critères doivent sappuyer sur la sémantique des données et/ou des traitements La définition des critères dépend du modèle conceptuel utilisé

7 Akoka & Wattiau7 Diplômé de EcoleEtudiant Sc-nom Sc- adresse St-numéro st-nom St-numéro St-nom Sc-nom Sc-adresse 1 - Critères dagrégation L'agrégation est un groupement sémantique d'entités fondé sur lexistence d'une relation II- Les critères de regroupement

8 Akoka & Wattiau8 2 - Critères de dominance La notion de dominance sappuie sur le concept dentité faible ProfesseurEtudiant ClasseSectionCours Professeur Cours 3.1 Etudiant 11 1 1 1 n n n n n m m II- Les critères de regroupement

9 Akoka & Wattiau9 3 - Le groupement par abstraction Personne ProfesseurEtudiant G Personne 2.1 II- Les critères de regroupement

10 Akoka & Wattiau10 4 - Le groupement par contrainte SociétéIndividuPersonne 3.4 Prêt Contrat X contrainte dexclusion II- Les critères de regroupement

11 Akoka & Wattiau11 III - Techniques de classification Une technique de classification - sappuie sur la base dun ou plusieurs critères - définit la construction des niveaux dabstraction et les schémas obtenus à chaque niveau

12 Akoka & Wattiau12 1 - Groupement par horizon logique (Feldman & al 86 ) L'horizon logique d'une entité E : contient toutes les entités qui peuvent être identifiées de façon unique à partir de lentité E en d'autres termes, toutes les entités sont liées à l'entité E par une (ou plusieurs) 1:N relation(s) appartenant à son horizon logique Exemple : Horizon logique de l'entité Département DépartementProfesseurCours 11 nn III - Techniques de classification

13 Akoka & Wattiau13 Principe du groupement par horizon logique a) Définir les centres de regroupement appelées entités majeures b) Former des groupements d'entités qui sont les horizons logiques de ces entités majeures Limites a) Procédure fastidieuse parce qu'elle est manuelle b) La définition des entités majeures nest pas aisée c) La classification utilise uniquement un critère : la relation III - Techniques de classification 1 - Groupement par horizon logique (Feldman & al 86 )

14 Akoka & Wattiau14 Utilisation des 4 critères définis par Teorey Le facteur de cohésion définit un ordre entre les différents critères de groupes dominance abstraction contrainte relation cohésion + - Principe de la classification 1) définir des centres de regroupement à l'intérieur des domaines fonctionnels 2) former des groupes d'entités 3) valider la classification Limites a) processus manuel b) définition des centres de regroupement difficile c) l'ordre entre les différents critères est arbitraire 2 - Groupement par cohésion (Teorey & al 89) III - Techniques de classification

15 Akoka & Wattiau15 spécifique aux méthodes orientées objets de type OOA [Coad] OOA préconise différents niveaux dabstraction appelés couches Lune des couches, appelée sujet, définit un mécanisme pouvant servir de guide pour une lecture aisée dun grand modèle complexe Identification des sujets 1) choisir dans chaque structure (hiérarchie dagrégation, de généralisation, etc) la classe de plus haut niveau : noyau du sujet 2) les classes qui ne sont dans aucune structure constituent aussi des sujets 3) les sujets sont affinés en utilisant : les sous-domaines du problème les interdépendances (structures et connexions dinstances) les interactions (connexions de messages) Limites a) processus manuel b) fait appel à lexpérience du concepteur 3 - Groupement par sujet III - Techniques de classification

16 Akoka & Wattiau ESSEC16 Défini sur la base du modèle des objets naturels [Brès] Lutilisateur perçoit des objets naturels dont la sémantique est plus riche que les concepts dentité et dassociation Tout objet naturel est construit autour dune entité principale, racine, et dune grappe dentités et dassociations reliées à cette racine Limites lidentification des objets naturels est laissée à lappréciation du concepteur 4 - Groupement naturel III - Techniques de classification

17 Akoka & Wattiau17 La méthode OOD suggère le regroupement de classes en catégories pour des raisons de visibilité Une catégorie contient toutes les classes du même domaine Le groupement par catégorie conduit à la définition de diagrammes de classes partiels plus faciles à lire Chaque diagramme contient trois sortes de classes les classes privées nappartiennent quà une seule catégorie les classes importées appartiennent principalement à une autre catégorie les classes exportées appartiennent à cette catégorie mais sont aussi importées dans dautres Limites a) processus manuel b) repose sur lexpérience du concepteur 5 - Groupement par catégorie III - Techniques de classification

18 Akoka & Wattiau18 6 - Conclusion sur les regroupements Dans le modèle E-R comme dans le modèle objet, le besoin de classification en plusieurs niveaux dabstraction est réel Les regroupements proposés sappuient sur la sémantique des applications Ils sont laissés à linitiative et à lexpérience du concepteur III - Techniques de classification

19 Akoka & Wattiau19 Les algorithmes de classification automatique permettent le regroupement en classes dun nuage de points Il existe un grand nombre dalgorithmes différents IV - Classification automatique de données x x x x x x x x x x x x x

20 Akoka & Wattiau20 IV - Classification automatique de données Les algorithmes de classification ascendante partent de lensemble des objets isolés et regroupe les plus proches en une classe. Puis les classes les plus proches sont regroupées et ainsi de suite. On parle de classification ascendante hiérarchique. Elle suppose la définition de deux distances: –une distance entre les points –une distance entre les classes

21 Akoka & Wattiau21 IV - Classification automatique de données Les algorithmes de classification descendante part de lensemble des objets considéré comme une classe, puis le coupe en deux et ainsi de suite jusquà lobtention du nombre de classes désiré et/ou jusquà lobtention du nombre de classes désiré

22 Akoka & Wattiau22 IV - Classification automatique de données Les algorithmes dagrégation consistent à créer des classes par agrégation –avec seuil de distance –autour de centres fixes –autour de centres mobiles : nuées dynamiques

23 Akoka & Wattiau23 V - Un algorithme de classification automatique Cest un algorithme de classification descendante Qui découpe lensemble de points jusquà obtention dun nombre donné k de classes Qui maximise la distance inter-classes Et minimise la distance intra-classes

24 Akoka & Wattiau24 V - Un algorithme de classification automatique Début Soit [i] la classe contenant lobjet i ; soit I i = d is ; soit E iq = d is Soit j=1. Les objets à classer sont tous mis ensemble dans la classe (1). Tant que j# k /* le nombre k de classes n'est pas obtenu */ Faire /* construire la (j+1)ème classe */ Choisir l'objet i tel que : I i = Max I s /* parmi tous les objets, i est le plus éloigné de sa classe */ Insérer i dans la classe (j+1). Tant que il existe i tel que : /* i est plus près de la classe [q] que de sa classe */ Faire transférer i dans la classe [q] Fin tant que j=j+1 Fin tant que Fin s [i]s [q] [i] s q

25 Akoka & Wattiau25 Soit E un ensemble dentités a)D éfinition : Une distance entre entités est une application d de ExE dans R+ qui vérifie les propriétés suivantes : b) Trois exemples de distances - distance visuelle - distance hiérarchique - distance cohésive d(x,y)=0 x=y d(x,y) = d(y,x) d(x,y) <= d(x,z) + d(z,y) VI - Classification automatique de schémas E-R

26 Akoka & Wattiau26 utilise des distances mathématiques classifie un ensemble dentités une classe contient les entités les plus proches au sens de la distance Objectif : appliquer les critères de classification de la littérature ou dautres obtenir un processus automatique de classification VI - Classification automatique de schémas E-R

27 Akoka & Wattiau27 1 - Distance visuelle d(i,j) = 1 si i et j sont liés par une relation sinon d(i,j) = min (d(i,k) + d(k,j)) k Exemple : Cadeau Employé Enfant Situation Fournisseur Bon de commande Cadeau Centre de vacances Choix Affecté Etablissement 1 1 1 1 1 1 1 N N N N N N N 2 classes Distance visuelle 1

28 Akoka & Wattiau28 1 - Distance visuelle d(i,j) = 1 si i et j sont liés par une relation sinon d(i,j) = min (d(i,k) + d(k,j)) k Cadeau Employé Enfant Situation Fournisseur Bon de commande Cadeau Centre de vacances Choix Mission Etablissement 1 1 1 1 1 1 1 N N N N N N N 1 Exemple : 3 classes Distance visuelle

29 Akoka & Wattiau29 2 - Distance hiérarchique d(i,j) = 1 si une relation 1:N existe entre i et j d(i,j) = 2 si une relation M:N existe entre i et j sinond(i,j) = min (d(i,k) + d(k,j)) k Exemple : Client Région Entrepôt PersonnelAffectation TâcheEmployé Niveau de réapprovisionnement Produit Ligne Commande Livraison du produit Livraison Client Stock 1 N 1 1 1 1 1 1 1 1 1 1 1 1 1 1 N N N N N N N N N NN N N N N N N N M M 1 M N 1

30 Akoka & Wattiau 30 2 - Distance hiérarchique d(i,j) = 1 si une relation 1:N existe entre i et j d(i,j) = 2 si une relation M:N existe entre i et j sinond(i,j) = min (d(i,k) + d(k,j)) k Exemple : Client Région Entrepôt PersonnelAffectation TâcheEmployé Niveau de réapprovionnement Produit Lignes Commande Livraison du produit Livraison Client Stock 1 N 1 1 1 1 1 1 1 1 1 1 1 1 N N N N N N N N N N N N N N N N N M 1 M N 1 N M 3 classes Distance hiérarchique

31 Akoka & Wattiau31 Client Région Entrepôt PersonnelAffectation TâcheEmployé Niveau de réapprovisionnement Produit Ligne Commande Livraison du produit Livraison Client Stock 1 N 1 1 1 1 1 1 1 1 1 1 1 1 N N N N N N N N N N N N N N N N N M 1 M N 1 2 - Distance hiérarchique d(i,j) = 1 si une relation 1:N existe entre i et j d(i,j) = 2 si une relation M:N existe entre i et j sinond(i,j) = min (d(i,k) + d(k,j)) k Exemple : M N 4 classes Distance hiérarchique

32 Akoka & Wattiau32 3 - Distance cohésive d(i,j) = 1 si i est une entité faible et j son entité régulière d(i,j) = 10 si i est une classe spécialisée de j d(i,j) =100 si i et j participent exclusivement dans une relation... sinon d(i,j) = min (d(i,k) + d(k,j)) k Exemple : Adresse Editeur Historique Editeur Notes Editeur Import Editeur Note Source Règlement Source Adresses Source Facture Historique lettre CommercialDistributeurEchange négocie avec entité faible entité régulière G N N N N N N N NN N N 1 1 1 1 1 1 11 1 1 G Lien entre entité spécialisée et générique

33 Akoka & Wattiau33 3 - Distance cohésive d(i,j) = 1 si i est une entité faible et j son entité régulière d(i,j) = 10 si i est une classe spécialisée de j d(i,j) =100 si i et j participent exclusivement dans une relation... sinon d(i,j) = min (d(i,k) + d(k,j)) k Exemple : Adresse Editeur Historique Editeurs Notes Editeurs Editeur Import Editeur Note Source Règlement Source Adresse Source Facture Historique lettre CommercialDistributeurEchange négocie avec entité faible entité régulière G N N N N N N N NN N 1 1 1 1 1 1 11 1 1 G Lien entre entité spécialisée et générique 2 classes Distance cohésive N M

34 Akoka & Wattiau 34 Adresse Editeur Historique Editeur Notes Editeur Import Editeur Note Source Règlement Source Adresse Source Facture Historique lettre CommercialDistributeurEchange négocie avec entité faible entité régulière G N N N N N N N NN N 1 1 1 1 1 1 11 1 1 G Lien entre entité spécialisée et générique N M 3 - Distance cohésive d(i,j) = 1 si i est une entité faible et j son entité régulière d(i,j) = 10 si i est une classe spécialisée de j d(i,j) =100 si i et j participe exclusivement dans une relation... sinon d(i,j) = min (d(i,k) + d(k,j)) k Exemple : 3 classes Distance cohésive

35 Akoka & Wattiau35 Adresse Editeur Historique Editeur Notes Pulicitaires Editeur Import Editeur Note Source Règlement Source Adresse Source Facture Historique lettre CommercialDistributeurEchange négocie avec entité faible entité régulière G N N N N N N N NN N 1 1 1 1 1 1 11 1 1 G Lien entre entité spécialisée et générique 3 - Distance cohésive d(i,j) = 1 si i est une entité faible et j son entité régulière d(i,j) = 10 si i est une classe spécialisée de j d(i,j) =100 si i et j participe exclusivement dans une relation... sinon d(i,j) = min (d(i,k) + d(k,j)) k Exemple : 4 classes Distance cohésive M N

36 Akoka & Wattiau36 VI - Classification automatique de schémas E-R La distance visuelle regroupe les objets proches sur le diagramme La distance hiérarchique permet de retrouver les horizons logiques de Feldman La distance cohésive permet de classifier en respectant la hiérarchie de critères proposée par Teorey 4 - Conclusion sur les distances E-R

37 Akoka & Wattiau37 On peut appliquer la même technique aux schémas orientés objets Lalgorithme utilisé est le même Il faut définir des distances spécifiques Nous décrivons ici cinq distances adaptées à différents modèles objets une distance structuro-connective une distance catégorielle une distance naturelle une distance communicative simple une distance communicative fréquente VII - Classification automatique de schémas objets

38 Akoka & Wattiau38 sappuie sur les concepts du modèle objet OOA [Coad], en particulier : –les liens structurels (agrégation, généralisation, composition), –les connexions dinstances, –les connexions de message. La distance entre deux objets vaut : –1 sil existe un lien hiérarchique entre eux, –10 sil existe une connexion dinstance ou de message entre deux objets, –au plus court chemin dans les autres cas 1 - Distance structuro-connective VII - Classification automatique de schémas objets

39 Akoka & Wattiau39 sappuie sur les concepts du modèle objet OOD, en particulier : –les liens dhéritage, –les relations uses for entre les classes. La distance entre deux objets vaut : –1 sil existe un lien dhéritage entre eux, –10 sil existe une relation uses for avec des cardinalités 1-+, 1-*, 1-? entre eux, –100 sil existe une relation uses for avec une cardinalité *+,** ou ++ –ou au plus court chemin dans les autres cas. 2 - Distance catégorielle VII - Classification automatique de schémas objets

40 Akoka & Wattiau40 sappuie sur les concepts du modèle des objets naturels, qui sapparente plus à un modèle E-R étendu : –les liens de généralisation, –les associations de cardinalité minimale nulle, –les dépendances dexistence, –les autres liaisons sémantiques. La distance entre deux entités vaut : –1 sil existe une association de card. min. 1 et aucune généralisation, ni dépendance dexistence ni assoc. de card. min. 0 –au plus court chemin si elles sont dans un même sous-graphe connexe, et à linfini sinon. 3 - Distance naturelle VII - Classification automatique de schémas objets

41 Akoka & Wattiau41 Un intérêt du modèle objet est quil intègre des caractéristiques de traitement Les distances communicatives utilisent le concept de message pour définir la proximité entre deux objets Nous utilisons le modèle POOM (Parallel Object Oriented Model) qui est un modèle objet incluant le parallélisme 4 - Distances communicatives VII - Classification automatique de schémas objets

42 Akoka & Wattiau42 Formalisme graphique de POOM Entité ou Relation # Attribut 1 Attribut 2... Attribut n Etape 1 Etape 2 Méthode 10Méthode 20 Méthode 30 Attributs de l'objet statique Attributs de l'objet dynamique Nom de l'objet Identifiant de l'objet Evénement interne Méthode publique Message Méthode privée

43 Akoka & Wattiau43 La distance communicative simple sappuie sur la communication entre deux objets : lexistence dun flux de messages entre objets traduit un lien sémantique entre ces objets. d(i,j) = 1 si un message existe entre les objets i et j sinon d(i,j) est égal au plus court chemin de messages entre i et j VII - Classification automatique de schémas objets 4 - Distances communicatives

44 Akoka & Wattiau44 1 d(i,j) = ------- où f k est la fréquence du k -ème message f k entre les objets i et j sinon d(i,j) = min d(i,k) + d(k,j) k La distance communicative fréquente sappuie aussi sur la communication entre deux objets : lexistence dun flux de messages entre objets traduit un lien sémantique entre ces objets. Elle intègre de plus la notion de fréquence de messages: plus deux objets communiquent fréquemment, plus ils sont proches sémantiquement VII - Classification automatique de schémas objets 4 - Distances communicatives

45 Akoka & Wattiau45 La distance structuro-connective permet de retrouver les sujets dOOA La distance catégorielle repère les catégories du modèle OOD La distance naturelle isole les objets du modèle des objets naturels La distance communicative fréquente permet de regrouper dans une classe les objets appartenant au même processus VII - Classification automatique de schémas objets 5 - Conclusion

46 Akoka & Wattiau46 VIII - Intégration vs Classification de schémas conceptuels

47 Akoka & Wattiau47 La classification de schémas peut être utilisée après intégration pour valider cette dernière et retrouver les vues initiales VIII - Autres applications La classification de tuples peut être utilisée pour définir un partitionnement de B.D. relationnelles parallèles La classification dattributs peut être utilisée pour alléger le processus de comparaison avant intégration des vues


Télécharger ppt "Akoka & Wattiau1 J. Akoka & I. Comyn-Wattiau. Akoka & Wattiau2 PLAN Introduction : le problème Critères de classification Techniques de classification."

Présentations similaires


Annonces Google