La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 Laboratoire de bases de données (LBD) Ecole Polytechnique Fédérale Lausanne (EPFL), Suisse.

Présentations similaires


Présentation au sujet: "1 Laboratoire de bases de données (LBD) Ecole Polytechnique Fédérale Lausanne (EPFL), Suisse."— Transcription de la présentation:

1 1 stefano.spaccapietra@epfl.ch Laboratoire de bases de données (LBD) Ecole Polytechnique Fédérale Lausanne (EPFL), Suisse

2 Modélisation informationnelle: espace, temps, contexte - une approche conceptuelle MADS Stefano Spaccapietra http://lbd.epfl.ch

3 Introduction: besoin de - modélisation (représentation) - décision - échange

4 4 Modélisation et information géographique Représentation de la structure urbaine de St.Maximin  Par exemple, pour des analyses socio-économiques Représentation de la structure de l'Hôtel Couvent Royal ou du complexe monastique (basilique+couvent)  Par exemple, pour l’étude des procédures d’évacuation Représentation de la montagne St.Victoire (espace géographique)  Par exemple, pour établir une cartographie Représentation d’une région (Provence), d’un pays (France)  Par exemple, pour des études d'aménagement Représentation d’un réseau de transport (routes, trains, fluvial, électrique, gaz, etc.)  Par exemple, pour la planification de son évolution

5 5 Décision et information géographique Gestion du trafic: faut-il doubler une autoroute ? Gestion des transports: faut-il renforcer une ligne ou créer une ligne nouvelle Gestion des risques naturels: sait-on faire face à une tempête ? Gestion des villes: quels sont les investissements prioritaires ? Gestion des risques industriels: organisation des secours ? Gestion de l’environnement: comment choisir les bons indicateurs ? Etudes archéologiques: quels types de bâti sont compatibles avec les ruines existantes ? (simulation)

6 6 Echanger: un besoin incontournable Rarement une base de données contient toutes les informations nécessaires L'accès à des données dans d'autres bases de données nécessite des solutions humaines (accord de partage) et des solutions techniques (protocoles d'exportation et d'importation). Les standards cherchent à faciliter la définition de ces protocoles. Ils règlent les problèmes de syntaxe. La solution des problèmes de sémantique (compréhension correcte des informations échangées) s'oriente aujourd'hui vers le recours aux ontologies (super-dictionnaire métier)

7 7 Les solutions informatiques Mémorisation des informations:  Bases de données géographique  Bases de données spatiales ou spatio-temporelles  Systèmes type SIG/GIS ou SGBD/DBMS étendu Support à la décision  Entrepôts de données spatiales ou spatio-temporelles  Systèmes Data Warehouse Interopérabilité - Echange  Protocoles standards  Ontologies

8 8 Les entrepôts de données Extraction des données Sources Externes Validation (cleaning) et intégrationdesdonnées Sources Internes Acquisition des données Data Warehouse Requêtes et analysedesdonnées Serveur OLAP OLAP requêtes/ rapports fouille Meta données Monitoring Administration Construction & maintenance

9 9 Ontologies Un moyen de partager l’information, entre humains comme entre ordinateurs “Une spécification explicite d’une conceptualisation" (Gruber) Constituée par :  un vocabulaire spécifique utilisé pour décrire les concepts pertinents pour un certain domaine du savoir, et  un ensemble de descriptions formelles de la signification de ces concepts

10 Les bases de données Modélisation conceptuelle

11 11 Modélisation conceptuelle Objectif: représenter la réalité telle qu'elle est perçue par les utilisateurs Avantages Attention portée sur les applications Indépendante des technologies  Portabilité  Longévité Orientée utilisateur  Facilité de compréhension  Support du dialogue concepteurs / utilisateurs  Permet la collaboration et la validation par les utilisateurs

12 12 Autres avantages Spécifications formelles, non ambiguës Puissance descriptive des concepts Support d’interfaces visuelles (lisibilité)  Diagrammes de structure des données  Manipulation de données Facilite les échanges d’informations entre SGBD différents (interopérabilité)

13 Comment structurer les informations

14 14 Conception d’une BD analyse de la réalité  partielle  subjective  infidèle représentation (modèle)  contenu  structure  règles  dynamique description (langage de définition des données - LDD) perception

15 15 Concepts de base d'un modèle conceptuel Les concepts de base (correspondent aux concepts d’abstraction de la réalité):  entité objet  lien association ("relationship")  propriété attribut + la représentation multiple

16 16 Des objets complexes diplôme année intitulé salaires date-début date-fin simple obligatoire monovalué complexe, facultatif, multivalué de type ensemble Employé No-emp nom prénoms CV postes montant date année mois liste simple, obligatoire, multivalué de type liste

17 17 Des associations entre objets Association: représentation d'un lien non orienté entre plusieurs entités (qui jouent un rôle déterminé) "achète" = PersonneMaison Achète

18 18 Les objets dans le temps qu'est qu'un client ??? Toute personne qui a une commande en cours Toute personne qui a fait une commande dans les six derniers mois Toute personne qui a fait une commande dans le passé ou qui est susceptible de faire une commande dans le futur ………

19 19 Les associations dans le temps Quels emprunts veut-on dans la BD? Seulement les emprunts en cours Les emprunts des trois derniers mois Aussi les emprunts à venir (réservations) …. PersonneLivre Emprunte

20 20 Les attributs Décrivent l’information (les propriétés) à conserver sur:  un objet  une association  un attribut nomprénomsalaire Date_mariage jourmois année Domaine [1,31] MARI FEMME Personne Marié à

21 21 Associations Ternaires "achète" = 3 objets liés ClientProduit Fournisseur Achète

22 22 Identifiants Pour désigner un objet (une association) de façon univoque Identifiant fixé par l'application: clé  Ensemble minimal d'attributs tel qu'il n'existe pas deux objets (ou deux associations) qui aient la même valeur pour ces attributs (exemple: numéro sécurité sociale)  Dans les bases de données relationnelles, toute table doit avoir un identifiant Identifiant fixé par le système: object identifier  Valeur discriminante attribuée à chaque objet (association) pour la différencier de toutes les autres

23 23 Contraintes de cardinalité Une personne peut ne pas avoir de voiture, en avoir 1, 2, … n (pas de contrainte) n Une voiture a un et un seul propriétaire 0 : n Personne Possède 0 : n 1 : 1 PersonneVoiture Possède

24 24 Contraintes d'intégrité âge  [0 : 130 ] 0 ≤ âge ≤ 130 SI mois  {4, 6, 9, 11} ALORS jour  [1:30], SINON SI mois=2 ALORS jour  [1:29], SINON jour  [1:31]  x,y  Personne,  Mariage => x.état-civil = "marié" & y.état-civil = "marié”  x  Personne,  y  Voiture,  Conduit => x.âge >=18  x  Personne, (x.sexe=F OR x.age x.statut_militaire=NULL

25 25 Représentation multiple Un objet peut avoir plusieurs représentations Plusieurs points de vue: un bâtiment un bâtiment religieux une église Bâtiment Religieux Civique Habitation Eglise Couvent Synagogue

26 26 Lien de Généralisation / Spécialisation (Is-a) Bâtiment civique Lien IS_A Bâtiment habitation EgliseSynagogueCouvent Bâtiment religieux Un bâtiment religieux est un bâtiment Raffinement de classification

27 27 Clusters de spécialisation Etudiant Et.garçonEt.filleEt.infoEt.archiEt.3èmeEt.4ème critère: sexe critère: discipline critère: année

28 28 Exemple avec multi-instanciation Véhicule Bicyclette Moyen de Transport Accessoire Cinéma Voiture Objet de collection overlapping Avion disjoint

29 29 Spécialisation d'associations Dans certaines applications on souhaite savoir lequel des auteurs d'un article apparaît en premier auteur. ChercheurArticle Auteur Premier Auteur

30 30 Spécialisation de TA avec liens supplémentaires Des liens (comme des attributs) peuvent être ajoutés à une association spécialisée PersonneBanque Prêt emprunteur Prêt Garanti garant

31 31 Des associations aux multi-associations Une association lie un objet de chaque type d'objet lié  Une personne possède un logement Parfois, on a besoin de lier des groupes d'objets, plutôt que des objets individuels  Un groupe de parcelles est restructuré pour donner un autre groupe de parcelles (remembrement)  En modélisation traditionnelle, ceci force la création d'un objet "groupe de parcelles" (objet artificiel)

32 32 La multi-association n Pas de correspondance 1-1 ou n-1 entre les batiments des deux types  Association N-M 5 bâtiments 1:10000 (1,2,3,4,5) représentés par 3 bâtiments 1:50000 (a,b,c) t = ( {1,2,3,4,5}, {a,b,c} ) Bâtiment 1:10000 Bâtiment 1:50000 Typification

33 33 Sémantique des (multi-)associations Les associations et multi-associations peuvent être enrichies avec une ou plusieurs sémantiques prédéfinies Agrégation Transition Génération Et d'autres, dans le domaine spatial, temporel, multi- représentation, …

34 34 Ferme Champ Bâtiment Composée 1,n Agrégation (ou composition) Noms des rôles:  composant, composé Règle de dérivation: Ferme.geometry = SpatialUnion (Champ.geometry,Bâtiment.geometry) Contrainte:  les champs et les bâtiment d'une même ferme doivent appartenir au même propriétaire et être adjacents

35 35 Transition Décrit l'évolution des objets par rapport à leur classification Personne Etudiant Alumnus Promotion T

36 36 Génération Un ensemble d'objets source génère un ensemble d'objets cible Parcelle 0:n cible 1:n 0:n source 1:n G Génère

37 Au delà des structures: espace, temps, contexte

38 38 Modélisation multidimensionnelle Décrire la structure des données est fondamental, mais il y a beaucoup plus à décrire …  La localisation dans l'espace des phénomènes qui nous intéressent  Leur localisation dans le temps  Les contextes multiples qui déterminent une modélisation particulière  Le degré de certitude/incertitude de l'information  Etc.

39 39 Espace de représentation multidimensionnel deux représentations du même objet selon le même point de vue à des résolutions spatiales différentes Classification Espace (granularité) Point de vue

40 40 Un instantané de BD Classification Temps Point de vue

41 41 rivières réservoirs bassins versants Orthogonalité des dimensions de modélisation

42 42 Exemple: structure des données / espace RivièreaRéservoir nom R# nom Rivière nom réservoirs R# nom localisation ou Objets spatiaux ou attributs spatiaux ? ou les deux ?

43 43 Ajouter des annotations spatiales Rivière Réservoir BassinVersant Dans Sur nomC# R# RivièreBassinVersant Dans nom B# réservoirs Rivière nom bassinVersantréservoirs B# surface nom R# nom localisation R# nom localisation

44 44 Ajouter des annotations temporelles nom budget nom présentations salaire f ( ) rue ville codePostal pays numéro nom dateNais adresse f ( ) téléphones Employé Département Projet Personne budget speaker lieu durée Affecté Fait Travaille Cycle de vie Attribut variable dans le temps attribut date (user defined time)

45 45 Modélisation de l'espace Vue discrète et vue continue Vue discrète  objets spatiaux  et attributs spatiaux  Rivière avec bassins versant, digues, réservoirs …  ZoneAvalanche avec point de départ, corridors  Associations à contraintes spatiales  Intersection routière : feux, signalisation, nombre de collisions …  topologiques, métriques, d'orientation… Vue continue  Attributs variables dans l'espace (space-varying attributes)  Fonction: étendue spatiale  valeurs  Exemples: altitude, hauteur de pluie, couverture du sol, type de sol, …

46 46 Vue discrète et vue continue Vue continue  grille (une valeur par cellule) Vue discrète  points, lignes ou surfaces (délimitées par des lignes) Monde réel

47 47 Attributs spatiaux Lac nom km2 iles (0,n) profondeur f( ) ports (0,n) nom localisation capacité Type d'objet spatial Attribut spatial (point) Attribut variable dans l'espace Attribut spatial (surface) UNE IMPLEMENTATION RELATIONNELLE Lac (Lnom, geometry, km2) Island (Lnom, numéro-Ile, surface) Profondeur (Lnom, point, prof) Port (Lnom, nom-port, localisation, capacité)

48 48 Types spatiaux en MADS SimpleArea PointSet Point ComplexArea ComplexGeoSimpleGeo disjoint OrientedLine Line LineSet OrientedLineSet disjoint Geo disjoint

49 49 Modélisation du temps Mémoriser quand un objet était (est, sera) actif  Cycle-de-vie des objets et des associations Validité des valeurs d'attribut  Mémoriser l'évolution (passée et future) des valeurs des attributs  Attributs variables dans le temps  Fonction : intervalle de temps --> valeurs Associations à contrainte temporelle  Imposer une contrainte temporelle sur le cycle de vie des objets liés  Associations de synchronisation  Ex.: Mariage => les deux personnes vivent au même moment  Ex.: PèreDe => le père est né avant son enfant

50 50 planifié actif suspendu désactivé Cycle de vie Différentes possibilités:  un intervalle de temps, ex. Personne  un instant, ex. EtoileFilante  Un ensemble d'intervalles  => état actif et suspendu  ex.: un professeur est en sabbatique  L'ensemble des états possibles et leurs propriétés dépendent des applications

51 51 Concepts spatio-temporels Variabilité dans l'espace et dans le temps  ex. occupation du sol  fonction: (domaine spatial X domaine temporel) --> valeurs  Implémentation: ensemble de (point, instant, valeur) Objets spatiaux mobiles Point mobile  Ex.: personne, voiture  fonction: Temps --> Point  trajectoires Surface mobile: tempête, nappe de pollution  fonction: Temps --> Surface  Avec déformations possibles

52 Les contextes: perception et représentations multiples

53 53 Multi-Représentation: points de vue multiples Bâtiment Pont Route Lac Avalanche Parcelle Monde Réel Constructeur Gestionnaire de risques no-bât geometry no-parcelle Bâtiment geometry Parcelle geometry no-route materiau Route geometry no-route type nbDeVoies Route geometry nom Lac Lac Léman Lac de Genève

54 54 Résolution multiples plus précise moins précise occupation-du-sol : {verger, vigne, céréales, pré, foret…} occupation-du-sol : {surface cultivée, foret, surface construite}

55 55 Géométrie multiples Rivière décrite comme surface ou comme ligne résolution plus précise résolution moins précise

56 56 Valeurs multiples d'attributs Décrire la même propri é t é à diff é rents niveaux d'abstraction  même id é e que les hi é rarchies de classification pour les objets surface cultivée forêt … poirierscitronnierspommiers verger céréalesoléagineux … mais blécolza tournesol vignes occupation du sol

57 57 La solution MADS Identification des perceptions  ex. BD Risques naturels  Résolutions : 1/1’000, 1/5’000, 1/25’000  Points de vue : Technicien, Gestionnaire, Public  => { T1, T5, T25, G1, G5, G25, P1, P5, P25 } Chaque objet ou lien du monde réel peut avoir dans la BD une ou plusieurs représentations  Souvent une par perception Estampillage de chaque élément de la BD et du schéma avec l'identifiant des perceptions auxquelles il appartient

58 58 Principes de la solution Deux usages d'une BD "PRM" (perceptions et représentations multiples)  mono-perception => BD “normale”  multi-perception => un nouveau genre de BD  Nouvelles règles de cohérence Deux façons de modéliser une BD PRM  Intégration  Toutes les représentations du même objet sont réunies en un seul type d'objet  Liens inter-représentation  un type d'objet par représentation

59 59 Des types mono-repr. aux types multi-repr. Perceptions Route numéro: (1:1) integer nom: (1:1) string dpt: (1:1) integer type: (1:1) string numéro: (1:1) integer nom: (1:1) string classAdm: (1:1) integer type: (1:1) enum (locale, regionale, nationale) Route numéro: (1:1) integer nom: (1:1) string f(P) classAdm: (1:1) integer dpt: (1:1) integer type: (1:1) enum (locale, régionale, nationale) string

60 60 Modélisations séparées Correspond numéro: (1:1) integer nom: (1:1) string classAdm: (1:1) integer type: (1:1) enum (locale, régionale, nationale) Route1 Route2 numéro: (1:1) integer nom: (1:1) string dpt: (1:1) integer type: (1:1) string Sémantique inter-représentation IR

61 61 Ouverture d'une BD PRM Route numéro: (1:1) integer nom: (1:1) string dpt: (1:1) integer type: (1:1) string Ouverture avec la perception rouge numéro: (1:1) integer name: (1:1) string classAdm: (1:1) integer type: (1:1) enum (locale, régionale, nationale) Road Ouverture avec la perception bleu Ouverture avec les perceptions rouge et bleu toutes les instances toutes les instances rouges, rouge&bleu toutes les instances bleues, rouge&bleu Route numéro: (1:1) integer nom: (1:1) string f(P) classAdm: (1:1) integer dpt: (1:1) integer type: (1:1) enum (locale, régionale, nationale) string

62 62 Manipulation dans une BD PRM Utilisateur rouge :  InsertInto Route (numéro: D506, nom: “Départementale Paris- Aubervilliers”, dpt: 78, type: locale, geometry: list-of-coordinates) Utilisateur bleu :  AddRepresentationTo Route Where (numéro: D506) (classAdm: 3, type: “route secondaire”, geometry: new-list-of-coordinates) Route numéro: (1:1) integer nom: (1:1) string f(P) classAdm: (1:1) integer dpt: (1:1) integer type: (1:1) enum (locale, régionale, nationale) string

63 63 Conclusion Les concepts pour la modélisation conceptuelle de l'espace et du temps existent. Une modélisation par dimensions orthogonales est préférable. Les outils correspondants ne sont qu'au stade de prototypes. Des outils de traduction d'une modélisation conceptuelle en spécifications logiques (compréhensibles par les systèmes type GIS actuels) sont en cours de développement. La représentation multiple est un besoin incontournable. L'interopérabilité reste pauvre.

64 64 Pour en savoir plus Les publications du laboratoire: http://lbd.epfl.ch Mon email: stefano.spaccapietra@epfl.ch Un livre:  Christine Parent, Stefano Spaccapietra, Esteban Zimán � yi Conceptual Modeling for Traditional and Spatio-Temporal Applications Springer 2006, 466 p. 115 Illus. 11 Tables. Hardcover Merci pour votre attention


Télécharger ppt "1 Laboratoire de bases de données (LBD) Ecole Polytechnique Fédérale Lausanne (EPFL), Suisse."

Présentations similaires


Annonces Google