La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Ghislain Atemezing Raphaël Troncy Vers une meilleure interopérabilité des données géographiques françaises sur le Web de données.

Présentations similaires


Présentation au sujet: "Ghislain Atemezing Raphaël Troncy Vers une meilleure interopérabilité des données géographiques françaises sur le Web de données."— Transcription de la présentation:

1 Ghislain Atemezing Raphaël Troncy Vers une meilleure interopérabilité des données géographiques françaises sur le Web de données

2 Plan Où sont les données géographiques ? Le mobile et lutilisation de la géo-localisation Données géographiques sur le web sémantique Modélisation des objets géographiques Modélisation des entités géographiques Modélisation de la géométrie Illustration avec des scénarios Aligner les représentations Formuler quelques recommandations Conclusion et travaux futurs 29/06/ IC2012, Paris

3 Où sont les données géographiques? IC2012, Paris- 3 GeoPortail CIA Factbook Foursquare: POI.. Opengeocoder: Bounding Box.. GeoNames: Codes des pays 29/06/2012

4 Où sont les données géographiques liées? - 4 DBpedia, GeoNames LinkedGeodata (OpenStreetMap), Freebase (Google) Ordnance Survey (UK), GeoLinkedData (ES) GADM-RDF NUTS-RDF data.ign.fr (FR) IC2012, Paris29/06/2012 Fournisseur#Donnée disponible DBpedia triplets GeoNames (« entités ») LinkedGeoData triplets Ordnance Survey6 295 triplets Freebase8,5 MB (tsv fichiers) GeoLinkedData.es triplets Projet GADM triplets Projet NUTS triplets

5 Données géographiques liées et LOD 5 Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. 31 jeux de données 19.43% triplets 29/06/2012IC2012, Paris

6 29/06/ Les vocabulaires utilisés IC2012, Paris

7 Quels sont les modèles IC utilisés ? Des listes dautorité de termes (Foursquare) Peu structurée Représente les catégories des Points dIntérêt Typiquement, un type réponse dune API Nécessite dexpliciter la sémantique Des catégories SKOS (GeoNames) Les classes sont des skos:conceptScheme Les codes sont des skos:Concept Peu de classes, de nombreux codes IC2012, Paris- 729/06/2012

8 Quels sont les modèles IC utilisés ? Des ontologies spécifiques au domaine Les ontologies par sous-domaine (transport, unité administrative, hydrographie, etc.) Ontologies interconnectées (owl:imports) UK (OS) – ES (GeoLinkedData) Des ontologies riches construites par des outils automatiques / TAL Les classes de haut-niveau pour structurer LinkedGeoData (16 classes de haut-niveau; 1294 classes au total) GeOnto (2 classes de haut-niveau; 783 classes au total) IC2012, Paris- 829/06/2012

9 - 9 Point (lat/long) Vocabulaire WGS 84 décrit au W3C Rectangle (bounding box) Vocabulaire géopolitique (FAO) Points dans une liste (« Nodes », « waynodes ») Séquence de points (LinkedGeoData) Points dans un groupe de ressources RDF Un objet est formedBy ListOfPoints(GeoLinkedData.es) Littéraux (représentation GML incluse en RDF) Ordnance Survey(UK) Représentation complètement structurée Le vocabulaire NeoGeo (GeoVocamp) IC2012, Paris29/06/2012 Modélisation de la geométrie

10 Scénario: Tour Eiffel / Paris 7ème - 10IC2012, Paris29/06/2012

11 La Tour Eiffel sur DBpedia (un Building…) - 11 dbpedia:Eiffel_Tower a dbpedia-owl:Building ; a ; (16 types différent) rdfs:label "Tour ; geo:lat " "^^xsd:float ; (WGS84 ) geo:long " "^^xsd:float ; geo:geometry "POINT( )" ;http://schema.org/Place dbpprop:buildingType "Observation ; dbpprop:elevatorCount "9"^^xsd:int ; dbpprop:location dbpedia:Paris ; dbpprop:isofRegion "FR-75" ; dbpprop:architect dbpedia:Stephen_Sauvestre. IC2012, Paris29/06/2012

12 La Tour Eiffel sur Freebase (un skyscraper) - 12 fb:en.eiffel_tower a fb:architecture.building ; a fb:architecture.skyscraper ; (12 rdf:type in total) fb:architecture.skyscraper.height_with_antenna_spire_meter s "324.0"^^xsd:float ; fb:location.geocode [ fb:location.geocode.longitude "2.2946"^^xsd:float ; fb:location.geocode.latitude " "^^xsd:float. ] ; IC2012, Paris29/06/2012

13 La Tour Eiffel sur GeoNames (un S.MMT) - 13 gnr: a gn:Feature ; gn:name "Eiffel Tower" ; gn:alternateName " ; (en 45 langues différentes) gn:featureClass gn:S [ a skos:ConceptScheme ; rdfs:comment "spot, building, ] ; gn:featureCode gn:S.MMT [ a skos:Concept ; rdfs:comment "a commemorative structure or ] ; gn:countryCode "FR" ; geo:lat " " ; geo:long " ". IC2012, Paris29/06/2012

14 La Tour Eiffel sur LGD (un chemin de 45 points) - 14 lgd:way a lgdo:Building, lgdo:ManMadeTower, lgdo:Attraction ; rdfs:label "Wieża ; (en 13 langues. ) lgdo:layer "2"; lgdp:building:height "301"; lgdp:importance "international"; lgdo:hasNodes.http://linkedgeodata.org/triplify/way /nodes rdf:_1 lgd:node ; …………; rdf:_10 lgd:node ; (tous les 45 points du polygone) IC2012, Paris29/06/2012

15 7ème Arrondissement in DBpedia (a gml_Feature) - 15 dbpedia:7th_arrondissement_of_Paris a gml:_Feature ; (gml nest pas en OWL ) a (Yago Class) rdfs:label " (14 different languages)http://dbpedia.org/class/yago/1900SummerOlympicVenuEs dbpprop:commune "Paris" ; dbpprop:département dbpedia:Paris ; dbpprop:région dbpedia:Île-de-France_(region) ; grs:point " " ; geo:geometry "POINT( )" ; (fake property?!) geo:lat " "^^xsd:float; geo:long " "^^xsd:float. IC2012, Paris29/06/2012

16 7ème Arrondissement in GeoNames (a A.ADM4) - 16 gnr: a gn:Feature ; gn:name "Paris 07"; gn:alternateName "7ème arrondissement"; gn:featureClass gn:A [ a skos:ConceptScheme ; rdfs:comment "country, state, ] ; gn:featureColde gn:A.ADM4 [ a skos:Concept ; rdfs:comment "a subdivision of a third-order administrative ]; gn:countryCode "FR"; gn:population "57410"; geo:lat " "; geo:long "2.321". IC2012, Paris29/06/2012

17 7ème Arrondissement in LGD (a Suburb) - 17 lgd:node a lgdo:Suburb ; rdfs:label "7th "7e Arrondissement" ; lgdo:contributor lgd:user13442 ; ;http://linkedgeodata.org/ontology/ref%3AINSEE lgdp:alt_name "VIIe Arrondissement" ; georss:point " " ; geo:lat ; geo:long IC2012, Paris29/06/2012

18 Vocabulaire GeOnto Ontologie des objets géographiques (PI) Résultat dun projet ANR Obtenue par des outils de TAL Recouvre la partie BDTopo (IGN) Classes en français rdfs:labels en FR & EN Pas de rdfs:comments Peu de relations 783 classes - 18IC2012, Paris29/06/2012IC2012, Paris

19 Méthodologie dalignement Alignement de GeOnto avec 4 vocabulaires et 2 taxonomies LGD, DBpedia, Schema.org, GeoNames Foursquare, Google Places Recherche des owl:equivalentClass Outil : Silk Métriques : LevenshteinDistance, Jaro Labels des classes Fonction dagrégation : moyenne Validation manuelle Pour les « rdfs:subClassOf » Alignement spécifique avec GeoNames - 19IC2012, Paris29/06/2012IC2012, Paris

20 Procédé dalignement avec GeoNames geOnto:AGeoConcept a owl:Class; rdfs:label a rdfs:subClassOf gn:Feature; owl:equivalentClass [a owl:Restriction; owl:onProperty gn:featureCode; owl:hasValue gn:CODE. ] - 20IC2012, Paris Silk Rechercher les skos codes des classes de GeOnto Vérifier les links <70% Générer les liens « sameAs » Entrepôt de triplets Construire un nouveau graphe avec des requêtes SPARQL « Construct » Fichier dalignement exporter le fichier rdf 29/06/2012IC2012, Paris

21 Résultats/Evaluation Precisions généralement > 80% Sauf P(Schema.org) = 50%. Raison possible: les entités GeOnto plus spécifiques à la France Niveau trop détaillé des entités sur Schema.org - 21IC2012, Paris Vocab/taxonomies#Classes#Classes alignées LGD owl:Class : DBpedia owl:Class : Schema.org owl:Class : GeoNames skos:Concept : Foursquare35946 Google Place /06/2012IC2012, Paris

22 Recommendations Séparation des objets de leur géométrie Bien distinguer dans les espaces de nommage Exemple: spatial:Feature vs geom:Geometry Usage du vocabulaire WGS84 pour représenter les points Réutiliser les propriétés natives (long; lat; alt) Géométrie complexe (polygone, courbe, etc.) Utiliser les représentations plus structurées Eviter au maximum les nœuds anonymes dans les données Proposer des transformations aux formats SIG (KML, GML, etc.) Extension de GeOnto Un bon candidat: NeoGeo Publier selon les Bonnes Pratiques (data.ign.fr) - 22IC2012, Paris29/06/2012IC2012, Paris

23 Perspectives Publier GeOnto++ Selon les Bonnes Pratiques du web de données liées « Lifter » les données de lIGN En utilisant le vocabulaire Poursuivre les Alignements Schema.org, Foursquare, Google Place (évolutif) GeoSPARQL Procéder à des alignements au niveau des donnés - 23IC2012, Paris29/06/2012IC2012, Paris

24 Questions ? Merci pour votre attention !

25 Spatial Things and Spatial Objects Credit: John Goodwin: Designing URI Sets for INSPIRE –Tutorial lifted your data, INSPIRE 2012, Istanbul IC2012, Paris29/06/


Télécharger ppt "Ghislain Atemezing Raphaël Troncy Vers une meilleure interopérabilité des données géographiques françaises sur le Web de données."

Présentations similaires


Annonces Google