Qualité des données géographiques collaboratives Institut Géographique National (IGN), France Laboratoire COGIT Qualité des données géographiques collaboratives Thèse : un modèle d'opérations réconciliables pour l'acquisition distribuée de données géographiques Carmen Brando Directrice : Bénédicte Bucher Journée des doctorants ED MSTIC 2010 Université Paris-Est Marne-la-Vallée 10 Juin 1 © IGN - 2010 1 1 1
Contenu généré par les utilisateurs (O’Reilly, 2007) © IGN - 2010
© IGN - 2010
Volunteered Geographic Information (VGI) : (Michael Goodchild, 2007) © IGN - 2010
Création de contenu spatial Edition d’instances géographiques Géolocalisation Wikipédia Flickr 5 © IGN - 2010 5 5 5
Problématique 6 © IGN - 2010 Généré par : http://www.wordle.net 6 6 6
Plan Qualité Approche proposée Conclusion et perspectives du contenu généré par les utilisateurs (CGU) du contenu spatial (CS) des données géographiques collaboratives (DGC) Approche proposée Conclusion et perspectives 7 © IGN - 2010 7
Qualité du contenu généré par les utilisateurs (CGU) : Définition Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives Qualité du contenu généré par les utilisateurs (CGU) : Définition est associée à si le contenu est utile ou pas aux besoins des utilisateurs : fitness for use confiance des utilisateurs au contenu : autorité du fournisseur Wikipédia : le meilleur exemple, mais… question de qualité : les utilisateurs sont anonymes Wikis: l’édition de contenu est facile et rapide Des éditeurs collaboratifs plus avancés assurent la cohérence du contenu par la réconciliation des opérations concurrents Ex : Google Wave 8 © IGN - 2010 8 8 8
Qualité du CGU. Qualité du CS. Qualité des DGC Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives Qualité du contenu généré par les utilisateurs (CGU) : comment l’améliorer ? Pendant l’édition : cohérence interne et citation des sources externes 9 © IGN - 2010 9 9 9
Après l’édition : Détection de conflits / Réconciliation Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives Qualité du contenu généré par les utilisateurs (CGU) : comment l’améliorer ? Après l’édition : Détection de conflits / Réconciliation Résolution manuelle des conflits 10 © IGN - 2010 10 10
Qualité du contenu spatial (CS) : Définition Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives Qualité du contenu spatial (CS) : Définition Représentation idéale (terrain nominal) Spécifications* Monde réel * La superficie des bâtiments est plus grande que 20m2 11 © IGN - 2010 11
Qualité du contenu spatial (CS) : Définition Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives Qualité du contenu spatial (CS) : Définition Spécifications des fournisseurs de données géographiques BD TOPO ® - IGN La connaissance associée à comment le monde est observé et comment il est modélisé dans la base de données 12 © IGN - 2010 12 12 12
Qualité du contenu spatial (CS) : Définition Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives Qualité du contenu spatial (CS) : Définition Représentation idéale (terrain nominal) Données requise par les utilisateurs Spécifications* Qualité externe Qualité interne Monde réel Données produites + Métadonnées (Spécifications + Critères d’erreur) Processus de production : erreurs** * La superficie des bâtiments est plus grande que 20m2 ** Il y a eu des erreurs de saisie ou la réalité a évoluée 13 © IGN - 2010 13
Qualité des données géographiques collaboratives (DGC) Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives Qualité des données géographiques collaboratives (DGC) DGC pour actualiser les bases de données (BD) des fournisseurs de DG au travers d’alertes OpenStreet Map, influence importante sur comment le contenu spatial est produit et actualisé Puis après, DGC pour complémenter les BD des fournisseurs de DG en permettant l’édition de contenu (en plus des alertes) (Budhathoki, 2008) (Elwood, 2008) (Antoniou, 2009) 14 © IGN - 2010 14 14
Spécifications pour les DGC ? Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives Approche proposée : Spécifications pour les DGC ? Celles sont appropriées pour les fournisseurs de DG comme l’IGN et les néogéographes seront peu enthousiastes à travailler avec des spécifications… © Scott Adams 15 © IGN - 2010 15 15
Spécifications pour les DGC ? Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives Approche proposée : Spécifications pour les DGC ? Yes We Can Groupes d’intérêts spéciaux (Coote, 2008) ont des besoins plus forts sur la qualité des données des limitations de budget pour collecter, rédiger et actualiser les spécifications Un manque d’expertise sur des techniques de modélisation pour assurer la cohérence de ces données un intérêt d’accepter quelques règles pendant la contribution 16 © IGN - 2010 16
Spécifications pour les DGC ? Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives Approche proposée : Spécifications pour les DGC ? Charte de directives Tags Reference Usage standard des étiquettes 17 © IGN - 2010
Spécifications pour les DGC ? Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives Approche proposée : Spécifications pour les DGC ? Ceci est fait par Keep Right! http://keepright.ipax.at Des contraintes d’intégrité prédéfinies sont vérifiées sur des données OSM 18 © IGN - 2010 18 18
Spécifications pour les DGC Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives Approche proposée : Spécifications pour les DGC Assister les utilisateurs à la saisie des spécifications Ensuite, pour vérifier la cohérence des données utilisateurs, on utilise des mécanismes automatisés : Pour évaluer des contraintes d’intégrité Pour réconcilier des éditions simultanées 19 © IGN - 2010
Approche proposée : Saisie des spécifications Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives Approche proposée : Saisie des spécifications Autorité Cecilia © Jorge Cham Taxonomie Géographique et schéma de données IGN Recherche dans un thesaurus (ex : WordNet Français) Saisie du schéma liaison Catégories et infobox Wikipédia Ex : création de la classe ruisseau Ex : eau, cours d’eau, fleuve, branche, ruisselet Enrichissement sémantique
Spécifications pour les DGC Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives Approche proposée : Spécifications pour les DGC Assister les utilisateurs à la saisie des spécifications Ensuite, pour vérifier la cohérence des données utilisateurs, on utilise des mécanismes automatisés : Pour évaluer des contraintes d’intégrité Pour réconcilier des éditions simultanées 21 © IGN - 2010
Contraintes d’intégrités Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives Approche proposée : Contraintes d’intégrités Manque de cohérence géométrique entre le réseau hydrographique et les limites administratives Une contrainte d’intégrité indiquant la relation entre les deux les deux types pour assurer le partage de la géométrie Possible réparation: placer la limite administrative au milieu du fleuve Données OpenStreetMap autour de Grenoble (Decembre 2009) 22 © IGN - 2010 22 22 22
Approche proposée : Spécifications pour les DGC Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives Approche proposée : Spécifications pour les DGC Assister les utilisateurs à la saisie des spécifications Ensuite, pour vérifier la cohérence des données utilisateurs, on utilise des mécanismes automatisés : Pour évaluer des contraintes d’intégrité Pour réconcilier des éditions simultanées 23 © IGN - 2010
Mécanisme de réconciliation Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives Approche proposée : Mécanisme de réconciliation Tajel © Jorge Cham Cecilia © Jorge Cham Rue de Paris Ajouter un tronçon de route à ‘Rue de Paris’ Changer le nom à ‘Avenue Bollée’ Spécification DGC : « l’attribut nom d’une route est Independent de la géométrie » ?? Avenue Bollée 24 © IGN - 2010 24 24
Conclusion & Perspectives Qualité du CGU Qualité du CS Qualité des DGC Approche Proposée Conclusion & Perspectives Conclusion & Perspectives Les données géographique collaboratives font référence à un nouveau paradigme pour produire du contenu spatial Une approche qui réconcilie la richesse de données géographiques collaboratives avec les exigences de qualité d’un fournisseur de données Tester cet approche dans la plateforme GeOxygene : http://oxygene-project.sourceforge.net 25 © IGN - 2010 25 25
Merci de votre attention 26 © IGN - 2010 26 26