PROJET DE RECHERCHE # 3 Évaluation et sélection de données sources “le défi pour faciliter l'agrégation automatique des données géospatiales des systèmes décisionnels” John-William Cely-PulidoÉtudiant Université Laval Yvan BédardDirecteur Titulaire de la Chaire Jean Brodeur Codirecteur Partenaire C.I.T. Sherbrooke Marc GervaisConseilleur Université Laval
Information Agrégée Information Agrégée géospatiale App..n Organisation Besoin 1 Besoin 2 Besoin 3 Besoin N Utilisateur 1 Utilisateur 2 Utilisateur 3 Utilisateur N Est-ce que les données correspondent aux besoins Des utilisateurs? Information Détaillée App1 Diversité de besoins Information Détaillée + Agrégée Données Sources Plusieurs Sources Contexte
Données agrégées pour construire le cube. Données détailléesDonnées agrégées Agrégation ou Généralisation Généralisation? Agrégation ? Difficulté d’automatisation Coûts élevés Délais très longs Solution: Chercher d’autres sources de données Sources alternatives Cartes à plus petites échelles Toute intégration de données nécessite une sélection à priori des sources à intégrer (Hallen 1991) Les données géospatiales agrégées peuvent provenir d'une source distincte des données détaillées (Bédard et al. 2001)
Le Problème S é lectionner la meilleure source qui correspond aux besoins Évaluer les efforts d'intégration/agrégation des différents jeux de données. Organisation Besoin 1 Besoin 2. Besoin n Différents besoins vs. Plusieurs sources Correspondance entre les objets à petite échelle et les objets détaillés. Il devient nécessaire d’identifier les meilleures sources de données afin d’assurer une information de qualité.
L’approche Besoin 1 Besoin 2 Besoin 3. Besoin n Besoins plusieurs niveaux de granularité plusieurs époques Sources Un seul niveau de granularité Une époque Source SPATIALE TEMPORELLE SEMANTIQUE Analyse des Efforts Critères de sélection : - Moins de travail - Moins cher - Plus accessible Critères d’évaluation: - Mise à jour - Restructuration - Changement de forme
L’approche Besoin 2 Besoin 1 Besoin 2 Besoin 3. Besoin n Besoins plusieurs niveaux de granularité plusieurs époques Sources Un seul niveau de granularité Une époque Source SPATIALE TEMPORELLE SEMANTIQUE Analyse des Efforts Critères de sélection : - Moins de travail - Moins cher - Plus accessible Critères d’évaluation: - Mise à jour - Restructuration - Changement de forme
L’approche Besoin 2 Besoin 1 Besoin 2 Besoin 3. Besoin n Besoins plusieurs niveaux de granularité plusieurs époques Sources Un seul niveau de granularité Une époque SPATIALE TEMPORELLE SEMANTIQUE Analyse des Efforts Source
L’approche Besoin 3 Besoin 1 Besoin 2 Besoin 3. Besoin n Besoins plusieurs niveaux de granularité plusieurs époques Sources Un seul niveau de granularité Une époque SPATIALE TEMPORELLE SEMANTIQUE Analyse des Efforts Source
L’approche Besoin N Besoin 1 Besoin 2 Besoin 3. Besoin n Besoins plusieurs niveaux de granularité plusieurs époques Sources Un seul niveau de granularité Une époque SPATIALE TEMPORELLE SEMANTIQUE Analyse des Efforts Source “Évaluation systémique de la qualité des données
Cadre Theórique Un processus à évaluer = Sélectionner la meilleure source mesure la performance Processus en Y -2TUP- (Adaptation Track Unified Process) Mesure la performance avec “Software Metrics”: “Aider à quantifier la meilleure source “ Quel est le meilleur processus Il y a un modèle pour gérer : (développement de systèmes d'information ) Les risques d’imprécision fonctionnelle, et d’inadéquation aux besoins.
ETL Pour le ETL : ETL moins cher, le plus facile. Les efforts de ETL :les plus petits (Évaluer la procédure ETL) Evaluation Select Geospatial Information “Une approche pour optimiser le processus ETL spatial à partir de la sélection de données”
Évaluer et sélectionner la meilleure source Évaluer et sélectionner la meilleure procédure Merci ! ”Évaluation systémique de la qualité des données pour l’optimisation du processus de peuplement des cubes des données géospatiales”