Analyses spatiales et transfert d’échelle

Slides:



Advertisements
Présentations similaires
Les TESTS STATISTIQUES
Advertisements

Scoring Séance II.
Dr DEVILLE Emmanuelle J D V 12/07/2006
Modélisation des systèmes non linéaires par des SIFs
Module SIG-Santé 11. Epidémiologie et analyse spatiale Marc SOURIS
Module SIG-Santé 12. SIG et analyse spatiale
Module SIG-Santé 15. Modélisation Marc SOURIS
Traitement de données socio-économiques et techniques d’analyse :
Module SIG-Santé 6. Géoréférencement Marc SOURIS Florent DEMORAES
Les systèmes d'information géographique servent principalement à :
Administration de bases de données spatiales avec SavGIS
Epidémiologie, analyse spatiale et géostatistique
Groupe 1: Classes de même intervalle
Construction de modèles visuels
La segmentation
Comprendre la variation dans les données: Notions de base
Entre construction théorique et mise en œuvre opérationnelle
Mesures de répartition de la population Claude Marois 2012.
Structure discriminante (analyse discriminante)
Interprétation automatique
Modélisation géométrique de base
Régression linéaire (STT-2400)
1. Représentation des informations
Présentation de la méthode des Eléments Finis
Soutenance de stage 16 Mai au 5 Août 2011
Soutenance de stage 16 Mai au 5 Août 2011
La systémique : une méthode
Régression linéaire multiple : hypothèses & interprétation. Partie 2.
Régression linéaire multiple : hypothèses & interprétation
Géométrie épipolaire (deux vues)
1 Modèles de particules Reeves, W. T., "Particle Systems - A technique for Modeling a Class of Fuzzy Objects," SIGGRAPH 83, Reeves, W. T., and.
Quelques principes de référence pour l’évaluation des systèmes éducatifs Alain Mingat Décembre 2013.
Service Traitement de l’Information et Méthodologies.
Méthodes de Biostatistique
Statistique Descriptive Analyse des données
Formation SIG-Santé Géoréférencement Marc SOURIS Elisabeth HABERT
Chapitre 3-B : AUTOMATIQUE : LES S.L.C.I.
Traitement des fichiers flux d’individus (mobilité) de L’INSEE à l’aide du portail SIDDT.
Dynamique des ligneux dans les écosystèmes tropicaux
Initiation à la Méthodologie de Recherche
Introduction à la Microéconomie
La progressivité des apprentissages par niveaux
PPA Lyon – GT Qualité de l’Air – 3 Novembre 2005 PPA LYON Simulations de scenarii.
Caswell 2001 Sinauer Associates
Épidémiologie Notions élémentaires Réalisation pratique d’un enquête
La firme Les techniques à deux facteurs La demande de facteurs
l’économie de Robinson et de vendredi
REGLAGE ECONOMIQUE DES PRODUCTIONS Le réglage tertiaire.
Rappels de statistiques descriptives
Biostatistiques Quand on souhaite étudier une (ou des) caractéristique(s) sur un ensemble d’individus ou d’objets, il est difficile, voir impossible, d’observer.
Mise-à-jour de données de haute incertitude spatiale Présentation dans le cadre du groupe de discussion sur la fusion de données géospatiales – 22 nov.
Hatainville Les Moitiers d’Allonne – Tel : Website : stratic.online.com La démarche projet Mars 2001.
Micro-intro aux stats.
Études écologiques.
Olivier Leclair, Université Laval Un algorithme de fouille dans une représentation des données par objets: une application médicale SIMON, Arnaud.
Application à la viabilité des systèmes irrigués à Podor de la modélisation à la restitution aux paysans Olivier Barreteau.
systèmes d’information géographique
1 Gestion des voitures médecins d'Urgences-Santé Michel Gendreau Émilie Frot¹ Gilbert Laporte Frédéric Semet¹ Centre de recherche sur les transports Université.
Échantillonnage (STT-2000) Section 5 Types d’erreur de sondage. Version: 22 août 2003.
Comparaison multi-échelle des précipitations du modèle Méso-NH et des données radar Colloque CNFSH – Ecole des Ponts ParisTech – 11/12 juin 2009 A., Gires.
Analyse des semis de point
Modélisation du signal de télédétection
Détecter les groupes à hauts risques cardiaques à partir de caractéristiques telles que l’alimentation, le fait de fumer ou pas, les antécédents familiaux.
ECHANTILLONAGE ET ESTIMATION
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
Hadrien Commenges Université Paris 7, Géographie-cités Hélène Mathian CNRS – Géographie-cités Claude Grasland Université Paris 7, Géographie-cités Introduction.
Bienvenue au cours MAT-350 Probabilités et statistiques.
De la Terre à la carte: Projections et Géoréférencement
Jean Gaudart1 Détection de clusters spatiaux d'évènements Jean Gaudart Labo. Biostatistiques Faculté de Médecine de Marseille.
Processus ponctuels Caractéristiques et Modèles de répartitions spatiales.
Transcription de la présentation:

Analyses spatiales et transfert d’échelle Formation SIG-Santé Analyses spatiales et transfert d’échelle Marc SOURIS Master Géographie de la Santé Paris X. Nanterre Laboratoire de Cartographie Appliquée IRD - Bondy

Sommaire Cadre général Les opérations de transfert d’échelle Les Systèmes d’Information Géographique SIG et transfert d’échelle Modélisation du réel Échelle de description L’analyse spatiale Opérations de transfert d’échelle dans le SIG Tests de transfert d’échelle dans les SIG Conclusion

Cadre général La variabilité spatiale des phénomènes de santé est un aspect important de la mesure de la santé, elle suggère l’existence de facteurs explicatifs liés à l’environnement ou au contexte local. La recherche de relations pathologie-environnement se heurte à de nombreux problèmes en relation avec le transfert d’échelle : Les données épidémiologiques sont souvent statistiques, et lorsqu’elles sont localisées, elles sont souvent données dans un découpage arbitraire, sans tenir compte de la localisation précise de chaque cas. On ne peut donc raisonner que sur des populations et non sur des individus. Les données environnementales proviennent de capteurs ou de cartes qui ne sont pas souvent en rapport direct avec le phénomène de santé au niveau des unités de population étudiées. Il faut donc repasser par l’individu, alors que sa localisation n’est pas précise.

Cadre général La recherche de formes de diffusion, d’agrégats spatiaux, de relations spatiales, permettent d’orienter la recherche des facteurs de risque d’une maladie. Exemple : Snow et les causes de l’épidémie de choléra à Londres au XIXème siècle

Cadre général Les échelles épidémiologiques et la variabilité environnementale peuvent coexister mais être difficiles à mettre en relation. Exemple : les causes de l’émergence et de la ré-émergence de la grippe aviaire en Thaïlande

Les opérations de transfert d’échelle Les opérations de transfert d’échelle permettent de mettre en relation de façon raisonnée des informations localisées qui ont des descriptions ou des précisions différentes. Elles doivent être manipulées avec prudence car elles présentent des inconvénients et dangers : Non représentativité de valeurs agrégées Moyennes et lissages de données initiales Perte des événements rares Echelles traitant d’objets qui ne sont plus directement en rapport avec le phénomène biologique étudié, mais avec des populations agrégées Echelles permettant de dégager des tendances mais pas de suivre un phénomène biologique Erreur écologique

Les systèmes d’information géographique (SIG) Les SIG sont des logiciels qui permettent de : Structurer l’information suivant une schématisation du réel Stocker l’information géographique correspondant à cette schématisation, en différentes collections d’objets localisés, sous forme de base de données Analyser les objets et leurs relations, en utilisant la localisation Cartographier les résultats Les opérations de transfert d’échelle sont au cœur des opérations d’analyse spatiale et leur mise en œuvre est relativement « facile » dans les SIG.

Les systèmes d’information géographique (SIG)

Les systèmes d’information géographique (SIG) Exemple : la leptospirose dans le nord de la Thaïlande L’aire d’étude couvre 270 km2 et est située dans la partie centrale de la province de Phrae, où les conditions environnementales sont hétérogènes. Cette région est bien adaptée à la recherche de facteurs environnementaux sur l’incidence de la leptospirose.

SIG et transfert d’échelle Cette présentation a pour objectif de décrire la plupart des opérations et tests de transfert d’échelle souvent disponibles dans les SIG : Géo-agrégations Géo-appartenances Interpolations Opérations géostatistiques Généralisations Géo-agrégation Géo-appartenance

Modélisation du réel La description du monde réel par la géographie implique une modélisation du réel en unités spatiales, correspondant à une certaine échelle de description spatiale et une vision schématique et agrégée des phénomènes. Les objets dont s’occupe la géographie sont le plus souvent des agrégats et non des objets élémentaires. Les informations localisées sont connues pour des objets spatiaux dont la géométrie est schématisée par des points, des lignes, ou des zones. Dans ce dernier cas, elle peut être régulière (carroyage de l’espace) ou irrégulière (découpages administratifs, carte avec échelle de description implicite).

Modélisation du réel Découpages administratifs imposés Carroyages réguliers Cartes et échelles de description

Échelle de description L’échelle de description correspond à la « précision » d’une collection d’unités spatiales. Chaque unité est décrite par des attributs descriptifs (des variables) et une localisation schématique, correspondant à une précision géométrique en rapport avec les attributs descriptifs. De mêmes phénomènes peuvent donc être décrits à différentes échelles : les attributs ne seront pas les mêmes, la schématisation de leur localisation non plus. La schématisation est souvent imposée, soit par la disponibilité des données, soit par l’objet de l’étude, soit par des considérations logistiques ou financières.

Échelle de description Exemple : la leptospirose dans le nord de la Thaïlande 267500 personnes dans 411 villages. Les données démographiques et la localisation des villages proviennent du NSO (National Statistics Office). Les zones urbaines ne sont pas cartographiées.

Échelle de description Exemple : la leptospirose dans le nord de la Thaïlande Le système de santé : 7 hôpitaux et 75 centres de santé locaux

Échelle de description Exemple : la leptospirose dans le nord de la Thaïlande Taux d’incidence de la leptospirose par village (incidence pour 10,000 habitants). Les cas sont concentrés dans les plaines, où la plupart des villages et des rizières sont situés.

L’analyse spatiale A partir d’une schématisation de la réalité, l’analyse spatiale en géographie a pour objectif de dégager des structures, des caractères, des invariants, des lois de comportement, en mettant en évidence : des distributions particulières de valeurs, pour un sous-ensemble d’objets particuliers, des distributions de lieux ou des structures spatiales (linéaires, ponctuelles), des structures temporelles et spatio-temporelles, des relations fonctionnelles (y=f(x1,x2,…., xn) ) permettant d’élaborer des modèles et des lois de comportement

L’analyse spatiale Exemple : la leptospirose dans le nord de la Thaïlande La première observation montre qu’il n’y a pas, à priori, de distribution spatiale particulière des cas de leptospirose dans la région étudiée. Les villages avec ou sans cas sont proches les uns des autres. Par contre, nous allons vérifier s’il existe une relation entre les cas de leptospirose et la proximité de rizières.

Échelle d’analyse L’articulation des différentes échelles de description est particulièrement importante : c’est l’objet du transfert d’échelle. L’analyse spatiale vise à mettre en évidence des structures spatiales qui ne correspondent pas forcément à l’échelle de description des objets. Elle consiste souvent à mettre en évidence l’échelle spatiale à laquelle ces structures apparaissent ou sont pertinentes.

Le transfert d’échelle : de nombreuses questions… Quelle est l’influence du niveau géographique de description choisi sur la perception d’un phénomène donné ? Comment cette perception se modifie-t-elle sur l’ensemble des niveaux ? Existe-t-il un niveau d’analyse adéquat pour l’observation d’un phénomène ? A quel niveau une variable perd-elle ou prend-elle un pouvoir de discrimination ? Quelle est la nature de l’hétérogénéité interne des unités spatiales ?

L’analyse du système d’échelle L’analyse exploratoire du système d’échelle consiste à réaliser deux types d’analyses complémentaires : L’analyse indépendante de chaque niveau d’agrégation, qui rend compte pour chaque niveau des profils moyens des entités spatiales agrégées et qui traduit l’inertie interclasse. L’analyse du transfert entre deux échelles, qui rend compte de l’hétérogénéité des profils des entités du niveau inférieur à l’intérieur de leur classe d’appartenance (du niveau supérieur) et qui traduit l’inertie intraclasse.

Opérations de transfert d’échelle dans le SIG En réunissant des objets spatialisées dans un même ensemble , les SIG permettent de mettre en œuvre assez facilement des opérations de transfert d’échelle. En particulier, les SIG assurent la compatibilité des mesures de la localisation (même datum, même projection), et permettent d’effectuer facilement des opérations d’agrégation spatiale. Ils permettent également d’effectuer des tests d’adéquation de l’échelle du transfert par rapport à la distribution initiale des objets étudiés, et de vérifier en particulier la variance des valeurs après le transfert.

Opérations et tests de transfert d’échelle Agrégations Regroupements et classifications Appartenance Interpolations Généralisations Tests, indices, analyses Tests de variances Géostatistique et continuité Indices de distribution et de dispersion (globaux, locaux) Analyse contextuelle

Opérations et tests de transfert d’échelle Agrégations L’opération consiste à agréger des objets d’une collection dans les objets d’une autre collection, en utilisant un relation d’appartenance, d’intersection, ou de distance. Agrégation par appartenance Agrégation par distance (fixe, variable) Agrégation par intersection

Opérations et tests de transfert d’échelle Exemple : la leptospirose dans le nord de la Thaïlande Extraction de la végétation active dans les plaines : indice SAVI dans une image TM5, restriction aux zones de pente très faible

Opérations et tests de transfert d’échelle Exemple : la leptospirose dans le nord de la Thaïlande Supposant que la plupart des fermiers travaillent à moins de 3 km de leur village, nous avons calculé pour chaque village le pourcentage de végétation active dans un rayon de 3 km autour du village. Nous avons utilisé une opération de géo-agrégation.

Opérations de transfert d’échelle dans le SIG Agrégations L’opération d’agrégation peut utiliser une collection existante (qui a déjà un sens géographique), ou utiliser un carroyage régulier de l’espace (mailles dont on peut choisir la taille). La collection qui reçoit les objets peut être de type zone, ligne, point, pixel.

Opérations de transfert d’échelle dans le SIG Exemples d’agrégations

Opérations de transfert d’échelle dans le SIG Agrégations L’opération d’agrégation peut poser des problèmes de validité lorsque les objets sont des zones. Elle pose peu de problèmes en cas de hiérarchie des découpages (c’est souvent le cas pour les découpages administratifs, mais pas toujours), ou que le découpage qui reçoit est lié aux discontinuités du phénomène étudié. Lorsque ces conditions ne sont pas remplies, il faut appliquer une méthode pour « ventiler » les valeurs (en général en fonction de la surface, en faisant une hypothèse d’homogénéité).

Opérations de transfert d’échelle dans le SIG Agrégations et variabilité L’opération d’agrégation utilise souvent la moyenne de valeurs numériques : il est fondamental de connaître la variabilité « horizontale » du résultat.

Opérations de transfert d’échelle dans le SIG Agrégations et densité Le calcul d’une densité à partir d’un semis de points impose un changement d’échelle par agrégation dans une surface. L’utilisation d’un carroyage régulier permet de s’affranchir des biais liés à l’utilisation d’un découpage administratif pour le calcul de densité. Mais plus la distribution des points est concentrée, plus l’influence de la taille de la maille est importante.

Opérations de transfert d’échelle dans le SIG Agrégations et images satellites L’opération de ré-échantillonnage d’une image (changement de résolution) correspond à un changement d’échelle, avec une opération qui utilisent les voisins immédiats : Pixel le plus proche Interpolation bilinéaire Interpolation bicubique

Opérations de transfert d’échelle dans le SIG Regroupements et classifications Les regroupements définissent de nouveaux objets par regroupement des objets d’une collection, en général sur les critères de contigüité et/ou de ressemblance. De nombreux regroupements sont possibles. On cherche en général à regrouper les objets en maximisant un critère basé sur la comparaison des variances intragroupes et intergroupes (maximisation d’indices tels que Goodness Fit of Variance, Tabular Accuracy Index). On peut y ajouter une contrainte de contiguïté.

Opérations de transfert d’échelle dans le SIG Agrégats (clustering) La recherche d’agrégat est un cas particulier de regroupement, souvent utilisé avec des données ponctuelles. Il permet de rechercher des structures spatiales liées à la distribution de certains objets, en mettant en évidence des lieux et des structures non aléatoires ou significativement différentes de la distribution spatiale de l’ensemble des objets.

Opérations de transfert d’échelle dans le SIG Appartenance L’opération d’appartenance est l’inverse de l’opération d’agrégation. Elle permet d’affecter à un objet la valeur d’un objet auquel il appartient. Elle peut être ambiguë en cas de non- hiérarchie des objets (zones ou lignes). L’opération est très utile pour résoudre les jointures spatiales via la localisation, ainsi que pour éviter l’erreur atomiste (interpréter le comportement d’individus indépendamment de contextes spatiaux homogènes auxquels ils appartiennent).

Agrégation et appartenance L’erreur « écologique » Consiste à réattribuer à des objets élémentaires des propriétés d’entités qui les contiennent (obtenues ou non par agrégation) : lorsque l’on analyse des données agrégées, il n’est possible de revenir aux individus qu’à de fortes conditions ou hypothèses d’uniformité. Des résultats de corrélations sur des populations ne peuvent donc être inférées aux individus. Confondre les relations entre des objets agrégées (la densité de moustique et le pourcentage de surface bâtie dans une zone, la seroprévalence et l’usage du sol d’un quartier) et entre les objets initiaux (entre un moustique et son environnement, l’état immunitaire et les conditions de vie de l’individu) est une erreur courante.

L’analyse contextuelle L’appartenance géométrique pour résoudre l’erreur atomiste L’erreur « atomiste » consiste à étudier des objets sans tenir compte de leur contexte, et plus particulièrement d’entités spatiales (supposées alors uniformes) auxquels ils appartiennent. L’opération d’appartenance permet de résoudre géométriquement les relations spatiales, d’affecter à un objet les caractéristiques de son contexte, en vue d’une analyse contextuelle ou multi-niveau. L’analyse des niveaux d’agrégation (inertie interclasse) ou du passage d’une échelle à une autre (inertie intraclasse) est rendue facile par l’opération d’appartenance.

La recherche de facteurs environnementaux L’exposition à un facteur de risque utilise en général une opération d’appartenance à un espace (exposé, non exposé). La résolution de cette appartenance est facile dans les SIG grâce à la localisation. Cette opération doit être faite au niveau de l’individu (malades, non malades) et non sur des populations agrégées (taux d’incidences, etc.), car l’on s’expose alors à l’erreur « écologique ».

Opérations de transfert d’échelle dans le SIG Interpolations L’interpolation permet d’estimer une valeur en tout point de l’espace à partir des valeurs d’autres objets, souvent ponctuels. Plusieurs types de calculs sont possibles : Calcul analytique avec prise en compte des voisins en fonction de leur distribution et leur distance (voisins de Voronoï, fenêtre mobile…) Calcul probabiliste par étude de la continuité et de la variabilité globale (krigeage)

Opérations de transfert d’échelle dans le SIG Interpolations et espaces d’influence (différentes méthodes)

Opérations de transfert d’échelle dans le SIG Exemple : température minimum par zone Courbes de niveaux (altitude) Modèle numérique de terrain (altitude) Stations Météo (température min. ) Stations Météo Modèle numérique (température min.) Interpolation Interpolation sous contrainte Selection Contrainte Districts (administrative) Géo-Agrégation Moyenne du minimum de température, par district

Opérations de transfert d’échelle dans le SIG Exemple : répartition des moustiques dans l’espace

Opérations de transfert d’échelle dans le SIG Généralisations Un transfert d’échelle s’accompagne en général d’une abstraction sémantique et d’un changement d’échelle de description. Lorsque la géométrie des nouveaux objets provient d’un niveau plus précis, il est parfois utile de procéder à une généralisation pour mettre la géométrie des objets en accord avec leur contenu sémantique. Généralisation de contours (divers algorithmes) Création de centroïdes - Centre d’un semis de point (point médian, point moyen) - Centroïde géométrique d’un polygone

Opérations de transfert d’échelle dans le SIG Schématisations Des schématisations géométriques plus complexes que la généralisation de contours sont également disponibles. Elles font appel à la morphologie mathématique et effectuent en général un changement de type d’implantation spatiale : Squelettisation Vectorisation, courbes d’équivaleurs

Opérations de transfert d’échelle dans le SIG Schématisations Points médians Squelette Vectorisation et courbes d’équivaleurs

Tests de transfert d’échelle dans les SIG Indices de dispersion d’un semis de points Courbes de concentration Indice de Theil Moyenne de la distance minimum entre deux points, et comparaison par rapport à une distribution aléatoire Estimation de la variabilité et géostatistique Indices d’autocorrélation spatiale et semi-variogrammes

Tests de transfert d’échelle dans les SIG Indices de comparaison des variances interclasses et intraclasses Tabulated Accuracy Index Goodness Fit of Variance Ces deux indices calculent le rapport entre la somme des distances des individus à la moyenne de leur classe, et la somme des distances des individus à la moyenne générale (médian, moyen).

Conclusion Les SIG facilitent grandement la mise en œuvre des transferts d’échelle, car les objets localisés peuvent facilement être mis en relation grâce à leur localisation dans l’espace. Agrégations et appartenances sont les opérations les plus utilisées. Attention à l’erreur écologique, toujours possible lorsque l’on analyse des populations et non des individus.

Modélisation et échelles La modélisation des phénomènes de santé La modélisation des phénomènes de santé met en jeu de nombreuses données localisées, souvent schématisées à des échelles différentes. Si la plupart des paramètres biologiques d’un modèle concernent les individus et les pathogènes, les données environnementales et contextuelles proviennent d’autres objets, localisés de façon indépendante, à des échelles très diverses. L’espace intervient non pas comme facteur explicatif direct, mais en permettant de modéliser des variations de valeurs en fonction de caractères géométriques ou topologiques entre les agents : proximité, voisinage et contiguïté, continuité, distances, concentration, dans le temps comme dans l’espace.

Modélisation : techniques La modélisation des phénomènes de santé Deux grands techniques de modélisation : La macro-modélisation, plutôt déterministe, à partir d’équations analytiques (souvent différentielles), et traitant de populations La micro-modélisation, avec résolution numérique par pas de temps fini, utilisant des lois de comportement, traitant d’objets qui sont à l’échelle des prises de décision (individus, ménages, vecteurs…) et non des populations, et utilisant une démarche stochastique sur ces individus pour résoudre le hasard des comportements.

Modélisation et localisation La modélisation des phénomènes de santé La prise en compte de la localisation est difficile dans les modèles basés sur des lois de comportement de populations. On s’expose à l’erreur écologique. Pour intégrer des variables environnementales, il faut faire coïncider espace et population, ou faire des hypothèses d’homogénéité souvent peu réalistes. Elle est par contre plus facile dans les modèles IBM (Individual Based Model) car, à chaque pas de temps, les agents peuvent connaître leur environnement (horizontal et vertical). Les modèles IBM permettent également de détecter les évènements rares ou chaotiques.

Modélisation et transfert d’échelle La modélisation des phénomènes de santé Mettre en œuvre un modèle IBM dans un SIG permet de bénéficier d’opérations de transfert d’échelle à chaque pas de la simulation. Cela impose néanmoins de grosses ressources de calcul, de manière à pouvoir résoudre à chaque pas de temps l’ensemble des transferts nécessaires (en général par appartenance) et des autres relations spatiales entre objets. Dans tous les cas, il convient d’énoncer clairement les hypothèses formulées dans des lois de comportement ou de décision, et de s’assurer que la résolution des transferts d’échelle est compatible avec ces hypothèses (en terme de précision notamment).

L’exemple de la dengue Exemple : la modélisation de la dengue La modélisation de la dengue fait intervenir un système complexe homme-vecteur-pathogène-environnement. Principaux paramètres : Homme : état immunitaire, conditions de vie, âge, activité, etc. Aedes : tous les paramètres biologiques et environnementaux permettant de modéliser la densité de moustiques Environnement : météo et climat, altitude, usage du sol, etc.

L’exemple de la dengue Exemple : la modélisation de la dengue La modélisation de la densité de moustique utilise le comportement individuel du moustique (automate à états finis)

L’exemple de la dengue Exemple : la modélisation de la dengue Aedes Aegyptii femelle La densité de moustique et la probabilité de piqûre sont calculées à chaque pas de temps par agrégation spatiale. L’influence de l’environnement intervient au niveau du comportement individuel du moustique.

Fin M. Souris, 2010