Module SIG-Santé 12. SIG et analyse spatiale

Slides:



Advertisements
Présentations similaires
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Advertisements

Efficient Simplification of Point-Sampled Surfaces
Collecte de données F. Kohler.
Inférence statistique
Les TESTS STATISTIQUES
Comparaison de plusieurs moyennes Analyse de variance
Dr DEVILLE Emmanuelle J D V 12/07/2006
Visualisation d’information interactive 5 : Graphes
Comparaison de plusieurs moyennes Analyse de variance
Module SIG-Santé 11. Epidémiologie et analyse spatiale Marc SOURIS
Sylvain Mondon Météo-France
Module SIG-Santé 15. Modélisation Marc SOURIS
Module SIG-Santé 1. Introduction : les systèmes d’information géographique pour l’épidémiologie et la géographie de la santé Marc SOURIS Paris Ouest Nanterre-La.
Traitement de données socio-économiques et techniques d’analyse :
Module SIG-Santé 6. Géoréférencement Marc SOURIS Florent DEMORAES
Eric Guilbert, Marc Daniel *, Eric Saux
Introduction Principes généraux des SIG
RECONNAISSANCE DE FORMES
Les systèmes d'information géographique servent principalement à :
Administration de bases de données spatiales avec SavGIS
Epidémiologie, analyse spatiale et géostatistique
Régression linéaire simple
Construction de modèles visuels
La segmentation
Opération et systèmes de décision Faculté des Sciences de l administration MQT Probabilités et statistique Mesures caractéristiques.
Howell, Chap. 1 Position générale
Comprendre la variation dans les données: Notions de base
Comprendre et décrire une épidémie
Mesures de répartition de la population Claude Marois 2012.
Commentaires sur les biais écologiques et les échelles non emboîtées
La statistique Définitions et méthodes. La statistique est la branche des mathématiques qui collecte, classe, analyse et interprète des données afin den.
Structure discriminante (analyse discriminante)
« Geographical genetics » Epperson 2003
CARTOGRAPHIE STATISTIQUE
Interprétation automatique
Modélisation géométrique de base
Régression linéaire multiple : hypothèses & interprétation. Partie 2.
Régression linéaire multiple : hypothèses & interprétation
Géométrie épipolaire (deux vues)
Statistique Descriptive Analyse des données
Formation SIG-Santé Géoréférencement Marc SOURIS Elisabeth HABERT
Analyses spatiales et transfert d’échelle
Rappels de statistiques descriptives
Biostatistiques Quand on souhaite étudier une (ou des) caractéristique(s) sur un ensemble d’individus ou d’objets, il est difficile, voir impossible, d’observer.
Epidémiologie Dr Lydia Guittet.
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
JEAN-MARC FONTAN SOC-1101 COURS 3
Modèles Mathématiques et représentation discrètes pour la description des images couleur Luc Brun.
Études écologiques.
SIG et Santé Théorie et pratique, avec le SIG SavGIS Contenu du cours
Olivier Leclair, Université Laval Un algorithme de fouille dans une représentation des données par objets: une application médicale SIMON, Arnaud.
Étude de l’écoulement moyen
OASIS: Un outil d’analyse de la ségrégation et des inégalités spatiales Mihai Tivadar, Yves Schaeffer, André Torre, Fréderic Bray IRSTEA, UR DTGR, Grenoble.
OASIS: Un outil d’analyse de la ségrégation et des inégalités spatiales Mihai Tivadar, Yves Schaeffer, André Torre, Fréderic Bray IRSTEA, UR DTGR, Grenoble.
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
systèmes d’information géographique
Analyse de données Cours 3 Analyse en composantes principales (ACP)
Analyse des semis de point
Modélisation du signal de télédétection
ECHANTILLONAGE ET ESTIMATION
Comparaison de plusieurs moyennes observées
Mesures de description des valeurs des variables
Reconnaissance d’objets 3D –point de vue complètement différent –pas d’invariant 3D Difficultés :
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
Hadrien Commenges Université Paris 7, Géographie-cités Hélène Mathian CNRS – Géographie-cités Claude Grasland Université Paris 7, Géographie-cités Introduction.
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
De la Terre à la carte: Projections et Géoréférencement
Jean Gaudart1 Détection de clusters spatiaux d'évènements Jean Gaudart Labo. Biostatistiques Faculté de Médecine de Marseille.
Processus ponctuels Caractéristiques et Modèles de répartitions spatiales.
Transcription de la présentation:

Module SIG-Santé 12. SIG et analyse spatiale Outils et méthodes pour l’analyse spatiale Marc SOURIS Paris Ouest Nanterre-La Défense Institut de Recherche pour le Développement Master de Géographie de la Santé, 2011-2012

Outils et méthodes pour l’analyse spatiale Gestion de données localisées Gestion de la localisation (datum, projection) Requêtes basées sur des critères descriptifs Requêtes basées sur des critères spatiaux (distance, voisinage, adjacence, inclusion, intersection…) Zones tampons (buffer) définies à partir de distances ou de valeurs Algèbre de buffer pour sélectionner une zone spécifique Jointures spatiales entre objets

Outils et méthodes pour l’analyse spatiale Gestion et traitement de l’imagerie satellitaire Met à disposition des données exhaustive sur l’environnement Gère les espaces, datum, projections Simplifie la gestion du traitement d’image (NDVI, texture, etc) Changement de type d’objet (création d’isovaleurs, de squelette)

Outils et méthodes pour l’analyse spatiale Cartographie Ajustement bayésien pour la cartographie des ratios Interpolation spatiale de données ponctuelles et représentation continue

Outils et méthodes pour l’analyse spatiale Opérations de transfert d’échelle Géoagrégation (par distance, fixe ou variable, ou par intersection) Géoappartenance Analyse du système d’échelles (variances inter, intra, indices de dispersion) Création d’un carroyage régulier pour la géoagrégation Regroupement et classification

Outils et méthodes pour l’analyse spatiale Exemples d’agrégations spatiale

Outils et méthodes pour l’analyse spatiale Les opérations de transfert d’échelle permettent de mettre en relation de façon raisonnée des informations localisées qui ont des descriptions ou des précisions différentes. En réunissant des objets spatialisées dans un même ensemble, les SIG permettent de mettre en œuvre assez facilement ces opérations. En particulier, les SIG assurent la compatibilité des mesures de la localisation (même datum, même projection). Ils permettent également d’effectuer des tests d’adéquation de l’échelle du transfert par rapport à la distribution initiale des objets étudiés, et de vérifier en particulier la variance des valeurs après le transfert. Les opérations de transfert d’échelle doivent être manipulées avec prudence car elles présentent des inconvénients et dangers : Non représentativité de valeurs agrégées Moyennes et lissages de données initiales Perte des événements rares Echelles traitant d’objets qui ne sont plus directement en rapport avec le phénomène biologique étudié, mais avec des populations agrégées Echelles permettant de dégager des tendances mais pas de suivre un phénomène biologique Erreur écologique

Outils et méthodes pour l’analyse spatiale Géo-agrégations Emetteur de type zone L’opération d’agrégation peut poser des problèmes de validité lorsque les objets sont des zones. Elle pose peu de problèmes en cas de hiérarchie des découpages (c’est souvent le cas pour les découpages administratifs, mais pas toujours), ou que le découpage qui reçoit est lié aux discontinuités du phénomène étudié. Lorsque ces conditions ne sont pas remplies, il faut appliquer une méthode pour « ventiler » les valeurs (en général en fonction de la surface, en faisant une hypothèse d’homogénéité). Variabilité inter et intra L’opération d’agrégation utilise souvent la moyenne de valeurs numériques : il est fondamental de connaître la variabilité « horizontale » du résultat.

Outils et méthodes pour l’analyse spatiale Géo-agrégations et densité Le calcul d’une densité à partir d’un semis de points impose un changement d’échelle par agrégation dans une surface. L’utilisation d’un carroyage régulier permet de s’affranchir des biais liés à l’utilisation d’un découpage administratif pour le calcul de densité. Mais plus la distribution des points est concentrée, plus l’influence de la taille de la maille est importante.

Outils et méthodes pour l’analyse spatiale Géo-agrégations et images satellites L’opération de ré-échantillonnage d’une image (changement de résolution) correspond à un changement d’échelle, avec une opération d’agrégation qui utilise les voisins immédiats : Pixel le plus proche Interpolation bilinéaire Interpolation bicubique

Outils et méthodes pour l’analyse spatiale Regroupements et classifications Les regroupements définissent de nouveaux objets par regroupement des objets d’une collection, en général sur les critères de contigüité et/ou de ressemblance. De nombreux regroupements sont possibles. On cherche en général à regrouper les objets en maximisant un critère basé sur la comparaison des variances intragroupes et intergroupes (maximisation d’indices tels que Goodness Fit of Variance, Tabular Accuracy Index). On peut y ajouter une contrainte de contiguïté. Indices de comparaison de variances inter- et intra-classes Tabulated Accuracy Index Goodness Fit of Variance Ces deux indices calculent le rapport entre la somme des distances des individus à la moyenne de leur classe, et la somme des distances des individus à la moyenne générale (médian, moyen).

Outils et méthodes pour l’analyse spatiale Appartenance L’opération d’appartenance est l’inverse de l’opération d’agrégation. Elle permet d’affecter à un objet la valeur d’un objet auquel il appartient. Elle peut être ambiguë en cas de non- hiérarchie des objets (zones ou lignes). L’opération est très utile pour résoudre les jointures spatiales via la localisation, ainsi que pour éviter l’erreur atomiste (interpréter le comportement d’individus indépendamment de contextes spatiaux homogènes auxquels ils appartiennent). L’opération d’appartenance permet de résoudre géométriquement les relations spatiales, d’affecter à un objet les caractéristiques de son contexte, en vue d’une analyse contextuelle ou multi-niveau. L’analyse des niveaux d’agrégation (inertie interclasse) ou du passage d’une échelle à une autre (inertie intraclasse) est rendue facile par l’opération d’appartenance.

Outils et méthodes pour l’analyse spatiale Interpolations L’interpolation permet d’estimer une valeur en tout point de l’espace à partir des valeurs d’autres objets, souvent ponctuels. Plusieurs types de calculs sont possibles : Calcul déterministe (voisins de Voronoï, fenêtre mobile, ajustement polynômial, directionnel…) Calcul probabiliste par étude de la variabilité globale et locale (krigeage)

Outils et méthodes pour l’analyse spatiale Calcul de relations métriques et topologiques Tessélation de Voronoï (polygones de Thiessen) Triangulation (Delaunay) Voisinages et adjacences Calcul de matrices de distances entre objets Recherche opérationnelle (plus courts chemins, optimisation) Analyse de réseau

Outils et méthodes pour l’analyse spatiale Calcul géostatistiques et simulations MC Recherche d’autocorrélation spatiale : variogrammes, indices (Moran, Geary…), indices locaux (Moran, Getis…) Indices de dispersion d’un semis de points, distribution par rapport à une distribution aléatoire : Courbes de concentration Indice de Theil Moyenne de la distance minimum entre deux points, et comparaison par rapport à une distribution aléatoire d’un sous-ensemble dans un ensemble dans le temps et dans l’espace Méthodes de recherche d’agrégats spatiaux (scan stat, indice)

Outils et méthodes pour l’analyse spatiale Analyse spatio-temporelles Recherche de cas index par filtre spatio-temporel Méthodes de recherche d’agrégats spatio-temporels (scan limités dans le temps) Reconstruction de parcours par chainage arrière Modélisation avec calculs de relations spatiales et spatio-temporelle

Outils et méthodes pour l’analyse spatiale Changement de type d’objets Généralisations (centres moyens, médians, lissage) Un transfert d’échelle s’accompagne en général d’une abstraction sémantique et d’un changement d’échelle de description. Lorsque la géométrie des nouveaux objets provient d’un niveau plus précis, il est parfois utile de procéder à une généralisation pour mettre la géométrie des objets en accord avec leur contenu sémantique. squelettisation, vectorisation, courbes d’isovaleurs Des schématisations géométriques plus complexes que la généralisation de contours sont également disponibles. Elles font appel à la morphologie mathématique et effectuent en général un changement de type d’implantation spatiale. rasterisation, ré-échantillonage création de réseaux à partir de points

SavGIS pour l’analyse spatiale en épidémiologie

SavGIS pour l’épidémiologie Statistique Calculs classiques (moments, histogrammes, ajustement visuel de distributions) Calcul de la variabilité d’un échantillon (calcul théorique et par simulation MC)

SavGIS pour l’épidémiologie Statistique pour l’épidémiologie Calcul de mesures d’association avec un facteur d’exposition, pour la recherche étiologique : odd-ratio, risque relatif, fraction de risque attribuable. Prise ne compte d’un facteur de confusion, calcul des valeurs ajustées, test de significativité (test de Mantel-Haenszel)

SavGIS pour l’épidémiologie Statistique pour l’épidémiologie Tests de comparaison de la moyenne de deux sous-ensembles (échantillons ou cas-témoins). Tests paramétriques (Z test, T test) et tests non paramétriques de rang (Mann-Whitney, Kolmogorov).

SavGIS pour l’épidémiologie Statistique pour l’épidémiologie Test d’évaluation d’un facteur d’exposition, qualitatif ou quantitatif, par rapport à une variable ‘maladie’ qualitative (cas-témoins). Tests paramétriques et non-paramétriques (par simulation MC) Analyse spatiale Calculs de position moyenne (centre moyen, médian, euclidien) Calcul de dispersion (standard deviation distance, standard deviational ellipse)

SavGIS pour l’épidémiologie Analyse spatiale (valeur qualitative ou booléenne) Distribution globale d’un ensemble de points Analyse de la distribution spatiale d’un ensemble de points – agrégée, dispersée, aléatoire (distance moyenne entre plus proches voisins, analyse par quadrant) Analyse de la distribution centrique d’un ensemble autour d’un point (centralité) Distribution relative d’un sous-ensemble dans un ensemble de points Analyse du caractère non-aléatoire de la position et de l’étendue d’un sous-ensemble dans un ensemble, par simulation MC Analyse de la distribution spatiale d’un sous-ensemble de points – agrégée, dispersée, aléatoire - dans un ensemble, par simulation MC Localisation des agrégats Analyse de l’attraction/répulsion d’un sous-ensemble dans un ensemble, par simulation MC

SavGIS pour l’épidémiologie Analyse spatiale (valeur numérique) Tests d’autocorrélation spatiale : indices globaux (Mantel, Knox, BB joint, BW joint, Moran, Geary), semi-variogrammes Indice de KNOX généralisé (tableau de tendance, en fonction de la distance et de la différence de valeur) Nuage distance-différence de valeurs Tests locaux d’association spatiale (LISA) : Moran, Geary, Getis-Ord

SavGIS pour l’épidémiologie Analyse spatiale : comparaison de deux sous-ensembles Distribution spatiale relative de deux sous-ensembles : colocalisation Analyse des relations spatiales entre deux sous-ensembles de points dans un ensemble (position, relations de voisinage, distances) Agrégats de colocalisation

SavGIS pour l’épidémiologie Calculs numériques Ajustement des taux pour tenir compte de la variabilité aléatoire due aux différences d’effectifs (EBE) Analyse des séries temporelles (moyennes mobiles, etc.) Régressions multivarées (linéaire, logistique, Cox) Calculs spatiaux-temporels Détermination de cas index (émergence, origine) Reconstruction de parcours de diffusion, analyse des parcours, moyennes spatiales mobiles Agrégats spatiaux-temporels

SavGIS pour l’épidémiologie Sondages. Choix d’échantillon spatiaux, avec stratification mailles et centroïdes création aléatoire tirage aléatoire sur une base spatiale Paramètres pour le design d’un sondage (tailles d’échantillon) Tirage aléatoire stratifié Correction pour autocorrélation

Fin M. Souris, 2011