Jean Gaudart1 Détection de clusters spatiaux d'évènements Jean Gaudart Labo. Biostatistiques Faculté de Médecine de Marseille
Jean Gaudart 2 Plan Introduction Types Hypothèses Moran Global Local (LISA) Tango Méthodes de balayage: Satscan Arbres de régression Application
Jean Gaudart 3 I. Introduction Nombreuses méthodes selon : Types de données Types de problématiques Types d'hypothèses 3 grandes classes de méthodes [Kulldorf1997] : Agrégats autour d'une source Détection globale Détection locale Distances entre points Méthodes plus générales 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart 4 Détection globale Le pattern observé globalement est-il concordant avec l'hypothèse nulle ? corrélations comparaisons de distributions Détection locale Y a-t-il localement un excès de cas ? corrélations (voisinage) comparaisons de groupes de proximités 1 test k tests Moran Tango LISA Satscan SpODT 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart 5 3 questions : Les distributions des cas de chaque zone sont- elles indépendantes? Quelles sont ces distributions ? Le risque est-il constant ? 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart 6 Hypothèse nulle Distribution des cas Uniforme sur le plan Complete Spatial Randomness Distribution de Poisson hétérogène = Constant Risk Hypothesis 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application Effectif région i
Jean Gaudart 7 Coefficient de corrélation Pondéré par les distances Similarités entre régions: écart à la moyenne de la région i écart à la moyenne de la région j II. Moran a) Global 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart 8 Test: H0: I=0; malades spatialement indépendants H1: I≠0 Sous H0: > N (0;1) Condition : distribution des Y normale insoutenable unité statistique: région, avec k petit Loi de I inconnue => Monte-Carlo ou Bootstrap 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart 9 Interprétation I >0: régions voisines: mêmes écarts à la moyenne = pattern sous forme de clusters I <0: régions voisines: écarts à la moyenne, = pattern régulier. I =0: aucune corrélation spatiale. Mesure de l'écart à la moyenne générale: pas d'interprétation locale possible. 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart 10 II. Moran b) Local [Anselin1995] LISA: Local Indicator of Spatial Autocorrelation A proximité d'un cas observé, les cas sont-ils regroupés ? Pour chaque région 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart 11 Pour chaque région H0: I i =0 indépendance des régions/ voisins H1: I i ≠0 Sous H0 et condition N : > N (0;1) Condition insoutenable: =>Loi de I i inconnue => Monte-Carlo ou Bootstrap Tests multiples et corrélés => correction de Bonferroni 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart 12 Interprétation I i >0: régions voisines similaires à région i = cluster local I i <0: régions voisines: à région i, = région i particulière. I i =0: aucune corrélation spatiale entre la région i et ses voisins. 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart 13 III. Tango Test Global Généralisation spatiale du 2 avec 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart 14 H0: pas d'écart entre observé et théorique H1: il y a des zones différentes Sous H0, T > N Mais k petit et convergence lente Approximation: sous H0 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart 15 H0: pas d'écart entre observé et théorique H1: il y a des zones différentes Approximation: sous H0 f (T) > 2 Test de comparaison de distributions + autocorrélations spatiales 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart 16 Poids des distances Distances entre localisations (ou centres des régions) Différents poids = différents résultats !! 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart 17 IV. Satscan [Kulldorf1997] Principe: Fenêtre circulaire, Rayon variable, centre variable (point ou centre) Balaye le plan => clusters potentiels => statistique avec 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application n/2
Jean Gaudart 19 Loi de T k inconnue => Monte-Carlo Interprétation: cluster: excès de cas dans la fenêtre risque relatif ou rapport d'incidence 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart 20 V. SpODT Découpage du plan optimale en classes CART: Classification And Regression Trees ODT: Oblique Decision trees principe Discrétiser les coordonnées géographiques pour maximiser la variance interclasses => arbre hiérarchique binaire 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart 21 N=29 N=10 N=19 N=2N=8N=13N=6 N=7 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart 22 Statistique: R 2 pourcentage de variance expliquée => Inférence de Monte-Carlo 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart 23 Interprétation: Classes de risques homogènes Détermination de clusters potentiels mais Test global Pas de pré-spécification du fenêtrage Données qualitatives ou quantitatives 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart 24 VI. Application Données Hyperendémie Palustre Août 1999 1339 enfants, 159 concessions Parasitémie P. falciparum 511 positifs (38,16%, CI95% [35,56-40,76]) GPS 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart 26 Logiciels R2.2.0: package Dcluster Satscan: SpODT: 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application
Jean Gaudart 29 L. Waller, C. Gotway Applied Spatial Statistics for Public Health Data Eds Wiley 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application