03-02-2006Jean Gaudart1 Détection de clusters spatiaux d'évènements Jean Gaudart Labo. Biostatistiques Faculté de Médecine de Marseille.

Slides:



Advertisements
Présentations similaires
Comparaison d’une moyenne observée à une moyenne théorique
Advertisements

Corrélation Position du problème Définition covariance (X,Y) r =
STATISTIQUE INFERENTIELLE L ’ESTIMATION
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Inférence statistique
C1 Bio-statistiques F. KOHLER
Comparaison de deux moyennes observées
Inférence statistique
Comparaison d'une distribution observée à une distribution théorique
Tests non paramétriques
Comparaison de plusieurs moyennes Analyse de variance
Les Tests dhypothèses. 1)Définition Un test cest une méthode qui permet de prendre une décision à partir des résultats dun échantillon.
Les tests d’hypothèses
Régression -corrélation
Statistiques et Probabilités au lycée
Concepts avancés en mathématiques et informatique appliquées
Méthodes de Biostatistique

La Régression Multiple
Régression linéaire simple
Groupe 1: Classes de même intervalle
Présenté par Mathieu Almeida, Amine Ghozlane
Commentaires sur les biais écologiques et les échelles non emboîtées
La corrélation et la régression multiple
Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte.
Le test t.
Les modèles linéaires (Generalized Linear Models, GLM)
Corrélation Principe fondamental d’une analyse de corrélation
Le comportement des coûts Chapitre 3
Théorie… Inférence statistique: étude du comportement d’une population ou d’un caractère X des membres d’une population à partir d’un échantillon aléatoire.
« Geographical genetics » Epperson 2003
La régression multiple
ORGANIGRAMME-MÉTHODES STATISTIQUES-COMPARAISONS DE MOYENNES
Jean Dubé CRDT, Université du Québec à Rimouski Mars 2012
Méthodes de Biostatistique
Méthodes de Biostatistique
Statistique Descriptive Analyse des données
ANALYSE DE DONNEES TESTS D’ASSOCIATION
Equations d’estimation généralisées: GEE
La thermodynamique statistique
Déterminisme génétique des caractères quantitatifs :
Emmanuel Barankanira, Nicolas Molinari, Théodore Niyongabo,
ANOVA à 1 facteur en groupes de mesure indépendants
Sériation et traitement de données archéologiques
Olivier Leclair, Université Laval Un algorithme de fouille dans une représentation des données par objets: une application médicale SIMON, Arnaud.
BIO 4518: Biostatistiques appliquées Le 25 octobre 2005 Laboratoire 6 Corrélation linéaire et régression linéaire simple.
Présenté par Mathieu Almeida, Amine Ghozlane
Statistiques analytiques sous STATA
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Tests d’ajustement à une distribution théorique
Méthode des moindres carrés (1)
Méthodes de Biostatistique Chapitre 9 Tests Nonparamétriques.
ATELIERS STATISTIQUES
Analyse des semis de point
Remise à niveau en statistique Eric Marcon – Module FTH 2006.
BIO 4518: Biostatistiques appliquées Le 8 novembre 2005 Laboratoire 8 Regressions multiples.
1 L2 STE. Test du χ2 d’adéquation/conformité: Il s'agit de juger de l'adéquation entre une série de données statistiques et une loi de probabilité définie.
Probabilités et statistique MQT-1102
ECHANTILLONAGE ET ESTIMATION
Comparaison de plusieurs moyennes observées
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Introduction aux statistiques Intervalles de confiance
Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.
J Gaudart 1, E Cloutman-Green 2, S Guillas 3, JC Hartley 2, N Klein 4. Variabilité spatiale de l’aérocontamination bactérienne au lit du patient (Londres,
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
De la Terre à la carte: Projections et Géoréférencement
Chap. III Statistiques inférentielles
Processus ponctuels Caractéristiques et Modèles de répartitions spatiales.
Transcription de la présentation:

Jean Gaudart1 Détection de clusters spatiaux d'évènements Jean Gaudart Labo. Biostatistiques Faculté de Médecine de Marseille

Jean Gaudart 2 Plan Introduction  Types  Hypothèses Moran  Global  Local (LISA) Tango Méthodes de balayage: Satscan Arbres de régression Application

Jean Gaudart 3 I. Introduction Nombreuses méthodes selon :  Types de données  Types de problématiques  Types d'hypothèses 3 grandes classes de méthodes [Kulldorf1997] :  Agrégats autour d'une source  Détection globale  Détection locale Distances entre points Méthodes plus générales 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart 4 Détection globale  Le pattern observé globalement est-il concordant avec l'hypothèse nulle ? corrélations comparaisons de distributions Détection locale  Y a-t-il localement un excès de cas ? corrélations (voisinage) comparaisons de groupes de proximités 1 test k tests Moran Tango LISA Satscan SpODT 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart 5 3 questions :  Les distributions des cas de chaque zone sont- elles indépendantes?  Quelles sont ces distributions ?  Le risque est-il constant ? 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart 6 Hypothèse nulle  Distribution des cas Uniforme sur le plan Complete Spatial Randomness  Distribution de Poisson hétérogène = Constant Risk Hypothesis 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application Effectif région i

Jean Gaudart 7 Coefficient de corrélation Pondéré par les distances Similarités entre régions: écart à la moyenne de la région i  écart à la moyenne de la région j II. Moran a) Global 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart 8 Test: H0: I=0; malades spatialement indépendants H1: I≠0  Sous H0:  > N (0;1)  Condition : distribution des Y normale insoutenable unité statistique: région, avec k petit  Loi de I inconnue => Monte-Carlo ou Bootstrap 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart 9 Interprétation  I >0: régions voisines: mêmes écarts à la moyenne = pattern sous forme de clusters  I <0: régions voisines:  écarts à la moyenne, = pattern régulier.  I =0: aucune corrélation spatiale. Mesure de l'écart à la moyenne générale: pas d'interprétation locale possible. 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart 10 II. Moran b) Local [Anselin1995] LISA: Local Indicator of Spatial Autocorrelation A proximité d'un cas observé, les cas sont-ils regroupés ? Pour chaque région 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart 11 Pour chaque région H0: I i =0 indépendance des régions/ voisins H1: I i ≠0  Sous H0 et condition N :  > N (0;1) Condition insoutenable: =>Loi de I i inconnue => Monte-Carlo ou Bootstrap  Tests multiples et corrélés => correction de Bonferroni 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart 12 Interprétation  I i >0: régions voisines similaires à région i = cluster local  I i <0: régions voisines:  à région i, = région i particulière.  I i =0: aucune corrélation spatiale entre la région i et ses voisins. 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart 13 III. Tango Test Global Généralisation spatiale du  2 avec 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart 14 H0: pas d'écart entre observé et théorique H1: il y a des zones différentes Sous H0, T  > N Mais k petit et convergence lente Approximation: sous H0 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart 15 H0: pas d'écart entre observé et théorique H1: il y a des zones différentes Approximation: sous H0 f (T)  >  2 Test de comparaison de distributions + autocorrélations spatiales 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart 16 Poids des distances Distances entre localisations (ou centres des régions) Différents poids = différents résultats !! 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart 17 IV. Satscan [Kulldorf1997] Principe:  Fenêtre circulaire,  Rayon variable, centre variable (point ou centre)  Balaye le plan  => clusters potentiels => statistique avec 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application n/2

Jean Gaudart 19 Loi de T k inconnue => Monte-Carlo Interprétation:  cluster: excès de cas dans la fenêtre  risque relatif ou rapport d'incidence 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart 20 V. SpODT Découpage du plan optimale en classes  CART: Classification And Regression Trees  ODT: Oblique Decision trees principe  Discrétiser les coordonnées géographiques pour maximiser la variance interclasses  => arbre hiérarchique binaire 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart 21 N=29 N=10 N=19 N=2N=8N=13N=6 N=7 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart 22 Statistique: R 2 pourcentage de variance expliquée => Inférence de Monte-Carlo 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart 23 Interprétation:  Classes de risques homogènes  Détermination de clusters potentiels mais Test global  Pas de pré-spécification du fenêtrage  Données qualitatives ou quantitatives 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart 24 VI. Application Données  Hyperendémie Palustre  Août 1999  1339 enfants, 159 concessions  Parasitémie P. falciparum  511 positifs (38,16%, CI95% [35,56-40,76])  GPS 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart 26 Logiciels  R2.2.0: package Dcluster  Satscan:  SpODT: 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application

Jean Gaudart 29 L. Waller, C. Gotway Applied Spatial Statistics for Public Health Data Eds Wiley 1. Introduction 2. Moran 3. Tango 4. Satscan 5. SpODT 6. Application