La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Commentaires sur les biais écologiques et les échelles non emboîtées L. Fortunato (1), C. Guihenneuc-Jouyaux (1)(2) D. Hémon (1) (1) : INSERM U754, Université.

Présentations similaires


Présentation au sujet: "Commentaires sur les biais écologiques et les échelles non emboîtées L. Fortunato (1), C. Guihenneuc-Jouyaux (1)(2) D. Hémon (1) (1) : INSERM U754, Université."— Transcription de la présentation:

1 Commentaires sur les biais écologiques et les échelles non emboîtées L. Fortunato (1), C. Guihenneuc-Jouyaux (1)(2) D. Hémon (1) (1) : INSERM U754, Université Paris Sud, IFR69, Villejuif (2) : CNRS UMR 8145, MAP5, UFR Biomédicale, Université Paris 5

2 2 Contexte : études écologiques (1) Etudes écologiques : données (IS et exposition) recueillies au niveau de groupe (unité géographique) et non au niveau individuel Avantages : Disponibilité des données (registres des maladies, recensements) Réduction des erreurs de mesures Forme naturelle des données : Radon, pollution de lair, qualité de leau Développement statistique

3 3 Contexte : études écologiques (2) Biais communs aux études écologiques et individuelles Choix du modèle Facteurs de confusion non mesurés (FC inter-unité) … Biais spécifiques aux études écologiques Biais de pure spécification Facteurs de confusion intra-unité géographique Problème des échelles non emboitées

4 4 Objectifs Modèle écologique de Poisson Partie 1 Prise en compte de la variabilité intra-unité des facteurs de risque dans les modèles écologiques Partie 2 Echelles géographiques non emboîtées

5 5 Partie 1 Prise en compte de la variabilité intra-unité des facteurs de risque dans les modèles écologiques

6 6 Introduction (1) Modèle classique : maladie rare modèle hiérarchique Dans chaque unité géographique i O i ~ P(R i E i ) Log(R i ) = Z i b + ε i - Z est la matrice des covariables résumés quantitatifs des FR : moyenne, médiane,… - ε est le vecteur des résidus, avec ou sans structure spatiale

7 7 Introduction (2) Si le but de létude est lestimation des liens individuels entre lindicateur de santé et les FR à partir de données agrégées Perte dinformation sur les expositions individuelles et sur leurs variabilités Estimations biaisées des effets individuels biais de pure spécification Problème largement discuté dans la littérature (Best, Richardson, Wakefield…) Prise en compte de la variabilité intra-unité géographique des FR dans la régression écologique Jamais de réelle quantification de la réduction du biais

8 8 Relations entre liens individuel et écologique Niveau individuel : modèle multiplicatif de risque g(x) = exp( + x) TI pr les individus exposés au même niveau x Niveau écologique : risque associé à lunité i R i = somme de tous les TI des individus de lunité i R i = E(g(X)) = g(x) H i (x) dx Si H i = N(µ i, i ²) distribution intra-unité du FR dans i

9 9 Estimation du lien individuel Vrai risque relatif Si on utilise le modèle classique : x i au lieu de µ i Fluctuations déchantillonnage 0 biais écologique Pas de biais écologique si : "petit" Variances intra-unité homogènes Variances intra-unité non corrélées aux moyennes du FR

10 10 Objectif général But : estimer un lien individuel entre l IS et le FR à partir de données écologiques Contexte : Modèle multiplicatif de risque au niveau individuel Plusieurs relevés du FR par unité Prendre en compte des fluctuations déchantillonnage Introduction de la distribution intra-unité du FR. Réduire le biais écologique Introduction de la variance intra-unité du FR. Etudier les conséquences de la mauvaise spécification de la distribution intra-unité du FR dans le modèle destimation Loi Gamma vs loi Normale

11 11 Modèles destimation Modèle classique Modèle complet (variabilité intra-unité) = modélisation Gaussienne de la variabilité extra-Poissonnienne

12 12 Simulations Domaine = lattice régulier 10×10 Différents nombres de mesures du FR par unité géographique : moyenne = 140, min = 26, max = 352 {µ i } = moyennes du FR (min = 3.09, max = 5.57) { i ²} = variances du FR (de 1 à 2.5), corrélées avec les moyennes Paramètre individuel : = 1 « forte » association individuelle entre le risque et lexposition

13 13 Analyse statistique Approche Bayésienne Distributions a priori peu informatives Algorithme MCMC ( WinBUGS ) Inférences statistiques basées sur itérations (contrôle de la convergence avec plusieurs critères)

14 14 Résultats : Distribution Gaussienne (100 réplications) β = 1, ρ µσ = 0.8

15 15 Sensibilité à lhypothèse de Normalité de la distribution intra-unité Sensibilité à lhypothèse de Normalité Etudier les conséquences de lutilisation de la loi Normale dans le modèle destimation alors que la distribution intra-unité sous- jacente ne lest pas. Etude dune distribution intra-unité Gamma

16 16 Résultats : Distribution Gamma (20 réplications) β = 1, ρ µσ = 0.8

17 17 Application : Incidence des leucémies de lenfant et exposition domestique au Radon Unité géographique : 94 départements (Corse exclue) Cas : incidence française des leucémies chez les enfants agés <15 ans de 1990 à 2001 (5306 cas) (Registre National des Hémopathies malignes de l'Enfant, J. Clavel, U754) Leucémies aiguës lymphoïdes (LAL) : 4327 cas Leucémies aiguës myéloïdes (LAM) : 907 cas Exposition : mesures du radon (IRSN) Transformation logarithmique des valeurs du radon car permet lapproximation Gaussienne

18 18 Moyennes a posteriori et IC 95% de

19 19 Partie 2 Echelles géographiques non emboîtées

20 20 Problématique Variables écologiques mesurées sur différentes échelles non emboîtées Transformation des données pour les mettre toutes à la même échelle (échelle plus grossière et commune) Perte importante dinformation Illustration : en France, 2 échelles administratives différentes Départements (94) Zones demploi (341) 62 ZE Dep Echelle commune : R é gion (21)

21 21 Un exemple … Bretagne (Région 53) : 18 zones demploi et 4 départements 4 zones demploi non emboîtées dans les départements

22 22 Notations Zone « Cible » Echelle géographique où lindicateur de santé (mortalité ou incidence) est mesuré Zone « Source » Echelle géographique où lexposition est mesurée

23 23 Méthodes Méthode M : relation entre les mesures latentes de lexposition sur les unités « cibles » et les mesures observées sur les unités « sources » X 3 p 3 X A + (1- p 3 ) X B p 3 = % de lunité A dans lunité 3 Méthode R : relation entre les risques relatifs sur les unités « cibles » et sur les unités « sources » R 3 p 3 R A + (1- p 3 ) R B avec R A = exp( + X A ² A ²) Hypothèses : modèle multiplicatif de risque distribution Gaussienne de lexposition sur A et B 1 AB p3p3

24 24 Exemple de la méthode classique (M) pour les données du Radon Données (moyennes et variances empiriques) disponibles sur les départements et les zones demploi. Pondération en fonction de la population (cartes similaires si pondération en fonction de la superficie) population du département j dans la ze i Poids = population dans la ze i

25 25

26 26

27 27 Modèles destimation Régression écologique de Poisson 1 er niveau : O i ~ P(E i R i ) 2 ème niveau p ij = aire de lintersection i et j / aire de i

28 28 Simulations Cas 1 Partition « cible » : lattice de 400 unités Partition « source » : lattice de 100 unités Cas 2 Partition « cible » : lattice de 100 unités Partition « source » : lattice de 400 unités Forte association entre lindicateur de santé et lexposition Proportion de recouvrement, nb dunités non emboitées

29 29 Résultats : cas 1 (10 réplications)

30 30 Résultats : cas 2 (10 réplications)

31 31 Résultats Pas de différence entre les 2 méthodes M et R (robustesse de la méthode classique) Différence entre les modèles avec ou sans variance intra- unité (attendue) Situation en cours détude

32 32 Application : Radon et toutes LA (1) (2) (1) : mêmes échelles géographiques pour les observés et lexposition (2) : échelles géographiques différentes et non emboitées pour les observés et lexposition

33 33 Application : Radon et LAM (1) (2)

34 34 MERCI

35 35

36 36 Méthodes dans la littérature Méthode la plus simple et la plus utilisée : reconstruction des données dexposition sur la partition « cible » à partir de la partition « source », proportionnellement à la population ou laire Méthode de Flowerdew et Green (1989) Régression de Poisson itérative (algorithme EM) pour estimer les caractéristiques des zones « cible » Méthode de Best et al (1998) Modèles Poisson/Gamma : les zones sont relativement petites Processus ponctuel Méthode de Mugglin et al (2000) 3 ème partition : Intersection des 2 partitions (« cible » et « source ») Lois sur les variables réponses latentes Pour les expositions : table de conversion


Télécharger ppt "Commentaires sur les biais écologiques et les échelles non emboîtées L. Fortunato (1), C. Guihenneuc-Jouyaux (1)(2) D. Hémon (1) (1) : INSERM U754, Université."

Présentations similaires


Annonces Google