Variations spatiales et spatio-temporelles de l’incidence des LA de l’enfant en France – 1990-2003 Stéphanie BELLEC – Jacqueline CLAVEL Inserm U754 Journées du GDR « statistique et santé » 26-27 novembre 2007 Hôpital Cochin – Paris 14
Les cancers de l’enfant En France : 1 enfant sur 500 est atteint avant l’âge de 15 ans 1500 nouveaux cas par an (la moitié avant 6 ans) 2ème cause de mortalité infantile Source : Registre National des Tumeurs Solides de l’Enfant Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Enregistrement des cancers de l’enfant Deux registres à l’échelle nationale Le Registre National des Hémopathies malignes de l’Enfant (RNHE) http://www.u754.idf.inserm.fr/ Créé en 1995 (U170/U754) Enregistrement des cas diagnostiqués depuis 1990 chez des enfants âgés de moins de 15 ans et résidant en France métropolitaine au moment du diagnostic Le Registre National des Tumeurs Solides de l’Enfant (RNTSE) http://www.chu-nancy.fr/rntse/ Créé en 2000 Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Les leucémies aiguës de l’enfant Environ 40 cas par million d’enfants et par an 80% des leucémies aiguës sont des leucémies aiguës lymphoblastiques (LAL), dont une majorité de LAL communes de la lignée B (LALBc) <20% de leucémies aiguës myéloblastiques (LAM) Les LAL présentent un pic d’incidence autour de 2 ans Les LAM ont une incidence plus élevée avant un an Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Facteurs de risque des LA Peu de facteurs de risque établis Rayonnements ionisants à forte dose Certains traitements anti-cancéreux Certains syndromes génétiques Nombreuses pistes Expositions environnementales in utero ou dans la petite enfance (CEM-EBF, pesticides, tabagisme passif, consommation maternelle de tabac et d’alcool pendant la grossesse, agents infectieux ...) Facteurs génétiques prédisposants Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Le problème particulier des clusters Premiers signalements au début du 20ème siècle Cas de leucémies signalés au sein d’une population restreinte sur une période de temps assez courte → Hypothèse : présence d’un agent infectieux ? → Aucune information sur la population à risque 1960 : premier rapport statistique : tendance des LA à apparaître sous formes de petits groupes Depuis, de nombreuses études sur l’hétérogénéité spatiale et spatio-temporelle ont été réalisées → Légère tendance à l’agrégation spatio-temporelle Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Objectif de l’étude Étude des variations spatiales et spatio-temporelles des LA de l’enfant en France, sur la période 1990-2003 Deux approches : «clustering » : recherche d’une hétérogénéité globale Hétérogénéité spatiale globale (tests de Potthoff-Whittinghill et de Rogerson) Interaction spatio-temporelle (test de Knox) « détection de cluster » : localisation d’une zone/période à plus fort risque de LA Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Données 6281 cas de leucémies aiguës (LA) sur la période 1990-2003 Les cas sont rattachés à leur commune de résidence au moment du diagnostic Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Méthodes – Notations Oi le nombre de cas observés dans la commune i (O le nombre total de cas observés) Ei le nombre de cas attendus, dans la commune i, sous l’hypothèse de non hétérogénéité spatiale de l’incidence des LA (E le nombre total de cas attendus) m le nombre d’unités géographiques considérées (36344 communes ou 3644 cantons) Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Méthodes – Hétérogénéité globale (1) Hétérogénéité spatiale globale Test de surdispersion (Potthoff-Whittinghill) Hypothèse: Oi suit une loi binomiale négative V(Oi)/E(Oi) = 1+β Test d’hétérogénéité spatiale globale (Rogerson) Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Méthodes – Hétérogénéité globale (2) Interaction spatio-temporelle (test de Knox) Sous H0 (absence d’interaction), la survenue des cas dans l’espace est indépendante de leur survenue dans le temps Statistique de test basée sur les nombres, observés et attendus, de paires de cas proches dans l’espace et dans le temps : nombre total observé de paires de cas proches dans l’espace : nombre total observé de paires proches dans le temps. Paramètres de proximité : espace (communes de résidence au diag) : 0, 5, 10, 15, 20, 30, 50 km temps (dates de diag) : 1, 3, 6, 9, 12 mois Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Méthodes – Détection de clusters (1) Test de Kulldorff Le territoire est parcouru par une fenêtre mobile circulaire, pour la détection de clusters spatiaux, ou cylindrique, pour la détection de clusters spatio-temporels. Fenêtre centrée sur une commune, de taille variable Tailles limites (dans l’espace et le temps) fixées arbitrairement (espace :10% de la population, temps : 50%) x y t y x Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Méthodes – Détection de clusters (2) A chaque fenêtre est associée une zone z composée des communes dont les centres sont inclus dans la fenêtre Pour chaque zone, rapport de vraisemblance sous l’hypothèse d’une distribution poissonnienne des cas, avec un risque p à l’intérieur de la zone, q à l’extérieur Localisation de la zone de cluster la plus probable définie par: oz et ez les nombres de cas observés et attendus dans la zone z Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Simulations de Monte Carlo (1) P-values déterminées par simulations sous H0 A chaque simulation, répartition du nombre total de cas LA dans les communes à l’aide d’une distribution multinomiale de paramètres Ei/E (Tests de Potthoff-Whittinghill, Rogerson, Kulldorff version spatiale) OU A chaque simulation, permutations des dates de diagnostic (conservation des structures spatiale et temporelle observées) (Tests de Knox, Kulldorff version spatio-temporelle) Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Simulations de Monte Carlo (2) Pour chaque jeu de données simulé, calcul de la statistique de test Sk Sobs : valeur de la statistique calculée sur les données observées K : Nombre de simulations réalisées 1{..} : fonction indicatrice Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Etapes d’analyses Analyse sur l’ensemble des données (LA, 0-14 ans, 1990-2003) Analyse par diagnostic (LAL, LALBc, LAM) Analyse par groupe d’âges (0-4 ans, 5-9 ans, 10-14 ans, 1-6 ans) Analyses sur 3 sous-périodes (1990-1994, 1995-1999, 2000-2003) Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Résultats – Hétérogénéité globale (1) Test de Potthoff-Whittinghill sur 1990-2003 Période LA LAL LALBc LAM âge au diagnostic O β (p-value) 0-14 ans 6 281 0,3% (0,33) 5 122 0,4% (0,29) 4 092 (0,26) 1 069 -0,8% (0,92) 0-4 ans 3 137 -0,1% (0,52) 2 599 0,0% (0,43) 2 325 (0,24) 5-9 ans 1 842 0,9% (0,91) 1 558 1 114 -0,5% (0,74) 10-14 ans 1 300 (0,11) 963 1,5% (0,03) 652 (0,95) 1-6 ans 3 725 0,1% 3 234 (0,42) 2 780 Quel que soit le diagnostic, quel que soit l’âge, aucune surdispersion mise en évidence sur la période 1990-2003 Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Résultats – Hétérogénéité globale (2) Test de Potthoff-Whittinghill par périodes (LA) Période 1990-2003 1990-1994 1995-1999 2000-2003 âge au diagnostic O β (p-value) 0-14 ans 6 281 0,3% (0,33) 2 234 1,3% (0,05) 2 227 0,7% (0,14) 1 820 -0,8% (0,88) 0-4 ans 3 137 -0,1% (0,52) 1 138 0,5% (0,21) 1 108 -0,5% (0,79) 891 -0,4% (0,66) 5-9 ans 1 842 -0,9% (0,91) 668 -0,3% (0,55) 660 0,1% (0,29) 514 (0,57) 10-14 ans 1 300 0,9% (0,11) 427 (0,50) 459 414 (0,44) 1-6 ans 3 725 (0,43) 1 368 (0,20) 1 309 (0,71) 1 048 (0,75) Légère surdispersion sur la période 1990-1994, pour les 0-14 ans uniquement (retrouvée pour les LAL et LALBc) Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Résultats – Hétérogénéité globale (3) Tests de Rogerson sur la période 1990-2003 Période LA LAL LALBc LAM âge au diagnostic O R (p-value) R (p-value) 0-14 ans 6 254 0,62 (0,26) 5 100 0,75 (0,30) 4 073 0,97 1 064 3,02 (0,77) 0-4 ans 3 123 1,25 2 587 1,46 (0,37) 2 314 1,62 (0,39) 5-9 ans 1 834 2,07 (0,35) 1 552 2,39 (0,40) 1 109 3,77 (0,14) 10-14 ans 1 297 2,80 (0,46) 961 3,53 (0,63) 650 5,66 1-6 ans 3 710 0,91 (0,64) 3 220 1,10 (0,50) 2 767 1,23 (0,59) Quel que soit le diagnostic, quel que soit l’âge, aucune hétérogénéité spatiale mise en évidence globalement sur la période 1990-2003 Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Résultats – Hétérogénéité globale (4) Tests de Rogerson par périodes Période 1990-2003 1990-1994 1995-1999 2000-2003 âge au diagnostic O R P-value p-value 0-14 ans 6 254 0,62 (0,26) 2 224 1,83 (0,18) 2 216 1,42 (0,78) 1 814 2,54 (0,05) 0-4 ans 3 123 1,25 1 134 4,38 (0,02) 1 102 3,09 (0,61) 887 3,58 (0,28) 5-9 ans 1 834 2,07 (0,35) 664 4,73 (0,79) 657 6,55 (0,11) 513 7,77 (0,23) 10-14 ans 1 297 2,80 (0,46) 426 9,24 457 6,38 (0,89) 414 8,82 (0,44) 1-6 ans 3 710 0,91 (0,64) 1 362 3,33 1 304 2,16 (0,92) 1 044 3,39 (0,49) Hétérogénéité spatiale sur la période 1990-1994, pour les plus jeunes enfants (retrouvée pour les LAL et LALBc) et sur 2000-2003 pour les 0-14 ans uniquement (et LAL) Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Résultats – Interaction spatio-temporelle Test de Knox 0-14 ans : aucune interaction mise en évidence 0-4 ans : 3 mois – 15 et 30 km (+ LAL et LALBC et retrouvée sur 1995-99) 5-9 ans : uniquement pour les LALBc (et sur 2000-2003) 10-14 ans : 9 et 12 mois – 0 et 5 km (+ LAL et retrouvée sur 1990-94) LAM 0-14 ans : interaction significative (1 à 12 mois – 15 et 20 km) Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Résultats – Détection de clusters (1) Test de Kulldorff 1990-2003 1995-1999 LA 0-14 0-4 5-9 10-14 Analyses spatiales NS 1 60 30 1 442 8 554 2 OS 5 14 5 76 35 ES 0,35 3,37 0,24 <0,01 39,2 0,02 13,2 0,01 PS 0,96 0,67 0,34 0,02 1,00 0,04 0,80 Analyses spatio-temp. NST 833 1344 886 T 1996-99 1998 1993 OST 65 9 50 EST 31,7 1,54 25,9 0,41 PST 0,78 0,71 0,40 0,57 LAM 142 1077 87 24 3994 3462 504 20 12 3 4 2,45 6,77 0,11 24,85 8,75 1,76 0,07 0,51 0,70 0,96 0,92 0,20 0,69 0,59 Nst 4302 645 913 2712 1994-97 1992 1996-98 1995 44 11 19,18 0,58 2,21 0,43 0,83 0,81 0,16 - Deux clusters de LA sur 1995-99, 0-14 ans et 5-9 ans - Aucun cluster de LAL significatif Un cluster de LAM, 5-9 ans sur 1996-1998 → clusters « emboîtés » → cluster de LAM 5-9 ans sur 96-98 (11 cas, 2,21 attendus) Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Résultats – Détection de clusters (2) Représentation du cluster de cas de LAM observé sur la période 1996-1998 Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Synthèse des résultats Très légère hétérogénéité des LA sur la période 1990- 1994 (LALBc, plus jeunes enfants) Interaction spatio-temporelle des LAL 0-4 ans, 5-9 ans et 10-14 ans, ainsi que pour les cas de LAM. Mais résultats instables selon les périodes Cluster de cas de LA de 5-9 ans sur la période 1995- 1999 (pas d’hypothèse actuellement) Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Critiques Méthodes soumises à des limites importantes PW : contribution des communes ayant au moins deux cas Knox : Forte influence de l’évolution de la population au cours du temps. Test adapté à une application à l’échelle individuelle Multiplicité des tests 4 familles de diagnostic, 5 groupe d’âges, 4 périodes Paramètres de proximités définis arbitrairement → Augmentation du risque de faux-positifs Journées du GDR « Statistiques et santé » - 26-27 novembre 2007
Conclusion Concordance avec la littérature concernant l’existence d’une hétérogénéité spatiale des LA (en particulier LALBc) MAIS de très faible amplitude Résultats à approfondir Données plus précises (adresses des cas) Echelle géographique différente ? Autres méthodes ? Journées du GDR « Statistiques et santé » - 26-27 novembre 2007