Point méthodologie: méthode capture-recapture Biblio 27/02/06
Origine de la méthode Zoologie : estimation de la taille de populations animales Exemple = « capture » de poissons Dans un second temps : applications à la démographie : nombre d’habitants dans une ville l’épidémiologie : taux d’incidence d’une maladie
Principe utilisé Tirer un échantillon aléatoire d’une espèce animale « Marquer » les animaux tirés au sort puis les relâcher Tirer un second échantillon et compter le nombre d’animaux marqués Estimer la population totale en appliquant une règle de trois
Soit N poissons dans un lac
Capture (E1) et marquage
Remise de l’échantillon E1
Retirage d’un échantillon E2 Estimation du nombre de poissons N
Objectifs en épidémiologie Exhaustivité et qualité des systèmes de surveillance Estimer le nombre de cas non répertoriés par la surveillance le nombre total de cas d’une maladie
Méthodes Croisement/ comparaison de plusieurs sources Modèle à 2 sources Modèle à plus de 2 sources
Conditions d’application Indépendance des sources : probabilité d’être identifié par une source indépendante de la probabilité d’être identifié par la 2ème source Homogénéité de capture : même probabilité pour tous les cas d’être identifié par une même source
2 sources de données : S1 et S2 S2 (LABM) N1 C = doublons N2 S1 (DO) Cas non identifiés = X
+ - + - X ??? N ??? Modèle à 2 sources : Tableau 2 x 2 S1 : DO S2 : LABM C= 161 N2=236 S=397 + - N1=171 X ??? N ??? R=332
Modèle à 2 sources Estimation de X et de N : X= N1*N2/C N= N observés +X N= N1+N2+C+X N= 161+236+171+250 N= 818 N= [(R+1) (S+1)/ C+] –1 Var N IC 95% de N
Modèle à 2 sources Exhaustivité de S1 et S2 ES1= R/N = 332/ 818 = 40,6 % ES2= S/N = 397/ 818 = 48,5 % Exhaustivité commune au deux systèmes : E = (332+397)-161 /818=69%
Modèle à 2 sources : indépendance des sources - + S2 OR= ad/ bc + a b c d - OR= 1 : indépendance des 2 sources OR > 1 : dépendance positive sous-estimation de N OR < 1 : dépendance négative sur-estimation de N OR= 1 : indépendance des 2 sources OR > 1 : dépendance positive sous-estimation de N OR < 1 : dépendance négative sur-estimation de N
Modèle à 2 sources : homogénéité de capture Stratification (classe d’âge, sexe, CSP…) Calcul de l’exhaustivité de S1 et S2 dans chaque strate Corrélation r
Modèle à plus de 2 sources
X=354*329/373=312 N=329+373+354+312=1368 E[CNR]=727/1368=53% E[DO]=702/ 1368=51%