Initiation aux enquêtes quantitatives Le BA-BA de l’épidémiologie et des statistiques
Les différents types d’enquête Cadre général : observationnel à différencier de l’interventionnel Enquêtes transversales avantage : une seule fois difficulté : représentativité Enquêtes longitudinales (prospectives) difficulté : attrition Cohortes Enquêtes cas témoins (rétrospectif) pas cher risque de biais
Enquêtes transversales Problème de la représentativité caractériser l’échantillon cible s’assurer la représentativité de l’échantillon biais supplémentaires si questionnaires biais de fréquentation Problème de la fiabilité des données rétrospectives Pas d’homogénéité de « la durée d’exposition » ( à une molécule, à un vécu….)
Description des données Données qualitatives en classes effectifs fréquences: n (%) éviter les questions ouvertes regrouper des classes faire le deuil de toutes les situations Données quantitatives distribution normale: moyenne et écart type autres distributions: médiane, IQR, rang
Tabac (n=2028) >20c/j 0 cig/j 1 à 20 cig/j Les fumeurs représentent 63% de l’échantillon
Analyse descriptive Données qualitatives en classes effectifs fréquences: n (%) éviter les questions ouvertes faire le deuil de toutes les situations Données quantitatives distribution normale: moyenne et écart type autres distributions: médiane, IQR, rang
Distribution normale
Distribution normale Écart-type moyenne
Distribution anormale Médiane : partage de 50% de la distribution IQR: limites de 3/4 de la distribution Rang: limites de la distribution entière
Les boites à moustache Nombre de symptômes déclarés
Analyse explicative But: rechercher les facteurs associés explicatifs d’une variable réponse 1ère question: quelle est la variable réponse? 2ème question: comment elle se distribue? 3ème question : quels facteurs explicatifs?
Analyse univariée L’objectif est de déterminer le rôle d’un facteur explicatif sur la variable réponse (ex: rôle du sexe ou de l’age sur l’observance au trt) On va comparer des proportions ou des distributions Variable explicative Obs Non-Obs Age moyen 40 36 % femmes 28 26
Tests statistiques La différence observée est elle due au hasard ou non? Test statistique exprimé par p : risque d’erreur associé au fait de dire qu ’il existe une différence si p <0.05 on décide que la différence observée est significative
Comparaison des personnes migrantes aux autres Autres Migrants Fumeurs 67% 38% Conso Alcool 46% 32% Conso produits 24% 9% Rapports homosexuels 51% 31% déjà répondu en 2002 15% 10% A eu une IST 30% 31% Fréquentation asso 1/s 41% 44% De même, les migrants fument moins souvent, boivent moins souvent… que les non migrants (on peut dire aussi : « il y a moins de fumeurs chez les migrants » ou encore « la proportion de fumeurs est moins importante chez les migrants que dans le reste de la population de l’enquête »). Par contre, il n’y a pas de différence concernant les antécédents d’IST ou la fréquentation régulière de l’association.
Comparaison des personnes migrantes aux autres Autres Migrants p Fumeurs 67% 38% 0.001 Conso Alcool 46% 32% 0.002 Conso produits 24% 9% <0.001 Rapports homos 51% 31% 0.001 déjà répondu 15% 10% 0.02 A eu une IST 30% 31% 0.51 Fréqu asso 1/s 41% 44% 0.26 De même, les migrants fument moins souvent, boivent moins souvent… que les non migrants (on peut dire aussi : « il y a moins de fumeurs chez les migrants » ou encore « la proportion de fumeurs est moins importante chez les migrants que dans le reste de la population de l’enquête »). Par contre, il n’y a pas de différence concernant les antécédents d’IST ou la fréquentation régulière de l’association.
Expression par un OR ou RR Exemple: risque de non-observance Variable explicative Obs Non-Obs OR [95%IC] femmes (%) 28 26 1.2 [0.90-1.56] sous IP (%) 58 66 1.5 [1.2-2.3] Age moyen 40 36 0.96[0.94-0.99] L’OR exprime le nombre de fois pour lequel on doit multiplier le risque de non-exposé (ex sans IP) par rapport aux exposés l ’association n ’est pas significative si le 1 est dans l’intervalle de confiance Le sens de la relation est indiqué
Limites des analyses univariées Le seuil de 0.05 est arbitraire, le sens s’interprète par rapport à la taille de l’échantillon On constate une relation, pas une causalité!!! Attention aux variables de confusion! Nécessité d’ajuster!
Prendre en compte les variables de confusion Toxi-infection alimentaire Pizza
Prendre en compte les variables de confusion Toxi-infection alimentaire Pizza Tiramisu
Sortir de la confusion Relation entre « manger une pizza » et toxi-infection alimentaire, OR= 10 [8-30] Parmi ceux qui n ’ont pas mangé de tiramisu: OR = 1 [0.8-1.2] Parmi ceux qui ont mangé du tiramisu: OR = 1.2 [0.9-1.3]
Prendre en compte les variables de confusion Code postal survie des séropos Facilité d’accès aux soins
Prendre en compte les variables de confusion Traitement simple Observance Tolérance perçue
L’analyse multivariée On tente d’expliquer la variable réponse par plusieurs facteurs indépendamment associés On introduit les facteurs associés ou presque associés dans l’analyse univariée Des facteurs liés à d ’autres vont « disparaître » On aboutit à un modèle qui résume plusieurs dimensions explicatives
Facteurs associés avec un comportement sexuel à risque avec un partenaire occasionnel (cohorte MANIF, analyse univariée,192 patients traités) OR 95% CI p Sexe Féminin 1.6 [0.94-2.72] 0.08 Plus de 2 partenaires 0.5 [0.27-0.93] 0.03 Plus de 1 rapport par semaine 1.3 [0.96-1.72] 0.09 Dépression 1.7 [1.19-2.51] 0.01 Usage de drogue Abstinent Sub non injecteur Injecteurs 1 1.41 1.98 [0.88-2.26] [1.12-3.53] 0.05 3 ou plus effets secondaires 1.76 [1.21-2.56] 0.003
Avoir un partenaire principal IP dans le traitement Facteurs non associés* avec un comportement sexuel à risque avec un partenaire occasionnel (cohorte MANIF, analyse univariée,192 patients traités) Bac Emploi Avoir un partenaire principal IP dans le traitement Nombre de comprimés Durée de traitement Charge virale indétectable Taux de CD4 Stade clinique Consommation quotidienne d’alcool * p > 0.25
Facteurs associés avec un comportement sexuel à risque avec un partenaire occasionnel (cohorte MANIF, analyse multivariée,192 patients traités) AOR 95% CI Plus de 2 partenaires 0.51 [0.27-0.95] Plus de 1 rapport / semaine 1.31 [0.98-1.76] Usage de drogue Abstinent Sub non injecteur Injecteurs 1 1.44 1.84 [0.89-2.33] [1.02-3.31] 3 ou plus effets secondaires 1.74 [1.19-2.55]
Facteurs associés à l’absence de traitement: comparaison des 779 traités et des 200 non traités (n= 979) VARIABLE OR Aj IC95% Age (an) 0.94 0.92-0.95 CMU de base 2.0 1.8-2.2 Consommation de produits 2.2 1.5-2.9 Consommation d’alcool 1.4 1.1-1.9 Taux de CD4 >350 1 200-350 0.7 0.5-1.1 <200 0.4 0.2-0.8 NSP 1.3 0.8-1.5 Cette diapo montre les déterminants (facteurs associés) de l’absence de traitement. L’Od ratio ajouté est un coefficient multiplicateur. La lecture est la suivante : une personne séropositive consommatrice de produits a 2,2 fois plus de risques de ne pas recevoir de traitement qu’une personne séropositive non CP. Pour l’âge, chaque année en plus ajoute un OR aj de 0,94 : donc, plus on est vieux, plus on a de « chances » de recevoir un traitement. Idem pour le taux de CD4 : logiquement, on voit que plus le taux de T4 est bas, plus on a de chances de recevoir un traitement.
Les modèles longitudinaux Modèle de Cox = modèle de survie, on modélise les facteurs associés à un 1er évènement Modèle GEE = observations répétées au cours du temps, le temps n’influence pas les facteurs expliquant la variable réponse Modèle mixte = observations répétées au cours du temps, le temps influence les facteurs qui expliquent la variable réponse Modèles joints
Impact of initial depression on HIV clinical progression (MANIF 2000 cohort, n= 243 treated patients) 1.00 No depression 0.75 Depression 0.50 log-rank test p<10-3 0.25 BOUHNIK ANTIVIR THER 2005 Time (months) 0.00 20 40 60 80
Independent factors associated with HIV clinical progression (Cox multivariate model, MANIF 2000, n= 243) RR CI [95%] Initial depression No 1 Yes 5,3 [2,2-13,0] Average proportion of non adherence during follow-up (per 10% increase) 1,2 [1,1-1,3] CD4 < 500 after ARV initiation No 1 Yes 2,9 [1,2-7,0]