Initiation aux enquêtes quantitatives

Slides:



Advertisements
Présentations similaires
Probabilités et statistiques au lycée
Advertisements

STATISTIQUE INFERENTIELLE L ’ESTIMATION
Association entre variables
Epidémiologie et qualité de la prise en charge du diabète du sujet âgé
Organisation et gestion de données, fonctions
Chapitre 5. Description numérique d’une variable statistique.
Echantillonnage Introduction
Analyse d’articles étude des biais
Comparaison d'une distribution observée à une distribution théorique
Tests non paramétriques
Epidémiologie : types d’enquêtes
Nombre de sujets nécessaires en recherche clinique
Licence 3ème année de sociologie Semestre 1
Dr DEVILLE Emmanuelle J D V 12/07/2006
Statistique descriptive
Les Biais Item 14°) Relever les biais discutés. Rechercher d’autres biais non pris en compte dans la discussion et Relever leurs conséquences Dr Marie-Christine.
Schémas d’étude.
Traitement de données socio-économiques et techniques d’analyse :
COURS 5 Les tableaux croisés, le chi-carré et la corrélation
Howell, Chap. 1 Position générale
Comprendre la variation dans les données: Notions de base
Les mesures de la tendance centrale
Loutil statistique les mesures de tendance centrale Auto-évaluation.
Séries chronologiques et prévision
Échantillonnage (STT-2000)
Régression linéaire multiple : hypothèses & interprétation. Partie 2.
Régression linéaire multiple : hypothèses & interprétation
Mesures de position Ils s’expriment dans la même unité que les observations Moyenne et moyenne pondérée Exemple : on dispose du nombre moyen d’enfants.
M1 2013/2014 Implémentation des procédures statistiques Introduction aux régressions linéaires.
Méthodes de Biostatistique
Présenter le projet et l’enquête
Thème: statistiques et probabilités Séquence 3: Statistique descriptive Utiliser un logiciel (par exemple, un tableur) ou une calculatrice pour étudier.
Initiation à la Méthodologie de Recherche
Introduction à l’analyse statistique
Joseph CHONG, Mauduit Pergent
Épidémiologie Notions élémentaires Réalisation pratique d’un enquête
Master 1 – Sciences du Langage –
 Quantifier la part du travail dans les gestes suicidaires  Rechercher des facteurs professionnels protecteurs ou décompensateurs du passage à l’acte.
Scénario Quatre hommes entrent en collision un dans l'autre dans un ascenseur plein de personnes. En conséquence ils laissent tomber leurs téléphones cellulaires.
Rappels de statistiques descriptives
Biostatistiques Quand on souhaite étudier une (ou des) caractéristique(s) sur un ensemble d’individus ou d’objets, il est difficile, voir impossible, d’observer.
* 16/07/96  Echographie de série en deux points couplée aux D-dimères versus échographie doppler couleur de la jambe entière pour le diagnostic d’une thrombose.
BDI3C Introduction à l’entrepreneuriat
PRINCIPE DES TESTS D’HYPOTHÈSE
La SPIROMETRIE Dr M. RAMAUT Pneumologie.
ANALYSE DE DONNEES TESTS D’ASSOCIATION
Epidémiologie Dr Lydia Guittet.
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
Séance 8 30 novembre 2005 N. Yamaguchi
Conférences Paris Descartes
Td sur la statistique descriptive. Enoncé du problème On a étudié la taille en cm chez 20 enfants de quatrième année primaire à l’école Constantine année.
MOYENNE, MEDIANE et ECART TYPE d’une série statistique
Principales distributions théoriques
Statistiques analytiques sous STATA
* 16/07/96  Echographie de série en deux points couplée aux D-dimères versus échographie doppler couleur de la jambe entière pour le diagnostic d’une thrombose.
Intervalles de fluctuation et de confiance. Dans une population, la proportion d’individus ayant un caractère donné est notée p Population.
Statistique Descriptive Les Paramètres de Tendance Centrale
Détecter les groupes à hauts risques cardiaques à partir de caractéristiques telles que l’alimentation, le fait de fumer ou pas, les antécédents familiaux.
Facteurs de risque de contamination par le virus de l’hépatite C. Etude cas-témoin en population générale.
BIOSTATISTIQUES Définitions.
BIOSTATISTIQUES Définitions.
Téléphone mobile, risque de tumeurs cérébrales et du nerf vestibuloacoustique: l’étude cas-témoins INTERPHONE en France. Lecture critique d’article Décembre.
ECHANTILLONAGE ET ESTIMATION
Comparaison de plusieurs moyennes observées
Mesures de description des valeurs des variables
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
TP1: Statistique application chapitre 2. Le tableau suivant reprend le taux d'intérêt (en %) payé par 20 banques sur les dépôts d'épargne de leurs clients.
Transcription de la présentation:

Initiation aux enquêtes quantitatives Le BA-BA de l’épidémiologie et des statistiques

Les différents types d’enquête Cadre général : observationnel à différencier de l’interventionnel Enquêtes transversales avantage : une seule fois difficulté : représentativité Enquêtes longitudinales (prospectives) difficulté : attrition Cohortes Enquêtes cas témoins (rétrospectif) pas cher risque de biais

Enquêtes transversales Problème de la représentativité caractériser l’échantillon cible s’assurer la représentativité de l’échantillon biais supplémentaires si questionnaires biais de fréquentation Problème de la fiabilité des données rétrospectives Pas d’homogénéité de « la durée d’exposition » ( à une molécule, à un vécu….)

Description des données Données qualitatives en classes effectifs fréquences: n (%) éviter les questions ouvertes regrouper des classes faire le deuil de toutes les situations Données quantitatives distribution normale: moyenne et écart type autres distributions: médiane, IQR, rang

Tabac (n=2028) >20c/j 0 cig/j 1 à 20 cig/j Les fumeurs représentent 63% de l’échantillon

Analyse descriptive Données qualitatives en classes effectifs fréquences: n (%) éviter les questions ouvertes faire le deuil de toutes les situations Données quantitatives distribution normale: moyenne et écart type autres distributions: médiane, IQR, rang

Distribution normale

Distribution normale Écart-type moyenne

Distribution anormale Médiane : partage de 50% de la distribution IQR: limites de 3/4 de la distribution Rang: limites de la distribution entière

Les boites à moustache Nombre de symptômes déclarés

Analyse explicative But: rechercher les facteurs associés explicatifs d’une variable réponse 1ère question: quelle est la variable réponse? 2ème question: comment elle se distribue? 3ème question : quels facteurs explicatifs?

Analyse univariée L’objectif est de déterminer le rôle d’un facteur explicatif sur la variable réponse (ex: rôle du sexe ou de l’age sur l’observance au trt) On va comparer des proportions ou des distributions Variable explicative Obs Non-Obs Age moyen 40 36 % femmes 28 26

Tests statistiques La différence observée est elle due au hasard ou non? Test statistique exprimé par p : risque d’erreur associé au fait de dire qu ’il existe une différence si p <0.05 on décide que la différence observée est significative

Comparaison des personnes migrantes aux autres Autres Migrants Fumeurs 67% 38% Conso Alcool 46% 32% Conso produits 24% 9% Rapports homosexuels 51% 31% déjà répondu en 2002 15% 10% A eu une IST 30% 31% Fréquentation asso 1/s 41% 44% De même, les migrants fument moins souvent, boivent moins souvent… que les non migrants (on peut dire aussi : « il y a moins de fumeurs chez les migrants » ou encore « la proportion de fumeurs est moins importante chez les migrants que dans le reste de la population de l’enquête »). Par contre, il n’y a pas de différence concernant les antécédents d’IST ou la fréquentation régulière de l’association.

Comparaison des personnes migrantes aux autres Autres Migrants p Fumeurs 67% 38% 0.001 Conso Alcool 46% 32% 0.002 Conso produits 24% 9% <0.001 Rapports homos 51% 31% 0.001 déjà répondu 15% 10% 0.02 A eu une IST 30% 31% 0.51 Fréqu asso 1/s 41% 44% 0.26 De même, les migrants fument moins souvent, boivent moins souvent… que les non migrants (on peut dire aussi : « il y a moins de fumeurs chez les migrants » ou encore « la proportion de fumeurs est moins importante chez les migrants que dans le reste de la population de l’enquête »). Par contre, il n’y a pas de différence concernant les antécédents d’IST ou la fréquentation régulière de l’association.

Expression par un OR ou RR Exemple: risque de non-observance Variable explicative Obs Non-Obs OR [95%IC] femmes (%) 28 26 1.2 [0.90-1.56] sous IP (%) 58 66 1.5 [1.2-2.3] Age moyen 40 36 0.96[0.94-0.99] L’OR exprime le nombre de fois pour lequel on doit multiplier le risque de non-exposé (ex sans IP) par rapport aux exposés l ’association n ’est pas significative si le 1 est dans l’intervalle de confiance Le sens de la relation est indiqué

Limites des analyses univariées Le seuil de 0.05 est arbitraire, le sens s’interprète par rapport à la taille de l’échantillon On constate une relation, pas une causalité!!! Attention aux variables de confusion! Nécessité d’ajuster!

Prendre en compte les variables de confusion Toxi-infection alimentaire Pizza

Prendre en compte les variables de confusion Toxi-infection alimentaire Pizza Tiramisu

Sortir de la confusion Relation entre « manger une pizza » et toxi-infection alimentaire, OR= 10 [8-30] Parmi ceux qui n ’ont pas mangé de tiramisu: OR = 1 [0.8-1.2] Parmi ceux qui ont mangé du tiramisu: OR = 1.2 [0.9-1.3]

Prendre en compte les variables de confusion Code postal survie des séropos Facilité d’accès aux soins

Prendre en compte les variables de confusion Traitement simple Observance Tolérance perçue

L’analyse multivariée On tente d’expliquer la variable réponse par plusieurs facteurs indépendamment associés On introduit les facteurs associés ou presque associés dans l’analyse univariée Des facteurs liés à d ’autres vont « disparaître » On aboutit à un modèle qui résume plusieurs dimensions explicatives

Facteurs associés avec un comportement sexuel à risque avec un partenaire occasionnel (cohorte MANIF, analyse univariée,192 patients traités) OR 95% CI p Sexe Féminin 1.6 [0.94-2.72] 0.08 Plus de 2 partenaires 0.5 [0.27-0.93] 0.03 Plus de 1 rapport par semaine 1.3 [0.96-1.72] 0.09 Dépression 1.7 [1.19-2.51] 0.01 Usage de drogue Abstinent Sub non injecteur Injecteurs 1 1.41 1.98 [0.88-2.26] [1.12-3.53] 0.05 3 ou plus effets secondaires 1.76 [1.21-2.56] 0.003

Avoir un partenaire principal IP dans le traitement Facteurs non associés* avec un comportement sexuel à risque avec un partenaire occasionnel (cohorte MANIF, analyse univariée,192 patients traités) Bac Emploi Avoir un partenaire principal IP dans le traitement Nombre de comprimés Durée de traitement Charge virale indétectable Taux de CD4 Stade clinique Consommation quotidienne d’alcool * p > 0.25

Facteurs associés avec un comportement sexuel à risque avec un partenaire occasionnel (cohorte MANIF, analyse multivariée,192 patients traités) AOR 95% CI Plus de 2 partenaires 0.51 [0.27-0.95] Plus de 1 rapport / semaine 1.31 [0.98-1.76] Usage de drogue Abstinent Sub non injecteur Injecteurs 1 1.44 1.84 [0.89-2.33] [1.02-3.31] 3 ou plus effets secondaires 1.74 [1.19-2.55]

Facteurs associés à l’absence de traitement: comparaison des 779 traités et des 200 non traités (n= 979) VARIABLE OR Aj IC95% Age (an) 0.94 0.92-0.95 CMU de base 2.0 1.8-2.2 Consommation de produits 2.2 1.5-2.9 Consommation d’alcool 1.4 1.1-1.9 Taux de CD4 >350 1 200-350 0.7 0.5-1.1 <200 0.4 0.2-0.8 NSP 1.3 0.8-1.5 Cette diapo montre les déterminants (facteurs associés) de l’absence de traitement. L’Od ratio ajouté est un coefficient multiplicateur. La lecture est la suivante : une personne séropositive consommatrice de produits a 2,2 fois plus de risques de ne pas recevoir de traitement qu’une personne séropositive non CP. Pour l’âge, chaque année en plus ajoute un OR aj de 0,94 : donc, plus on est vieux, plus on a de « chances » de recevoir un traitement. Idem pour le taux de CD4 : logiquement, on voit que plus le taux de T4 est bas, plus on a de chances de recevoir un traitement.

Les modèles longitudinaux Modèle de Cox = modèle de survie, on modélise les facteurs associés à un 1er évènement Modèle GEE = observations répétées au cours du temps, le temps n’influence pas les facteurs expliquant la variable réponse Modèle mixte = observations répétées au cours du temps, le temps influence les facteurs qui expliquent la variable réponse Modèles joints

Impact of initial depression on HIV clinical progression (MANIF 2000 cohort, n= 243 treated patients) 1.00 No depression 0.75 Depression 0.50 log-rank test p<10-3 0.25 BOUHNIK ANTIVIR THER 2005 Time (months) 0.00 20 40 60 80

Independent factors associated with HIV clinical progression (Cox multivariate model, MANIF 2000, n= 243) RR CI [95%] Initial depression No 1 Yes 5,3 [2,2-13,0] Average proportion of non adherence during follow-up (per 10% increase) 1,2 [1,1-1,3] CD4 < 500 after ARV initiation No 1 Yes 2,9 [1,2-7,0]