Traitement et analyse des données Seni KOUANDA, MD, PhD
Introduction Qualité des données: qualité des résultats Qualité de la collecte: outils de la collecte, agents chargés de la collecte Enregistrement des données: saisie
Qualités des outils Qualités générales des outils: Être adaptés Précis et non ambigus Applicables avec uniformité Minimiser les erreurs des répondants, enquêteurs et codeurs Être limités à l’essentiel
Validité et fiabilité des outils Validité: la validité d’un instrument est atteinte s’il mesure réellement ce qu’il est censé mesurer Exple: par quel moyen peut on mesurer les inégalités de santé de manière valide? Fiabilité: la fiabilité de l’outil dépend de la mesure avec laquelle un score obtenu avec un outil d’observation est reproductible lors d’applications repétées Exemple: échelle de poids et taille, échelle de satisfaction
Introduction Contrôle à chaque étape du processus Collecte des données Enregistrement des données
Codification et codage Codification: assignement d’un nombre ou d’un symbole pour représenter une réponse Type de codification Codification numérique: une réponse=un nombre Exemple: femme= 1, homme=2 Codification alphanumérique: réponse= ensemble de caractères Exemple: O ou N pour Oui, Non
Codification et codage Chaque réponse= code distinct Règle pour les valeurs manquantes: le plus facile est d’utiliser le « blanc » à condition que le logiciel ne l’assimile pas à la valeur 0. Attribuer une valeur 9,99, 999 et la déclarer valeur manquante dans le programme Enregistrer les variables quantitatives et recoder ensuite Exemple: âge
Codification et codage Questions à choix multiples Exemple: quelles sont vos sources d’approvisionnement en eau: Forage Puits Robinets Eau de source Chaque réponse devient une variable
Enregistrement des données Utilisation de logiciel de saisie: epi data, excel Agent de saisie: formation à la saisie et à la compréhension du questionnaire Tester la saisie des données Saisie unique ou double? Vérifier à chaque fois la saisie des données Réponse aberrante ou saisie aberrante? Agent de saisie: automatisme
FONCTIONS D’EPIDATA Conception du masque de saisie Contrôle à la saisie Saisie Exportation sous différents formats
Apurement des données Vérifier le nombre d’enregistrement total: est-il égal au nombre de personnes enquêtées? Vérifier les réponses manquantes Vérifier les réponses aberrantes Vérifier la logique entre les variables Contrôler avec la deuxième saisie Retour sur les outils
Apurement des données QUESTIONS Codes Pouvez-vous me dire combien de temps avez-vous passé aujourd’hui dans cette formation sanitaire de votre arrivée à la fin de vos soins ? Minutes|___||___| Heures :|___||___| Pouvez-vous me dire combien de temps avez-vous passé aujourd’hui dans cette formation sanitaire avant d’être reçu par un soignant ou la personne qualifiée à vous offrir les soins pour lesquels vous êtes ici ?
Analyse des données Logiciels d’analyse des données: Epi info, SPSS, Stata, SAS, excel Exportation des données du logiciel de saisie vers le logiciel d’analyse des données Plan d’analyse des données: guide pour le statisticien
Analyse des données Analyse doit se focaliser sur les objectifs de l’étude Statistiques descriptives: moyenne, médiane, DS,
Caractéristiques Groupes d’âges Sexe Masculin (%) Feminin Ensemble 35-39 ans 204 5,1 189 4,3 393 4,7 40-44 ans 157 3,9 107 2,5 264 3,2 45-49 ans 91 2,3 85 1,9 176 2,1 50-54 ans 73 1,8 56 1,3 129 1,5 55-59 ans 42 1,1 51 1,2 93 80-84 ans 13 0,3 21 0,5 34 0,4 85 + 9 0,2 5 0,1 11 Total 3995 100 4360 8355
Analyses des données Comparaison des résultats en fonction des variables dépendantes, explicatives Utilisation des tests de comparaison (test t, test du khi 2) En général, dans les rapports, on fait peu de modélisation
Cout de l’accouchement 2006 2010 Coût de l’accouchement normal Moyenne 5172 1865,3 Ecart-type 4975 2784,7 Médiane 3950 900 Q1 2573,75 Q3 6096,25 1900 Effectif 396 911
Analyse des données Génération de tableaux Choix entre tableaux et figures
Rédaction du rapport Disponibilité des résultats Rédaction du rapport Sections du rapport: Introduction/justification étude Méthodologie Résultats/ discussion Recommandations
Conclusion Résultats fiables et valides: Bonne question de recherche Méthodologie robuste Méthodes standardisées de collecte des données Collecte sans biais des données Saisie correcte des données Analyse: choix des mesures appropriées
Conclusion Equipe pluridisciplinaire Discussion sur les problèmes de choix des méthodes, sur la pertinence des outils et sur les choix pour l’analyse