Evaluation de la qualité des données sur l’âge et le sexe

Slides:



Advertisements
Présentations similaires
Diagnostic du territoire et de la société Les enjeux du vieillissement en Limousin Bonjour à tous, Il y a 5 ans déjà la Région réalisait un diagnostic.
Advertisements

Base de sondage et Plan de sondage Pres. 5
La santé mentale des immigrants et des minorités au Canada effets sociaux et économiques M. Annie Xu (RHDCC/UNB) Rencontre casse-croûte Metropolis 13 juillet.
Projections démographiques
Epidémiologie et qualité de la prise en charge du diabète du sujet âgé
InVS 27/11/2006 Test dinfection récente… Sur le chemin de lincidence ? J Pillonel, F Cazein, F Lot, R Pinget, S Le Vu, P Bernillon, C S le (InVS) et.
Chapitre 5. Description numérique d’une variable statistique.
LE QUESTIONNAIRE D’ENQUETE
Atelier régional des Nations Unies sur lévaluation des recensements et les enquêtes post censitaires, Tunis, décembre 2009 Appariement Pres. 7.
Atelier sur lanalyse approfondie des migrations à partir des données de recensement: Ouagadougou novembre 2011 Bonayi Hubert DABIRE, UO/ISSP
Vue d’ensemble des méthodes d’analyse démographiques pour évaluer les recensements Pres. 3 Atelier régional des Nations Unies sur l’évaluation des recensements.
PLAN I- Présentation sommaire du Congo
Atelier régional des Nations Unies sur lévaluation des recensements et les enquêtes post censitaires, Tunis, décembre 2009 Ajustement des résultats.
Atelier régional des Nations Unies sur lévaluation des recensements et les enquêtes post censitaires, Tunis, 7-11 décembre 2009 Vue densemble des méthodes.
Atelier régional des Nations Unies sur lévaluation des recensements et les enquêtes post censitaires, Tunis, décembre 2009 Tabulations et système.
Atelier régional des Nations Unies sur lévaluation des recensements et les enquêtes post censitaires, Tunis, décembre 2009 Evaluation des erreurs.
Comparaison d'une distribution observée à une distribution théorique
1. Les caractéristiques de dispersion. 11. Utilité.
LE RECUEIL D’INFORMATION SUR LA DEMANDE
1 Statistiques Séance 5 – 9 Nov Résumé séance précédente Lécart-type σ ou s. Comment le calculer? Les propriétés numériques de la courbe normale.
Indépendance & Khi-deux ²
Atelier régional des Nations Unies sur lévaluation des recensements et les enquêtes post-censitaires Tunis, 7-11 décembre 2009 LEVALUATION DES RECENSEMENTS.
Statistiques Séance 9 – 6 décembre 2005 N. Yamaguchi.
Faire de lâge un atout pour le développement de votre entreprise Mars 2008 Aract Bretagne, CRCI Bretagne, Alef Pays de Cornouaille, En quoi lentreprise.
Les Traits et Tendances Démographiques
METIERS : COMPARAISON PAR GROUPES DE METIERS (1) SELON 3 CRITERES : AGE, PARITE, FORMATION (1) : définition des groupes, voir annexe II 2005 Source : enquête.
REPRESENTATION AU NIGER 5ème PROGRAMME PAYS. DIAGNOSTIC.
Régression linéaire simple
Comprendre la variation dans les données: Notions de base
Ensemble des couples (Modalité M, Effectifs de M) Exemple [sexe] : {(Homme,52) ; (Femme,64)} [AnneeDEtude] : {(L1,125) ; (L2,117) ; (L3,52)} [Age] : {
T. Eggerickx, J.-P. Sanderson et M. Poulain
Séminaire d’Analyses comparatives et enquête sociologique
Corrélation Principe fondamental d’une analyse de corrélation
La statistique Définitions et méthodes. La statistique est la branche des mathématiques qui collecte, classe, analyse et interprète des données afin den.
Département des finances, des institutions et de la santé Service de la santé publique Etat de santé de la population valaisanne Rapport janvier.
La situation démographique au Québec, si la tendance se maintient...
MALI SEMINAIRE REGIONAL DES NATIONS-UNIES Pour la promotion et l’utilisation des résultats du recensement et sur la révision des Principes et Recommandations.
Approches de Santé publique, épidémiologie
Le belge : une espèce en voie de disparition ? Un contexte démographique dans les leçons de mathématiques. CREM, Nivelles, 07/05/08 Johan Deprez cfr.
Pretoria, Afrique du Sud, Mars 2014
Page 1 Pretoria, Afrique du Sud, Mars 2014 Séminaire régional des Nations Unies sur la Promotion et l'Utilisation des Résultats du Recensement et.
Séance 8 30 novembre 2005 N. Yamaguchi
JEAN-MARC FONTAN SOC-1101 COURS 3
ANALYSE D’UN ÉCHANTILLON PORTANT SUR UNE VARIABLE STATISTIQUE
JUIN 2014 AGENCE NATIONALE DE LA STATISTIQUE ET DE LA DEMOGRAPHIE.
Conférences Paris Descartes
Pour débuter la présentation animée
VARIABLES ET MESURES DE FREQUENCES Pr. KELLIL M 1.
Directeur de collection :
Journée du Tennis Féminin Journée du Tennis Féminin Mercredi 11 février 2009 Ligue de Seine Saint Denis.
Direction de santé publique de la Montérégie PORTFOLIO THÉMATIQUE PROFIL DÉMOGRAPHIQUE ET SOCIOÉCONOMIQUE DE LA POPULATION ET DES FAMILLES DE LA COMMUNAUTÉ.
Direction de santé publique de la Montérégie PORTFOLIO THÉMATIQUE PROFIL DÉMOGRAPHIQUE ET SOCIOÉCONOMIQUE DE LA POPULATION ET DES FAMILLES DE SAINT-GEORGES-DE-CLARENCEVILLE.
* 16/07/96 Cohorte des travailleurs du nucléaire à Électricité de France : mortalité des agents statutaires sur la période 1968–2003 *
Composantes de base en démographie
Direction de santé publique de la Montérégie PORTFOLIO THÉMATIQUE PROFIL DÉMOGRAPHIQUE DE LA POPULATION ET DES FAMILLES DE SAINT-STANISLAS-DE-KOSTKA Direction.
Direction de santé publique de la Montérégie PORTFOLIO THÉMATIQUE PROFIL DÉMOGRAPHIQUE ET SOCIOÉCONOMIQUE DE LA POPULATION ET DES FAMILLES DE SAINT-ALEXANDRE.
Statistique Descriptive Les Paramètres de Tendance Centrale
Direction de santé publique de la Montérégie PORTFOLIO THÉMATIQUE PROFIL DÉMOGRAPHIQUE ET SOCIOÉCONOMIQUE DE LA POPULATION ET DES FAMILLES DE SAINT-RÉMI.
Direction de santé publique de la Montérégie PORTFOLIO THÉMATIQUE PROFIL DÉMOGRAPHIQUE ET SOCIOÉCONOMIQUE DE LA POPULATION ET DES FAMILLES DE SAINT-JEAN-BAPTISTE.
Chapitre 4 Concepts fondamentaux Les composantes d’un test statistique Les hypothèses nulles en statistiques Le sens de p Inférence: comment traduire p.
Direction de santé publique de la Montérégie PORTFOLIO THÉMATIQUE PROFIL DÉMOGRAPHIQUE ET SOCIOÉCONOMIQUE DE LA POPULATION ET DES FAMILLES DE VENISE-EN-QUÉBEC.
Comparaison de plusieurs moyennes observées
Direction de santé publique de la Montérégie PORTFOLIO THÉMATIQUE PROFIL DÉMOGRAPHIQUE ET SOCIOÉCONOMIQUE DE LA POPULATION ET DES FAMILLES DE SAINT-PATRICE-DE-SHERRINGTON.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Tableau à double entrée ou Tableau de contingence ou … 1.
PRESENTATION DE L’ENQUETE SUR LE TABAGISME (TQS) AU TOGO PAR AGBETI KOMI INGENIEUR STATISTICIEN ECONOMISTE (ISE) INSTITUT NATIONAL DE LA TATISTIQUES ET.
Tableau à double entrée ou Tableau de contingence ou … 1.
STATISTIQUE DESCRIPTIVE
Dr NZEYIMANA Senya-Diane POINT EPIDEMIOLOGIQUE DU VIH AU BURUNDI.
Transcription de la présentation:

Evaluation de la qualité des données sur l’âge et le sexe Cours destiné á : ISE 3 ENSAE, Dakar - Sénégal Année académique : 2013-2014 Animateur : Abdou GUEYE Statisticien démographe Intrahealth International, SN

Plan du cours Objectifs de l’évaluation Les différents types d’erreurs rencontrées Dépistage des erreurs sur l’âge Dépistage graphique des erreurs Mesure des attractions/répulsions des âges et Indices de préférence Ajustement simple des données de structure par sexe et par âge Application 

I. Objectifs de l’évaluation Diverses erreurs entachent les données collectées. Sources des erreurs: mauvais enregistrement incompréhension des recensés, complexité du questionnaire, omissions ou doubles comptes de personnes mauvaises déclarations lors de la saisie des données. Que faire? Comment faire? Evaluation Redressement éventuel Des méthodes spécifiques

II. Les différents types d’erreurs rencontrées 1. Erreurs sur le sexe Sous dénombrement différentiel par sexe ; Erreurs d’enregistrement dues aux enquêteurs (ex. erreurs de classement aux jeunes âgés). 2. Erreurs sur l’âge 2 sortes : Erreurs de couverture : Sous énumération différentielle par âge Erreurs d’enregistrement : Attraction des âges ou son corollaire la répulsion des âges. Biais d’enregistrement systématiques des âges (rajeunissement ou vieillissement par rapport à l’âge réel).

III. Dépistage des erreurs sur l’âge Erreurs de couverture Comparaison du recensement à des données obtenues par d’autres voies : enquêtes démographiques ou recensements antérieures, enquête de couverture post-censitaire. Erreurs d’enregistrement Elles se détectent plus facilement. Pour ce faire on utilise 2 méthodes possibles : dépistage graphique et évaluation numérique.

1. Dépistage graphique des erreurs Pyramide par année d’âge (ou à défaut courbes des effectifs par âge et par sexe) Une pyramide des âges est formée de deux histogrammes horizontaux accolés des distributions par sexe selon l’âge des effectifs d’une population. sexe masculin à gauche et sexe féminin à droite. Respect de la règle de proportionnalité des effectifs aux surfaces; Construction : effectifs absolus ou effectifs relatifs (effectifs ramenés à 1000 ou 10 000) calculés sur la base de l’effectif total de la population. Ce dernier cas est le plus utilisé car : comparer les deux distributions par sexe sur la même base ou l’évolution de la structure par sexe selon le sexe dans le temps.

1. Dépistage graphique des erreurs Pyramide par année d’âge (ou à défaut courbes des effectifs par âge et par sexe) Interprétation Dans les conditions normales où il n’existe pas d’erreurs sur l’âge, ni dénombrement préférentiel la pyramide par année d’âge doit avoir une forme régulière (base élargie, sommet effilé et effectifs en décroissance régulière). Toute distorsion observée décrit, soit une erreur sur l’âge soit des événements exceptionnels vécus par les générations concernées.

1. Dépistage graphique des erreurs b. Graphique des rapports de masculinité selon l’âge Il mesure le nombre d’hommes pour 100 femmes. Il est calculé en rapportant l’effectif des hommes à celui des femmes. compris entre 102 et 107 et ne doit pas croître avec l’âge plus élevé en milieu urbain qu’en milieu rural. Toutefois, si à la naissance, il survient plus de garçons que de filles, par la suite le rapport de masculinité s’inverse en faveur des filles sous l’effet différencié de la mortalité par sexe.

1. Dépistage graphique des erreurs b. Graphique des rapports de masculinité selon l’âge Interprétation Elle permet de détecter les erreurs différentielles selon l’âge ou selon le sexe. En effet, en situation normale où il n’existe pas d’erreurs sur l’âge, ni dénombrement préférentiel et en l’absence d’événements exceptionnels vécus par la population étudiée, la courbe de masculinité présente l’allure classique d’une courbe logistique renversée.

1. Dépistage graphique des erreurs b. Graphique des rapports de masculinité selon l’âge Interprétation Tout écart par rapport à cette courbe idéale est la manifestation d’une mauvaise qualité des données sur l’âge. Si les données sur l’âge sont exemptes d’erreurs, tout écart par rapport à cette courbe idéale décrit soit un enregistrement différentiel des sexes, soit une exposition différentielle des sexes à un phénomène démographique quelconque, à l’exemple de la migration

2. Mesure des attractions/répulsions des âges et Indices de préférence Indice de Whipple Vise à mesurer le degré de préférence des âges ronds se terminant par 0 et 5. Analyse les préférences, non sur l’ensemble de la distribution par âge, mais seulement au sein du groupe d’âges 23 – 62 ans, Calcul : Effectif total des personnes âgées de 23 à 62 ans. Somme des effectifs de l’intervalle 23-62 ans dont les âges se terminent par 0 ou 5

2. Mesure des attractions/répulsions des âges et Indices de préférence Indice de Whipple (IW) Vise à mesurer le degré de préférence des âges ronds se terminant par 0 et 5. Analyse les préférences, non sur l’ensemble de la distribution par âge, mais seulement au sein du groupe d’âges 23 – 62 ans, Calcul : Effectif total des personnes âgées de 23 à 62 ans. Somme des effectifs de l’intervalle 23-62 ans dont les âges se terminent par 0 ou 5 Iw = rapport somme 2° sur 1/5 effectif total 1°).

2. Mesure des attractions/répulsions des âges et Indices de préférence Indice de Whipple (IW) Interprétations : Iw varie entre 0 et 5. Si Iw = 0, il y’a répulsion totale du 0 et du 5 Si Iw = 5, tous les âges enregistrés se terminent par 0 et 5 Si Iw <1, il y a répulsion pour le 0 et le 5 Si Iw = 1, il n’a aucune préférence Si 1< Iw <5, il y a attraction, d’autant plus forte que W est voisin de 5.

2. Mesure des attractions/répulsions des âges et Indices de préférence Indice de Whipple (IW) Par ailleurs l’annuaire démographique des Nations Unies 1955 (Gilles Roger et al,1981, p141) donne : W < 1,05: données très exactes 1,05 ≤w ≤ 1,099:données relativement exactes 1,10 ≤ w ≤ 1,249: données approximatives 1,25 ≤ w ≤ 1,749: données grossières 1,75 ≤w données très grossières

2. Mesure des attractions/répulsions des âges et Indices de préférence Indice de Whipple (IW) Remarques: Insuffisance de l’indice car ne concerne que les préférences pour 0 ou 5. la préférence (attraction/répulsion) pour un chiffre entraîne automatiquement le même effet pour l’autre chiffre. Une amélioration possible serait de calculer un indice séparé pour chaque chiffre 

2. Mesure des attractions/répulsions des âges et Indices de préférence Indice de Myers Mesure l’attraction ou la répulsion de chacun des 10 chiffres 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, pour les individus âgés de 10 ans et + d’une part et de 20 ans et + d’autre part. Avantage : il élimine, au moins en partie, la diminution des effectifs entre deux âges séparés de 10 ans en se servant d’effectifs pondérés. Calcul : Somme du nombre de personnes dont les âges se terminent par chaque nombre entier : d’une part, pour les individus âgés de 10 ans et plus : So, S1, S2, S3, ..., S9

2. Mesure des attractions/répulsions des âges et Indices de préférence Indice de Myers d’autre part, pour les gens âgés de 20 ans et plus : S’0, S’1, ....., S’9. 2.Pondération de ces sommes par des coefficients entiers (1 à 10 dans le 1er cas et 9 à 0 dans le second cas respectivement). 3. On additionne les sommes pondérées pour aboutir à une « population fictive » de la façon suivante : F0 = 1.S0 + 9.S’0 F1 = 2.S1 + 8.S’1 F2 = 3.S2 + 7.S’2 F3 = 4.S3 + 6 S’3 F4 = 5.S4 + 5.S’4 F5 = 6.S5 + 4 S’5 F6 = 7.S6 + 3 S’6 F7 = 8.S7 + 2.S’7 F8 = 9.S8 + 1.S’8 F9 = 10.S9 + 0.S’9

2. Mesure des attractions/répulsions des âges et Indices de préférence Indice de Myers N.B : La somme des coefficients dans chaque cas est égale à 10. 4. Calcul du pourcentage de chaque Fi par rapport au total des Fi. 5. Calcul des différences (écarts) entre ces pourcentages et 10% ; ceci détermine le coefficient de Myers ainsi que l’attraction (+) ou la répulsion (-) pour chaque chiffre. 6. Somme des valeurs absolues des écarts qui est l’indice de Myers.

2. Mesure des attractions/répulsions des âges et Indices de préférence Indice de Myers interprétation Cet indice varie entre 0 (aucune distorsion sur les âges) et 180 (tous les individus recensés ont un âge terminé par le même chiffre). Remarque : Cet indice permet de connaître l’attraction ou la répulsion de certains chiffres, mais ne tient pas compte du fait que la préférence pour un chiffre peut être due à une préférence pour un âge donné, qui ne se retrouve pas pour les autres âges terminés par le même chiffre.

2. Mesure des attractions/répulsions des âges et Indices de préférence Régularité des structures par groupes d’âge (quinquennaux) et par sexe Le rapport des groupes d’âges successifs Px = ---------------------- ½ (Px-5, Px+5) Cet indicateur évalue la régularité des distributions par sexe et par groupe d’âges. Son calcul est basé sur l'hypothèse selon laquelle l'effectif d'un groupe d’âges donné devrait sensiblement être égal à la demi-somme des effectifs des groupes d’âges encadrant Si la valeur est supérieure à 100, cela voudrait dire que les effectifs correspondant à l’âge x, ont bénéficié de ceux des âges encadrants ; au contraire si la valeur est inférieure à 100, alors, les effectifs des âges encadrants ont plutôt bénéficié des effectifs de l’âge x.

2. Mesure des attractions/répulsions des âges et Indices de préférence Indices de régularité de la structure par âge et par sexe ou Indice combiné des Nations Unies (ICNU) Le classement par groupes d’âge quinquennaux élimine les erreurs dues à certains chiffres mais pas complètement à cause des déplacements qu’il peut y avoir d’un groupe d’âge à un autre. Deux indices permettent d’évaluer la régularité des structures. I1. Indice de la régularité de la structure par âge ou indice « rapport d’âges » Calcul : 1. Faire le rapport (%) de l’effectif de chaque groupe d’âge par rapport à la moyenne des effectifs des groupes d’âge encadrant.

2. Mesure des attractions/répulsions des âges et Indices de préférence 2. Calculer la différence de chaque rapport et 100. 3. Faire la somme des valeurs absolues de ces différences. 4. Calculer l’indice des âges = la moyenne des valeurs absolues de ces différences pour chaque sexe séparément (ou pour l’ensemble de la distribution).

2. Mesure des attractions/répulsions des âges et Indices de préférence I2. Indice de masculinité ou indice de « rapport de masculinité » Calcul : 1. Calculer le rapport de masculinité pour chaque groupe d’âge (%), en général jusqu’au groupe d’âge 70-74 ans. 2. Calculer les différences entre les rapports successifs. 3. Calculer la somme des valeurs absolues des écarts. 4. Calculer l’indice de masculinité = la moyenne des valeurs absolue des écarts.

2. Mesure des attractions/répulsions des âges et Indices de préférence I3. Indice combiné des Nations Unies ICNU A = indice des âges des hommes B = indice des âges des femmes C = indice de masculinité ICNU = A + B + 3C. Remarque : Si ICN > 40, la structure par âge et par sexe est très défectueuse. La méthode n’examine pas le problème de l’attraction des âges comme le font les indices précédents.

2. Mesure des attractions/répulsions des âges et Indices de préférence Elle s’applique aux données classées par groupe d’âges ; méthode influencée par le regroupement ; exemple des groupes d’âges  quinquennaux ou décennaux ==> comparaison des indices que s’ils se rapportent au même intervalle de classe. Les Anomalies relevées par la méthode peuvent être réelles et dues par exemple aux décès découlant d’une épidémie. Les Nations Unies préconisent de limiter le calcul des rapports des groupes d’âges et des rapports de masculinité aux groupes d’âges jusqu’à 70 ans. Car au dessus de cet âge, les séries connaissent des variations importantes. » (F. Gendreau : La population de l’Afrique (1991).

3. Ajustement simple des données de structure par sexe et par âge Lorsque les classes annuelles sont très irrégulières, on peut recouvrir à un lissage des structures. Lissage graphique : Utilisation des distributions cumulées En l’absence de perturbations importantes, les courbes des répartitions cumulées sont régulières. Les irrégularités des courbes traduiront des erreurs de dénombrement, d’enregistrement des âges ou des variations de fécondité, de mortalité ou de migration. On utilise des proportions (%, ‰) de chaque âge par sexe et les cumuls croissants ou décroissants. On représente la courbe des cumuls et on redresse à la main les anomalies constatées

3. Ajustement simple des données de structure par sexe et par âge Lissage au moyen de formules : Utilisation des moyennes mobiles Moyennes mobiles appliquées à une répartition par année d’âge nx-1 + nx + nx+1 Moyenne mobile sur 3 ans : n’x =-------------------- 3 Moyenne mobile sur 5 ans : nx-2 + nx-1 + nx + nx+1 + nx+2 n’x = ------------------------------------ 5

3. Ajustement simple des données de structure par sexe et par âge Lissage au moyen de formules : Utilisation des moyennes mobiles Moyenne mobile par groupes d’âges quinquennaux N-2 + 4N-1 + 10Nx + 4N1 + N2 N’0 = ------------------------------------- 16 Lissage par une fonction mathématique Utilisation des procédures du PASEX : SINGAGE (MEYER, de WHIPPLE et de BACHI); AGESEX (ICNU) et AGESMTH (structure ajustée)