1 Société française de Statistique Groupe Statistique et Société Le recensement rénové de la population Le RP : tabulations et secret statistique, que.

Slides:



Advertisements
Présentations similaires
Comprendre les nouvelles estimations de chômage
Advertisements

Les indicateurs disponibles sur insee.fr
TD: Découverte du site de l’Insee
La pondération de l’enquête Sans Domicile 2012
Module 10- Concevoir un stage de formation d'évaluateurs : la démarche
Le rapport du groupe SML sur les méthodes et sources statistiques publiques
Atelier sur lanalyse approfondie des migrations à partir des données de recensement: Ouagadougou novembre 2011 Bonayi Hubert DABIRE, UO/ISSP
Agence Nationale de la Statistique et de la Démographie Direction du Management de lInformation Statistique Confidentialité et anonymisation des microdonnées.
Traitement des données du Recensement Général de la Population et de l’Habitation de 2006 du Burkina Faso.
POLITIQUES ET PROCEDURES DARCHIVAGE DES DONNEES AU BURUNDI.
Atelier régional des Nations Unies sur lévaluation des recensements et les enquêtes post censitaires, Tunis, décembre 2009 Ajustement des résultats.
Collecte de données F. Kohler.
Mode demploi des documents Le principe est de suivre le mode délaboration indiqué dans les programmes :
L'aide financière consiste à accorder au propriétaire une subvention annuelle fixe sur une durée de 15 ans. Par l'attribution d'une aide, l'État entend.
Une mesure de l ’évolution dans le temps
MODULE METHODOLOGIE LA PRISE DE NOTES.
Dictionnaire des noms de familles Avertissement Les pages de ce diaporama sont paramétrées pour une lecture automatique. Aussi, ne vous inquiétez pas car.
Groupe 1: Classes de même intervalle
Principaux résultats Enquête Nationale Anthropométrique ENA 2011 Rabat le 20/11/2012.
DataLab® Toute la connaissance client en quelques minutes
NOMENCLATURES DE PRODUITS. Au niveau le plus détaillé une « Nomenclature dactivités des communautés européennes » (NACE) a été définie au niveau européen.
Programmation linéaire en nombres entiers : les méthodes de troncature
Traitement des fichiers flux d’individus (mobilité) de L’INSEE à l’aide du portail SIDDT.
Le découpage en unités urbaines de l’Insee
THEME : ETAT DES MICRODONNEES DE LA GUINEE Par: MARIE-ANNE DOUALAMOU, DNAS/MP.
ANALYSE DE DONNEES TESTS D’ASSOCIATION
LA FRANCE EST-ELLE LE PAYS OU L’ON PAIE LE PLUS D’IMPOTS ?
Renforcement des capacités nationales en statistiques de la pauvreté
Lotfi Hrizi Ingénieur statisticien Atelier régional sur l’évaluation des recensements Tunis – Tunisie décembre 2009.
Que sont les fichiers de mobilité de l’INSEE?
Pauvreté et autres formes d’exclusion sociale en Aquitaine
JUIN 2014 AGENCE NATIONALE DE LA STATISTIQUE ET DE LA DEMOGRAPHIE.
Diffusion infracommunale à façon du RP. Page 2 Diffusion infracommunale à façon du RP – Diaf-RP : diffusion infracommunale à façon du recensement de la.
Bureautique M1 Publipostage.
Construire un diagnostic sexué : mobiliser des données quantitatives 10 mars 2015.
De grandes choses en perspective : Un avant-goût du Recensement de mai 2006 Atelier IDD du Québec (Montréal) Lucie Gauthier // Francine Lampron.
1. 2 Centaure : Gestion de la valorisation de la recherche  QUASAR Conseil  Le Roussillon Pleumartin - France  
Les zones d’emploi : usages franciliens
EPTEGE 2002 L ’INSEE. EPTEGE 2002 Présentation générale  L ’organisation : - un siège situé à Paris - 28 sites régionaux - 5 centres informatiques nationaux.
1 Rôle de la technologie dans la diffusion et l’utilisation des données du recensement _______________________________.
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Présentation : RORCAL Juin 2015.
Auteur Fonction Date Offre Insee Observation du domaine médico-social.
SANS TRAITEMENT STATISTIQUE, UN SIMPLE
PROJET D’ECOLE Réunion des directeurs du 14 mai 2009.
Cours 5 - Trois algorithmes de tri d'un tableau
Algorithmique Tableaux de données
Recensement de la population de Mayotte 2012
Les nouveaux zonages Qu’est ce qu’un bassin de vie ? : il est conçu pour qualifier l’espace rural – c’est le plus petit territoire sur lequel les habitants.
CONSTRUCTION DE TABLEAUX CROISES SUR LE LOGICIEL MODALISA MET4 – Avril 2005.
Direction de santé publique de la Montérégie PORTFOLIO THÉMATIQUE PROFIL SOCIODÉMOGRAPHIQUE DES AÎNÉS DE SAINT-JEAN-BAPTISTE Direction de santé publique.
des savoir-faire applicables aux données quantitatives
Analyse de données avec R
PREMIERS RESULTATS DANS LE DEPARTEMENT DE LA LOIRE
Direction de santé publique de la Montérégie PORTFOLIO THÉMATIQUE PROFIL DÉMOGRAPHIQUE ET SOCIOÉCONOMIQUE DE LA POPULATION ET DES FAMILLES DE SAINT-JEAN-BAPTISTE.
Ministère des finances et des comptes publics Ministère des affaires sociales, de la santé et des droits des femmes Ministère du travail, de l’emploi,
Direction de santé publique de la Montérégie PORTFOLIO THÉMATIQUE PROFIL DÉMOGRAPHIQUE ET SOCIOÉCONOMIQUE DE LA POPULATION ET DES FAMILLES DE SAINT-PATRICE-DE-SHERRINGTON.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Introduction aux statistiques Intervalles de confiance
19 mai 2011 Gwennaëlle BRILHAULT INSEE – Dép.de la Démographie Séminaire SFDS Les calculs de précision dans le recensement rénové.
Jean-Michel FLOCH INSEE DAR 19 mai 2011 Territoires urbains: que peut dire le recensement ?
Objectifs des réunions avec les Directions Régionales nationale.
Les géographes et les données localisées, des RP au RRP Catherine Rhein D.R. CNRS.
1 Ménages et familles : le recensement et les autres sources de données Laurent Toulemon Le recensement rénové de la population : résultats statistiques.
Jean-Luc LIPATZ INSEE DG Division « Etudes territoriales » Recensement et sources administratives et si on parlait géographie?
Double entrée Reprise du cours ( semaine du 18 au 21 novembre 2014 ; Gr. 1 à 5 ) Exemple : le naufrage du Titanic La question : o influence de la classe.
Chapitre 5 Interprétation des données d’enquête 1.
Mesures de la migration: Claude Marois © Mouvements migratoires : Méthode directe: Migration à partir du lieu de naissance: Les chiffres du recensement.
Présentation de l’outil de création de progression pédagogique Un fichier Excel, 6 onglets pour générer automatiquement une progression sur le cycle 4.
1 UE Intro. Optimisation L3 INFO UPSud II. Programmation linéaire en variables entières (ou mixtes)
Transcription de la présentation:

1 Société française de Statistique Groupe Statistique et Société Le recensement rénové de la population Le RP : tabulations et secret statistique, que faire ? Alexandre Kych Archive de données issues de la Statistique publique (ADISP) Service des données du Centre Maurice Halbwachs (CMH) UMR 8097 CNRS-EHESS-ENS Partenaire du Réseau Quetelet Jeudi 19 mai 2011

2 Un rappel : la diffusion du RP99 (1) Les données affichables au moyen de requêtes sur les site web de l’INSEE ne sont pas pris en considération dans cette présentation 1) Des collections de tableaux standards Analyses - très détaillés Profils - moyennement détaillés, à 2 dates Références - peu détaillés, à 3 dates Mobilités - les 3 flux Îlots - 14 variables Cantons - ≈ tab. Profils Circonscriptions législatives - ≈ tab. Analyses ZUS - Très élaborés (variables et comparaisons)

3 Un rappel : la diffusion du RP99 (2) 2) Des fichiers détail diffusables Logement au 1/1 variables localisation, immeuble, logement Individus au 1/20 toutes variables, sauf îlot et variables sensibles (origine) Individus au ¼ localisation grossière lieu de résid.(≥ 50 Mh.) pas de lieux de travail, de résid. antér. variables sensibles grossières (± 12 postes) individus dans le désordre

4 Un rappel : la diffusion du RP99 (2) 3) Les 2 fichiers détail au 1/1 et au 1/4 complets non diffusables hors de l’INSEE mais tabulables au début, tabulations Beyond ensuite, programmation en SAS (PSM) gratuit pour les chercheur passant par l’ADISP totale liberté dans la conception des tableaux … … à la condition de respecter les règles de zonages propres aux variables sensibles

5 Un rappel : la diffusion du RP99 (4) Au final, un dispositif qui satisfait les besoins d’une grande majorité des chercheurs un recours ultime : les PSM les 2 regrets : l’îlot les variables sensibles à l’infra-TRIRIS

6 Trois évolutions vont converger et changer profondément les conditions de diffusion des données issues du RP - Un nouveau recensement le cycle de 5 ans les 2 procédures selon la taille de la commune les 2 fichiers annuels : EAR et RP … sans compter les changements de concepts - Une nouvelle diffusion - Une nouvelle règle du secret statistique

7 Une nouvelle diffusion (1) 1) Des collections de tableaux standards Chiffres-clés - 6 tableaux, de 60 à 160 variables par tableau Tableaux détaillés - 50 tableaux, de 10 à 350 var. par tab. Données infracommunales - 5 tableaux, de 50 à 100 var./tab nomenclatures de 2-10 à postes croisements à 2 variables rien sur les flux ou les variables d’origine Flux de mobilités – 6 tableaux de 3 à 5 variables flux de ≥ 100 individus entre 2 communes indicateurs de migration en 2 postes par communes

8 Une nouvelle diffusion (2) 1) Des collections de tableaux standards (suite) On a perdu des collections Vie politique (circonscriptions législatives, cantons) Politique de la ville (ZUS) Localisations fine (îlots) Données rétrospectives (profils, références) Heureusement, pour les IRIS et les ZUS, il y a aussi Les données urbaines infra-communales par quartier données issues de sources non censitaires … et des RP 9 à 10 tableaux avec 4 à 45 variables par tableaux Pour résumer : Des tableaux beaucoup moins détaillés Des tableaux abandonnés

9 Une nouvelle diffusion (3) 2) Des fichiers détail diffusables Logement (fichier principal) variables localisation, immeuble, logement + ménage Individus par régions (fichier complémentaire) nomenclatures très détaillées (mais nationalité en 45 postes) mais seulement région et indicateurs de mobilité Individus par cantons-villes (fichier complémentaire) zonage du lieu de résidence non standard seulement indicateurs de mobilité nomenclatures peu détaillées (CS8 et nationalité en 2 postes) Individus mobilités études / travail / résidence (fichier complémentaire) localisation de la mobilité concernée à la commune seulement indicateurs pour les autres mobilité peu de variables et variables peu détaillées

10 Une nouvelle diffusion (4) 2) Des fichiers détail diffusables (suite) Pour résumer, des améliorations … plus de fichiers détail un fichier Logement plus riche des fichiers Mobilités plus riches … des reculs peu de nomenclatures très détaillées quasi disparition des différentes localisations segmentation des thèmes il n’y a plus de fichier complet, quel qu’en soit le taux de sondage

11 Une nouvelle diffusion (4) 3) Des fichiers détail non diffusables hors de l’INSEE, mais tabulables (PSM) À présent, il y en a 5 Logement (fichier principal) Logement (fichier complémentaire) Famille (fichier complémentaire) Individus (fichier principal) Individus (fichier complémentaire) C’est-à-dire qu’il n’y a plus les 2 fichiers Individus complets segmentation des thèmes logements-ménages / familles / individus variables logement seulement dans le fichier Logement disparition des variables décrivant les individus exemplaires PRM et son conjoint, PRF, père et mère de famille seulement la commune de résidence actuelle, absence des variables pour les autres localisations pas d’IRIS observations dans le désordre

12 Une nouvelle règle du secret statistique (1) qui modifie complètement l’utilisation des PSM Aucune case du tableau ne doit comporter entre 1 et 3 unités observées: soit un effectif de 10 au minimum si la population correspond à un sondage de 40 %, soit un effectif de 16 au minimum si la population correspond à un sondage au quart. Éviter autant que possible des distributions trop concentrées (par exemple, 80 % ou 90 % des unités dans une case d’une ligne, d’une colonne ou d’un tableau) Par unité, il faut entendre individu, famille, ménage ou logement selon le fichier tabulé

13 Une nouvelle règle du secret statistique (2) Elle s’applique en plusieurs étapes Pour un tableau donné, l’INSEE va d’abord 1) calculer le rapport nbre d’unités / nbre de cases et il ne peut être inférieur à 50 % 2) calculer le rapport nbre de cases masquées / nbre de cases et il ne peut être supérieur à 50 % Enfin, le chercheur peut choisir 3) de conserver le tableau avec les cases masquées ou de demander un autre tableau

14 Une nouvelle règle du secret statistique (3) Si l’on prend les 45 demandes de PSM réalisées en 2009 pour l’ADISP 15 tableaux auraient été refusés dès la 1ère étape 27 tableaux auraient été refusés au terme de la 2ème étape 1 seul tableau n’aurait eu aucune case masquée Une demande aussi simple que le tri à plat du pays de naissance en 200 postes France entière et croisé avec aucune autre variable on obtient déjà 5 ou 6 cases masquées

15 Une nouvelle règle du secret statistique (4) On voit bien que la plupart des demandes posées par les chercheurs qui veulent croiser plusieurs variables qui veulent des résultats par zones géographiques fines qui veulent des nomenclatures fines afin de les agréger selon leurs besoins afin de les analyser avec des procédures appropriées vont presque toutes contenir des cases masquées à moins d’avoir été directement refusées

16 Les chercheurs sont désormais condamnés à des démarches sans fin avec l’INSEE pour mettre au point des demandes qui minimisent le nombre de cases masquées Le recours au CASD n’est pas une solution (Centre d’Accès Sécurisé aux Données) C’est une procédure lourde Qui n’a pas été conçue pour réaliser des tabulations … … tabulations qui finalement doivent obéir aux mêmes règles ! Et ces nouvelles règles du secret statistique s’appliquent désormais aux RP antérieurs

17 On est dans une situation intenable - L’évolution de l’offre des produits issus du RP rend le recours aux PSM incontournable - La nouvelle règle portant sur le secret statistique rend les PSM de facto inaccessibles

18 Que peut faire le chercheur ? 1) Espérer un changement de la règle du secret statistique Prendre en compte la finesse du zonage géographique ? Sera-ce possible et quand ? 2) Construire des tableaux qui minimisent le nbre de cases masquées Exercice laborieux et interminable … … surtout sans disposer des fichiers détail pour les tester (sauf à passer par le CASD) 3) Faire avec Considérer que le masquage est déjà une information de 1 à 3 unités

19 Faire avec ? - Peut-on alors envisager de calculer des totaux, marginaux et général ? - Peut-on alors envisager de calculer des pourcentages et toutes les statistiques des tableaux de contingence ? - Peut-on envisager de se servir de tels tableaux pour des analyses statistiques plus élaborées ? C’est la question posée aux statisticiens

20 Merci de votre attention