La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 Société française de Statistique Groupe Statistique et Société Le recensement rénové de la population Le RP : tabulations et secret statistique, que.

Présentations similaires


Présentation au sujet: "1 Société française de Statistique Groupe Statistique et Société Le recensement rénové de la population Le RP : tabulations et secret statistique, que."— Transcription de la présentation:

1 1 Société française de Statistique Groupe Statistique et Société Le recensement rénové de la population Le RP : tabulations et secret statistique, que faire ? Alexandre Kych Archive de données issues de la Statistique publique (ADISP) Service des données du Centre Maurice Halbwachs (CMH) UMR 8097 CNRS-EHESS-ENS Partenaire du Réseau Quetelet Jeudi 19 mai 2011

2 2 Un rappel : la diffusion du RP99 (1) Les données affichables au moyen de requêtes sur les site web de l’INSEE ne sont pas pris en considération dans cette présentation 1) Des collections de tableaux standards Analyses - très détaillés Profils - moyennement détaillés, à 2 dates Références - peu détaillés, à 3 dates Mobilités - les 3 flux Îlots - 14 variables Cantons - ≈ tab. Profils Circonscriptions législatives - ≈ tab. Analyses ZUS - Très élaborés (variables et comparaisons)

3 3 Un rappel : la diffusion du RP99 (2) 2) Des fichiers détail diffusables Logement au 1/1 variables localisation, immeuble, logement Individus au 1/20 toutes variables, sauf îlot et variables sensibles (origine) Individus au ¼ localisation grossière lieu de résid.(≥ 50 Mh.) pas de lieux de travail, de résid. antér. variables sensibles grossières (± 12 postes) individus dans le désordre

4 4 Un rappel : la diffusion du RP99 (2) 3) Les 2 fichiers détail au 1/1 et au 1/4 complets non diffusables hors de l’INSEE mais tabulables au début, tabulations Beyond ensuite, programmation en SAS (PSM) gratuit pour les chercheur passant par l’ADISP totale liberté dans la conception des tableaux … … à la condition de respecter les règles de zonages propres aux variables sensibles

5 5 Un rappel : la diffusion du RP99 (4) Au final, un dispositif qui satisfait les besoins d’une grande majorité des chercheurs un recours ultime : les PSM les 2 regrets : l’îlot les variables sensibles à l’infra-TRIRIS

6 6 Trois évolutions vont converger et changer profondément les conditions de diffusion des données issues du RP - Un nouveau recensement le cycle de 5 ans les 2 procédures selon la taille de la commune les 2 fichiers annuels : EAR et RP … sans compter les changements de concepts - Une nouvelle diffusion - Une nouvelle règle du secret statistique

7 7 Une nouvelle diffusion (1) 1) Des collections de tableaux standards Chiffres-clés - 6 tableaux, de 60 à 160 variables par tableau Tableaux détaillés - 50 tableaux, de 10 à 350 var. par tab. Données infracommunales - 5 tableaux, de 50 à 100 var./tab nomenclatures de 2-10 à 30-50 postes croisements à 2 variables rien sur les flux ou les variables d’origine Flux de mobilités – 6 tableaux de 3 à 5 variables flux de ≥ 100 individus entre 2 communes indicateurs de migration en 2 postes par communes

8 8 Une nouvelle diffusion (2) 1) Des collections de tableaux standards (suite) On a perdu des collections Vie politique (circonscriptions législatives, cantons) Politique de la ville (ZUS) Localisations fine (îlots) Données rétrospectives (profils, références) Heureusement, pour les IRIS et les ZUS, il y a aussi Les données urbaines infra-communales par quartier données issues de sources non censitaires … et des RP 9 à 10 tableaux avec 4 à 45 variables par tableaux Pour résumer : Des tableaux beaucoup moins détaillés Des tableaux abandonnés

9 9 Une nouvelle diffusion (3) 2) Des fichiers détail diffusables Logement (fichier principal) variables localisation, immeuble, logement + ménage Individus par régions (fichier complémentaire) nomenclatures très détaillées (mais nationalité en 45 postes) mais seulement région et indicateurs de mobilité Individus par cantons-villes (fichier complémentaire) zonage du lieu de résidence non standard seulement indicateurs de mobilité nomenclatures peu détaillées (CS8 et nationalité en 2 postes) Individus mobilités études / travail / résidence (fichier complémentaire) localisation de la mobilité concernée à la commune seulement indicateurs pour les autres mobilité peu de variables et variables peu détaillées

10 10 Une nouvelle diffusion (4) 2) Des fichiers détail diffusables (suite) Pour résumer, des améliorations … plus de fichiers détail un fichier Logement plus riche des fichiers Mobilités plus riches … des reculs peu de nomenclatures très détaillées quasi disparition des différentes localisations segmentation des thèmes il n’y a plus de fichier complet, quel qu’en soit le taux de sondage

11 11 Une nouvelle diffusion (4) 3) Des fichiers détail non diffusables hors de l’INSEE, mais tabulables (PSM) À présent, il y en a 5 Logement (fichier principal) Logement (fichier complémentaire) Famille (fichier complémentaire) Individus (fichier principal) Individus (fichier complémentaire) C’est-à-dire qu’il n’y a plus les 2 fichiers Individus complets segmentation des thèmes logements-ménages / familles / individus variables logement seulement dans le fichier Logement disparition des variables décrivant les individus exemplaires PRM et son conjoint, PRF, père et mère de famille seulement la commune de résidence actuelle, absence des variables pour les autres localisations pas d’IRIS observations dans le désordre

12 12 Une nouvelle règle du secret statistique (1) qui modifie complètement l’utilisation des PSM Aucune case du tableau ne doit comporter entre 1 et 3 unités observées: soit un effectif de 10 au minimum si la population correspond à un sondage de 40 %, soit un effectif de 16 au minimum si la population correspond à un sondage au quart. Éviter autant que possible des distributions trop concentrées (par exemple, 80 % ou 90 % des unités dans une case d’une ligne, d’une colonne ou d’un tableau) Par unité, il faut entendre individu, famille, ménage ou logement selon le fichier tabulé

13 13 Une nouvelle règle du secret statistique (2) Elle s’applique en plusieurs étapes Pour un tableau donné, l’INSEE va d’abord 1) calculer le rapport nbre d’unités / nbre de cases et il ne peut être inférieur à 50 % 2) calculer le rapport nbre de cases masquées / nbre de cases et il ne peut être supérieur à 50 % Enfin, le chercheur peut choisir 3) de conserver le tableau avec les cases masquées ou de demander un autre tableau

14 14 Une nouvelle règle du secret statistique (3) Si l’on prend les 45 demandes de PSM réalisées en 2009 pour l’ADISP 15 tableaux auraient été refusés dès la 1ère étape 27 tableaux auraient été refusés au terme de la 2ème étape 1 seul tableau n’aurait eu aucune case masquée Une demande aussi simple que le tri à plat du pays de naissance en 200 postes France entière et croisé avec aucune autre variable on obtient déjà 5 ou 6 cases masquées

15 15 Une nouvelle règle du secret statistique (4) On voit bien que la plupart des demandes posées par les chercheurs qui veulent croiser plusieurs variables qui veulent des résultats par zones géographiques fines qui veulent des nomenclatures fines afin de les agréger selon leurs besoins afin de les analyser avec des procédures appropriées vont presque toutes contenir des cases masquées à moins d’avoir été directement refusées

16 16 Les chercheurs sont désormais condamnés à des démarches sans fin avec l’INSEE pour mettre au point des demandes qui minimisent le nombre de cases masquées Le recours au CASD n’est pas une solution (Centre d’Accès Sécurisé aux Données) C’est une procédure lourde Qui n’a pas été conçue pour réaliser des tabulations … … tabulations qui finalement doivent obéir aux mêmes règles ! Et ces nouvelles règles du secret statistique s’appliquent désormais aux RP antérieurs

17 17 On est dans une situation intenable - L’évolution de l’offre des produits issus du RP rend le recours aux PSM incontournable - La nouvelle règle portant sur le secret statistique rend les PSM de facto inaccessibles

18 18 Que peut faire le chercheur ? 1) Espérer un changement de la règle du secret statistique Prendre en compte la finesse du zonage géographique ? Sera-ce possible et quand ? 2) Construire des tableaux qui minimisent le nbre de cases masquées Exercice laborieux et interminable … … surtout sans disposer des fichiers détail pour les tester (sauf à passer par le CASD) 3) Faire avec Considérer que le masquage est déjà une information de 1 à 3 unités

19 19 Faire avec ? - Peut-on alors envisager de calculer des totaux, marginaux et général ? - Peut-on alors envisager de calculer des pourcentages et toutes les statistiques des tableaux de contingence ? - Peut-on envisager de se servir de tels tableaux pour des analyses statistiques plus élaborées ? C’est la question posée aux statisticiens

20 20 Merci de votre attention


Télécharger ppt "1 Société française de Statistique Groupe Statistique et Société Le recensement rénové de la population Le RP : tabulations et secret statistique, que."

Présentations similaires


Annonces Google