Olivier Dupriez, Banque mondiale Tunis, Avril 2005 Quelques commentaires sur différents aspects de la diffusion des micro-données Olivier Dupriez, Banque mondiale Tunis, Avril 2005
Divers aspects… Légal Technique Ethique/déontologique Institutionnel ... et politique
Légal Principe fondamental universel: confidentialité Divergences en matière d’application Recommandations internationales (CoE/UNECE) “Données personnelles”: une notion relative (sujet identifié ou identifiable par des moyens raisonnables) Données anonymisées peuvent être diffusées légalement à des fins statistiques et de recherche (diverses techniques; pas de standard) INS doivent gérer le risque (selon le type de données, l’utilisateur, le dommage potentiel, etc.); pas de règle pour évaluer objectivement; souvent surestime INS: optimiser la diffusion des micro-données (maximisation sous contrainte)
Technique Données non documentées: inutiles Données mal documentées (la majorité): risque Recommandation: le standard international “Data Documentation Initiative’ (DDI) Une liste d’ éléments (“tout sur l’enquête”), une structure standardisée au format XML pour l’échange, la diffusion et la préservation des meta-données Outils disponibles pour utilisation simple et bon marché (le “Data Dissemination Toolkit” de la Banque mondiale)
Ethique/déontologique Déontologie de l’utilisateur Respecter les interdictions et obligations (non transfert, utilisation à des fins de recherche/statistique uniquement, citation, feedback au producteur Feedback: l’INS fournit un produit de grande valeur et s’expose au risque d’être critiqué. Le chercheur doit faire preuve de la même générosité et du même courage en rendant publics ses inputs et outputs (“replication standard”)
Institutionnel La diffusion des micro-données peut rendre floue la distinction entre données officielles et non-officielles Importance pour l’INS d’analyser ses données Contre le monopole de l’accès aux données, mais en faveur d’un “droit de première publication”
Conclusion Diffuser les micro-données non confidentielles est un impératif pour un système statistique moderne, qui impose: une politique transparente (pas “ad hoc”), définissant notamment les droits et obligations des utilisateurs des mécanismes appropries pour la documentation, la préparation (anonymisation), la préservation, et la distribution un mécanisme de gestion du feedback le développement de la capacité en matière d’archivage et diffusion des micro-données