La gamme de produits de l’IDD Aperçu des ressources pour accéder à la collection de l’IDD Chantal Ripp June 14
Statistics Canada • Statistique Canada Qui peut utiliser la collection de l’IDD? Qui Pourquoi l’utiliser la collection de l’IDD? Pourquoi C’est quoi la collection de l’IDD? Quoi Où trouver la collection de l’IDD? Où Comment y accéder la collection de l’IDD? Comment Statistics Canada • Statistique Canada 27/06/2018
Statistics Canada • Statistique Canada Qui? La Collection de l’IDD Les étudiants, les professeurs, le corps professionnel et les chercheurs des institutions membres Accès Sur le campus (où via proxy) pour les ressources électronique (SDW, Nesstar) Par la personne-ressource de l’IDD (accès par TEF) Statistics Canada • Statistique Canada 27/06/2018
Statistics Canada • Statistique Canada Pourquoi La collection de l’IDD Les données ne sont pas disponibles sur le site de Statcan Si les microdonnées sont requises On trouve tous les produits standard de Statcan Statistics Canada • Statistique Canada 27/06/2018
Statistics Canada • Statistique Canada Quoi La collection de l’IDD L’IDD offre accès aux produits standard de Statistique Canada Ces données sont numérisées et organiser dans un fichier électronique, qui inclus Fichiers de microdonnées Fichiers géographiques Base de données Données agrégées Standard electronic product is an “off the shelf’” product available to the public Statistics Canada • Statistique Canada 27/06/2018
Statistics Canada • Statistique Canada La collection de l’IDD La collection de l’IDD inclus des produits “spéciaux” pour les institutions membres Fichier des codes postauxMO fichiers de recherche analytique de la Base de données sur les congés des patients (BDCP) de l'Institut canadien d'information sur la santé (ICIS) Have some “special” products just for DLI members who have signed the appendices in the DLI licence Statistics Canada • Statistique Canada 27/06/2018
Statistiques vs données Faits/chiffres Établish à partir des données Données fichiers numériques créés et organisés en vue du traitement et de l'analyse Nécessite un traitement Les statistiques sont les faits et les chiffres qui ont été établis à partir des données. Elles peuvent prendre la forme de publications électroniques, de tableaux électroniques ou de bases de données. Les données sont des fichiers numériques créés et organisés en vue du traitement et de l'analyse. Il existe deux types de données – agrégées et microdonnées. Les données agrégées et les microdonnées offrent à l'utilisateur un plus grand contrôle concernant les variables disponibles pour l'analyse. Les statistiques ont été établis à partir des données Source : DLI Orientation: Concepts by Chuck Humphrey, University of Alberta, 2004 Statistics Canada • Statistique Canada 27/06/2018
Données agrégées vs microdonnées Les données agrégées correspondent à des résumés statistiques présentés dans une structure de fichier de données particulière Les microdonnées (données brutes) sont des données observées directement ou recueillies auprès d'une unité d'observation particulière 000001353594362261605241223332233132221226966966666666666666666666111142122081029.732226622622222296669662266622222222222222216666612960402030105000000000001010122666612122222222222222122221222222207126666666626666666666666666666666666662666666666666666666666211311231323112326666603010401010129622222222226666112222000000111113666666666666666266666666666666661266666666666666666666666666666666666666662266666666666666662666666666266966666666666666616666666666626966666666696666666611016666666666666661112612244222222203221111122212222121266969696000.0000.3000.4000.0000.0001.4002.2111222222222122222222222660053001499669966996699669966996699669966996600239966996699669966996699669966996699669966996699660101200.210033231069606050729696969696166666466666666662966666666269696969666666666626960266666696699.9962666666666296969666969.96266666696210339699699696666969966666605699626669662666666266666666666266666666666666666662622112222666610202299699699699699699699666666666666666699610000001121422329612329612629629622969.9699.662666666699.662696969699.6626696969696969696969696969696969696969696969696969696969662669669696966966969669696669669696612266966666666666666266666666666666666666699966662666666666666666666666666996296969696129666666626666666666666696969626666666666666662969.969696126299699699699699699699699696962612611442000021211122073035116266666612455041333200124.00 Source : CCHS 1.2 and Chuck Humphrey, University of Alberta Les données agrégées correspondent à des résumés statistiques présentés dans une structure de fichier de données particulière, qui permet l'analyse informatique subséquente (c'est-à-dire le traitement des données). Dans un fichier de données agrégées, les variables ne permettent pas de générer des totalisations croisées des personnes parce que l'unité d'observation initiale a été remplacée par le temps, la géographie ou une dimension sociale. Les données agrégées ne contiennent pas toutes les combinaisons de variables qu'un utilisateur pourrait vouloir effectuer à partir des microdonnées. Par exemple, un chercheur pourrait vouloir déterminer si la consommation d'alcool et le jeu sont corrélés et examiner si ces variables diffèrent entre les hommes et les femmes, selon le groupe d'âge, et si les résultats varient au Canada. Même si les données de l'Enquête sur la santé dans les collectivités canadiennes (ESCC) 3.1 sont recueillies selon la localisation géographique du répondant, le sexe, l'âge, l'Indice canadien du jeu excessif et la consommation d'alcool, ces combinaisons de variables peuvent ne pas avoir été utilisées pour créer un produit de données agrégées. C’est pour cette raison qu’on utilise les microdonnées… Les microdonnées sont des données observées directement ou recueillies auprès d'une unité d'observation particulière. C'est donc dire qu'un fichier de microdonnées comprend des données brutes organisées, les lignes représentant une unité de mesure particulière (habituellement une personne, un ménage ou une famille) et l'information concernant les lignes correspondant aux valeurs des variables. Pour traiter les microdonnées il faut utilier de logiciels d’analyse statistique (eg: SAS, SPSS, STATA) Statistics Canada • Statistique Canada 27/06/2018
Fichier de microdonnées à grande diffusion (FMGD) Chaque fichier de microdonnées à grande diffusion repose sur un fichier principal correspondant (contient toutes les réponses de chaque répondant) Les modifications apportées aux fichiers principaux (p. ex., le regroupement de variables ; la suppression de variables) afin de render les fichiers anonymes Plus de 1,300 FMGD dans la collection de L’IDD Enquête sociale générale (ESG) Euquête auprès des peoples autochtones (EAPA) Enquête sur la santé dans les collectivités canadiennes (ESCC) J’ai lu ça dans “Le Quotidien”… par Michael Sivyer (Bulletin de l’IDD, Automne 2000, Vol.4, Numéro 2) Les modifications apportées par Statistique Canada avant la diffusion du FMGD garantissent que les risques d'enfreindre la confidentialité ont été supprimés. Les modifications apportées aux fichiers principaux pour les convertir en FMGD peuvent inclure : le regroupement de variables (p. ex., groupes d'âge au lieu d'âges individuels); le regroupement en une seule variable (p. ex., plusieurs questions sur la langue regroupées en une seule variable sur la langue pour l'analyse); la suppression de variables (même si la variable fait partie du fichier principal, elle n'apparaît pas dans le fichier à grande diffusion); l'élimination des observations extrêmes (élimination des exceptions – souvent utilisée pour revenu). En utilisant ces techniques afin de rendre les fichiers anonymes, la combinaison de variables ne produira pas de résultats permettant d'identifier un répondant. Les FMGD proviennent des quelques enquêtes sociales – nous n’avons pas des FMGD des enquêtes des entreprises. Statistics Canada • Statistique Canada 27/06/2018
Statistics Canada • Statistique Canada Comment mode d’accès Accès restraint à l’information de l’IDD Serveur de données Web (SDW) de Beyond 20/20 de l'IDD Nesstar Site TEF Autres <odesi> (OCUL – Scholar’s Portal) SDA (University of Toronto) CHASS (University of Toronto) Statistics Canada • Statistique Canada 27/06/2018
Statistics Canada • Statistique Canada Où There are third party distributions tools, Odesi and Equinox among others, which provide access to DLI data products. In order to access the DLI products through those mode of access, you need to be a DLI member Statistics Canada • Statistique Canada 27/06/2018
Statistics Canada • Statistique Canada 27/06/2018
Tous les produits de l’IDD Links to the product in the appropriate application Statistics Canada • Statistique Canada 27/06/2018
Statistics Canada • Statistique Canada SDW de l’IDD Compris données agrégées de l’IDD Recognaissance par adresse IP un afficheur de tableaux multidimensionnel sur le Web Parmet la diffusion et manipulation des tableaux B2020 (.ivt) sans avoir à installer un logiciel The Beyond 20/20 Web Data Server is a web based multidimensional table viewer which allows for the dissemination of data over the web in a variety of formats. Statistics Canada • Statistique Canada 27/06/2018
Statistics Canada • Statistique Canada Nesstar Portail sur le Web pour l’exploration, l’extraction et l’analyse des microdonnées Recognaissance par adresse IP Parmet Parmet de traité les microdonnées sans avoir à utiliser de logiciel d’analyse statistique (SAS or SPSS) Bienvenue dans le portail de données Nesstar, un outil Web pour l'exploration, l'extraction et l'analyse des données en sciences sociales. Le portail de données Nesstar est composé de deux catalogues de données de Statistique Canada : les fichiers de microdonnées à grande diffusion (FMGD) les fichiers maîtres des centres de données de recherche (CDR) Les utilisateurs peuvent chercher et cerner des variables d'intérêt dans les fichiers de microdonnées et déterminer lesquels des FMGD ou des fichiers maîtres répondront le mieux à leurs besoins pour la recherche. Les métadonnées qui figurent dans cet outil ne représentent pas l'ensemble de la collection de FMGD ou de fichiers maîtres des CDR en raison du temps qu'il faut pour baliser un fichier selon les normes relatives aux métadonnées de la Data Documentation Initiative (DDI) et de l'intégrer à l'outil. www62.statcan.ca Statistics Canada • Statistique Canada 27/06/2018
Statistics Canada • Statistique Canada TEF Seulement les personnes-ressources ont accès Compris tous la collection de l’IDD (incluant le FCCP et les BDCP) Requis d’une application FTP (p.ex., WS_FTP Pro, FileZilla, etc.) MAD_DLI MAD_DLI_CIHI MAD_DLI_PCCF When files are released, they are placed on the EFT within a short delay. Files are prepared in statistical packages and formatted (data; doc) for distribution. Although not always intuitive to the first time user, the EFT directory structure is quite logical. The same directory structure has been used for all recent additions to the DLI collection. The readme file is a very useful tool to help users understand the set-up of each folder. The initial screen upon entering the DLI EFT site provides a listing of folder names. The folders are named according to their corresponding survey acronym and are sorted alphabetically. Statistics Canada • Statistique Canada 27/06/2018
Statistics Canada • Statistique Canada DLI Website Site TEF : MAD_DLI recensement (agri. et pop.) géo Autres-produits enquêtes Rapports Semestriels Procès verbaux du CCE MAD_DLI MAD_DLI_CIHI MAD_DLI_PCCF When files are released, they are placed on the EFT within a short delay. Files are prepared in statistical packages and formatted (data; doc) for distribution. Although not always intuitive to the first time user, the EFT directory structure is quite logical. The same directory structure has been used for all recent additions to the DLI collection. The readme file is a very useful tool to help users understand the set-up of each folder. The initial screen upon entering the DLI EFT site provides a listing of folder names. The folders are named according to their corresponding survey acronym and are sorted alphabetically. Statistics Canada • Statistique Canada 27/06/2018
Statistics Canada • Statistique Canada DLI Website Trousse de survie de l’IDD Nesstar is a web-based data exploration, extraction and analysis tool. It lets you search for survey variables across the collection, and supports basic tabulation and analysis online. It also allows for the downloading of the PUMF files into statistical software for further analysis. Statistics Canada • Statistique Canada 27/06/2018
Statistics Canada • Statistique Canada DLI Website Trousse de survie de l’IDD Nesstar is a web-based data exploration, extraction and analysis tool. It lets you search for survey variables across the collection, and supports basic tabulation and analysis online. It also allows for the downloading of the PUMF files into statistical software for further analysis. Statistics Canada • Statistique Canada 27/06/2018
Statistics Canada • Statistique Canada Encore perdue? Consulter la trousse de survie de l’IDD en ligne Contacter l’équipe de l’IDD Statistics Canada • Statistique Canada 27/06/2018
Statistics Canada • Statistique Canada DLI Collection Merci statcan.stcinet-dli-idd.statcan@canada.ca Statistics Canada • Statistique Canada 27/06/2018