La nature des données numériques Sous-groupe de travail sur les fichiers de données numériques Richard Boily Atelier IDD/CREPUQ Québec, le 5 février 1998:

Slides:



Advertisements
Présentations similaires
Qu’est-ce qu’une problématique ? (1)
Advertisements

METHODOLOGIE.
CYCLE DE VIE D’UNE ENQUÊTE
Objet et définition de la comptabilité de gestion
Projet ORI Outil de Référencement et dIndexation Colloque International lUniversité à lÈre du Numérique Atelier B8 – Le processus de partage des ressources.
CREPUQ - Atelier sur les données numériques 1 Les données numériques : atelier d'information (et de démystification) - Le rôle des données numériques Québec,
Crepuq- Atelier sur les données numériques La documentation sur les données Une définition –les données sur les données –informations sur l enquête –informations.
CREPUQ - Atelier sur les données numériques L Initiative de Démocratisation des Données (IDD) Nouveau modèle d accès aux données de Statistique Canada.
Le Continuum daccès pour les produits de Statistique Canada par Sage Cram Le 30 avril 2004 Atelier de Formation IDD Université de Montréal.
les déterminants de la santé
Sociologie de l’action sociale contre la sociologie du fait social
LE QUESTIONNAIRE D’ENQUETE
ENQUETE ANNUELLE DENTREPRISES DANS LE SECTEUR DU COMMERCE (EXERCICE 2004) ROYAUME DU MAROC HAUT COMMISSARIAT AU PLAN DIRECTION DE LA STATISTIQUE.
POLITIQUES ET PROCEDURES DARCHIVAGE DES DONNEES AU BURUNDI.
Collecte de données F. Kohler.
Echantillonnage Professeur Francis GUILLEMIN > Ecole de santé publique - Faculté de Médecine.
Les TESTS STATISTIQUES
DEME - La méthode d’enquête – introduction
Les TESTS STATISTIQUES
Dr DEVILLE Emmanuelle J D V 12/07/2006
1 Introduction : Quelles méthodes & techniques de collectes de données ? => Construction méthodologique à partir dinstruments empruntés à divers domaines.
LE RECUEIL D’INFORMATION SUR LA DEMANDE
CREPUQ - Atelier sur les données numériques 1 Les données numériques : atelier d'information (et de démystification) - Introduction Québec, le 5 février.
Traitement de données socio-économiques et techniques d’analyse :
Chapitre 10 : La veille mercatique et commerciale
Les variables au plan fonctionnel
Programmes de maîtrise et de doctorat en démographie Modèles de risque et de durée Cours 2 Séance du 17 janvier 2014 Benoît Laplante, professeur.
La communication : notions de base
Howell, Chap. 1 Position générale
Comprendre la variation dans les données: Notions de base
Le mythe et la pensée magique (cours 2A)
Ce qui disparait du nouveau programme Introduction « La démarche des sciences des sciences économiques et sociales » (1 semaine) « La famille, une institution.
Introduction à la recherche en science politique
Analyse de marchés SÉANCE 6
RECHERCHE COMMERCIALE
Objectifs du chap. 5: Plans de recherche classiques
Objectifs Chapitre 7: variables indépendantes et dépendantes
Objectifs Chapitre 2: variables
Paradigme Constructivisme social
Le processus scientifique
2. La structure de la population active
Master 1 – Sciences du Langage –
Les Techniques d’enquête quantitative
Que sont les fichiers de mobilité de l’INSEE?
LA DEMARCHE DE RECHERCHE
Association évaléco. Buts de l’association évaléco  Elaborer une méthode permettant le diagnostic des pratiques des structures désirants s’inscrire dans.
Comment analyser une situation de travail ?
Les 6 Concepts de la Géographie Géo-Planétaire 12
Modelisation/ Analyse - Equations differentielles
- 1 - Christiane Bétie Directrice de la surveillance, p.i. Le traitement des plaintes à la Commission d’accès à l’information du Québec Réunion de l’AFAPDP.
LA RECHERCHE B. GOUNAND F. GAILLARD.
Études de Marché MBA Hiver 2006 SÉANCE 3: LES DONNÉES PRIMAIRES: MÉTHODES QUALITATIVES.
JEAN-MARC FONTAN SOC-1101 COURS 4
ECOLE DES HAUTES ETUDES COMMERCIALES
Composantes de base en démographie
Introduction à la recherche en science politique
ECOLE DES HAUTES ETUDES COMMERCIALES
Bilan du cours Information Spécialisée M1 RETIC. Objectifs du cours (annoncés) Acquérir une culture informationnelle en SIC ; Acquérir une culture informationnelle.
Claude Matricon ("le marketing du réel") propose une classification qui permet de distinguer les 4 différents marchés dont dépend l'entreprise :  marché.
Epicure VIème partie. Nous avons remarqué que notre connaissance de la vérité était dépendante de nos sens. Mais tout n’est pas si simple. S’il y a effectivement.
INTERVENTION NOM DE L’ETABLISSEMENT VILLE Classe de NIVEAU DATE Séance 2 Pôle de développement de l’Économie Sociale et Solidaire du Pays de Cornouaille.
Bienvenue!  Professeur : Dr. David Beaudoin.  Disponibilité : Mardi 15h30-17h local  Disponibilité d’Antoine Gautier: Mardi et Jeudi à compter.
ECHANTILLONAGE ET ESTIMATION
1 Ménages et familles : le recensement et les autres sources de données Laurent Toulemon Le recensement rénové de la population : résultats statistiques.
Bienvenue au cours MAT-350 Probabilités et statistiques.
CONCEPTS FONDAMENTAUX Concepts liés au développement humain
Chapitre 5 Interprétation des données d’enquête 1.
STATISTIQUE DESCRIPTIVE
Des variables et des données. Dans le domaine de la statistique le mot variable signifie une idée différente de celle dans l’algèbre ou les fonctions.
Transcription de la présentation:

La nature des données numériques Sous-groupe de travail sur les fichiers de données numériques Richard Boily Atelier IDD/CREPUQ Québec, le 5 février 1998: Montréal, le 6 février 1998

Sous-groupe de travail sur les fichiers de données numériques2 Nature des données numériques : de quoi va-t-on parler?

Sous-groupe de travail sur les fichiers de données numériques3

4

5 Snif!

Sous-groupe de travail sur les fichiers de données numériques6

7

8

9

10

Sous-groupe de travail sur les fichiers de données numériques11

Sous-groupe de travail sur les fichiers de données numériques12 Nature des données numériques : de quoi va-t-on parler?

Sous-groupe de travail sur les fichiers de données numériques13 Nature des données numériques Ce que sont les données numériques La collecte des données Les formes et les caractéristiques La documentation LInitiative de démocratisation des données (IDD) - Statistique Canada

Sous-groupe de travail sur les fichiers de données numériques14 Les données numériques se situent au cœur du processus dinformation. Nature des données numériques : de quoi parle-t-on? Information Production Utilisation

Sous-groupe de travail sur les fichiers de données numériques15 Nature des données numériques : de quoi parle-t-on? Peu importe le sujet, les données numériques peuvent être associées à différents points de vue ou à diverses approches. Avortement : éthique ou religieux littéraire médical scientifique social

Sous-groupe de travail sur les fichiers de données numériques16 Nature des données numériques : de quoi parle-t-on? Les changements climatiques, le tourisme et … le développement régional Les médias et le développement social Les phénomènes religieux La qualification et lemploi La consommation de drogue Lunion libre

Sous-groupe de travail sur les fichiers de données numériques17 Nature des données numériques : de quoi parle-t-on? Une association de protection des consommateurs évalue la durabilité de différentes marques dampoules électriques. Dans une étude sociologique, on sintéresse à leffet des programmes dinformation et de sensibilisation aux méthodes de contraception. Pour établir un portrait de la situation, un sondage dopinion est réalisé parmi les étudiants de luniversité sur la question de lavortement. La vie de couple sest considérablement modifiée au Canada au cours des dernières décennies. Comment le phénomène de lunion libre modifie-t-il les comportements?

Sous-groupe de travail sur les fichiers de données numériques18 Nature des données numériques : de quoi parle-t-on? Définition : « La statistique est létude des variations observables. Sans variations, il ny a pas de statistique et sans observations, encore moins. –Observations : de la durée de vie des ampoules (du mouvement des planètes, des espèces vivantes) des opinions (sur lavortement) des phénomènes sociaux (vie de couple)

Sous-groupe de travail sur les fichiers de données numériques19 Nature des données numériques : de quoi parle-t-on? Définition : « La statistique est létude des variations observables. Sans variations, il ny a pas de statistique et sans observations, encore moins. Cest à laide dobservations quon appréhende le monde qui nous entoure, autant physique et biologique quéconomique et social. Et cest à partir dobservations de phénomènes et de relations entre ces observations que sélaborent des hypothèses explicatives qui se transforment éventuellement en théories. Le mot théorie ne nous vient-il pas du grec theôrein qui signifie précisément « observer » ».

Sous-groupe de travail sur les fichiers de données numériques20 Nature des données numériques : de quoi parle-t-on? « La statistique est létude des variations observables. Sans variations, il ny a pas de statistique et sans observations, encore moins ». Le but de toute étude statistique est dobtenir une information significative à partir de données qui, au premier abord, peuvent sembler disparates. La première étape de la recherche dinformation est donc la cueillette de données.

Sous-groupe de travail sur les fichiers de données numériques21 La collecte de données On recueille généralement ces données par le biais : dobservations des phénomènes naturels : –enregistrement quotidien et en plusieurs endroits des données météorologiques.

Sous-groupe de travail sur les fichiers de données numériques22 La collecte de données On recueille généralement ces données par le biais : –dobservations des phénomènes naturels –dexpériences scientifiques : en agriculture, évaluation de nouveaux fertilisants test de qualité des produits industriels (ampoules électriques)

Sous-groupe de travail sur les fichiers de données numériques23 La collecte de données On recueille généralement ces données par le biais : dobservations des phénomènes naturels dexpériences scientifiques denquêtes et de sondages –recensements –procédures dadmission –indices boursiers et autres statistiques financières –bilans financiers annuels des entreprises –comptes nationaux des gouvernements –sondages dopinion (politiques, comportements personnels, consommation, habitudes sexuelles, physiques, culturelles)

Sous-groupe de travail sur les fichiers de données numériques24 La collecte de données : notion de variable statistique À chaque mesure que lon veut prendre, ou à chaque question spécifique que lon pose, correspond une variable statistique sil y a effectivement moyen de prendre des mesures ou dobtenir des réponses, cest-à- dire de faire des observations.

Sous-groupe de travail sur les fichiers de données numériques25 La collecte de données : notion de variable statistique Définition : « Une variable statistique est une caractéristique susceptible de variations observables. » La mesure dune caractéristique peut varier : dun moment à lautre; dun lieu à lautre; dun objet à lautre (ampoules). La réponse à une question concernant une caractéristique peut varier : dune personne à une autre (étudiants et étudiantes); dun organisme à un autre.

Sous-groupe de travail sur les fichiers de données numériques26 La collecte de données : notion de variable statistique Sil y a variations, cela signifie quune variable peut prendre plusieurs valeurs. On entend explicitement par valeurs les mesures distinctes dune caractéristique donnée. On distingue : –les valeurs possibles dune variable, i.e. les résultats possibles a priori, et –les valeurs observées, i.e. les résultats observés a posteriori.

Sous-groupe de travail sur les fichiers de données numériques27 La collecte de données : notion de variable statistique Valeurs possibles : Durées des ampoules électriques : un nombre positif quelconque. Opinions sur lavortement : pour, contre, abstention. Mode de vie familiale : –marié, sans enfant –marié, avec enfant(s) –en union libre, sans enfant –en union libre, avec enfant(s) –divorcé et remarié, sans enfant –etc...

Sous-groupe de travail sur les fichiers de données numériques28 La collecte de données : notion de population Nous avons établi précédemment quune variable statistique peut varier dune personne à une autre, dun objet à un autre, dune entreprise à une autre, dun lieu à un autre, dun moment à un autre. On dira simplement dun individu à un autre et, dans nos exemples, un individu sera : –une ampoule électrique –un étudiant –une personne (susceptible de vivre en union)

Sous-groupe de travail sur les fichiers de données numériques29 La collecte de données : notion de population Dans la définition complète dune variable statistique, on doit préciser non seulement pour quel type dindividu, mais aussi pour quel groupe dindividus on considère cette variable. Lensemble des individus considérés pour fins dobservations est appelé une population. –Les ampoules électriques de marque x, y, z... –Les étudiants de lUniversité... –Les personnes (susceptibles de vivre en union) au Canada

Sous-groupe de travail sur les fichiers de données numériques30 Formes et caractéristiques des données : microdonnées Données brutes ou microdonnées : résultats immédiats dobservations de variables statistiques qui nont été soumis à aucun traitement, ni à aucune modification. Lunité danalyse est alors lindividu.

Sous-groupe de travail sur les fichiers de données numériques31 Formes et caractéristiques des données : microdonnées

Sous-groupe de travail sur les fichiers de données numériques32 Formes et caractéristiques des données : microdonnées

Sous-groupe de travail sur les fichiers de données numériques33 Formes et caractéristiques des données : microdonnées

Sous-groupe de travail sur les fichiers de données numériques34 Formes et caractéristiques microdonnées

Sous-groupe de travail sur les fichiers de données numériques35 La nature des données numériques (rappel et précision) La statistique est létude des variations observables et mesurables; les données représentent des mesures (observations) dattributs ou de variables (de nature sociale ou économique); les données sont codées numériquement, et elles sont stockées dans une structure de fichier.

Sous-groupe de travail sur les fichiers de données numériques36 Formes et caractéristiques microdonnées

Sous-groupe de travail sur les fichiers de données numériques37 Formes et caractéristiques des données : données agrégées Contrairement aux données brutes, les données agrégées sont présentées après avoir fait lobjet dun traitement statistique quelconque, du plus simple au plus complexe.

Sous-groupe de travail sur les fichiers de données numériques38 Formes et caractéristiques des données : données agrégées Les données sont traitées pour permettre : –de repérer un chiffre (une valeur) ou un tableau pré-généré; –de générer un nouveau tableau ou de procéder à une analyse (i.e. voir la relation entre différentes variables).

Sous-groupe de travail sur les fichiers de données numériques39 Formes et caractéristiques : données agrégées

Sous-groupe de travail sur les fichiers de données numériques40 Formes et caractéristiques : données agrégées

Sous-groupe de travail sur les fichiers de données numériques41 Formes et caractéristiques : données agrégées

Sous-groupe de travail sur les fichiers de données numériques42

Sous-groupe de travail sur les fichiers de données numériques43 Typologie des données Type denquête –enquête transversale (ponctuelle) –Ex. : enquête. Sur la famille de 1984 –enquête répétée cyclique (sujet répété / échantillons différents) –ex. : enquête Sociale générale rotative (sujet répété / remplacement partiel de léchantillon) longitudinale (sujet répété sur le même échantillon) –ex. : enquête sur la dynamique du travail et du revenu

Sous-groupe de travail sur les fichiers de données numériques44 Typologie des données Type denquête Format de diffusion –microdonnées –données agrégées par lieux géographiques par caractéristiques sociales dans le temps

Sous-groupe de travail sur les fichiers de données numériques45 Source pour les concepts sur la statistique Statistique : concepts et méthodes / Sabin Lessard et Monga. Montréal : Presses de lUniversité de Montréal. 1993