La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

La nature des données numériques Sous-groupe de travail sur les fichiers de données numériques Richard Boily Atelier IDD/CREPUQ Québec, le 5 février 1998:

Présentations similaires


Présentation au sujet: "La nature des données numériques Sous-groupe de travail sur les fichiers de données numériques Richard Boily Atelier IDD/CREPUQ Québec, le 5 février 1998:"— Transcription de la présentation:

1 La nature des données numériques Sous-groupe de travail sur les fichiers de données numériques Richard Boily Atelier IDD/CREPUQ Québec, le 5 février 1998: Montréal, le 6 février 1998

2 Sous-groupe de travail sur les fichiers de données numériques2 Nature des données numériques : de quoi va-t-on parler?

3 Sous-groupe de travail sur les fichiers de données numériques3

4 4

5 5 Snif!

6 Sous-groupe de travail sur les fichiers de données numériques6

7 7

8 8

9 9

10 10

11 Sous-groupe de travail sur les fichiers de données numériques11

12 Sous-groupe de travail sur les fichiers de données numériques12 Nature des données numériques : de quoi va-t-on parler?

13 Sous-groupe de travail sur les fichiers de données numériques13 Nature des données numériques Ce que sont les données numériques La collecte des données Les formes et les caractéristiques La documentation LInitiative de démocratisation des données (IDD) - Statistique Canada

14 Sous-groupe de travail sur les fichiers de données numériques14 Les données numériques se situent au cœur du processus dinformation. Nature des données numériques : de quoi parle-t-on? Information Production Utilisation

15 Sous-groupe de travail sur les fichiers de données numériques15 Nature des données numériques : de quoi parle-t-on? Peu importe le sujet, les données numériques peuvent être associées à différents points de vue ou à diverses approches. Avortement : éthique ou religieux littéraire médical scientifique social

16 Sous-groupe de travail sur les fichiers de données numériques16 Nature des données numériques : de quoi parle-t-on? Les changements climatiques, le tourisme et … le développement régional Les médias et le développement social Les phénomènes religieux La qualification et lemploi La consommation de drogue Lunion libre

17 Sous-groupe de travail sur les fichiers de données numériques17 Nature des données numériques : de quoi parle-t-on? Une association de protection des consommateurs évalue la durabilité de différentes marques dampoules électriques. Dans une étude sociologique, on sintéresse à leffet des programmes dinformation et de sensibilisation aux méthodes de contraception. Pour établir un portrait de la situation, un sondage dopinion est réalisé parmi les étudiants de luniversité sur la question de lavortement. La vie de couple sest considérablement modifiée au Canada au cours des dernières décennies. Comment le phénomène de lunion libre modifie-t-il les comportements?

18 Sous-groupe de travail sur les fichiers de données numériques18 Nature des données numériques : de quoi parle-t-on? Définition : « La statistique est létude des variations observables. Sans variations, il ny a pas de statistique et sans observations, encore moins. –Observations : de la durée de vie des ampoules (du mouvement des planètes, des espèces vivantes) des opinions (sur lavortement) des phénomènes sociaux (vie de couple)

19 Sous-groupe de travail sur les fichiers de données numériques19 Nature des données numériques : de quoi parle-t-on? Définition : « La statistique est létude des variations observables. Sans variations, il ny a pas de statistique et sans observations, encore moins. Cest à laide dobservations quon appréhende le monde qui nous entoure, autant physique et biologique quéconomique et social. Et cest à partir dobservations de phénomènes et de relations entre ces observations que sélaborent des hypothèses explicatives qui se transforment éventuellement en théories. Le mot théorie ne nous vient-il pas du grec theôrein qui signifie précisément « observer » ».

20 Sous-groupe de travail sur les fichiers de données numériques20 Nature des données numériques : de quoi parle-t-on? « La statistique est létude des variations observables. Sans variations, il ny a pas de statistique et sans observations, encore moins ». Le but de toute étude statistique est dobtenir une information significative à partir de données qui, au premier abord, peuvent sembler disparates. La première étape de la recherche dinformation est donc la cueillette de données.

21 Sous-groupe de travail sur les fichiers de données numériques21 La collecte de données On recueille généralement ces données par le biais : dobservations des phénomènes naturels : –enregistrement quotidien et en plusieurs endroits des données météorologiques.

22 Sous-groupe de travail sur les fichiers de données numériques22 La collecte de données On recueille généralement ces données par le biais : –dobservations des phénomènes naturels –dexpériences scientifiques : en agriculture, évaluation de nouveaux fertilisants test de qualité des produits industriels (ampoules électriques)

23 Sous-groupe de travail sur les fichiers de données numériques23 La collecte de données On recueille généralement ces données par le biais : dobservations des phénomènes naturels dexpériences scientifiques denquêtes et de sondages –recensements –procédures dadmission –indices boursiers et autres statistiques financières –bilans financiers annuels des entreprises –comptes nationaux des gouvernements –sondages dopinion (politiques, comportements personnels, consommation, habitudes sexuelles, physiques, culturelles)

24 Sous-groupe de travail sur les fichiers de données numériques24 La collecte de données : notion de variable statistique À chaque mesure que lon veut prendre, ou à chaque question spécifique que lon pose, correspond une variable statistique sil y a effectivement moyen de prendre des mesures ou dobtenir des réponses, cest-à- dire de faire des observations.

25 Sous-groupe de travail sur les fichiers de données numériques25 La collecte de données : notion de variable statistique Définition : « Une variable statistique est une caractéristique susceptible de variations observables. » La mesure dune caractéristique peut varier : dun moment à lautre; dun lieu à lautre; dun objet à lautre (ampoules). La réponse à une question concernant une caractéristique peut varier : dune personne à une autre (étudiants et étudiantes); dun organisme à un autre.

26 Sous-groupe de travail sur les fichiers de données numériques26 La collecte de données : notion de variable statistique Sil y a variations, cela signifie quune variable peut prendre plusieurs valeurs. On entend explicitement par valeurs les mesures distinctes dune caractéristique donnée. On distingue : –les valeurs possibles dune variable, i.e. les résultats possibles a priori, et –les valeurs observées, i.e. les résultats observés a posteriori.

27 Sous-groupe de travail sur les fichiers de données numériques27 La collecte de données : notion de variable statistique Valeurs possibles : Durées des ampoules électriques : un nombre positif quelconque. Opinions sur lavortement : pour, contre, abstention. Mode de vie familiale : –marié, sans enfant –marié, avec enfant(s) –en union libre, sans enfant –en union libre, avec enfant(s) –divorcé et remarié, sans enfant –etc...

28 Sous-groupe de travail sur les fichiers de données numériques28 La collecte de données : notion de population Nous avons établi précédemment quune variable statistique peut varier dune personne à une autre, dun objet à un autre, dune entreprise à une autre, dun lieu à un autre, dun moment à un autre. On dira simplement dun individu à un autre et, dans nos exemples, un individu sera : –une ampoule électrique –un étudiant –une personne (susceptible de vivre en union)

29 Sous-groupe de travail sur les fichiers de données numériques29 La collecte de données : notion de population Dans la définition complète dune variable statistique, on doit préciser non seulement pour quel type dindividu, mais aussi pour quel groupe dindividus on considère cette variable. Lensemble des individus considérés pour fins dobservations est appelé une population. –Les ampoules électriques de marque x, y, z... –Les étudiants de lUniversité... –Les personnes (susceptibles de vivre en union) au Canada

30 Sous-groupe de travail sur les fichiers de données numériques30 Formes et caractéristiques des données : microdonnées Données brutes ou microdonnées : résultats immédiats dobservations de variables statistiques qui nont été soumis à aucun traitement, ni à aucune modification. Lunité danalyse est alors lindividu.

31 Sous-groupe de travail sur les fichiers de données numériques31 Formes et caractéristiques des données : microdonnées

32 Sous-groupe de travail sur les fichiers de données numériques32 Formes et caractéristiques des données : microdonnées

33 Sous-groupe de travail sur les fichiers de données numériques33 Formes et caractéristiques des données : microdonnées

34 Sous-groupe de travail sur les fichiers de données numériques34 Formes et caractéristiques microdonnées

35 Sous-groupe de travail sur les fichiers de données numériques35 La nature des données numériques (rappel et précision) La statistique est létude des variations observables et mesurables; les données représentent des mesures (observations) dattributs ou de variables (de nature sociale ou économique); les données sont codées numériquement, et elles sont stockées dans une structure de fichier.

36 Sous-groupe de travail sur les fichiers de données numériques36 Formes et caractéristiques microdonnées

37 Sous-groupe de travail sur les fichiers de données numériques37 Formes et caractéristiques des données : données agrégées Contrairement aux données brutes, les données agrégées sont présentées après avoir fait lobjet dun traitement statistique quelconque, du plus simple au plus complexe.

38 Sous-groupe de travail sur les fichiers de données numériques38 Formes et caractéristiques des données : données agrégées Les données sont traitées pour permettre : –de repérer un chiffre (une valeur) ou un tableau pré-généré; –de générer un nouveau tableau ou de procéder à une analyse (i.e. voir la relation entre différentes variables).

39 Sous-groupe de travail sur les fichiers de données numériques39 Formes et caractéristiques : données agrégées

40 Sous-groupe de travail sur les fichiers de données numériques40 Formes et caractéristiques : données agrégées

41 Sous-groupe de travail sur les fichiers de données numériques41 Formes et caractéristiques : données agrégées

42 Sous-groupe de travail sur les fichiers de données numériques42

43 Sous-groupe de travail sur les fichiers de données numériques43 Typologie des données Type denquête –enquête transversale (ponctuelle) –Ex. : enquête. Sur la famille de 1984 –enquête répétée cyclique (sujet répété / échantillons différents) –ex. : enquête Sociale générale rotative (sujet répété / remplacement partiel de léchantillon) longitudinale (sujet répété sur le même échantillon) –ex. : enquête sur la dynamique du travail et du revenu

44 Sous-groupe de travail sur les fichiers de données numériques44 Typologie des données Type denquête Format de diffusion –microdonnées –données agrégées par lieux géographiques par caractéristiques sociales dans le temps

45 Sous-groupe de travail sur les fichiers de données numériques45 Source pour les concepts sur la statistique Statistique : concepts et méthodes / Sabin Lessard et Monga. Montréal : Presses de lUniversité de Montréal. 1993


Télécharger ppt "La nature des données numériques Sous-groupe de travail sur les fichiers de données numériques Richard Boily Atelier IDD/CREPUQ Québec, le 5 février 1998:"

Présentations similaires


Annonces Google