Traitement de données socio-économiques et techniques d’analyse : Claude Marois © 2012
TRAITEMENT DES DONNÉES ET TECHNIQUES D’ANALYSE : géographie population et géographie sociale Dans presque toute recherche , il y a une quantification à certaines étapes de la démarche; La quantification est une démarche pour la recherche et la compréhension de problèmes en géographie humaine; La démarche quantitative implique la mesure de phénomènes ; Mesurer est une opération visant l’extraction de certaines propriétés ou de certaines caractéristiques d’objets, de personnes, d’événements; Cela implique qu’on attribue une valeur, un chiffre, un code ;
Les avantages: Plus de précision: le géographe décrit à l’aide de nombres l’importance relative du phénomène à l’étude; Aider à mieux définir des concepts et à les opérationnaliser : par exemple, définir le concept de « pauvreté » et les critères qui distinguent les pauvres et autres classes de la société; Introduire un niveau d’objectivité dans l’analyse ; Pouvoir comparer: il y a une certaine uniformité dans la mesure d’un phénomène; Vérifier la validité d’une hypothèses; Pouvoir généraliser/particulariser.
Les limites: Les difficultés reliés à la mesure de phénomènes: en géographie humaine comme en sciences sociales, les phénomènes ne sont pas directement mesurables lorsque l’objet d’étude touche au comportement humain; Il y a la difficulté de traduire une information qualitative, un concept ou une donnée quantitative.
Les difficultés de l’interprétation: Il ne faut pas confondre précision et validité. Être précis, c’est décrire une observation en détail; Être exacte, c’est refléter la réalité. Par exemple, on peut calculer la distance moyenne que franchi un individu à toutes les semaines : cette mesure peut être précise, mais elle n’est pas nécessairement exacte. De plus, il y a une autre difficulté inhérente à la limite des techniques quantitatives. Chaque technique comporte ses limites, ses présomptions.
Variable qualitative, variable quantitative: Qualitative: variable qui n’est pas mesurée par des nombres ; Quantitative: variable faisant appel aux propriétés mathématiques des nombres ; variable discrète: données numériques qui sont des données dont les valeurs sont des entiers. variable continue: dans ce cas, les valeurs sont des entiers, mais aussi des fractions.
Échelles de mesure: Il faut bien distinguer entre les diverses échelles de mesure: Les échelles nominales - Les échelles ordinales propriétés Les échelles d’intervalle mathématiques Les échelles de rapport + Chaque échelle de mesure permet certaines opérations mathématiques.
Échelle nominale: Niveau de mesure le plus bas; Les nombres ou symboles choisis servent uniquement à identifier des personnes ou des objets; La seule propriété formelle est l’équivalence.
Échelle ordinale: Les nombres et les symboles sont utilisés à la fois pour identifier des personnes ou des objets et pour décrire leur relation avec d’autres personnes ou objets; Elle possède la relation d’équivalence, mais aussi la relation « plus grand que » ou « plus petit que »; On assigne un rang; Il y a un type d’échelle appelé « échelle nominale ordinale » (catégorical ordinal) – par exemple, on peut exprimer la variable « âge » de la façon suivante: « enfant », « adolescent », « adulte », « personnes âgées ».
Échelle intervalle: Exemple: Le rapport de 2 points dépend de l’unité de mesure; Il n’existe pas de zéro absolu ; Les propriétés sont: L’équivalence; L’ordre; La connaissance du rapport de 2 intervalles. Exemple: Températures C ou F
Échelle de rapport: Mêmes caractéristiques que l’échelle intervalle; Il comporte un zéro absolu; N.B. Une variable nominale peut être: Binominale : à 2 catégories exclusives. Multinominale: à 2 catégories et plus.
Choix d’une technique d’analyse ou de plusieurs techniques Quel est le problème à l’étude? Quels sont les objectifs? Quelles sont les hypothèses? Décrire, expliquer, prédire: Pour chaque hypothèse, on peut choisir une ou des techniques spécifiques. Collecte des données: Statistiques secondaires et/ou données d’enquête
Quels sont les types de variable et les échelles de mesure? Quelles sont les variables associées à chacune des hypothèses? Quelles sont les techniques associées à chacune des hypothèses? Décrire des distributions; Établir des relations entre variables dans l’espace; Expliquer : relation causale; Prédire ou projeter.
Sur le plan spatiale: Est-ce qu’il y a des variations dans l’espace? Si oui: Est-ce qu’il y a une structure spatiale au phénomène à l’étude?
Si oui, il y a des facteurs liés au traitement qui expliquent en partie le phénomène à l’étude ; Quels facteurs? Environnement social, environnement socio-culturel ou socio-économique, etc.
Quels sont les facteurs géographiques pouvant Quels sont les facteurs géographiques pouvant expliquer la structure du phénomène? Facteurs reliés à la géométrie de l’espace: espace indicateur; espace topologique; Points « lieux » Lignes « réseaux » Surfaces « unités spatiales » Facteurs reliés au milieu géographique: Selon les échelles géographiques; Les échelles imbriquées
Quelle est la part des ces facteurs dans l’explication du phénomène? Quelle est la part des autres facteurs? Statistique paramétrique: La composante de base de la statistique paramétrique est l’inférence statistique. Raisonnement permettant de généraliser les conclusions tirées d’un échantillon à une population.
On passe par les tests paramétriques: Qu’est-ce qu’un test paramétrique ? Un test paramétrique est un test dont le modèle indique certaines conditions au sujet des paramètres de la population.
Comporte les étapes suivantes: Choisir l’hypothèse à vérifier; Choisir une hypothèse alternative; Se fixer une règle pour prendre la décision d’accepter ou de rejeter l’hypothèse; Choisir un échantillon aléatoire et calculer la statistique; Prendre la décision.
Statistique non-paramétrique: Les méthodes adaptées aux données nominales et ordinales. Transformations de données: Proportions: fréquences relatives d’une catégorie par rapport au total; Pourcentages: multiplier la proportion correspondante par 100.
Taux: Proportions exprimées par rapport à un nombre constant (1,000; 100,000); Ratios: Poids relatif des effectifs d’une catégorie par rapport aux effectifs d’une autre catégorie.
Standardisation: Par exemple: les valeurs centrées réduites (Z). Tableau statistique: (Létourneau, p. 115) Mode de classement de données numériques montrant une distribution de fréquences; La construction d’un tableau statistique est fonction des objectifs de la recherche des hypothèses, de la démarche méthodologique.
On peut construire des tableaux à « n » dimensions: 2 dimensions: Y 3 dimensions: Z Z X X Y Y 4 dimensions:
Analyse et interprétation des résultats: L’analyse est un processus composé de plusieurs étapes; Identification des facteurs pertinents; Description de l’interdépendance des facteurs: Quelles sont les relations entre les facteurs?
Évaluation de l’importance relative de facteurs? Construction ou conception d’un schéma descriptif ou explicatif ou préalable; Construction d’un modèle ou d’une théorie.