CARTOGRAPHIE STATISTIQUE

Slides:



Advertisements
Présentations similaires
Corrélation Position du problème Définition covariance (X,Y) r =
Advertisements

ANALYSE GÉOMÉTRIQUE DES DONNÉES
Thème Compétences programme Compétences socle mises en œuvre.
GESTION DE PORTEFEUILLE chapitre n° 7
Présentation des programmes de terminale STG Juin 2006.
Chapitre 5. Description numérique d’une variable statistique.
Gestion de l'information
Formation en Analyse des Données
Les TESTS STATISTIQUES
Les TESTS STATISTIQUES
Animation pédagogique Géographie Alain Bogart CPC EPS Avion Cycle 3 1. Comprendre l'organisation de l'espace par les sociétés humaines grâce à une activité
Statistique et probabilités au collège
Régression -corrélation
Time Series Séries Chronologiques Georges GARDARIN.
Module SIG-Santé 15. Modélisation Marc SOURIS
Statistiques descriptives
Traitement de données socio-économiques et techniques d’analyse :
la statistique descriptive se compose de 3 domaines distincts :   
Les principaux résumés de la statistique
Les systèmes d'information géographique servent principalement à :
ALGORITHMIQUE en classe de seconde
Cours Corporate finance Eléments de théorie du portefeuille Le Medaf
Régression linéaire simple
Groupe 1: Classes de même intervalle
Construction de modèles visuels
Dominique LOUIS – Stage cartographie – 8 mars 2006 Discrétisation cartographique La carte, un ensemble de choix.
Opération et systèmes de décision Faculté des Sciences de l administration MQT Probabilités et statistique Mesures caractéristiques.
STATISTIQUES POUR LA CARTOGRAPHIE
Corrélation et régression linéaire simple
Mesures de répartition de la population Claude Marois 2012.
Commentaires sur les biais écologiques et les échelles non emboîtées
Avantages et Désavantages
Le forage de données ou data mining
CARTOGRAPHIE STATISTIQUE
Traitement des données de flux. Analyse multivariée Conclusion sur la construction et linterprétation des cartes statistiques Indicateurs démographiques.
Régression linéaire multiple : hypothèses & interprétation. Partie 2.
Régression linéaire multiple : hypothèses & interprétation
Statistique Descriptive Analyse des données
Outils mathématiques pour le datamining
COURS STATISTIQUE - DESCRIPTIVE DEFINITIONS
STATISTIQUES DESCRIPTIVES
Sériation et traitement de données archéologiques
Initiation à la conception des systèmes d'informations
STATISTIQUE DESCRIPTIVE Dr LEMDAOUI MOHAMED CHERIF
Introduction à une analyse statistique de données
Statistiques descriptives-Distributions expérimentales à une dimension
Olivier Leclair, Université Laval Un algorithme de fouille dans une représentation des données par objets: une application médicale SIMON, Arnaud.
Étude de l’écoulement moyen
PARAMETRES STATISTIQUES
MINISTÈRE DE L’ENSEIGNEMENT SUPÉRIEUR ET DE LA RECHERCHE SCIENTIFIQUE
STATISTIQUES DESCRIPTIVES
Chapitre 2 La statistique descriptive I
Premiers cours : démarrer
Analyse des semis de point
Statistique Descriptive Les Paramètres de Tendance Centrale
Détecter les groupes à hauts risques cardiaques à partir de caractéristiques telles que l’alimentation, le fait de fumer ou pas, les antécédents familiaux.
Bienvenue!  Professeur : Dr. David Beaudoin.  Disponibilité : Mardi 15h30-17h local  Disponibilité d’Antoine Gautier: Mardi et Jeudi à compter.
BIOSTATISTIQUES Définitions.
BIOSTATISTIQUES Définitions.
Mesures de description des valeurs des variables
Système d’Information Géographique Equipe-SIG Direction Régionale de Meknès.
 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs.
Introduction à l’analyse multidimensionnelle Master BOE LATLI Adrien
Hadrien Commenges Université Paris 7, Géographie-cités Hélène Mathian CNRS – Géographie-cités Claude Grasland Université Paris 7, Géographie-cités Introduction.
Bienvenue au cours MAT-350 Probabilités et statistiques.
Chapitre 12 Des modeles corrélationnelles. A la fin de ce chapitre on sera capable de:  definir le but et l’utilisation des modeles correlationnelles.
De la Terre à la carte: Projections et Géoréférencement
STATISTIQUE DESCRIPTIVE
Processus ponctuels Caractéristiques et Modèles de répartitions spatiales.
Transcription de la présentation:

CARTOGRAPHIE STATISTIQUE Hubert Mazurek Louis Arréghini Institut de Recherche pour le Développement La télédétection en tant qu’ensemble d’outil et de méthodes de traitement d’images, ainsi que les Système d’Information Géographique comme outil d’organisation des données sont plutôt bien adaptés au traitement des données environnementales, et permettent aussi, sous certaines conditions, d’y intégrer quelques couches d’information socio-économiques. Mais, ils apparaissent inadaptés à la plupart des besoins de traitement de ces données socio-économiques. Il existe en fait un ensemble de méthodes et de modèles de traitement, assez distincts de la philosophie des SIG, bien qu’ils peuvent y être intégrés, pour répondre à ce type de besoin de traitement. Cet ensemble constitue la cartographie statistique, dont la spécificité repose moins sur le développement d’un logiciel intégré que sur base d’expertise et de savoir-faire à facettes multiples, ordonnées et complémentaires (des méthodes diversifiées, la définition d’indicateurs originaux, la pertinence du choix de traitement et l’interprétation des résultats). Ce cours va exposer l’essentiel des méthodes de cette cartographie statistique et des modèles sous-jacents, et qui repose sur la base d’un traitement statistique de données censitaires, ainsi que des données d’enquêtes et la plupart des données localisées quantitatives, souvent recueillie par des entreprises ou des administrations pour leurs besoins de gestion mais qui exploitent peu la dimension géographique de leurs données.

Contenu – Premier Jour 1 – Introduction: objectif et usage de la cartographie statistique 2 – Particularités de la statistique pour la géographie 3 – Traitement à partir de la statistique descriptive 3.1 – Quelques notions de base 3.2 – Processus de discrétisation des variables 3.3 – Test de signification de la discrétisation 3.4 – Relation entre la distribution spatiale et la distribution statistique. 4 – Symbolisation et sémiologie graphique

2 – Particularités de la statistique en géographie 1 – Introduction sur les objectifs et l’usage de la cartographie statistique 2 – Particularités de la statistique en géographie 3 – Traitement cartographique à partir de l’analyse descriptive 3.1 – Quelques notions de base 3.2 – Discrétisation des variables 3.3 – Signification statistique d’une discrétisation 3.4 – Relation entre la distribution spatiale et la distribution statistique. 3.5 – Résumé et méthodes particulières à la comparaison de cartes 4 – Symbolisation et sémiologie graphique appliquées à la cartographie statistique 5 – Distribution spatiale, hétérogénéité et comparaison entre distributions statistiques 5.1 – La mesure de la diversité 5.2 – Mesure de la spécificité en relation avec un modèle 5.4 - Régression 5.5 – Analyse structure - résidu 5.7 – Analyse multi variée 5.8 - Classification 6 – Traitement des données de flux 7 - Distribution spatiale et Autocorrélation 8 – Conclusion sur la construction et l’interprétation des cartes statistiques 9 ­– Cartes statistiques et modèles graphiques

Contenu – Jour 2 5 – Distribution spatiale, hétérogénéité et comparaison de données 5.1 – La mesure de la diversité 5.2 – Mesure de la spécificité en relation à un modèle 5.4 - Régression 5.5 – Analyse structure – résidus 5.7 – Analyse en composante principale et analyse de correspondance 5.8 – Classification 6 – Traitement des données de flux.

Contenu – Jour 3 7 – Conclusion sur la construction et l’interprétation des cartes statistiques 8 – L’étude des recensements Avantages et désavantages des recensements Comparaison entre recensements Problèmes relatifs à l’agrégation des données 9 – Indicateurs démographiques et interprétation à partir des cartes.

Introduction Les outils Les méthodes Cartografía La palabra carta viene del latino charta que ella misma viene por su lado del griego khartès que quiere decir hoja de papiros. Entonces, cartografía es en griego khartès graphiè, que literalmente quiere decir dibujo sobre una hoja de papiros. Obviamente, a la época de Ptolomeo, el dibujo del mundo se hacía sobre papel de papiros. Mapa La etimología es mappe y quiere decir aplastar. La palabra se encuentra en español (mapa), en itialano (màppa) y en inglés (map). Entonces, mapamundi es el mundo aplastado. Al origen, el mapamundi es una representación del mundo en dos hemisferios pero aplastados. Las otras representaciones del mundo son nombrados planisferios.

Les outils Les fondements: la sémiologie graphique Le rôle de l’évolution technologique La diversification des produits en géographie Fondamentalement, la cartographie n’a pas changé depuis ses origines, théorisée par la sémiologie graphique, mais l’évolution technologique des outils et des supports, qui s’est accéléré ces dix dernières années, a conduit a modifier certaines pratiques parmi les cartographes et les géographes. On ne peut à proprement parler de révolution. Mais on note cependant que l’utilisation de l’ordinateur, comme cela se passe dans toutes les disciplines scientifiques, a profondément influencé les modes de traitement de l’information et les formes de représentation: En permettant de traiter d’importantes bases de données En banalisant les procédures En permettant que les formes de représentation cartographique évoluent avec le progrès des techniques graphiques et algorithmiques. Il reste en effet à découvrir des techniques nouvelles de représentation qui concrétiseraient les règles de connaissance et les pratiques des géographes. Les principes de la cartographie n’ont pas changé depuis que Jacques Bertin a énoncé les lois de la sémiologie graphique dans les années soixante, d’abord avec son ouvrage de référence « Sémiologie graphique » (1967), suivi de l’ouvrage « La graphique et le traitement graphique de l’information » (1977). Cependant, les pratiques quantitatives de la géographie se sont profondément modifiées avec l’évolution constante de la puissance des ordinateurs.

Schéma 1 Cartes quantitatives manuelles (départements) Cartes qualitatives manuelles 1975 5 à 7 jours Cartes quantitatives automatiques Cartes de synthèse Régresion Cartes qualitatives manuelles 1980 Diversification, temps de traitement, interactivité Les progrès constants de l’informatiques se traduisent par la complexification et l’accélération de calculs (schéma 1). Plus de détails et de précision du point de vue qualitatif; diversification et multiplications des entités géographiques du point de vue quantitatif. Cartes quantitatives automatiques (communes) données hétérogènes et historiques Cartes qualitatives semi-automatiques 1990 11 à 2 heures 2000 DAO et SIG Cartes quantitatives automatiques pas de limites modélisation 1 à 2minutes

Schéma 2 Évolution technologique Sources diverses, précisions accrues Techniques graphiques et statistiques Nouvelles images; nouveaux supports La diversification touche aussi les supports de valorisation des résultats (shéma 2). Le champ de la recherche s’en est trouvé élargi, intégrant des méthodes provenant d’autres disciplines, essentiellement statistiques mais aussi de l ’économie, de la géologie, de l’écologie et même de la physique. La géographie est ainsi devenue une science expérimentale proposant ses propres modèles et élaborant ses propres lois, tout comme le biologiste le ferait en mesurant le poids et la taille des animaux. Cette mutation a été importante car elle a conduit a reconsidérer la place de la géographie, dans toute la diversité de ses approches et de ses champs d’activité, parmi les sciences sociales et parmi les sciences en général. Les champs de la recherche s’en trouvent élargies. Avant d’explorer ces champs, il n’est pas inutile de faire un petit rappel historique de l’évolution des objectifs de la cartographie, à travers un schéma proposé par Roger Brunet dans les années quatre vingt, et qui mériterait sans doute une actualisation. Ce qui nous permettra de situer la cartographie statistique parmi tous les champs de la production cartographique. -Géographie science expérimentale -Accélération des procédures banales -Finesse des analyses -Traitement sur grandes bases -Nouveaux modes de représentation -Systèmes experts -Simulation et modélisation Bases de données, fonds, CD, vidéodisques Interactivité (micro-ordinateurs) Diffusion grand public (PAO, internet° Pédagogie, didactique

Évolution des objectifs de la cartographie Découvrir: les itinéraire maritimes Dominer, surveiller: appropriation des territoires et domination des peuples Gérer: organiser l’exploitation des ressources Longtemps, les objectifs de la cartographie se sont cantonnés à la description de lieux, souvent de lieux mythiques, l’ailleurs, l’inconnu; et surtout à la description des itinéraires pour s’y rendre. A partir du 15ème siècle, les changements successifs des paradigmes qui vont construire l’originalité de la culture occidentale va induire une profonde évolution des objectifs de la cartographie. En premier lieu découvrir; puis dominer et surveiller; enfin équiper et gérer. Détaillons ces changements: Découvrir: Les itinéraires maritimes. Pour sacrifier à la tradition de recherche des origines, on peut situer celle de la cartographie en remontant aux temps préhistoriques. Retenons comme exemple les itinéraires maritimes que les anciens mélanésiens gravaient par pyrogravure sur des bouts de bambou pour mémoriser leurs découvertes et transmettre leurs itinéraires. Bien qu’on puisse considérer ces reliques comme les premières cartes que l’humanité ait produite, transmettant une information spatialisée, la diffusion de la cartographie moderne a pu débuter grâce à l’héritage culturel grec. Grâce à la trigonométrie et en particulier aux efforts d’Erathostène et plus tard de Ptolémée, la cartographie s’est constituée en ensemble de méthodes rigoureux de mesure de la terre. La mesure et le dessin de la terre a d’ailleurs constitué l’essentiel des activités des géographes jusqu’au 18ème siècle. L’héritage grec est considérable dans le domaine de la mesure et du dessin de la terre. Pythagore avait déduit très tôt la rotondité de la terre à partir d’observations très simples comme l’ombre de la terre sur la lune lors d’éclipses, ou l’apparition du mât d’un bateau à l’horizon avant sa proue. Erathosthène, pour sa part, en avait mesuré la circonférence au IIème siècle avant Jésus-Christ, avec une précision étonnante à l’égard des techniques de l’époque. Cet héritage grec, fort heureusement sauvegardée par les arabes, a connu une longue éclipse dans le monde occidental avant de réapparaître à l’époque des grandes découvertes des terrae incognitae. À Partir de la fin du 15ème siècle, la cartographie moderne se développe en occident, liée aux grandes découvertes du monde par les européens. Au retour de chaque expédition, pour la justifier et pour obtenir des ressources pour organiser la suivante, on remettait au sponsor, en l’occurrence, le roi d’Espagne ou du Portugal, plus tard aux guildes des marchands du nord de l’Europe et de l’Italie, des preuves des richesses potentielles, du continent découvert et… une carte. On prête même à la main de Christophe Colomb le dessin de plusieurs cartes qui nous sont parvenus de cette époque. Parfois l’imaginaire peuplait ces cartes d’itinéraires fantaisistes ou d’animaux marins fabuleux, par ignorance, supputation ou simplement pour fourvoyer la concurrence! Enfin, l’art et la poésie pouvait s’immiscer dans le tracé précis et ordonné des cartes comme en témoigne la mappemonde de Guillaume Delisle, dessinée en 1720, en plein âge d’or de la cartographie française.

Mappemonde de Guillaume Delisle Recherche sur les système de projection. Qu’a voulu exprimer Guillaume Delisle en proposant cette projection bien singulière? La volonté de se situer au cœur du monde? Ou l’utopie de vivre dans un monde de cœur?

Évolution des objectifs de la cartographie Découvrir: les itinéraire maritimes Dominer, surveiller: appropriation des territoires et domination des peuples Gérer: organiser l’exploitation des ressources Dominer, surveiller: Après l’époque des découvertes, survient celle des conquêtes, de l’appropriation des territoires et de la domination des peuples. Les caractéristiques exclusivement linéaires des carte d’itinéraires disparaissent au profit d’une cartographie plus auréolaires, une cartographie des territoires. Le but est de réduire jusqu’à les faire disparaître toutes les zones d’incertitude, les zones à risques. C‘est d’ailleurs l’essentiel du projet du monde occidental: réduire l’incertitude pour maîtriser le risque. L’entreprise, poursuivie tout au long des 19 et 20ème siècles est encore en cours. Dessiner un espace, tout comme le nommer, c’est le transformer en territoire, en le délimitant. C’est un puissant acte d’appropriation. Ici c’est le géomètre qui œuvre avec ses tracés précis et rigoureux, parfois esthétique. Ses cartes sont à l’origine des plans cadastraux.

Évolution des objectifs de la cartographie Découvrir: les itinéraire maritimes Dominer, surveiller: appropriation des territoires et domination despeuples Gérer: organiser l’exploitation des ressources Gérer: Après le temps de l’appropriation vient le temps du contrôle et de l’administration. Militaires et administrateurs se suivent pour remplir ces tâches. La carte topographique naît de leurs activités. Pour optimiser l’exploitation des ressources, pour harmoniser la répartition des hommes et des activités, la gestion des territoires est devenue indispensable. Cela se traduit par des politiques territoriales dont l’aménagement du territoire et la décentralisation contemporaines sont les aspects les plus connus. La complexité de la gestion territoriale se traduit dans la diversité de l production cartographique. On a besoin de plus en plus de spécialistes de disciplines différentes qui vont produire des informations qui couvrent l’éventail des besoins et des points de vue sur la gestion et l’aménagement du territoire. Pour illustrer cette diversité, le schéma suivant, bien que daté car produit dans les années 80, est toujours d’actualité, même s’il faudra sans doute le compléter.

Acteurs, sources, outils, produits et usages de la cartographie. D’après Roger Brunet: La carte mode d’emploi Le schéma est tiré de l’ouvrage de Roger Brunet, la carte, mode d’emploi. Il propose un panorama des actions et des acteurs qui utilisent les méthodes et les techniques de la cartographie et de la géographie: Construire, équiper: schéma directeur, plan d’occupation du sol. Les cartes qui en sont issues ont souvent une grande précision formelle et des tracés épurés, en particulier les schémas, qui trahissent l’origine professionnelle de leur concepteurs: architectes ou agent des directions de l’équipement. Allouer: la précision des documents cartographique est ici de mise puisqu’il s’agit de délimitations administratives. Cette précision requise aura une influence sur le comportement de tout un corps de métier dédié à cette activité: les géomètres. Voyager, explorer: Les cartes routières et touristiques sont les héritières des cartes d’itinéraire des routes maritimes et des royaumes mythiques. Au-delà de leur caractère utilitaire, elles sont support de rêve d’évasion vers un ailleurs qui change du quotidien, porteuses d’une dimension onirique qu’il s’agit d’exploiter commercialement. Dans ce cas, elles sont instruments promotionnel et de propagande. Il est assez instructif de comparer la production des cartes routières et touristiques de la firme Michelin et de l’IGN, en particulier dans le choix des objets à représenter ainsi que leur tracé. Dans certains lieux, comme dans l’Amazonie bolivienne, il est préférable de se munir d’un GPS car la production de l’institut militaire local met le voyageur dans un état de perplexité: les informations fausses contenues dans ces cartes, et qui l’induisent en erreur, relèvent-elles de la pure ignorance ou de la tromperie délibérée? Gérer: le militaire d’abord, puis l’administrateur va produire des cartes à fin de gestion. Par exemple, la précision des cartes topographiques, dites cartes d’état-major étaient indispensables pour des besoins de balistique et de tactique. Chercher: Il est dit souvent que la carte est l’outil privilégié du géographe et en effet, elle lui sert d’argument pour construire ses connaissance et de support pour donner à connaître. L’atlas est toujours un produit apprécié en dépit des cycles de mode et de démode. Connaître: l’entrepreneur trouve dans la cartographie une dimension indispensable dans la gestion de ses implantations et de ses activités, dans ses études de marché et l’identification de son cœur de cible. D’ores et déjà, on voit nettement que se dessine deux branches de la cartographie. La première concerne ceux qui utilisent majoritairement la topographie (c’est-à-dire qui privilégient le lieu). La seconde branche utilise plutôt la statistique pour décrire (les cartographes mettent l’accent sur la signification, les propriétés du lieu). A partir de ces deux branches correspondant à des besoins différents, deux grandes classes d’outils se sont mises en place dans les années 80, utilisant souvent les mêmes méthodes mais sans qu’il y ait correspondance ou union possible tant les concepts et les objectifs d’études son différents.

Classes d’outils de la cartographie Les SIG (Systèmes d’Information Géographiques La Cartographie Statistique Le DAO (Dessin Assisté par Ordinateur) Le SIG: D’un point de vue pratique, un SIG est un système informatique capable de réaliser une gestion complète des données géographiques référencées. C’est sans doute aussi une manière très spécifique de conceptualiser l’espace et de concevoir la manipulation des éléments spatiaux d’un territoire. Les SIG montrent leur efficacité dès qu’il s’agit de réaliser à grande fréquence des interrogations sur la localisation ou les caractéristiques des éléments de topographie, ou de calculer des combinaisons ou des associations de ces éléments. Ainsi c’est un outil particulièrement bien adapté à des espaces ou des territoires en constants changements ou en constante évolution du point de vue de leurs délimitations. L’utilisation la plus fréquente des SIG concerne: Les cadastres ou des plans urbains Des réseaux routiers, de distribution, de transport La gestion d’un milieu (environnement, géologie, topographie, etc.) Le suivi de phénomènes climatiques L’interprétation dans une certaine mesure de l’imagerie satellitaire

La différence SIG / CS La cartographie statistique (ou quantitative): Ici les éléments géoréférencés sont de moindre importance, changent assez lentement. Il s’agit d’analyser, avec un ensemble d’outil et de modèles statistiques, une base de données qui leur sont associées. En général, les éléments spatiaux, réunis en un fonde de carte, n’ont pas besoin d’une grande précision et sont simplifiés. Dans ce cas, les SIG deviennent inadaptés et peu efficaces car lourds à manipuler. Ce qui est important dans ce contexte, c’est la localisation, les caractéristiques et le traitement des données numériques; les attributs spatiaux et non les unités spatiales elles-mêmes. Cela suppose un « milieu » géographique relativement stable, une priorité sur de gréquentes interrogation sur des données attributaires, une focalisation sur l’analyse spatiale du territoire. L’utilisation la plus fréquente de ce type d’outils peut concerner la télédétection (avec des outils un peu spécifiques) et le traitement géographiques des données d’enquêtes et de recensements. Le DAO Ces outils permettent également de réaliser des cartes de territoires qui ne changent pas beaucoup et qui possèdent des caractéristiques stables au moins à moyen terme. Par exemple les cartes géologique ou la répartition des familles linguistiques peuvent être réalisées en DAO pour des projets ponctuels. Dans ce cas le outils de dessins sont bien plus souples et plus rapides que les classes d’outils précédentes. Mais l’absence de critères de précision et de géoréférencement font que les informations ne peuvent être intégrées dans des projets plus ambitieux. SIG: Changements fréquents de l’information géoréférencée Les lieux sont plus importants que leurs caractéristiques CS: Changement de l’information statistique Les caractéristiques sont plus importantes que les lieux.

Méthodes quantitatives et Géographie La géographie comme science sociale Les sciences sociales et les méthodes quantitatives Presque toutes les disciplines ont recours aux méthodes quantitatives: sociologie, économie, écologie, etc. Elles se limitent toutefois à la statistique descriptive Mais en quoi une distribution de fréquences ou une moyenne peuvent-elles avoir un sens différent en sociologie, en biologie ou en géographie? Un écart-type mesure-t-il réellement une dispersion spatiale? Comment identifier des structures spatiales et leur dynamiques avec des méthodes aspatiales? Mais la géographie ne se résume pas à un ensemble d’outils. Elle s’attache à étudier les phénomènes spatiaux, c’est-à-dire à la fois les processus de formation des territoire, les relations entre les territoires et l’influence des facteurs externes ou endogènes sur la dynamique de ces territoires. Les méthodes mises en œuvre s’apparentent à celles utilisées par ailleurs dan les disciplines aussi diverses que la sociologie, l’économie ou l’écologie. Ce sont des méthodes fondées essentiellement sur la statistique descriptive. Mais en quoi une distribution de fréquences ou une moyenne peuvent-elles avoir un sens différent en sociologie, en biologie ou en géographie? Un écart-type mesure-t-il réellement une dispersion spatiale? Comment répondre à l’aide des méthodes dont nous disposons aux questions spécifiques de la géographie? La localisation: qu’y a-t-il à tel endroit? La sélection: Où trouve-t-on tel entité ou tel phénomène? La tendance: qu’y a-t-il de changé depuis…? La distribution: Comment se répartit…? La relation: Quelle correspondance spatiale entre…? La modélisation: Que se passe-t-il si…?

Schéma 5 La géographie ne se résume pas à la cartographie: Structure spatiale Dynamique spatiale Formation d’un territoire Relations entre territoires Facteurs qui influencent la dynamique territoriale Il devrait être possible de répondre à ce genre de questions, sans pour autant prétendre à l’exhaustivité toujours diffcilie à atteindre en matière de méthodologie. Les réponses s’organisent autour de cinq thèmes: Le territoire Les variables La symbolisation L’analyse spatiale La cartographie et la modélisation

PARTICULARITES DES METHODES STATISTIQUES POUR LA GEOGRAPHIE Données et méthodes

Données Il existe trois types de données: Qualitatif cardinal: Modalités d’un caractère, en général discontinu: classification climatique ou classe d’une typologie. Qualitatif ordinal: Modalités ordonnable d’un caractère; inclue les valeurs bianires (présence absence) et les classifications ordonnées, par exemple une note ou un gradient. Quantitatif: Numération ou mesure avec des valeurs continues. La majeur partie des données apparetiennent à cette classe: population, température, production, etc.

Méthodes Les méthodes se rangent en 4 types: Méthodes basées sur les statistiques descriptives (une, dos ou plus dimensions). On utilise les paramètres qui caractérisent la distribution des données. Méthodes basées sur les probabilités (modèles théoriques). Il s’agit de vérifier la conformation d’une distribution avec une distribution théorique ayant les mêmes paramètres. L’inférence statistique (estimation et hypothèse). Il s’agit de comparer la distribution des données avec un modèle et d’établir une estimation et une erreur. Analyse multivariée : Modèles d’interraction au sein d’un ensemble de variables homogènes.

Individu – Population - Unité Les données géographiques ont une valeur numérique plus une localisation. Elles ne sont pas sonstitutées d’une distribution d’individus mais d’une distribution de population. Chaque élément de la distribution est une aggrégation d’une série de caractères qui sont localisées. L’analyse de la distribution géographique est par conséquent l’analyse de la répartition spatiale d’une distribution de population.

Les trois éléments de base de la représentation graphique Localisation Précision Echelle Point X,Y dX, dY Individus   Entités Groupes Ligne X0,Y0 - X1,Y1 Chemin Angle, longitude Axes Direction Flux Polygone X0, Y0 - Xn, Yn Arête Imprécision Fonction POLY Noeud Ensemble

Changement d’échelle et agrégation

Courbes de concentration suivant le niveau d’agrégation des données

Autre exemple avec l’indice de pauvreté en Bolivie Limites de classes différentes L’histogramme n’a pas la même structure L’interprétation dépend de l’échelle et du niveau d’agrégation des données.

Exemple du Pando A gauche, les données officielles disponibles sur lesquelles tout le monde travaille (ministères, consultants, ONGs, institutions, etc.). A droite, une cartographie fine réalisée par Hubert Mazurek et son équipe. C’est un travail fastidieux de repérage des lieux habités. Mais c’est une cartographie réellement utile pour la recherche pour le développement. Le peuplement linéaire, le long des cours d’eau et voie de circulation apparaît nettement. C’est une cartographie réellement utile à la recherche pour le développement.

Introduction à la distance La métrique de Minkowski résume la mesure de la distance dans un espace à p dimensions. p=1: distance de Manhattan p=2: distance euclidienne (matrice des corrélations en ACP) P=2: en utilisant la matrice de covariance: Distance D2 de Mahalanobis

Introduction à la distance Distance du khi2 (Matrice de contingence en AFC)

Distances : loi de gravité Distance euclidienne / distance réelle (technique de la régression) = Estimation de la dépendance

Cartographie statistique et chorématique Identifier les structuresspatiales Aide à l’interprétation Avancer dans l’abstraction Outil de comparaison Si l’on part de l’idée qu’il n’y a pas de connaissance objective mais qu’il n’y a que des représentations de la réalité, modéliser apparaît comme une étape supplémentaire dans l’effort d’abstraction que nous nous imposons pour arriver à mieux connaître l’espace et aussi donner à le connaître. La cartographie statistique procède déjà de cet effort d’abstraction en produisant des objets issus de traitement mathématiques et sémiologiques complexes. On peut aller plus loin. Des géographes s’y sont risqués et ont même formalisé des outils et des méthodes de modélisation. En général, les modèles sont souvent investis de plusieurs rôles: Ils sont sensés résumer les propositions extraites du travail en cours et donc, synthétisent les analyses déjà développées. Ils revêtent aussi une dimension analytique. Dans ce cas, c’est leur valeur didactique qui est mis en avant. Enfin on mise la qualités sémiologiques des modèles graphiques pour communiquer. Quoiqu’il en soit, les modèles devraient permettre une meilleure comparaison des espaces étudiés. On recherche ainsi à mieux cerner en quoi diffèrent certains espaces soumis aux mêmes contraintes ou types de phénomènes et comment se manifestent les récurrences. Jusqu’à quel point peut-on identifier les structures et les dynamiques communes et quelle est la part des contingences d’ordre local? Du point de vue des objets et de la démarche, la chorématique de Roger Brunet est finalement assez proche de la cartographie statistique. Elle est soumise aux mêmes lois de la sémiologie graphique et hérite des mêmes avancées théoriques en ce domaine.

Chorèmes Origine, définitions Développement Le rôle de la revue Mappemonde Question d’échelles Carte, modèles et développement territoriales C’est un outil: analyse, synthèse, consolidation, vérification, comparaison Est-ce un langage? Selon R. Brunet (1980), le chorème est une structure spatiale élémentaire. « ils sont autant de signes exprimant, en en général, des stratégies de domination des la nature et des autres ». L’auteur propose un tableau de 28 structures spatiales élémentaires issues du croisement entre des variables topographiques (le point, la ligne, l’aire, les réseaux) et six formes particulières d’occupation de l’espace (le maillage, le quadrillage, l’attraction, le contact, le tropisme, la dynamique spatiale et la hiérarchie), dérivées de l’hypothèse que l’espace se construit uniquement selon les modes de domination et d’appropriation. Utiliser les chorèmes comme outils de découverte des structures spatiales c’est accepter cette hypothèse forte comme outil de réflexion. Ici on recherche par ses effets, comment l’espace s’organise et selon quelles pratiques sociales. On identifie à travers les structures et les dynamiques spatiales quels sont les acteurs et quelles stratégies déploient-ils. On considère l’espace comme un catégorie, une entrée pour comprendre d’une côté comment se spatialisent les sociétés, et de l’autre, comment se socialise l’espace. 2. Les applications des chorèmes Il faut souligner le rôle central de la revue Mappemonde dans la diffusion des théories et des pratiques de la chorématique, pour le meilleur comme pour le pire. Et comme la revue Mappemonde est très lue des professeurs de collèges, c’est auprès d’eux que la méthode connaît le plus grand succès grâce à leurs vertus supposées didactiques et pédagogiques. Mais les chorèmes ne sont pas utilisés uniquement dans le cadre scolaire. Ils connaissent aussi une diffusion auprès du milieu universitaire et de recherche. Deux groupes travaillant à des éhelles différentes s’en emparent. Les géographes tropicalistes tels Jean-Paul Deler et Hervé Théry les utilisent tels quels et font avancer la réflexion théorique à partir du socle. Deler travaille à la définition de chorotypes, structures typiques de l’espace andin, issu de la composition des structures élémentaires identifiées au préalable. Hervé Théry introduit de son côté de façon originale la dimension historique en introduisant les notions de paléochorème (structure spatiale héritée d’un passé plutôt lointain) et de chronochorèmes (succession de chorèmes dans le temps qui traduisent une évolution). Il faut dire que la méthode de Brunet a été documentée à partir des échelles mésos (échelles des pays et des macrorégions), qui s’avèrent être leurs échelles de travail. De surcroît, les processus coloniaux qu’ont subi la plupart des espaces tropicaux produisent des structures et des dynamiques spatiales similaires. Un autre groupe grand utilisateurs de chorèmes sont des géographes ruraux et des agronomes qui travaillent à des échelles locales. Leur travail de réflexion sur l’outil chorématique a abouti à la proposition d’un nouveau socle spécifique à cette échelle. Ce groupe pose un sérieux problème d’ordre théorique. Le socle d’origine ne serait donc pas universelle, ni mêmes lesprémisses, hypothèses sous-jacentes (la domination de la nature et des autres). C’est pourtant à cette échelle locale où la production chorématique est la plus abondante pour des applications très diversifiées: support e dialogue social et de résolution de conflits d’usages; zonages à dires d’cteurs; chorèmes et développement territorial. 3. Quelques difficultés théoriques: Ambiguïté outil/lngage. Signe/indice. Lois dde l’espace/lois dans l’espace. Pistes qu’on explore: revisiter le socle en fonction de la dimension structurelle ou conjoncturelle des processus. Les rôles respectifs de l’endogène et de l’exogène, exacerbés par l amondialisation….

Programme de Cartographie Statistique CABRAL (1500) Programme de Cartographie Statistique La Maison de la Géographie fut un lieu particulièrement fécond pour la géographie française durant les années 80 et 90, tant du point de vue théorique que méthodologique et de développement des outils. Le contexte de l’époque se prêtait particulièrement aux développements des outils supportés par des réflexions théoriques stimulées par une concentration importante de chercheurs et d’ingénieurs qui s’appuyaient sur un plateau technique exceptionnel. La cartographie sur micro-ordinateur en était à ses balbutiements et la quasi-totalité des développements se faisaient sur grands systèmes (SAS, Uniras, etc.). C’est un chercheur de la maison de la géographie, Philippe Waniez qui le premier eut l’idée de développer un cartographeur sur Mac OS qu’il nomma Cabral 1500 (Du nom du navigateur Pedro Alvarez Cabral, qui explorait pour le compte de la couronne du Portugal et qui se présenta à l’embouchure du fleuve Amazone en l’an 1500). Le succès immédiat du logiciel correspondait à un besoin réel de disposer d’un programme léger et facile d’emploi capable de créer facilement des cartes statistiques dans les règles de l’art. Hubert Mazurek, alors ingénieur à la Maison de la Géographie développa la version Windows qui connut un succès encore plus foudroyant. A présent, seul subsiste la version Windows enrichie de modèles statistiques les plus courants. L’usage le fait appeler à présent Cabral tout court. Hubert Mazurek est à présent Chargé de recherche à l’IRD et continue bon an mal an à développer Cabral. L’étape suivante serait d’implémenter Cabral comme un ensemble d’outils et de méthodes disponibles sur internet afin de valoriser les bases de données produites un peu partout chez nos partenaires du Sud et qui sont à la recherche de tel outils.

DISCRETISATION Une histoire de compromis statistique/cartographie Réduction statistique de l’information Lorsqu’on a une variable statistique à caractère quantitatif ou un indicateur, on réduit l’information apportée par ce caractère, on la résume en ramenant l’ensemble des valeurs ordonnées en classes susceptibles d’être représentées cartographiquement. On s’efforcera de rendre les différences à l’intérieur d’une classe la plus minime possible. Cette opération de découpage en classes d’une série quantitative est appelée discrétisation parce qu’elle consiste à rendre discrète (synonyme de discontinue) une série mesurée au départ sur une échelle continue de valeurs. Une discrétisation réussie est une discrétisation qui réduit l’information contenue dans une série tout en conservant et qui est cartographiée avec la meilleure des lisibilités. Le compromis statistique/cartographie Les exigences de rigueur statistique entrent souvent en contradiction avec les exigences de lisibilité d’une carte. Pour atténuer cette contradiction, prendre en compte l’extrême diversité des distributions dans les séries liées à la géographie et permettre au cartographe de choisir entre mettre en valeur la forme de la distribution, conserver sa dispersion ou faire apparaître ses irrégularités, les géographes-cartographes proposent une batterie de méthodes de discrétisation que nous développement plus loin. Cela ne nous dispense pas au final d’examiner chaque carte afin de choisir un compromis entre rigueur des opérations de réduction de l’information statistique (discrétisation) et conditionnement sémiologique qui détermine la visibilité de la carte. Ce qui rend illusoire toute idée de traitement automatique. On tient là peut-être la raison de l’insuccès du néologisme cartomatique, qui dérive de cartographie automatique que de cartographie statistique. 2. Opération de réduction de l’information - Informer sur l’ordre de grandeur Même si une opération cartographique renseigne essentiellement sur des inégalités relatives ou des variations locales d’un phénomène, il s’avère indispensable de faire dans la légende des indications chiffrées qui vont permettre aux spécialistes du thème d’apprécier dans l’absolue les valeurs représentées. L’information apporté par des valeurs centrales permettent d’interpréter correctement les écarts. Le mode est la valeur la plus fréquence. Très peu utilisé en géopgraphie. La médiane est la valeur telle que la moitié des observations lui sont inférieurs. Pour cette raison, les adeptes de l’analyse exploratoire des données lui concède le titre de « résumé résistant », puisqu’il résiste à n’importe quelle forme de distribution, en particulier les distributions parfaitement asymétriques où les valeurs moyenne est peu représentative.

Rappel 1 Distribution de données Distribution de fréquence Fréquence / Fréquence relative Histogramme: Superficie proportionnelle à la valeur de chaque classe Sinon c’est un diagramme en bâtons Numéro optimum de classes: Méthode de Hunstberger: Méthode de Brooks-Carruthers: La moyenne arithmétique est la valeur la plus utilisée pour résumer une distribution, en particulier les distributions normales. Elles s’obtient en additionnant toutes les valeurs d’une distribution et en divisant le résultat par le nombre d’observations. Conserver la forme de la distribution: Les séries statistiques en géographie sont rarement uniformes peu symétriques, très souvent dissymétriques. Il faut en tenir compte lorsqu’il s’agit de quantité brute. Pour les taux, il et parfois nécessaire de supprimer des individus dont la taille gênent la mesure des inégalités. Conserver ou non la forme de la distribution dépend aussi du public, averti ou non, à qui s’adresse la carte. Les valeurs exceptionnelles ou singulières doivent être examinées avec soin pour prendre la décision de les exclure ou non du traitement. De même pour les représenter il faut choisir entre effacer leur singularité la parquer en créant une classe spécialement pour elles Conserver la dispersion: maximiser la variance intraclasse: Une classe devrait être la plus homogène possible et les classes devraient être les plus hétérogènes possible entre elles. Ce sont les deux principes qui gouvernent une discrétisation lorsqu’on souhaite mettre en valeur la dispersion d’une série , ce qi est le cas le plus fréquent. Pour des séries courtes, l’œil souvent suffit à repérer les creux de la distribution où poser les bornes de classes. Cependant, il existe un indice de mesure de dispersion très commode qui est la variance. Un algorithme comme celui de Jenks propose une procédure de test de mesure des variances en fonction des limites de classes et de choisir celles qui maximisent la variance intraclasse.

Rappel 2 Amplitude Médiane Moyenne arithmétique Différence moyenne nationale, moyenne géographique Quantiles Variance Ecart-type Coefficient de détermination ou de variation Moment Parmi tous les résumés qui décrivent une série, il faut souligner l’importance des résumés « résistants » (médiales et quantiles) car ils s’adaptent à la description d’être dissymétriques. Ils savent par exemple à la confection des diagrammes « boîte et moustaches » ainsi qu’à la plupart des outils de visualisation de l’analyse exploratoire des données.

Pourquoi découper en classes ?

Discrétisation Permettre une meilleure interprétation visuelle des cartes. L’oeil humain ne peut distinguer qu’entre 8 et 10 tonalités différentes d’une même gamme. Evaluer la similitude entre les unités. Celles qui appartiennent à la même classe peuvent être considérées comme étant très proche du point de vue statistique. Disponer de tests fiables pour mesurer cette similitude. Tester des hypothèses en relation à la méthode utilisée. Dans une certaine mesure, l’utilisation de classes permet d’éliminer certaines erreurs de l’échantillonnage. Ceci peut se tester.

Types de discrétisation Méthodes arithmétiques non statistiques Equidistance Progression arithmétique Progression géométrique Méthodes statistiques Quantiles Par écart-type Moyennes emboîtées Jenks ou analyse de variance Equiprobabilités Méthodes graphiques Histogramme Courbe clinographique Courbe de distance ou de superficie Le choix d’une méthode de discrétisation dépend essentiellement des propriétés intrinsèques d’une distribution et des possibilité de représentation cartographique, mais dépend aussi des objectifs que le cartographe s’est fixé quant à l’information qu’il souhaite communiquer. On dispose de fait d’un grand nombre de méthodes de discrétisation capables de répondre au moindre cas particulier de la distribution. Il n’est pas utile de les connaître tous car à l’usage on finit par utiliser un nombre restreint de méthodes qui correspondent à nos besoins réels. Le classement entre les trois grands groupes de méthodes (arithmétiques, statistiques et graphiques) est formel, fonction du type de traitement et non de la finalité des méthodes ou de leur adaptation aux séries statistiques. Méthodes arithmétiques Classes d’égale amplitude: on mesure l’étendue de la série, on détermine le nombre de classes puis on fixe les bornes afin d’obtenir des classes d’égale amplitude. Dans le cas, rare en géographie, d’une distribution uniforme, les classes auront des fréquences identiques. Mais dans le cas, très fréquent en géographie, de distribution dissymétriques, les classes sont d’inégales fréquences. Parfois, elles peuvent être vides. Une telle méthode transmet l’information sur la dissymétrie d’une distribution mais s’avère inefficace pour traduire la position relative des unités entre elles. Progression arithmétique ou géométrique: Les distributions dissymétriques peuvent être discrétisées en plaçant les bornes selon une progression arithmétique ou géométrique en fonction de l’ampleur de la dissymétrie. Pour chercher la raison r d’une progression géométrique, on transforme l’expression en logarithmes: log(max)=log(min)+k log r; log®=(log(max)-log(min)/k ou k est le nombre de classes. C’est une méthode très utile lorsque la distribution observée s’avère être une série dissymétrique.

Types de discrétisation Méthodes arithmétiques non statistiques Equidistance Progression arithmétique Progression géométrique Méthodes statistiques Quantiles Par écart-type Moyennes emboîtées Jenks ou analyse de variance Equiprobabilités Méthodes graphiques Histogramme Courbe clinographique Courbe de distance ou de superficie 2. Méthodes statistiques Utilisation de la moyenne et des écarts-types: Les valeurs centrales constituent des valeurs de référence qui facilitent les comparaisons en particulier sur des distributions de nature différente. Il est toujours intéressant de voir sur deux carte que telle région est au-dessus de la moyenne et telle autre en dessous. De même les valeurs de dispersions sont très significatives (exemple: + 2 écarts-types = spécialisation). C’est une méthode adaptée pour représenter des séries normales (gaussiennes). Utilisation de la médiane et des quantiles (classes d’effectifs égaux): cette méthode aboutit à des classes de même effectifs. On perd l’information relative à la forme de la distribution; on gagne la position relative de chaque unité. Cette méthode sera utilisée lorsque l’information statistique contenue dans la distribution sera jugée secondaire. Moyennes emboîtées, Jenks, équiprobables (cf. Cauvin, Reymond, Serradj: Discrétisation et représentation cartographique)

Types de discrétisation Méthodes arithmétiques non statistiques Equidistance Progression arithmétique Progression géométrique Méthodes statistiques Quantiles Par écart-type Moyennes emboîtées Jenks ou analyse de variance Equiprobabilités Méthodes graphiques Histogramme Courbe clinographique Courbe de distance ou de superficie 3. Méthodes graphiques Lorsque la série est courte, on dresse un diagramme qui place chaque valeur sur une échelle numérique. Les classes sont repérées visuellement dans les « creux » de la distribution, c’est-à-dire, là où e situent les intervalles les plus grands entre les valeurs successives. Une telle méthode empirique donne la plupart du temps des résultats identiques à l’algorithme de Jenks. L’utilisation de l’histogramme de la distribution pour discrétiser relève du même processus.

Discrétiser en vue d’une comparaison Comparer la position des unités géographiques dans plusieurs distributions Comparer des dispersions de plusieurs distributions Comparer un caractère à des dates différentes Lorsqu’on cartographie une série statistique pour elle-même, on choisira la méthode de discrétisation optimale. Mais pour coarer plusieurs séries, il est nécessaire d’adopter une autre stratégie de traitement. Les méthodes de comparaison diffèrent en fonction de l’objectif de la comparaison: Comparer la position des unités géographiques dans plusieurs distributions: dans ce cas, l’emploi d’une méthode de discrétisation avec des paramètres prores à chaque série suffit à la comparaison (moyenne et écarts-types; médianes et fractiles). Comparer des dispersions de plusieurs distributions: pour faire apparaître la notion de dispersion, on jouera plutôt sur las gammes de figurés (grande dispersion, gamme étendue; petite dispersion, gamme restreinte). Comparer un caractère à des dates différentes: on définira les classes sur l’ensemble des valeurs observées toutes dates confondues. Les classes ne bougent donc pas d’une date à l’autre. On peut voir l’évolution des unités d’une date à l’autre.

Relation structure spatiales et distribution statistique Récapitulatif: Repérer les valeurs extrêmes. S’il y a une valeur exceptionnelle, prendre la décision de l’inclure ou l’exclure des calculs; ensuite de l’individualiser ou non dans la distribution. Repérer les formes de la distribution: diqgramme pour une série courte; paramètres statistiques (moyenne etécarts-types; médianes et fractiles; coefficient d’asymétrie) pour les autres. Le cas des séries plurimodales: elles peuvent être un indice qu’il s’agit de populations hétérogènes. Pour les séries dissymétriques, transformer les valeurs en logarithme. Pour les séries normales, calculer la moyenne, l’écart-type

En guise de conclusion Cartographie outil et/ou langage Outil: analyse, synthèse, consolidation, vérification, comparaison Langage: communication égalitaire (échange, confrontation); communication inégalitaire (enseignement, didactique, pédagogie) Questions d’éthique et de responsabilité Connaître les objectifs, les fondements et les usages de la cartographie statistique, et la situer parmi les différentes classes d’outils de la cartographie s’avère plus que jamais indispensable dans tous les milieux professionnels qui recourent à la dimension spatiale. Cependant, la maîtrise technique de cet outil doit être complétée à mon sens par deux de questions: une question sur sa nature intrinsèque et une autre, plus générale sur l’éthique en cartographie et les responsabilités du cartographe. 1. La cartographie et les modèles « iconiques » comme les chorèmes partagent la même contradiction d’être à la fois un outil et un langage. En tant qu’outil, ils permettent de mettre à jour des connaissances, d’organiser des données en vue de l’analyse et de la synthèse. En tant que langage, ils permettent de communiquer à travers un système de signes qu’il convient de normaliser avec du vocabulaire, une grammaire, une syntaxe et une relation signifiant-signifié. Tout cela renvoie à la sémiologie graphique, un domaine qui fera l’objet d’un cours détaillé dans le cadre de ce DU. D’un côté, il faut associer ces outils à d’autres outils de génération de connaissance, par exemple la mathématique ou la statistique, qui sont également des langages fondamentaux. De l’autre, il s’agit de faire un travail normatif, en s’appuyant sur les acquis d la sémiologie graphique et de la linguistique. Enfin dans la pratique, le cartographe doit avoir en permanence conscience de cette contradiction outil/langage et faire la distinction entre les deux domaines dans sa pratique: Il l’utilise comme outil lorsqu’il cherche à connaître à travers un protocole d’activité de recherche: analyse, synthèse, consolidation, vérification, comparaison. Il s’en sert comme langage, lorsqu’il tente de donner à voir ses découvertes à travers la communication qui peut être de type égalitaire dans le cadre d’échange et de confrontation d’idée ou inégalitaire comme par exemple dans le cadre d’un enseignement. 2. Questions d’éthique et de responsabilité Aucun mode de connaissance n’est autonome, coupé de son contexte social et politique et de la notion de pouvoir. Lorsqu’on manipule des bases de données, avec des méthodes complexes et précises, on a tendance à développer un sentiment de supériorité par rapport aux productions du passé et des autres Cultures. sentiment de supériorité Responsabilités scientifiques, politiques et sociales des cartographes. La technologie a tendance à déresponsabiliser les auteurs de cartes. La carte la plus précise n’est pas exempt d’idéologie ni de jugement moral ou de valeur.