STATISTIQUES POUR LA CARTOGRAPHIE LA REDUCTION STATISTIQUE DE L’INFORMATION LA REPRESENTATION DES SERIES STATISTIQUES
LA CARTOGRAPHIE La cartographie constitue une représentation de la terre ou d’une autre planète sous une forme géométrique et graphique (D. POIDEVIN, 1999). C’est à la fois : Une science : ses bases sont mathématiques (détermination des formes, dimensions, etc.) et l’enjeu est la précision et la fiabilité. Un art : elle doit avoir des qualités esthétiques et didactiques grâce à son expressivité et sa lisibilité. Cela implique donc un choix pertinent des modes de représentation.
LA CARTOGRAPHIE Une technique : elle nécessite l’utilisation d’instruments et de techniques dont les progrès ont bouleversé toute la filière cartographique (photographies aériennes, images satellites, informatique, impression, diffusion, etc.).
STATISTIQUES / STATISTIQUE Le mot statistique au pluriel désigne un ensemble de données numériques résultant d’études préalables. Au singulier, il renvoie à la science d’observation quantitative et aux méthodes mathématiques d’analyse et d’interprétation de ces observations.
STATISTIQUES POUR LA CARTOGRAPHIE : Pourquoi ? Les statistiques offrent un champ inépuisable pour l’analyse spatiale. Cela explique pourquoi la plupart des cartes sont aujourd’hui réalisées à partir des données chiffrées. La représentation des séries statistiques, nécessite un traitement préalable : la réduction de l’information. De ce traitement dépendra le résultat final de la carte.
LA REDUCTION STATISTIQUE DE L’INFORMATION Le but est de disposer d’une information claire sur l’ordre de grandeur de la distribution. Pouvoir interpréter correctement les variations de la série statistique. Cela passe d’abord par la connaissance des indicateurs de position (mode, médiane, moyenne) et des indicateurs de dispersion (variance et écart-type).
LA REDUCTION STATISTIQUE DE L’INFORMATION : LES INDICATEURS La moyenne : c’est la valeur centrale la plus utilisée pour résumer une distribution. Elle est obtenue en faisant le rapport entre la somme de toutes les valeurs (Xi) de la série et le nombre total d’observations (N).
LA REDUCTION STATISTIQUE DE L’INFORMATION : LES INDICATEURS La médiane (Me): comme la moyenne, elle informe sur l’ordre de grandeur d’une série. 50% des observations lui sont inférieures. Elle correspond à la valeur de la variable qui partage l’effectif total en 2 parts égales.
LA DISCRETISATION Elle consiste en un découpage en classes d’une série statistique continue. Son but est de simplifier l’information pour obéir à la perception visuelle tout en conservant les spécificités de la série statistique. Elle constitue donc un compromis entre la rigueur statistique et les nécessités de la représentation cartographique.
LA REDUCTION STATISTIQUE DE L’INFORMATION : LES INDICATEURS Le mode (Mo) : elle correspond à la fréquence la plus élevée d’une distribution. Variance (V) : c’est la moyenne des carrés des écarts des valeurs à la moyenne arithmétique. L’écart-type : il mesure de la dispersion des valeurs par rapport à la moyenne (plus l'écart-type est élevé et plus les observations sont dispersées).
LA DISCRETISATION : LES REGLES Aucune classe ne doit être vide. Lorsque la distribution est dissymétrique, le risque de classe vide peut se produire selon les méthodes de discrétisation utilisées. Les limites des classes doivent couvrir l’ensemble du domaine de la variation de la série statistique. Les limites des classes ne doivent pas se chevaucher.
LA DISCRETISATION : LES METHODES Classes d’amplitude égale : cette méthode consiste à effectuer le rapport entre l’étendue (e) de la série et le nombre (n) de classes souhaitées. Les classes sont ensuite fixées en ajoutant le résultat, c’est-à-dire l’amplitude au minimum.Cette méthode se prête mieux à une distribution uniforme. La discrétisation selon les quantiles : elle permet de diviser une série en classes contenant les mêmes effectifs. Elle convient pour des distributions dissymétriques à plusieurs seuils ou pics.
LA DISCRETISATION : LES METHODES La discrétisation selon les moyennes emboîtées : la série est d’abord divisée en 2 classes par la moyenne. Les 2 classes créées sont ensuite divisées par leur moyenne. La discrétisation standardisée : cette méthode est celle qui utilise la moyenne comme limite de classe l’écart-type pour calculer leur amplitude. Les classes ont l’amplitude d’un écart-type. Cette méthode convient pour une distribution symétrique. Il y’a aussi la discrétisation selon une progression géométrique et selon le relief de l’histogramme où le découpage s’effectue visuellement.
Distribution Discrétisation Uniforme Classes d’amplitude égale Symétrique Discrétisation standardisée (moyenne + écart type) Dissymétrique Progression géométrique Dissymétrique à pics Quantiles (Effectifs égaux) ou seuils observés
LA REPRESENTATION DES SERIES STATISTIQUES Plusieurs types de représentations permettent la restitution visuelle de l’information statistique. Cette restitution doit éviter de perdre l’information. Elle doit être facilement comprise. Elle doit passer par des choix pertinents des modes de représentation.
LA REPRESENTATION DES SERIES STATISTIQUES Les signes de volumes proportionnels (3D) : la hauteur varie en fonction des quantités à représenter. Inconvénient : il est parfois difficile de choisir un angle de vue qui permette de voir l’ensemble des unités géographiques.
LA REPRESENTATION DES SERIES STATISTIQUES L’information relative aux variables continues : Une variable géographique continue prend des valeurs en tout points de l’espace (température, altitude, etc.). Elle passe par des valeurs intermédiaires. On doit la cartographier à l’aide d’un mode de représentation qui conserve l’apparence visuelle de la continuité (isolignes, auréoles).
LA REPRESENTATION DES SERIES STATISTIQUES Les cartogrammes et les anamorphoses : Ces deux méthodes consistent en une déformation de la carte ou d’une zone résultant des déplacements de ses limites des points géographiques qu’elles visualisent. Objectif : révéler des tendances cachées afin de les analyser, de les interpréter voire de les communiquer.
LA REPRESENTATION DES SERIES STATISTIQUES Les cartes en 3 D issues du carroyage : Elles permettent de s’affranchir des inégalités de surface des circonscriptions administratives. Exemple des MNT pour la représentation des données altimétriques en implantation.
LA REPRESENTATION DES SERIES STATISTIQUES Autres modes de représentation : Les bandes alternées Le diagramme de triangulaire La régression linéaire et cartographie des résidus
REFERENCES BIBLIOGRAPHIQUES Michèle BEGUIN, Denise PUMAIN : La représentation des données géographiques: Statistiques et cartographie. Paris, A. Colin, 1994, 192 p. Didier POIDEVIN : La carte, moyen d’action. Guide pratique pour la conception et la réalisation de cartes. Paris, éd. Marketing, 1999, 199 p. http://www.acnantes.fr/peda/disc/histgeo/outice/microgeo/microgeo.htm