CARTOGRAPHIE STATISTIQUE

Slides:



Advertisements
Présentations similaires
Présentation des données
Advertisements

ANALYSE GÉOMÉTRIQUE DES DONNÉES
GESTION DE PORTEFEUILLE chapitre n° 7
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Chapitre 5. Description numérique d’une variable statistique.
Formation en Analyse des Données
C1 Bio-statistiques F. KOHLER
Statistique et probabilités au collège
Régression -corrélation
RESUMÉ.
Statistiques descriptives
Traitement de données socio-économiques et techniques d’analyse :
Séminaire dAnalyses comparatives et enquête sociologique Séances 8 et 9 Lanalyse des résultats.
Les principaux résumés de la statistique
Cours Corporate finance Eléments de théorie du portefeuille Le Medaf
Epidémiologie, analyse spatiale et géostatistique
Régression linéaire simple
Groupe 1: Classes de même intervalle
Dominique LOUIS – Stage cartographie – 8 mars 2006 Discrétisation cartographique La carte, un ensemble de choix.
STATISTIQUES POUR LA CARTOGRAPHIE
Comprendre la variation dans les données: Notions de base
Corrélation et régression linéaire simple
Mesures de répartition de la population Claude Marois 2012.
Commentaires sur les biais écologiques et les échelles non emboîtées
Avantages et Désavantages
Symbolisation et Sémiologie graphique
Traitement des données de flux. Analyse multivariée Conclusion sur la construction et linterprétation des cartes statistiques Indicateurs démographiques.
CARTOGRAPHIE STATISTIQUE
La régression multiple
Régression linéaire multiple : hypothèses & interprétation. Partie 2.
Régression linéaire multiple : hypothèses & interprétation
Mesures de position Ils s’expriment dans la même unité que les observations Moyenne et moyenne pondérée Exemple : on dispose du nombre moyen d’enfants.
Statistique Descriptive Analyse des données
Biostatistiques Quand on souhaite étudier une (ou des) caractéristique(s) sur un ensemble d’individus ou d’objets, il est difficile, voir impossible, d’observer.
Outils mathématiques pour le datamining
COURS STATISTIQUE - DESCRIPTIVE DEFINITIONS
N. Yamaguchi1 Statistiques Séance 6 – 16 Nov 2005.
STATISTIQUE DESCRIPTIVE ÉLÉMENTAIRE
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
Séance 8 30 novembre 2005 N. Yamaguchi
ANALYSE D’UN ÉCHANTILLON PORTANT SUR UNE VARIABLE STATISTIQUE
Sériation et traitement de données archéologiques
STATISTIQUE DESCRIPTIVE Dr LEMDAOUI MOHAMED CHERIF
SIG et Santé Théorie et pratique, avec le SIG SavGIS Contenu du cours
Introduction à une analyse statistique de données
Statistiques descriptives-Distributions expérimentales à une dimension
Olivier Leclair, Université Laval Un algorithme de fouille dans une représentation des données par objets: une application médicale SIMON, Arnaud.
Étude de l’écoulement moyen
PARAMETRES STATISTIQUES
STATISTIQUES DESCRIPTIVES
Chapitre 2 La statistique descriptive I
Analyse des semis de point
Statistique Descriptive Les Paramètres de Tendance Centrale
Rapport 20 Final 40 Partiel TD.
Détecter les groupes à hauts risques cardiaques à partir de caractéristiques telles que l’alimentation, le fait de fumer ou pas, les antécédents familiaux.
Analyse de données avec R
Bienvenue!  Professeur : Dr. David Beaudoin.  Disponibilité : Mardi 15h30-17h local  Disponibilité d’Antoine Gautier: Mardi et Jeudi à compter.
BIOSTATISTIQUES Définitions.
BIOSTATISTIQUES Définitions.
Classification-Segmentation
Mesures de description des valeurs des variables
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs.
Introduction à l’analyse multidimensionnelle Master BOE LATLI Adrien
Hadrien Commenges Université Paris 7, Géographie-cités Hélène Mathian CNRS – Géographie-cités Claude Grasland Université Paris 7, Géographie-cités Introduction.
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
Chapitre 12 Des modeles corrélationnelles. A la fin de ce chapitre on sera capable de:  definir le but et l’utilisation des modeles correlationnelles.
STATISTIQUE DESCRIPTIVE
Processus ponctuels Caractéristiques et Modèles de répartitions spatiales.
Transcription de la présentation:

CARTOGRAPHIE STATISTIQUE Louis Arréghini Hubert Mazurek Institut de Recherche pour le Développement Estamos en un periodo donde existe una abundencia de teorias, practicas, metodologias que pretenden resolver el problema de la pobreza y de la seguridad alimentaria en los paises del Sur. Estamos tambien en un momento en donde la sociedad civil, la sociedad politica, y la sociedad de los investigadores, se estan pensando que hay algo que no funciona en estos mecanismos. Estamos finalmente en un mundo regulado por el “monstro” de la globalizaciùon como si fuera una resignacion que nos cayera del cielo !!

Contenu – Jour 1 1 – Introduction: objectif et usage de la cartographie statistique 2 – Particularités de la statistique pour la géographie 3 – Traitement à partir de la statistique descriptive 3.1 – Quelques notions de base 3.2 – Processus de discrétisation des variables 3.3 – Test de signification de la discrétisation 3.4 – Relation entre la distribution spatiale et la distribution statistique. 4 – Symbolisation et sémiologie graphique 5 – Cartographie statistique et chorématique

Contenu – Jour 2 5 – Distribution spatiale, hétérogénéité et comparaison de données 5.1 – La mesure de la diversité 5.2 – Mesure de la spécificité en relation à un modèle 5.4 - Régression 5.5 – Analyse structure – résidus 5.7 – Analyse en composante principale et analyse de correspondance 5.8 – Classification 6 – Traitement des données de flux.

Contenu – Jour 3 7 – Conclusion sur la construction et l’interprétation des cartes statistiques 8 – L’étude des recensements Avantages et désavantages des recensements Comparaison entre recensements Problèmes relatifs à l’agrégation des données 9 – Indicateurs démographiques et interprétation à partir des cartes.

Des apports multiples, une diversification et une complémentarité des outils de production cartographique.

La différence SIG / CS SIG: Changements fréquents de l’information géoréférencée Les lieux sont plus importants que leurs caractéristiques CS: Changement de l’information statistique Les caractéristiques sont plus importantes que les lieux.

La géographie n’est pas seulement la cartographie: Structure spatiale Dynamique spatiale Formation d’un territoire Relations entre territoires Facteurs qui influencent la dynamique territoriale

L’interprétation de ces processus peuvent s’appuyer sur une série de méthodes dont les méthodes statistiques sont les plus développées. Presque toutes les disciplines utilisent ces méthodes: la sociologie, l’économie ou l’écologie; en se limitant souvent aux statistiques descriptives. Une moyenne, une distribution de fréquence peuvent elles avoir des interprétations différentes selon qu’elles s’utilisent en sociologie, en biologie ou en géographie ? L’écart type mesure-t-il réellement une dispersion spatiale ? Comment montrer des structures et des dynamiques au moyen de méthodes qui n’ont rien de spatial ?

PARTICULARITES DES METHODES STATISTIQUES POUR LA GEOGRAPHIE Données et méthodes

Données Il existe trois types de données: Qualitatif cardinal: Modalités d’un caractère, en général discontinu: classification climatique ou classe d’une typologie. Qualitatif ordinal: Modalités ordonnable d’un caractère; inclue les valeurs bianires (présence absence) et les classifications ordonnées, par exemple une note ou un gradient. Quantitatif: Numération ou mesure avec des valeurs continues. La majeur partie des données apparetiennent à cette classe: population, température, production, etc.

Méthodes Les méthodes se rangent en 4 types: Méthodes basées sur les statistiques descriptives (une, dos ou plus dimensions). On utilise les paramètres qui caractérisent la distribution des données. Méthodes basées sur les probabilités (modèles théoriques). Il s’agit de vérifier la conformation d’une distribution avec une distribution théorique ayant les mêmes paramètres. L’inférence statistique (estimation et hypothèse). Il s’agit de comparer la distribution des données avec un modèle et d’établir une estimation et une erreur. Analyse multivariée : Modèles d’interraction au sein d’un ensemble de variables homogènes.

Individu – Population - Unité Les données géographiques ont une valeur numérique plus une localisation. Elles ne sont pas sonstitutées d’une distribution d’individus mais d’une distribution de population. Chaque élément de la distribution est une aggrégation d’une série de caractères qui sont localisées. L’analyse de la distribution géographique est par conséquent l’analyse de la répartition spatiale d’une distribution de population.

Les trois éléments de base de la représentation graphique Localisation Précision Echelle Point X,Y dX, dY Individus   Entités Groupes Ligne X0,Y0 - X1,Y1 Chemin Angle, longitude Axes Direction Flux Polygone X0, Y0 - Xn, Yn Arête Imprécision Fonction POLY Noeud Ensemble

Changement d’échelle et agrégation

Courbes de concentration suivant le niveau d’agrégation des données

Autre exemple avec l’indice de pauvreté en Bolivie Limites de classes différentes L’histogramme n’a pas la même structure L’interprétation dépend de l’échelle et du niveau d’agrégation des données.

Exemple du Pando

Introduction à la distance La métrique de Minkowski résume la mesure de la distance dans un espace à p dimensions. p=1: distance de Manhattan p=2: distance euclidienne (matrice des corrélations en ACP) P=2: en utilisant la matrice de covariance: Distance D2 de Mahalanobis

Introduction à la distance Distance du (Matrice de contingence en AFC)

Distances : loi de gravité Distance euclidienne / distance réelle (technique de la régression) = Estimation de la dépendance

Programme de Cartographie Statistique CABRAL Programme de Cartographie Statistique

DISCRETISATION

Rappel 1 Distribution de données Distribution de fréquence Fréquence / Fréquence relative Histogramme: Superficie proportionnelle à la valeur de chaque classe Sinon c’est un diagramme en bâtons Numéro optimum de classes: Méthode de Hunstberger: Méthode de Brooks-Carruthers:

Rappel 2 Amplitude Médiane Moyenne arithmétique Différence moyenne nationale, moyenne géographique Quantiles Variance Ecart-type Coefficient de détermination ou de variation Moment

Pourquoi découper en classes ?

Discrétisation Permettre une meilleure interprétation visuelle des cartes. L’oeil humain ne peut distinguer qu’entre 8 et 10 tonalités différentes d’une même gamme. Evaluer la similitude entre les unités. Celles qui appartiennent à la même classe peuvent être considérées comme étant très proche du point de vue statistique. Disponer de tests fiables pour mesurer cette similitude. Tester des hypothèses en relation à la méthode utilisée. Dans une certaine mesure, l’utilisation de classes permet d’éliminer certaines erreurs de l’échantillonnage. Ceci peut se tester.

Types de discrétisation Méthodes arithmétiques non statistiques Equidistance Progression arithmétique Progression géométrique Méthodes statistiques Quantiles Par écart-type Moyennes emboîtées Jenks ou analyse de variance Equiprobabilités Méthodes graphiques Histogramme Courbe clinographique Courbe de distance ou de superficie

Relation structure spatiales et distribution statistique

Exercice 1 Ouvrir Cabral Menu Fichier / Espace de Travail / Répertoire Choisir le répertoire où se trouve le matériel Menu Fichier / Espace de Travail / Nouveau ou F2 1 – Utilisation des fichiers SAS (fcant90.sas et fond-dep-canton.sas) Fichier des données : densite-cant.txt Faire la carte des densités Refaire la manip avec le fonds Adobe (fond-cantons.ai) Regarder l’histogramme Conclusion ? Faire Ctrl+E , Ctrl+A , Ctrl+G , Ctrl+S, Ctrl+Q Conclusion sur cette dernière phase ?