Hadrien Commenges Université Paris 7, Géographie-cités Hélène Mathian CNRS – Géographie-cités Claude Grasland Université Paris 7, Géographie-cités Introduction.

Slides:



Advertisements
Présentations similaires
Corrélation Position du problème Définition covariance (X,Y) r =
Advertisements

Institut Français de recherche pour l'exploitation de la mer Variabilité hydrologique et courantologique dans le golfe de Gascogne, déterminées à partir.
Sociologie de l’action sociale contre la sociologie du fait social
1/17 Projet LAGAN Dechou & CO Développement dun programme de gestion dascenseurs Plan d'assurance qualité
Projet LAGAN Développement d’un programme de gestion d’ascenseurs
Excel 2007 et les services Excel. Pourquoi Excel ? Outil privilégié danalyse des données issues des bases multidimensionnelles Ergonomie connue des outils.
Introduction Pour concrétiser l’enseignement assisté par ordinateur
Dr Mohamadou SALL IPDSR
IDAMS Logiciel développé internationalement pour la gestion et lanalyse de données Organisation de Nations Unis pour léducation, la science et la culture.
C1 Bio-statistiques F. KOHLER
Entre construction théorique et mise en œuvre opérationnelle
DEME - La méthode d’enquête – introduction
L’analyse de graphique
Question 3 Représenter le monde Des outils pour la géographie
Connaissances Logiciel de géométrie dynamique Epreuve Expérimentale Série S 2007/08.
La prise en compte de la dimension spatiale en prospective :
Modélisation des systèmes non linéaires par des SIFs
PARTIE 3 : Le SYSTEME D’INFORMATION FUTUR
Module SIG-Santé 15. Modélisation Marc SOURIS
Analyse en Composantes Principales
Ecole thématique Dynamique de la production écrite : approche pluridisciplinaire Poitiers, 09 juillet 2013 Ecole thématique Dynamique de la production.
Traitement de données socio-économiques et techniques d’analyse :
Les Systèmes Multi-Agents pour la Gestion de Production
Analyse factorielle.
Administration de bases de données spatiales avec SavGIS
06/12/2005 C. Massot À PROPOS DE LOGICIELS STATISTIQUES.
Epidémiologie, analyse spatiale et géostatistique
Howell, Chap. 1 Position générale
DataLab® Toute la connaissance client en quelques minutes
Entre construction théorique et mise en œuvre opérationnelle
Introduction aux matrices : exemples en dynamique de population
Mesures de répartition de la population Claude Marois 2012.
ELEMENTS DE COURS 1. LERIDON H., TOULEMON L. (1997) – Démographie. Approche Statistiques et dynamique des populations. Paris, Economica. 2. FALISSARD.
Commentaires sur les biais écologiques et les échelles non emboîtées
La corrélation et la régression multiple
Les analyses multivariées
Tolerance Manager Un concept métier
Réalité virtuelle et Représentation de Données Complexes
CARTOGRAPHIE STATISTIQUE
Présentation de l’étude de cas : Accéléromètres MEMS
Sensibilisation a la modelisation
La géographie en quelques mots
Statistique Descriptive Analyse des données
ANALYSE DE DONNEES TESTS D’ASSOCIATION
Sériation et traitement de données archéologiques
Olivier Leclair, Université Laval Un algorithme de fouille dans une représentation des données par objets: une application médicale SIMON, Arnaud.
Cours n°1 Introduction, Conception
Modélisation des flux Introduction et définition
Knowledge discovery in Databases (KDD)
1 Licence Stat-info CM1 b 2004Christophe Genolini 2.1. Vocabulaire Individu : objet étudié Population : Ensemble des individus Variable : nom donné à ce.
Modèles dynamiques en épidémiologie
Atelier Créativité & Communication La sémiologie graphique L’information et sa représentation graphique.
systèmes d’information géographique
Le Marketing Prédictif
Analyse de données Cours 3 Analyse en composantes principales (ACP)
Présentation de l’étude de cas : Accéléromètres MEMS
Initialisation au logiciel (Statistical Analysis System)
Détecter les groupes à hauts risques cardiaques à partir de caractéristiques telles que l’alimentation, le fait de fumer ou pas, les antécédents familiaux.
Analyse de données avec R
ACP visualisation Représentation graphique: projection dans un plan de n individus à p caractères Un individu est un point d’un espace à p dimensions.
BIOSTATISTIQUES Définitions.
Classification-Segmentation
Les bases de données Séance 2 Méthodologies d’analyse.
 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs.
Introduction à l’analyse multidimensionnelle Master BOE LATLI Adrien
Introduction à l’analyse multidimensionnelle Master BOE LATLI Adrien
UML Unified Modeling Language. UML : 8 diagrammes 1.Classes 2.Activités 3.Séquences 4.Collaboration 5.Etats transition 6.Cas d’utilisation 7.Composants.
Processus ponctuels Caractéristiques et Modèles de répartitions spatiales.
Transcription de la présentation:

Hadrien Commenges Université Paris 7, Géographie-cités Hélène Mathian CNRS – Géographie-cités Claude Grasland Université Paris 7, Géographie-cités Introduction aux méthodes de traitement des données géographiques avec R

2 Expliquer la localisation d’un phénomène en un lieu Conjugaison de 3 dimensions localisation d’un phénomène en un lieu donné Spatiale Interactions avec les autres lieux « Ecologique » Caractéristiques humaines Et physiques de ce lieu Historique Héritage, succession d’événements en ce lieu D’après Durand-Dastès (Géopoint 1990) et Pumain, Saint-Julien (L’analyse spatiale, 1997, cursus, Colin) Composante horizontale Composantes verticales

3 Objectifs et moyens de l’analyse spatiale Objectifs : décrire et expliquer une organisation spatiale –Analyse des localisations et structures –Analyse des facteurs explicatifs Moyens : enchaînement de méthodes –Identification et description de structures spatiales –Tester la pertinence d’un modèle spatial –Simuler un processus spatial

4 Les méthodes statistiques au service de l’analyse spatiale Ensemble de techniques et méthodes statistiques pour décrire et expliquer les répartitions spatiales. -Approches exploratoires (Tukey) -Approches descriptives (analyse des données) -Approches explicatives (modèles linéaires, log-linéaires…) -Approche de généralisation (lissage)

5 L’analyse statistique de données spatiales A donné lieu à 3 types de développements méthodologiques: -l’analyse géostatistique -l’économétrie spatiale -l’analyse statistique spatiale et/ou analyse exploratoire des données spatiales (spatial data mining).

6 Différentes formalisations possibles pour un même objectif - décrire et comprendre l’évolution de la distribution de la population au niveau communal dans la région de Montpellier ; - proposer des prévisions pour 2020 approche statistique Micro- simulation modèle dynamique de type logistique

7 Les méthodes statistiques dans une démarche d’analyse spatiale pour décrire et expliquer les répartitions spatiales 1 variable univarié Ordres de grandeur: -tendance centrale -dispersion, variabilité -hétérogénéité 2 variables bivarié Analyse des relations -corrélations -test du chi2 -analyse de la variance plusieurs variables multivarié Analyse des données Toutes les variables jouent le même rôle -classifications - analyses factorielles Modèles statistiques Une variable « à expliquer » -analyse de la variance - modèle logit

8 De la « réalité » au Système d’Information 3 grandes phases de modélisations Acquisition Modélisation Représentation

9 Les données L’ensemble des observations de n individus décrits par p variables se présente sous la forme d’un tableau individus/caractères qui constitue les données. X 1 X 2 X j X p 12in12in x 11 x 12 x 1j x 1p x 21 x 22 x 2j x 2p x i1 x i2 x ij x ip x n1 x n2 x nj x np

10 Un jeu … de données Distribution statistique et distribution spatiale

11 Mise en œuvre dans logiciels Logiciel à script Logiciel à interface Orienté données géographiques Orienté méthodes statistiques Gratuit Libre

12 Intro à Le logiciel Interface Rstudio

13 Premiers pas: les objets Stat Tableau de données (X i,j ) Colonne Ou ligne X i ou X j Paramètre ou valeur R data.frame Vecteur Scalaire

14 Accéder aux objets Stat Tableau de données (X i,j ) Identifiant Colonne X j Ou Ligne X i Paramètre ou valeur R Montab ID Montab[3,] Montab[,10] Montab[2,3]

15 Type Stat Variable quantitative Variable qualitative Données manquantes R Type numeric Type character Type numeric (!) Type factor NA

16 Premières opérations Instruction Pseudo code -Calculer /31 Code dans R Afficher le résultat : / 31 Stocker le résultat : MonObj < / 31

17 Premières opérations Instruction Pseudo code -Faire somme de P.,j pour j = [1962… 2008] Code dans R sum(MonTab[, “POP1936”] sum(MonTab[, “POP1954”] etc. sum(MonTab[, 3] sum(MonTab[, 4] etc.

18 L’opérateur c() Créer un vecteur : vExemple1 <- c(1, 2, 3, 4, 5) vExemple1 ## [1] vExemple2 <- c("CP", "CE1", "CE2", "CM1", "CM2") vExemple2 ## [1] "CP" "CE1" "CE2" "CM1" "CM2 » Pour « voir » le contenu Combinaison de 5 valeurs pour Créer un vecteur

19 Exemple: créer un dataframe, gérer sa structure Créer un dataframe dExemple <- data.frame(vExemple1, vExemple2, stringsAsFactors = FALSE) colnames(dExemple) ## [1] "vExemple1" "vExemple2" colnames(dExemple) <- c("ID", "CLASSE") dExemple <- data.frame(ID = vExemple1, CLASSE = vExemple2, stringsAsFactors = FALSE) dExemple ## ID CLASSE ## 1 1 CP ## 2 2 CE1 ## 3 3 CE2 ## 4 4 CM1 ## 5 5 CM2

20 bonus Script tout fait de la cartographie

21 2è exo: intro variable quali Obj: manipulation de données quali -Recodage %oui-/- %non (factor) -Tri à plat (listing et stocké) -Diagramme en bâton

22 3è exo : croisement de variable) -Crée la var département -Quali-quali: Tri croisé= res_réfx dep -Quali-quanti- Traitement différencié: -Somme population par département -moyenne des % d’ouvriers par résultat référendum

23 Parallèle entre descriptif et création d’information agrégée

24 4è exo: melting pot Créer la variable "distance à Paris centre". Recoder la variables distance à Paris en 4 classes: 15km. Calculer revenu_hab par département et par classe de distance à Paris. Faire une la représentation graphique associée au croisement du revenu_hab et de la distance à Paris. (nuage de point des communes) Refaire cette représentation en différenciant les communes par département. Qu'observe-t-on ?

25 5è exo: bivarié- régression Quanti-quanti Construire une matrice de corrélation (variables à définir) %ouvrier et %non= régréssion simple –Nuage de points –coefficent

26 Manipulations avancées Superposition et concaténation SuperpositionConcaténation ou jointure Colonne identiques Colonnes différentes Même lignesLignes différentes

27 Manipulations avancées Traitement par ligne et par colonne (apply)

28 Manipulations avancées Transposition

29 Conclusion Ouverture : –SQL –objets géo et traitement stat spatiale