La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Groupe 1: Classes de même intervalle Intervalle pour n classes: Classe 1: Minimum -> Minimum+Ic Classe 2: Minimum+Ic -> Minimum+(2*Ic) Classe i: … Classe.

Présentations similaires


Présentation au sujet: "Groupe 1: Classes de même intervalle Intervalle pour n classes: Classe 1: Minimum -> Minimum+Ic Classe 2: Minimum+Ic -> Minimum+(2*Ic) Classe i: … Classe."— Transcription de la présentation:

1 Groupe 1: Classes de même intervalle Intervalle pour n classes: Classe 1: Minimum -> Minimum+Ic Classe 2: Minimum+Ic -> Minimum+(2*Ic) Classe i: … Classe n: Minimum+((n-1)*Ic) -> Minimum+(n*Ic) o Maximum Désavantages: Très sensible aux valeurs extrêmes Avec une distribution asymétrique ou qui présente des discontinuités, certaines classes peuvent être vides ou il peut y avoir une concentration dans certaines classes. Avantages: Facilité de calcul et dinterprétation. Très utile lorsque la variable va de 0 à 1 ou de 0 à 100, … ou en valeurs extrêmes connues.

2 Groupe 1: Progression arithmétique Pour n classes, on calcule la raison de la progression: Classe 1: Minimum -> Minimum+A Classe 2: Minimum+A -> Minimum+(2*A) Classe i:… Classe n: Minimum+((n-1)*A) -> Minimum+(n*A) Mêmes désavantages Avantages: permet davoir plus de classes dans les petites valeurs, utile lorsque la distribution est asymétrique.

3 Groupe 1: Progression géométrique Pour n classes, on calcule la raison de la progression: Classe1: Minimum -> Minimum*G Classe 2: Minimum*G -> Minimum*G2 Classe i:… Classe n: Minimum*G(n-1) -> Minimum*Gn Cette méthode propose des classes encore plus fines dans les petites valeurs. Elle correspond à la méthode des intervalles égaux pour une variable ayant subie une transformation logarithmique. Cette méthode suppose que le minimum ne soit pas 0.

4 Prendre les fichier LR et le fichier des densités Faire la carte des densités, et modifier la discrétisation avec Ctrl+E, Ctrl+A, Ctrl+G Conclusion ? Regarder lhistogramme et le diagramme boite et moustaches Exercice

5 Groupe 1: Utilisation 1.Vérifier que la distribution ne présente pas de forte dissymétrie, des valeurs du minimum et maximum trop singulières, ou des discontinuités dans la distribution. 2.Si la distribution est à peu près normale ou uniforme, il est préférable dutiliser les intervalles égaux. Dans le second cas, cette méthode sera proche des quantiles. 3.Si la distribution présente de fortes dissymétries dans les petites valeurs, il est préférable dutiliser la progression arithmétique. 4.Si, en plus de la dissymétrie, la distribution se rapproche dun modèle log-normal, utiliser la progression géométrique. 5.La progression arithmétique ou géométrique peuvent être utilisés quand il sagit de montrer des phénomènes particuliers qui se distribuent de cette manière, par exemple la densité de la population ou la hiérarchie des villes.

6 Groupe 2: Classes selon les quantiles Cette méthode calcule les limites de classes de manière à ce que chaque classe ait le même nombre dobservation. Nombre dobservation dans chaque classe: m = Nombre dobservations / Nombre de classes La série dobservations est ordonnée selon les valeurs croissantes de la variable. On compte m observations pour construire une classe. Les limites des classes sont des valeurs réelles de la série. Si n=4, on obtient des quartiles. Si n=10, ce sont des percentiles, etc.

7 Inconvénients: Il est possible que chaque classe nait pas exactement le même nombre dobservations, parce quil peut exister plusieurs observations avec la même valeur. Dans ce cas, il peut exister un déséquilibre des classes. Il peut être aussi très difficile de construire les classes dans le cas de séries très discontinues. Sil existe des valeurs extrêmes particulières, les limites de classes seront difficiles à interpréter. Dans ce cas, on découpe deux classes extrêmes correspondants aux percentiles 5 et 95. Avantages: Cette méthode fonctionne avec nimporte quel type de distribution, normale ou pas. Elle est indépendante des valeurs, et des valeurs extrêmes. Cette méthode permet une comparaison entre différentes séries ou cartes, en comparant lordre des observations dans la distribution. En considérant que chaque classe dispose du même nombre dobservation, lentropie est maximum. Ceci signifie que cette méthode apporte le maximum dinformation graphique, et la meilleure lecture possible. Les limites de classes sont des valeurs réelles.

8 Groupe 2: Moyenne et écart-type On calcule la moyenne (m) et lécart type (s) Les limites de classes sont calculées de la manière suivante: Nombre paire de classesNombre impaire Classe 1: (m-0.5s)Classe 2: (m-2s) -> (m-1s) Classe 3: (m-0.5s) -> (m+0.5s)Classe 3: (m-1s) -> m Classe 4: (m+0.5s) -> (m+1.5s)Classe 4: m -> (m+1s) Classe 5 > m+1.5sClasse 5: (m+1s) -> (m+2s) Classe 6 > m+2s Cette méthode calcule les limites de classes selon une fraction décart-type. Il est nécessaire que la distribution soit normale, ou que lon ait réalisé une transformation de la variable pour que la distribution sapproche dun modèle normal. Avantage: Permet la comparaison entre variables très différentes puisquon norme la variable à partir de sa moyenne et de son écart-type, à condition davoir une distribution normale. Parfois il est nécessaire disoler les valeurs extrêmes qui sortent de lintervalle de confiance.

9 Groupe 2: - Moyennes emboîtées La moyenne arithmétique sépare la distribution en deux groupes. Chaque sous-groupe peut faire lobjet du calcul de moyenne ce qui divise la distribution en 4 groupes. Etc. Avec cette méthode, on ne peut avoir que 2, 4 ou 8 classes.

10 Avantages: Construit des groupes selon des valeurs statistiques connues : les moyennes arithmétiques. Si la distribution na pas des valeurs extrêmes exceptionnelles, on sapproche dune distribution par quantiles. Si la distribution es très asymétrique, on sapproche dune discrétisation par progression géométrique. Inconvénients: Sil y a des trous importants dans la distribution, particulièrement dans les valeurs extrêmes, la moyenne na plus de sens. Le nombre de classes est invariable : 2, 4 ou 8.

11 Groupe 2: - Méthode de Jenks ou danalyse de variance. Cette méthode propose, sur la base dune analyse de variance, de minimiser la variance intra-classe, et de maximiser la variance inter-classe. On ordonne les données par valeur croissante On cherche tous les groupes possibles pouvant former k classes. Pour chaque configuration, on calcule la variance à lintérieur du groupe, et entre les groupes. On compare lensemble des valeurs et on prend la configuration qui minimise la variance dans le groupe et maximisa la variance entre les groupes. Avantage: Cette méthode est la meilleure du point de vue statistique parce quelle crée des groupes homogènes et très hétérogènes entre eux. Les limites de classes sont des valeurs réelles de la distribution. Inconvénient: Peu de stabilité en augmentant le nombre de classes. Ne peut sappliquer quà des valeurs faibles (problème dalgorithme)

12 Groupe 2: - Equiprobabilités. Cette méthode est basée sur la distribution théorique des probabilités associée aux paramètres de la distribution réelle. La distribution de fréquence adoptée est une equirépartition avec le même numéro dobservations dans chaque classe. Le numéro dobservation est calculé comme: E = Numéro total dobservations / Numéro de classes. On utilise la table des probabilités dune loi normale pour chercher la probabilité davoir E individus dans chaque classe. Cette valeur théorique correspond à des valeurs centrées réduites. On utilise la moyenne et lécart type de la distribution pour calculer les limites de classes. Avantages: Si la distribution est normale, on cumule les avantages de la méthode des quantiles et celle de lécart type. Fréquences et probabilités sont alors similaires. Si la distribution nest pas normale, le nombre dobservations dans chaque classe nest pas constant et la différence indique la distance entre les deux distributions.

13 Fichier pop-age-ct.txt (cantons) Prendre 8 classes et la variable % jeune <15 Faire les cartes correspondant à Quantile, Probabilité, Jenks, Equirépartition, Medias et écart-type. Pour chaque carte : faire menu Statistique / Statistiques descriptives Relever les paramètres Normalité, Redondance, Intra/inter Faire un tableau récapitulatif Conclusion ?

14 Comparaison des paramètres stats 8 classes % jeunes NormalitéRedondanceIntra/Inter Quantiles Probabilités Jenks Equiprobabilité Ecart-type Moyennes

15 Conclusion Le rapport Intra/inter est le plus intéressant : plus il est faible, meilleure est la discrétisation : grande homogénéité dans la classe, forte hétérogénéité entre les classes. Dans notre cas ??? Quantile, Jenks et Moyennes sont les plus efficaces. Dans le cas de léquiprobabilité, des moyennes emboîtées et de lécart type, la représentation cartographique peut se faire au moyen dune gamme de couleurs en opposition. Dans le cas de la méthode des écart types, lutilisation dun nombre impaire de classe permet davoir une classe centrale autour de la moyenne.

16 Groupe 3: Courbe clinographique Cette méthode permet de choisir les limites de classe dune variable à partir de la distribution dune autre variable. Un cas typique est la distribution de la population en fonction de la superficie de chaque unité. Un autre cas possible est la distribution dun pourcentage en fonction de la valeur brute de cette variable. Pour réaliser cette courbe, il est nécessaire: Ordonner la variable principale X par valeur croissante Calculer le cumul de la variable Y Calculer le % cumulé de Y La courbe se construit en posant en abscisse la variable X (par exemple la densité) et en ordonnée la variable Y cumulée (par exemple la population ou la superficie). On prend les limites de classes de X correspondant à 100/k de la variable Y, correspondant à k classes.

17 Avantage: Permet dinclure dans la discrétisation une variable de pondération. En général on utilise une population ou une superficie. Chaque classe contient alors la même quantité dindividus ou de superficie (et non dunités spatiales). Létude de la forme de la courbe donne des indications sur la distribution statistique et sur la répartition géographique. Exercice avec le LR: fichier densite-lr.txt (carte densite + population et densité + superficie) Exercice avec les cantons : fichier pop-age-ct.txt (carte Jeune + population, âgés + population)

18 Groupe 3: Utilisateur et histogramme A partir de la carte du % de personnes âgées, faire Ctrl+U et préciser les valeurs. Montrer les divers types de graphiques et à laide du menu Modif., modifier les classes.

19 Signification dune discrétisation La discrétisation optimum nexiste pas. Chaque méthode donnera une carte différente, plus ou moins conforme à la distribution de départ, et ceci pour deux raisons : Lagrégation de données en classes, cest à dire la réduction de linformation utile; ceci introduit une erreur ou une distorsion dans la perception de cette distribution. Le modèle de distribution intervient dans le choix dune discrétisation. Ceci introduit une hypothèse qui nécessite un test. Trois paramètres permettent de choisir une discrétisation : Une seule carte ou un groupe de cartes à comparer; Tester ou non une hypothèse statistique; Conformation de la distribution à un modèle particulier. Chaque fois, il est nécessaire de tester la signification des classes réalisées, soit au moyen dune analyse de variance, soit au moyen de la comparaison des moyennes des classes.

20

21

22

23


Télécharger ppt "Groupe 1: Classes de même intervalle Intervalle pour n classes: Classe 1: Minimum -> Minimum+Ic Classe 2: Minimum+Ic -> Minimum+(2*Ic) Classe i: … Classe."

Présentations similaires


Annonces Google