Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parEmmanuelle Tison Modifié depuis plus de 10 années
1
Robustesse......en Analyse Spatiale Didier JOSSELIN ESPACE, UMR 6012, CNRS, Avignon, France didier.josselin@univ-avignon.fr Tél.: 04 90 16 26 93
2
PLAN -Quest-ce que la robustesse ? -La qualité dans les données -La robustesse des méthodes statistiques : appréhension empirique avec la Médienne -La robustesse de la décision -Conclusions à travers quelques applications
3
Le processus danalyse (spatiale) EXPERT OUTILS STATISTIQUES Données (Spatiales) Décision, Règles Connaissance... Approche Analyse
4
Quest-ce que la robustesse (au sens large) ? Tronc Racine Branches Feuilles La robustesse augmente... Avoir ou montrer une force, une vigueur Etre résistant aux maladies et aux perturbations
5
Besoin de robustesse ?...à différents niveaux du processus danalyse : 1- Données : « Qualité » 2- Méthodes statistiques : « Robustesse, résistance » 3- Aide à la décision « ? » Plus dintervention De lexpert ZAPPER
6
1 – Robustesse des données : qualité (Goodchild, Gopal, 1989, Goodchild, Jeansoulin, 1998) Structure de données Base de données Métadonnées Données Complétude Précision Fiabilité Adéquation etc. Bruit ?
7
Qualité des données : notre proposition Fournir à lexpert des indicateurs et des cartes duals pour évaluer la qualité de linformation
8
Question : la moyenne est-elle robuste ?
9
Question : la médiane est-elle robuste ?
10
Manipulation de la robustesse, de la moyenne, de la médiane…
11
2 – Robustesse des outils statistiques Fouille de données : Capacité de généralisation Détection des dépendances statistiques Conservation de toutes les données Elimination du bruit Outils statistiques : Résistance aux outliers Adéquation Justesse Hypothèses...
12
Robustesse dun outil statistique / estimateur : définition (Andrews et al., 1972, Huber, 1981, Hoaglin, Mosteller, Tukey, 1983, Hampel et al., 1986, Lecoutre et Tassi, 1987) Un estimateur est dit resistant sil est peu affecté par un petit nombre de grosses erreurs ou par un grand nombre de petites erreurs Un estimateur est dit robuste sil est peu affecté par un écart aux hypothèses sous-jacentes du modèle
13
Exemple dindice robuste : construction empirique de la médienne
14
Un problème concret posé : Conserver les zones homogènes et les zones hétérogènes ou de gradients (écotones) ….
15
Différentes distributions de groupes de pixels Données : vignes en Languedoc-Roussillon, France, INRA, Jean-Marc Robbez-Masson ZAPPER
16
Quels filtres sont couramment utilisés ? Données brutes Filtre médian Filtre moyen Filtre moyen pondéré Données : pullulation des campagnols, DRAF-SRPV Franche-Comté
17
: un échantillon de données ordonnées : sa médiane : sa moyenne Associer la moyenne et la médiane pour définir la médienne...
18
Comportement de la moyenne et de la médiane face aux outliers et « inliers » Outlier « Inlier »
19
Définition de la médienne
20
Une mesure de centralité qui s'adapte aux distributions locales Une combinaison linéaire des normes L1 et L2 (Dodge, 1987, 2000)... combinaison liée aux résistances de la moyenne et la médiane Les résistances étant estimées par un bootstrap But et principe de la médienne ( Josselin, 2000, Josselin et Ladiray, 2001)
21
Calcul de la médienne (simple) Quand la médiane est plus résistante que la moyenne la médienne tend vers la médiane vers la moyenne dans le cas inverse Mesure la résistance d'un estimateur with Lidée : une métrique qui sadapte à la distribution locale en combinant les normes L1 et L2
22
Formulation de la médienne de Laplace ( Laplace 1818, Stigler, 1973, 1986, Josselin et Ladiray, 2001, 2002) avec
23
Comment estimer les variances de la moyenne et de la médiane ? la voie du bootstrap (Efron, Tibshirani, 1993, Shao, Tu, 1995)
24
Le Bootstrap pour estimer la résistance X=(x 1,x 2,…,x N ) X* 1 X* 2 X* b … Soit un échantillon de données Un ensemble de B échantillons « bootstrappés » (tirage avec remise) F (X* 1 )F (X* 2 )F (X* b )… Un ensemble de B estimateurs pour chaque « fonction F » appliquée (moyenne, médiane…) Estimation de la variance de chaque estimateur F
25
Bootstrap : application à la médienne Estimateur : Variance de lestimateur :avec : Et covariance moyenne-médiane (pour médienne de Laplace) :
26
Application de la médienne au filtrage spatial : le cas de la pullulation du campagnol (Josselin, Ladiray, 2002) Degré de Contiguïté 1
27
Application de la médienne au filtrage spatial : le cas de la pullulation du campagnol Degré de Contiguïté 2
28
Application de la médienne au filtrage spatial : comparaison aux M estimateurs ZAPPE 2 ZAPPE 1
29
Propriétés de la médienne
30
La médienne confrontée à 4 distributions typiques Panel 1: Moyenne, médiane et médienne sont presque identiques Panel 2: Médiane et médienne sont plus résistantes aux outliers Panel 3: Distribution asymétrique où la médienne est proche de la médiane Panel 4: Distribution bimodale où moyenne et médienne sont plus robustes Mean Meadians Median
31
Comportement spécifique de la médienne de Laplace
32
Résultats : simulations et filtrage spatial
33
u on choisit un ensemble de lois statistiques u pour chaque distribution, on calcule son Efficacité Relative : le rapport entre la variance du meilleur estimateur testé et la variance de l'estimateur considéré (permutations de type Monte- Carlo) u le meilleur estimateur est celui qui possède : Le plus petit Ecart-type d'efficacité relative pour les diverses distributions Le plus grand Minimum d'efficacité relative (Robustesse) Evaluation de l'efficacité de la médienne (Hoaglin, Tukey, Mosteller, 1983 )
34
Efficacité relative et robustesse de la moyenne, la médiane et des médiennes selon différentes lois et l'effectif de la distribution.
35
Réflexions autour de la médienne et des normes Lp
36
Les normes Lp et leurs méthodes de minimisation découlent du modèle général de régression : (Dodge and Jurecková, 2000) Modèle de régression Où Y est une variable à expliquer par X 1, X 2,...,X j,..., X k variables explicatives Pour n données observées (i=1,2,...,n), le modèle est : Où les coefficients sont inconnus, Z un terme d'erreur avec z1, z2,..., zn les résidus.
37
Norme L 1 : p=1 ; objectif : minimiser les écarts absolus Métrique de Minkowsky ou Norme L p Avec Norme L 2 : p=2 ; méthodes des moindres carrés Norme L : p= ; minimiser le résidu absolu maximum (minmax)
38
Transcription graphique Norme L 1 : distance de Manhattan : H 1 +H 3 Norme L 2 : distance euclidienne : H 2 = (H 1 2 + H 3 2 ) 1/2 Norme L : H 1 = max ( H 1 ; H 3 ) A B C H 1H 1 H 2 H 3 La médiane minimise la norme L 1 La moyenne minimise la norme L 2 La moyenne des deux valeurs extrêmes minimise la norme L ZAPPER
39
Y aurait-il un couple robuste (p, valeur centrale) ? Et pourrait-il correspondre à la médienne ? Médiane Moyenne Exposant p Médiennes ? Valeur centrale Norme Lp Distribution gaussienne
40
Cas où médiane < médienne < moyenne et 1 < p médienne < 2 Médiane (p=1) Moyenne (p=2) Valeur de P de la norme Lp Médienne ( p 1,8 ) Valeur centrale minimisant la norme Lp
41
Cas où médienne > moyenne et p médienne > 2 Valeur de P de la norme Lp Valeur centrale minimisant la norme Lp Médienne ( p ) La médienne est très proche du couple (p,valeur centrale) le plus robuste
42
Cas où médienne < médiane et p médienne ?? Valeur de P de la norme Lp Valeur centrale minimisant la norme Lp Médienne (p ?) La médienne est différente du couple (p,valeur centrale) le plus robuste : p=6
43
Robustesse des outils statistiques : notre proposition exploratoire Ne jamais accepter par défaut la méthode la plus utilisée, mais rechercher la plus pertinente. Trouver des méthodes robustes capables de généraliser et qui sadaptent aux configurations locales des distributions statistiques et spatiales, tout conservant tous les individus...
44
3 – Robustesse dans laide à la décision Objectivité : La part de la connaissance qui est indépendante de lexpert ? Subjectivité : La pensée et la vision de lexpert ? Efficience Pertinence Durabilité « Incontestabilité » « Consensualité » « Généricité » Transposabilité ….. ? « Emergenciabilité » « Adaptabilité » dans le temps « Souplesse »
45
Aide à la décision et modélisation : quelques mots-clés et quelques pistes... Déductive Inductive Abductive Individus Résidus La tendance Micro- modèles Hypothético déductif Exploratoire Confirmatoire
46
Aide à la décision, notre proposition : Une modélisation locale instruite insérée dans une analyse globale Avec lE(S)DA
47
CONCLUSION et exemples dapplication
48
Quand on a des objectifs à atteindre et des données à traiter...
49
... à laide doutils et de méthodes statistiques plus ou moins appropriés...
50
La voie de lEDA...
51
On porte un regard critique sur les outils et les méthodes...
53
… que nous choisissons les plus robustes possible pour analyser les données...
55
... sur lesquelles nous formulons des hypothèses sans a priori.
57
On souhaite maîtriser le temps de lanalyse spatiale et faire partie intégrante du processus...
58
Le Distogramme Double Distributions et Discontinuités statistiques et spatiales Dynamique Distorsion de Données
59
… tout en restant en permanence proche des données... en considérant que les individus ne sont pas interchangeables...
61
... que nous éclairons par des représentations multiples...
62
Lavstat (Josselin, Chatonnay, Guerre, Dancuo, 1999)
63
... grâce aux liens dynamiques et à linteractivité.
65
On recherche la tendance comme la marge … et lon regarde de plus près les écarts au modèle, les résidus
66
Modèle gravitaire des échanges commerciaux (Josselin, Nicot, 2001)
67
… et les relations entre les objets géographiques.
68
ARPEGE (Josselin, 2000)
69
Lanalyse doit être globale et locale...à travers les échelles.
70
Analyse exploratoire multiscalaire (Foltête, Josselin, 2001)
71
… la validation des résultats mathématique et empirique.
73
On cherche aussi à appréhender le qualitatif et le quantitatif en même temps... Q Q Q
75
… la sémantique, la géométrie et la topologie...
77
… en considérant bien que la densité de la mesure nest pas constante.
78
…Si vous faites de lexplo, attention à … sion l explo toirera combina
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.