La perception subjective de la corrélation dans les nuages de points

Slides:



Advertisements
Présentations similaires
Introduction aux statistiques Intervalles de confiance
Advertisements

Temps de réaction et facteurs énergétiques
Approche graphique du nombre dérivé
Projections démographiques
Classification des signaux exemples de signaux réels
RECONNAISSANCE DE FORMES
ACTIVITES Le calcul littéral (3).
La méthode expérimentale TD 2 - Licence Laure Fernandez
4 février 2005DESS Economie et Gestion des Cliniques et Etablissements pour personnes âgées 1 La prise en compte des critères économiques dans lanalyse.
1. Les caractéristiques de dispersion. 11. Utilité.
Corrélations et ajustements linéaires.
Lecture de graphiques a. b. c. d. e. a. b. c. 1) 2)a. 2)b. 3)a. 3)b.
Psychoacoustique seuils de détection
Analyse de la variance à un facteur
Jérémie Malle, Patrice Clément, Patrice Tochon, André Bontemps
Christelle Scharff IFI 2004
Chapitre V : Cinétique chimique
Guy Gauthier, ing., Ph.D. Session été 2013.
Control des objectifs des technologies de l’information COBIT
Statistiques Séance 9 – 6 décembre 2005 N. Yamaguchi.
Cours de physique générale I Ph 11
Capital économique analyse et reporting pour Fortis Assurances
Département fédéral de lintérieur DFI Office fédéral de la statistique OFS La qualité de lemploi en Suisse Silvia Perrenoud Journées suisses de la statistique.
Cours Corporate finance Eléments de théorie du portefeuille Le Medaf
Régression linéaire simple
Partie 3 La psychophysique.
Réseaux de neurones.
Corrélation et régression linéaire simple
Veille Technologique : Étudier les avantages et inconvénients du typage statique et du typage dynamique pour des applications interactives Sujet proposé.
La méthodologie expérimentale Fondements et bases d’application
Guy Gauthier, ing., Ph.D. Session automne 2012.
La corrélation et la régression multiple
La corrélation et la régression
Le test t.
La corrélation et la régression
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Les modèles linéaires (Generalized Linear Models, GLM)
Corrélation Principe fondamental d’une analyse de corrélation
La méthodologie expérimentale Fondements et bases d’application
L’OFFRE ET LA DEMANDE.
LES ERREURS DE PRÉVISION e t = X t - P t X1X2X3X4 X5 X6…X1X2X3X4 X5 X6…X1X2X3X4 X5 X6…X1X2X3X4 X5 X6… P5P6P5P6P5P6P5P6 e5e6e5e6e5e6e5e6.
Objectifs Chapitre 8: Mesure en psychologie
Observatoire de lUFR, fév (Licence QMEE, 3ème année ) 1 PROFIL DES ÉTUDIANTS Responsable du diplôme: Edouard LAROCHE Licence Qualité et.
1 PROFIL DES ETUDIANTS Master SCIENCES POUR LINGÉNIEUR Spécialité: Mécatronique 2 ème année Responsables de la formation: Dominique Knittel. ANNEE UNIVERSITAIRE.
UFR DE PHYSIQUE ET INGÉNIERIE Spécialité: Mécatronique
DISCRIMINATION VISUELLE
La régression multiple
28/02/2013 JOURNEE DE FORMATION ACADEMIQUE - Un nouveau regard sur légalité des chances à lécole 1 Comparaison filles/garçons Après la 6ème.
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
Régression linéaire multiple : hypothèses & interprétation
ECOLE DES HAUTES ETUDES COMMERCIALES
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
1 Notations Asymptotiques Et Complexité Notations asymptotiques : 0 et  Complexité des algorithmes Exemples de calcul de complexité.
1 - Programme de Seconde (juin 2009) Statistique et probabilités
Conférence de presse du 21 août 2014 Perspectives démographiques à horizon 2040 Le Valais et ses régions Maurice Tornay Chef du Département des finances.
10 paires -. 9 séries de 3 étuis ( n° 1 à 27 ) 9 positions à jouer 5 tables Réalisé par M..Chardon.
Probabilités et Statistiques
Quel est l’intérêt d’utiliser le diagramme de Gantt dans la démarche de projet A partir d’un exemple concret, nous allons pouvoir exploiter plusieurs parties.
Dr. KHERRI Abdenacer 2014/ ECOLE DES HAUTES ETUDES COMMERCIALES.
1 Une méthode itérative pour l'unfolding des données expérimentales, stabilisée dynamiquement(*) Bogdan MALAESCU LAL LLR 28/09/2009 (*arxiv: )
Chimiometrie (Chemometrics)
Relevez le numéro de votre logo préféré et adressez-le à : En cas d’hésitation, vous pouvez choisir jusqu’à 3 logos. Seront pris.
ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage
Séance 8 30 novembre 2005 N. Yamaguchi
Probabilités et Statistiques Année 2010/2011
Visualisation de données : quand la carte se réinvente
Analyse des données. Plan Lien entre les statistiques et l’analyse des données Propagation des erreurs Ajustement de fonctions.
Dr Vincent BIGE Centre de référence Mucoviscidose de Lyon
Transcription de la présentation:

La perception subjective de la corrélation dans les nuages de points Alexandre THIL M2 SIP IHM

Présentation de l’article « The Perception of Correlation Scatterplots », Ronald A. Rensink, Gideon Baldrige, Eurovis 2010

Les nuages de points Utilisé en statistiques pour : Représenter visuellement des données dépendant de plusieurs variables Représenter la corrélation de données Permettent de déterminer visuellement : Tendances Relations Dispersion Valeurs aberrantes Nuage de point : scatterplot Les points sont placés sans être reliés Utile lorsque y dépend de x Souvent utilisé en statistiques : car permettent de montrer la corrélation Il est difficile de comparer l’efficacité de deux modèles, ou d’un en particulier

La corrélation

Problématique Difficile de représenter visuellement des données Difficile de déterminer le meilleur choix possible Des tests sont nécessaires Difficulté de représenter visuellement des données : il faut choisir le type de graphique, la taille, les types d’éléments, l’échelles des axes Il est difficile de déterminer le meilleur choix possible entre plusieurs configurations

Résultats des études réalisées Des résultats expérimentaux obtenus Mais ne sont pas validés scientifiquement Pour 2 < |r| < 6 : sous-estimation de la corrélation Pour 0 < |r| < 2 : pratiquement aucune corrélation percue

Problèmes rencontrés Exactitude Précision Erreur systématique Erreur systématique : si l’erreur sous-évalue ou sur-évalue toujours la mesure

Loi de Webber-Fechner La perception humaine des grandeurs physiques (ex: poids, luminosité…) n’est pas linéaire. La sensation varie comme le logarithme de l'excitation S = k.log(I) S : sensation perçue I : intensité de la stimulation k : constante ΔI/I = k ΔI : seuil différentiel ΔI /I: seuil différentiel relatif

Méthodologie But : déterminer l’évaluation subjective de la corrélation g(r) comme une fonction de la corrélation objective r. Générer des nuages de points de corrélation différentes (100 points selon une loi de distribution normale bivariée) Sélectionner un panel de testeurs Utiliser des méthodologies de test

Méthodologie 1 : Discrimination JND : Just Noticeable Difference (75%) Stimulus double Mesure : précision Chaque observateur voit deux nuages de points (l’un plus corrélé que l’autre) et doit sélectionner celui qui est le + corrélé.   La différence initiale des corrélations était de 1. Lorsqu’une réponse correcte est donnée, on soustrait 0,01 à la différence  La tâche devient plus difficile Lors d’une réponse incorrecte, la différence est augmentée de 0,03  tâche moins difficile Pour s’assurer une bonne qualité (de réponse***)  les graphiques sont remplacés chaque fois par de nouveaux. Le test se poursuit jusqu’une JND est trouvée (75% de succès des cas).

Méthodologie 2 : Estimation directe 1ère idée : chaque observateur assigne une note pour chaque graphique d’une série de test Mesure : précision Mauvaise précision si utilisation d’une échelle

Méthodologie 2 : Estimation directe Stimulus triple : deux images de référence, une de test L’observateur doit ajuster (au clavier) l’image de test pour que sa corrélation soit à mi-chemin de la corrélation des deux images de référence.

Méthodologie du test 20 observateurs (âge moyen 24 ans, tous habitués aux nuages de points) Méthodologies : discrimination et estimation directe Pas de limite de temps L’accent est mis sur la « précision  » Entraînement : séance de 50 essais

Suppression des valeurs aberrantes Ecart-type > 0,19 Beaucoup d’estimations < 0,2 4 observateurs défaillants  remplacés par de nouveaux observateurs

Résultats : Discrimination Temps moyen de décision : 1,6 secondes

Résultats : Discrimination

Résultats : Estimation directe g(r) = ln(1–b.r) / ln(1-b) avec b = 0,875 Les résultats concordent avec d’autres études Il y’a une forte sous-estimation de la corrélation pour 0,2 < |r| < 0,6

Comparaison Précision Exactitude

Conclusion de l’étude But de l’étude : proposer une méthodologie rigoureuse pour évaluer la capacité des observateurs à percevoir la corrélation dans les nuages de points, et pouvoir représenter mathématiquement la perception subjective de la corrélation On sait que l’activité cérébrale humaine augmente lorsque que la corrélation baisse Certains graphiques complexes peuvent compliquer la perception de la corrélation Il est préférable de présenter des graphiques clairs et simples pour la visualisation et l’analyse de données

Projets futurs Evaluer d’autres facteurs (ex: taille des points, formes et couleurs) pour déterminer leur impact sur la perception subjective Evaluer d’autres types de graphiques pour d’autres phénomènes (ex: graphiques en barres, courbes…) Evaluer d’autres perceptions (ex: moyennes, variances…)

Bibliographie « The Perception of Correlation in Scatterplots », Ronald A. Rensink and Rideon Baldridge, University of British Columbia, Vancouver, Canada « Image Quality Assessment Using Natural Scene Statistics », Sheikh Loi de Weber, Encyclopédie Universalis http://www.lepla.edu.pl/fr/modules/Activities/p04/p04-error1.htm http://www.tc3.edu/instruct/sbrown/ti83/regress.htm http://en.wikipedia.org/wiki/File:Oldfaithful3.png

Fin de l’exposé Merci pour votre attention N’hésitez pas à poser vos questions