HISTORIQUE Les origines des techniques du positionnement multidimensionnel remontent aux travaux de Richardson (1938) qui cherchait à comprendre.

Slides:



Advertisements
Présentations similaires
LE SCHEMA CINEMATIQUE.
Advertisements

Analyse d’items Ensemble de procédés statistiques dont le but est d ’évaluer la qualité d’un instrument de mesure et des items qui le composent. Ensemble.
Chapitre 4: Le comportement des clients de l'UC
Introduction générale : quelques épreuves sensorielles
S. Meshoul & M. Batouche Equipe Vision, Laboratoire LIRE
Regroupement (clustering)
Regroupement (clustering)
RECONNAISSANCE DE FORMES
ANALYSE CONJOINTE 29/06/07- Analyse conjointe.
Collecte de données F. Kohler.
C1 Bio-statistiques F. KOHLER
Les TESTS STATISTIQUES
DEME - La méthode d’enquête – introduction
Les TESTS STATISTIQUES
Définition Contraintes / Astreintes Taches / Activités
La démarche clinique infirmière
LE SCHEMA CINEMATIQUE.
L ’ANALYSE MULTIDIMENSIONNELLE DES DONNEES
LE RECUEIL D’INFORMATION SUR LA DEMANDE
Analyse des proximités, des préférences et typologie Michel Tenenhaus.
Analyse des proximités, des préférences et typologie
Analyse des proximités
3.1 L’offre 3 Construire l'offre 3.1 L'offre 3.2 La valeur de l'offre
Présentation: NGOK Emmanuel Expert en comptabilité nationale AFRISTAT
CHAPITRE 17. LA SEGMENTATION
Analyse en Composantes Principales
Traitement de données socio-économiques et techniques d’analyse :
COURS 5 Les tableaux croisés, le chi-carré et la corrélation
LA SEGMENTATION STRATÉGIQUE
Lecture critique MA.
Thème 5 (suite) : le développement des échelles de mesure
Algorithmes Branch & Bound
L’ANALYSE SENSORIELLE
Programmes de maîtrise et de doctorat en démographie Modèles de risque et de durée Cours 2 Séance du 17 janvier 2014 Benoît Laplante, professeur.
Le management strategique
Groupe 1: Classes de même intervalle
La segmentation
Opération et systèmes de décision Faculté des Sciences de l administration MQT Probabilités et statistique Mesures caractéristiques.
Comprendre la variation dans les données: Notions de base
Comprendre le monde de l’entreprise
Les prévisions et la gestion de la demande
RECHERCHE COMMERCIALE
Interprétation automatique
La régression multiple
Présentation du marché obligataire
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
Intervalles de confiance pour des proportions L’inférence statistique
Sériation et traitement de données archéologiques
Travaux Pratiques Optimisation Combinatoire
Chapitre 1. Du constat à l’objectif de recherche
Knowledge discovery in Databases (KDD)
- Exemple de détermination de tolérance de localisation
Thème: Essai d’analyse comportementale du consommateur Algérois par rapport au yaourt et produits similaires. Cas d’étude: Yaourt Soummam Réalisé par.
Études de Marché MBA Hiver 2006 SÉANCE 3: LES DONNÉES PRIMAIRES: MÉTHODES QUALITATIVES.
JEAN-MARC FONTAN SOC-1101 COURS 4
Analyse des semis de point
Claude Matricon ("le marketing du réel") propose une classification qui permet de distinguer les 4 différents marchés dont dépend l'entreprise :  marché.
Détecter les groupes à hauts risques cardiaques à partir de caractéristiques telles que l’alimentation, le fait de fumer ou pas, les antécédents familiaux.
Classification-Segmentation
Être en relation avec les clients
ECHANTILLONAGE ET ESTIMATION
Introduction aux statistiques Intervalles de confiance
 Analyser le couple marché/produit  Etudier une politique commerciale autour des 4 P  Identifier les stratégies de fixation des prix, de communication.
 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs.
Les indices du commerce extérieur (ICE) méthodologie et réforme.
Introduction à l’analyse multidimensionnelle Master BOE LATLI Adrien
Processus ponctuels Caractéristiques et Modèles de répartitions spatiales.
Les dossiers patients d’un hôpital contiennent les attributs suivants : – nom – code postal – pression systolique en mm de mercure. – s’il est porteur.
Transcription de la présentation:

HISTORIQUE Les origines des techniques du positionnement multidimensionnel remontent aux travaux de Richardson (1938) qui cherchait à comprendre comment les individus regroupaient des ensembles d'objets, les classifiaient.

Définition Le Positionnement Multidimentionnel (« Multidimensional scaling » ou MDS) est un ensemble de techniques statistiques utilisées souvent dans le domaine de la visualisation d'information pour explorer les similarités et les dissimilarités dans les données. Le positionnement multidimentionnel est un cas particulier de l'analyse multivariée.

L ’ANALYSE MULTIDIMENSIONNELLE DES SIMILARITÉS  Principe: construire une carte perceptuelle à partir de mesure perçues de la similarité (ou dissimilarité) entre des objets  Les mesures de similarité correspondent à des distances psychologiques

L ’ANALYSE MULTIDIMENSIONNELLE DES SIMILARITÉS Illustration Plusieurs marques de boissons gazeuses ont fait l ’objet d ’une comparaison par paires auprès d ’un échantillon de consommateurs

L ’ANALYSE MULTIDIMENSIONNELLE DES SIMILARITÉS Non Cola Fresca  Sprite  Like  7 UP  Diète Non diète Pepsi DIMENSION 2  Coke  Diet Pepsi  Cola DIMENSION 1

L ’ANALYSE MULTIDIMENSIONNELLE DES SIMILARITÉS L’analyse MDS vise à déterminer les dimensions auxquelles les consommateurs se réfèrent lorsqu ’ils comparent des objets (produits, marques, etc.)

À quoi sert MDS? Sur quels critères choisit-on un aliment : sa couleur, sa texture, son odeur, son prix…? Qu’est ce qui détermine le choix des électeurs : l’appartenance politique du candidat, les positions exprimées, son charisme individuel…? Comment se situent les supermarchés présents sur Montréal les uns par rapport aux autres ? Comment se situent mon supermarché par rapport à un supermarché idéal ?

 Comment faire pour révéler la structure qui se cache derrière les disparités observées dans les comportements individuels d’achat, de vote, d’adhésion…  Fournir une représentation graphique du pattern des proximités entre un ensemble d'objets

1. Formulation du problème Préciser le but de MDS * Identifier les dimensions * Positionner des objets * Prendre des décisions de Re/positionnement Nombre d'objets à évaluer (entre 8 et 15)

Le choix des objets et de leur nombre doit être basé sur la problématique de recherche, la théorie, le jugement du chercheur… Administrer le questionnaire à un nombre d’individus correspondant au moins à 20 fois la taille de votre équipe

2. Point de départ: matrice de proximités Préférences - Rangez ces paires, de telle sorte que rang de 1 soit assigné à la paire la plus similaire - Affectez les objets similaires dans les mêmes groupes Fixer le nombre de groupes Laisser le répondant choisir, tendance à isoler les inconnus Perceptions - Sur une échelle de 1 à 100, indiquez le degré de similarité… - Répartissez 100 points entre chaque paire…

Matrice de proximités Matrice de proximités D Modèle métrique Perceptions: Indices de similarité/ dissimilarité Préférences Échelle intervalle / ratio Échelle ordinale Modèle métrique Modèle non métrique

En marketing: Analyser simultanément les préférences d’un panel de consommateurs pour un ensemble déterminé de produits En finance ou politique: Synthétiser les jugements émis par différents experts sur les risques présentés un ensemble d’opérateurs financiers ou de pays Des mesures objectives: Distance à vol d’oiseau entre 2 villes peuvent représenter les similarités Calculer les similarités au sein d’une population sur la base d’indices statistiques basés sur des données multivariées issues de mesures, de recensements…

Distance de similarité ou de dissimilarité? - Est-ce qu’un plus grand nombre entre une paire indique: les stimuli doivent être placés plus éloignés ou plus proches l’un de l'autre sur la carte??? - SPSS matrice de dissimilarité

3. Sélection d’une procédure MDS Nature des données d’entrée * Échelle ordinale  : données de préférence entre les paires * Échelle intervalle: Écart numérique entre chaque paire ALSCAL de SPSS: Construire des structures géométriques multidimensionnelles Résulte une production métrique même d’une procédure non métrique Résultats similaires produits par les méthodes métriques et non-métriques

Niveau individuel vs agrégé des répondants * Matrice agrégée : - Moyenne des matrices de proximité de l’ensemble des répondants - La carte perceptuelle est obtenue à partir de la moyenne des matrices de proximité l’ensemble des répondants * Matrice(s) individuelle(s) : Hommes vs Femmes Gros client …

Décider du nombre de dimensions à retenir Connaissance a priori: théorie ou recherche antérieure R²: mesure de la qualité d'ajustement (0.6) F-stress: mesure du manque d’ajustement des données de proximités par les dimensions  Objectif: minimiser ce critère pour améliorer la correspondance entre les proximités et les distances

Idée fondamentale du F-stress: Représenter chaque stimulus dans un espace euclidien, de telle sorte que 2 objets semblables soient représentés par 2 points proches l’un de l’autre

1- Attribuer des points à des coordonnées arbitraires dans l'espace à p dimensions 2- Calculer les distances euclidiennes entre tous les couples de points, pour former la matrice Dhat 3- Comparer la matrice Dhat avec la matrice d'entrée D en évaluant la fonction de stress. Plus la valeur est petite, plus grande est la correspondance entre les deux 4- Ajuster les coordonnées de chaque point de la meilleure façon en vue de baisser le f-stress 5- Répéter les étapes 2 à 4 jusqu'à ce que le stress soit à son minimum

Stress Vs Dimensionalité 0.1 0.2 1 4 3 2 5 0.0 0.3 Stress Number of Dimensions - Plus la mesure du Stress est faible, meilleure est la représentation Standards: tout ce qui est <0.10 est excellent tout ce qui est >0.15 est inacceptable Ajustement vs Interprétabilité

Exemple On se donne les distances à vol d'oiseau entre 10 villes américaines. Les données se présentent sous la forme suivante :

Exemple Atl Chi Den Hou LA Mia NY SF Sea DC 587 1212 701 1936 604 748 587 1212 701 1936 604 748 2139 2182 543 920 940 1745 1188 713 1858 1737 597 879 831 1726 1631 949 1021 1494 1374 968 1420 1645 1891 1220 2339 2451 347 959 2300 1092 2594 2734 923 2571 2408 205 678 2442 2329

Principales limites  Difficulté à interpréter la configuration produite par l ’analyse

Thank You! Questions?