Analyse des proximités, des préférences et typologie Michel Tenenhaus
2 1. Analyse factorielle dun tableau de distances Exemple Distances entre 10 villes européennes (en Miles)
3 Analyse factorielle dun tableau de distances Un nuage centré N de n points {x 1,…,x n } de R p. On dispose des distances d ij = ||x i – x j ||. On exprime les produits scalaires b ij = x i ´x j en fonction des distances (formule de Torgerson) : Doù : On obtient X en diagonalisant B : ACP de N Plan principal Les colonnes de X sont les composantes principales du nuage N
4 Utilisation de ALSCAL Carte de lEurope La solution est donnée à une rotation/réflexion près.
5 Qualité du résultat
6 2. Positionnement multidimensionnel de données de proximités Les données Un tableau de proximités p ij entre n objets Problème On recherche n points {x 1,…,x n } dans un plan tels que les contraintes soient respectées au mieux.
7 % de Confusion entre Signal 1 en ligne et Signal 2 en colonne Exemple : Les codes Morse
8 Utilisation de M-D-SCAL
9 ALSCAL et MDSCAL Soit n points {x 1,…,x n } dans un plan. Définition des disparités :
10 Qualité de la représentation graphique Les disparités sont une fonction décroissante des similarités
11 Validation
12 3. Étude des classifications spontanées des marques de cigarettes par les fumeurs Obtenir une classification-type des marques de cigarettes les plus vendues en France en fonction des perceptions des fumeurs. Objectif de létude :
13 Les données Chaque personne interrogée construit une typologie des 56 marques de cigarettes et donne des commentaires sur chaque groupe : 100 typologies avec des commentaires Chaque personne construit sa typologie sur les marques quelle déclare connaître.
14 La méthodologie a)Construire un indice de proximité entre les marques. b)Faire une représentation graphique du tableau des proximités. c)Faire une classification ascendante hiérarchique des 56 marques. d)Interpréter les groupes en fonction des commentaires.
15 Construction dun indice de proximité entre les marques N 1 (i, j) = Nombre de personnes connaissant les marques i et j N 2 (i, j) = Nombre de personnes connaissant les marques i et j et les mettant dans le même groupe p(i, j) = N 2 (i, j)/N 1 (i, j) = Indice de similarité entre les marques i et j
16 Tableau des proximités (extrait)
17 Analyse dun tableau de proximités … p(i,j)i j i k j Visualisation par analyse des proximités abcdef Classification ascendante hiérarchique
18 Analyse des proximités Au tableau de proximités {p(i, j)} on veut associer 56 points x 1,…, x 56 dun plan tels que : Air France Camel 6 Benson & Hedges Black & White 67 B&H Air France B&W Camel
19 Stress 1 =.147 Cor(dist., disp.) =.95 Carte des marques de cigarettes (M-D-SCAL)
20 Classification ascendante hiérarchique (Critère de la moyenne) Etape 1 : On regroupe les 2 marques i et j les plus proches. Etape 2 : Nouvelle marque [i, j]. Proximité entre k et [i, j] : On regroupe les deux « marques » les plus proches. Et ainsi de suite…
21
22 Classification choisie
23 Visualisation de la typologie Groupe 1 Groupe 2 Groupe 3 Groupe 4 Groupe 5
24 4. Analyse des préférences avec PREFMAP Tableau des fréquences dassociation entre les critères et les groupes Centre de gravité des groupes p Homme X1X1 X2X2
25 Axe 2 Groupe 1 Groupe 3 Groupe 4 Groupe 2 Groupe 5 Positionnement des commentaires La corrélation entre [Homme] et les projections est maximum.78*3.63*3
26 Calcul de la position des commentaires Solution 1.Régression de p Homme sur X 1, X 2 2. Normalisation
27 Utilisation de SPSS
28 Utilisation du Prefmap de XLSTAT
29 Carte des préférences groupe_1 groupe_2 groupe_3 groupe_4 groupe_5 Hommes Femmes Jeunes Moins_jeunes Aisés Tout_le_monde Grands_fumeurs Petits_fumeurs Snobs Prolétaires Employés Non_connaisseur s Fantaisie Luxe Pas_chère Chère Pharmaceutique Bâtarde Occasionnelle Courante Goût_agréable Léger Parfumé Infecte Corsé Mentholé Fade Esthétique Goût_américain Gâterie_offerte Passe_temps Pour_faire_bien Axe_1 Axe_2
30 Critères classés par valeur décroissante du R 2 >.76
31 Axe 2 Groupe 1 Groupe 3 Groupe 4 Groupe 2 Groupe 5 Conclusion de létude