La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 1 5 : Typologies SAS DistanceS Classes.

Présentations similaires


Présentation au sujet: "QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 1 5 : Typologies SAS DistanceS Classes."— Transcription de la présentation:

1 QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 1 5 : Typologies SAS DistanceS Classes de typologie Typologies hiérarchiques Typologies nodales Qualité dune typologie

2 QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 2 Raison dêtre Les individus ont des logiques (sensibilités), des comportements et des caractéristiques différentes Ne pas tenir compte de ces différences et raisonner à un niveau agrégé (marché) conduit à des erreurs importantes Il faut donc « segmenter » cest à dire constituer des groupes Assez homogènes « adressables/contactables » avec un marketing-mix spécifique Dune taille suffisante pour que les actions soient rentables

3 QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 3 De la Segmentation à la Typologie La segmentation (marketing) peut être réalisée sur les trois blocs de variables (sensibilité (déclarative), comportement, caractéristiques (observées)) « a priori » si on connaît déjà des variables qui sont des déterminants importants du comportement (âge, genre, urbain …) On recherche un lien direct entre ces variables et une variable de comportement ( Typologie monothétique ou segmentation (arbre) « a posteriori » si on constitue des groupes ayant des attitudes homogènes par exemple à laide dun questionnaire typologie polythétique ou simplement typologie (nodale, hiérarchique) On relie ensuite lappartenance à un groupe avec un comportement dachat De manière concomitante quand on cherche à la fois un découpage explicatif mais avec des groupes cohérents

4 QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 4 Principe dune typologie Faire une typologie cest Mettre dans un groupe des individus « proches » Constituer un nombre raisonnable de groupes « différents » Questions clés : Comment définir « proches » ? (distances, similarité, dissimilarité) Comment savoir si les groupes obtenus sont intéressants ? Maximiser la variance inter-groupe / minimiser lintra-groupe R2, Pseudo F Difficultés : Il existe toujours plusieurs solutions Les solutions dépendent De lalgorithme Des valeurs de départ choisies

5 QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 5 DistanceS 3 axiomes fondamentaux signe d(A,B) > 0 ; d(A,B)=0 A=B symétrie d(A,B)= d(B,A) inégalité triangulaire : d(A,B)<=d(A,C)+d(C,B) Deux catégories de problème existence dune relation entre les variables (corrélation) : si n variables représentent la même information, cette information aura un poids n hétérogénéité des unités de mesure (centrer, réduire) Quand ce ne sont pas des distances … ce sont des similarité/dissimilarités

6 QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 6 Distances sur variables quantitatives Euclidienne non standardisée ( =1) standardisée à l'écart-type ( =1/ 2 ) standardisée à l'écart maximum ( =1/max (Xik-Xjk)) Minkovsky n=2 : dist euclidienne n=1 : dist rectangulaire poids unitaire = city-block Mahalanobis tient compte des corrélations entre les variables

7 QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 7 Distances sur fréquences Informationnelle (base modèles log-linéaires) Distance du Chi-2

8 QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 8 Distances sur variables binaires a (1,1); b(1,0) ; c(0,1); d(0,0) Ochiai = a/ racine [(a+b)*(a+c)] Yule = (a.d+c.b) / (a.d-c.b) Haman= [(a+d)-(c+b)] / [(a+d)+(c+b)]

9 QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 9 Classes de typologie Typologie en partitions fortes (classique) Un individu appartient à 1 seul groupe Typologies de recouvrement Un individu appartient à 1 ou plusieurs groupes Typologie floue Un individu appartient à chacun des groupes à un degré variable Formes fortes Lorsque lon effectue plusieurs typologies Certains individus sont souvent classés ensemble

10 QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 10 Typologies classiques I. Hiérarchiques (arbre) descendante - ascendante calcul de la matrice des distances à chaque étape limites : pas d'optimum global itérations et stockage fonction de la taille du problème II. Nodales heuristiques pour traiter de gros volumes à coût raisonnable Problèmes de la typologie pas de critère explicite pour le choix des variables, le nombre de groupes ou le choix d'une bonne typologie beaucoup moins formalisé que l'Analyse factorielle hypothèse : une classification est pertinente !

11 QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 11 Principe des méthodes hiérarchiques un cluster est un sous-ensemble dindividus proches Algorithme de Johnson calcul des distances ; regroupement selon les distances les plus faibles ; Caractéristiques : résistance à la transformation des données, résistance aux outliers capacité à séparer des groupes proches MAIS sensibilité aux ex-aequo, aux effets de chaînage,

12 QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 12 Méthode des centroïdes (moyennes) Regroupement des centroïdes les plus proches Méthode de la variance (Ward) Minimisation de la variance intra-groupe Méthode de chaînage simple : le plus court, le plus long complet moyen Différentes méthodes hiérarchiques

13 QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 13 Analyse - interprétation Analyse graphique : le dendrogramme Reporte les distances à la combinaison des clusters Les premiers regroupements sont à gauche Permet didentifier les regroupements qui « coûtent » le plus en terme de perte dinformation (longs segments horizontaux) !!! Ne pas le demander si les individus sont trop nombreux En fonction du nombre de groupes souhaité, faire la coupure dans larbre au nombre de segments Statistiques sur les variances inter et intra cluster

14 QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 14 Dendrogramme * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine C A S E Label Num PG0 1 òûòòòòòòòø PG70 18 ò÷ ó PG65 15 òûòø ó PG68 17 ò÷ ó ó PG60 14 òø ó ùòòòòòø PG66 16 òú ùòø ó ó PG10 4 òôòø ó ó ó PG40 10 òú ó ó ó ó PG1 2 ò÷ ó ùòòò÷ ùòø PG5 3 òòò÷ ó ó ó PG15 5 òòò÷ ó ó ùòòòø PG35 9 òòòòò÷ ó ó ó PG45 11 òòòòòòòòòòòòòòò÷ ó ùòòòø PG25 7 òòòòòòòòòòòòòòòòò÷ ó ùòòòòòòòòòòòø PG30 8 òòòòòòòòòòòòòòòòòòòòò÷ ó ùòòòòòòòòòòòø PG50 12 òòòòòòòòòòòòòòòòòòòòòòòòò÷ ó ó PG20 6 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷ ó PG55 13 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷

15 QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 15 Principe des méthodes nodales définir un nombre de groupe et un seuil de regroupement (S) calcul de la quantité de déplacement D AB = 2.d AB. (N A.N B /(N A +N B ) si D AB <= Seuil regroupement de A et B sinon nouveau type ou non classé options : calcul des centres à chaque individus ou à la fin de l'allocation (batch / lot)

16 QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 16 Remarques : la phase d'allocation initiale est sensible aux valeurs aberrantes (outliers) et à l'ordre des données => faire deux passages Combiner les approches hiérarchiques et nodales Dabord hiérarchique sur un sous-échantillon pour obtenir des centres de classe fiables Puis généralisation avec une méthode nodale

17 QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 17 Démarche Typologie nodale formulation du problème sélection d'une mesure de distance sélection d'une procédure décider le nombre de groupes interprétation et profil des groupes vérifier la validité des groupes

18 QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 18 Evaluation de la qualité de la typologie Variance intra-groupe R 2 = % de variance intra-cluster R 2 =1- w k /VT Pseudo F = {(T- w k ) / (G-1) } / {( w k ) / (n-G)}

19 QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 19 Apport de chaque découpage Sarrêter à celui qui commence le « plat » juste après une chute Pseudo t carré (appréciation marginale : le dernier découpage) R2 semi-partiel (appréciation globale)

20 QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 20 Milligan and Cooper (1985) and Cooper and Milligan (1984) compared thirty methods for estimating the number of population clusters using four hierarchical clustering methods. The three criteria that performed best in these simulation studies with a high degree of error in the data were a pseudo F statistic developed by Calinski and Harabasz (1974), a statistic referred to as J_e(2)/J_e(1) by Duda and Hart (1973) that can be transformed into a pseudo t^2 statistic, and the cubic clustering criterion. The pseudo F statistic and the CCC are printed by FASTCLUS; these two statistics and the pseudo t^2 statistic, which can be applied only to hierarchical methods, are printed by CLUSTER. It may be advisable to look for consensus among the three statistics, that is, local peaks of the CCC and pseudo F statistic combined with a small value of the pseudo t^2 statistic and a larger pseudo t^2 for the next cluster fusion. It must be emphasized that these criteria are appropriate only for compact or slightly elongated clusters, preferably clusters that are roughly multivariate normal.


Télécharger ppt "QUITTER MENU PRINCIPAL > > < < Spécialité Marketing Master Marketing et Stratégie Master MARKETING / Pierre Desmet 1 5 : Typologies SAS DistanceS Classes."

Présentations similaires


Annonces Google