La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Master MARKETING / Pierre Desmet

Présentations similaires


Présentation au sujet: "Master MARKETING / Pierre Desmet"— Transcription de la présentation:

1 Master MARKETING / Pierre Desmet
5 : Typologies SAS DistanceS Classes de typologie Typologies hiérarchiques Typologies nodales Qualité d’une typologie Master MARKETING / Pierre Desmet

2 Master MARKETING / Pierre Desmet
Raison d’être Les individus ont des logiques (sensibilités), des comportements et des caractéristiques différentes Ne pas tenir compte de ces différences et raisonner à un niveau agrégé (marché) conduit à des erreurs importantes Il faut donc « segmenter » c’est à dire constituer des groupes Assez homogènes « adressables/contactables » avec un marketing-mix spécifique D’une taille suffisante pour que les actions soient rentables Master MARKETING / Pierre Desmet

3 De la Segmentation à la Typologie
La segmentation (marketing) peut être réalisée sur les trois blocs de variables (sensibilité (déclarative), comportement, caractéristiques (observées)) « a priori » si on connaît déjà des variables qui sont des déterminants importants du comportement (âge, genre, urbain …) On recherche un lien direct entre ces variables et une variable de comportement ( Typologie monothétique ou segmentation (arbre) « a posteriori » si on constitue des groupes ayant des attitudes homogènes par exemple à l’aide d’un questionnaire typologie polythétique ou simplement typologie (nodale, hiérarchique) On relie ensuite l’appartenance à un groupe avec un comportement d’achat De manière concomitante quand on cherche à la fois un découpage explicatif mais avec des groupes cohérents Master MARKETING / Pierre Desmet

4 Principe d’une typologie
Faire une typologie c’est Mettre dans un groupe des individus « proches » Constituer un nombre raisonnable de groupes « différents » Questions clés : Comment définir « proches » ? (distances, similarité, dissimilarité) Comment savoir si les groupes obtenus sont intéressants ? Maximiser la variance inter-groupe / minimiser l’intra-groupe R2, Pseudo F Difficultés : Il existe toujours plusieurs solutions Les solutions dépendent De l’algorithme Des valeurs de départ choisies Master MARKETING / Pierre Desmet

5 Master MARKETING / Pierre Desmet
DistanceS 3 axiomes fondamentaux signe d(A,B) > 0 ; d(A,B)=0 <=> A=B symétrie d(A,B)= d(B,A) inégalité triangulaire : d(A,B)<=d(A,C)+d(C,B) Deux catégories de problème existence d’une relation entre les variables (corrélation) : si n variables représentent la même information, cette information aura un poids “n” hétérogénéité des unités de mesure (centrer, réduire) Quand ce ne sont pas des distances … ce sont des similarité/dissimilarités Master MARKETING / Pierre Desmet

6 Distances sur variables quantitatives
Euclidienne non standardisée (w=1) standardisée à l'écart-type (w=1/s2) standardisée à l'écart maximum (w=1/max (Xik-Xjk)) Minkovsky n=2 : dist euclidienne n=1 : dist rectangulaire poids unitaire = city-block Mahalanobis tient compte des corrélations entre les variables Master MARKETING / Pierre Desmet

7 Distances sur fréquences
Informationnelle (base modèles log-linéaires) Distance du Chi-2 Master MARKETING / Pierre Desmet

8 Distances sur variables binaires
a (1,1); b(1,0) ; c(0,1); d(0,0) Ochiai = a/ racine [(a+b)*(a+c)] Yule = (a.d+c.b) / (a.d-c.b) Haman = [(a+d)-(c+b)] / [(a+d)+(c+b)] Master MARKETING / Pierre Desmet

9 Master MARKETING / Pierre Desmet
Classes de typologie Typologie en partitions fortes (classique) Un individu appartient à 1 seul groupe Typologies de recouvrement Un individu appartient à 1 ou plusieurs groupes Typologie floue Un individu appartient à chacun des groupes à un degré variable Formes fortes Lorsque l’on effectue plusieurs typologies Certains individus sont souvent classés ensemble Master MARKETING / Pierre Desmet

10 Typologies classiques
I. Hiérarchiques (arbre) descendante - ascendante calcul de la matrice des distances à chaque étape limites : pas d'optimum global itérations et stockage fonction de la taille du problème II. Nodales heuristiques pour traiter de gros volumes à coût raisonnable Problèmes de la typologie pas de critère explicite pour le choix des variables, le nombre de groupes ou le choix d'une bonne typologie beaucoup moins formalisé que l'Analyse factorielle hypothèse : une classification est pertinente ! Master MARKETING / Pierre Desmet

11 Principe des méthodes hiérarchiques
un cluster est un sous-ensemble d’individus proches Algorithme de Johnson calcul des distances ; regroupement selon les distances les plus faibles ; Caractéristiques : résistance à la transformation des données, résistance aux outliers capacité à séparer des groupes proches MAIS sensibilité aux ex-aequo, aux effets de chaînage, Master MARKETING / Pierre Desmet

12 Différentes méthodes hiérarchiques
Méthode des centroïdes (moyennes) Regroupement des centroïdes les plus proches Méthode de la variance (Ward) Minimisation de la variance intra-groupe Méthode de chaînage simple : le plus court, le plus long complet moyen Master MARKETING / Pierre Desmet

13 Analyse - interprétation
Analyse graphique : le dendrogramme Reporte les distances à la combinaison des clusters Les premiers regroupements sont à gauche Permet d’identifier les regroupements qui « coûtent » le plus en terme de perte d’information (longs segments horizontaux) !!! Ne pas le demander si les individus sont trop nombreux En fonction du nombre de groupes souhaité, faire la coupure dans l’arbre au nombre de segments Statistiques sur les variances inter et intra cluster Master MARKETING / Pierre Desmet

14 Master MARKETING / Pierre Desmet
Dendrogramme * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine C A S E Label Num PG òûòòòòòòòø PG ò÷ ó PG òûòø ó PG ò÷ ó ó PG òø ó ùòòòòòø PG òú ùòø ó ó PG òôòø ó ó ó PG òú ó ó ó ó PG ò÷ ó ùòòò÷ ùòø PG òòò÷ ó ó ó PG òòò÷ ó ó ùòòòø PG òòòòò÷ ó ó ó PG òòòòòòòòòòòòòòò÷ ó ùòòòø PG òòòòòòòòòòòòòòòòò÷ ó ùòòòòòòòòòòòø PG òòòòòòòòòòòòòòòòòòòòò÷ ó ùòòòòòòòòòòòø PG òòòòòòòòòòòòòòòòòòòòòòòòò÷ ó ó PG òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷ ó PG òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷ Master MARKETING / Pierre Desmet

15 Principe des méthodes nodales
définir un nombre de groupe et un seuil de regroupement (S) calcul de la quantité de déplacement DAB = 2.dAB . (NA.NB/(NA+NB) si DAB <= Seuil regroupement de A et B sinon nouveau type ou non classé options : calcul des centres à chaque individus ou à la fin de l'allocation (batch / lot) Master MARKETING / Pierre Desmet

16 Master MARKETING / Pierre Desmet
Remarques : la phase d'allocation initiale est sensible aux valeurs aberrantes (outliers) et à l'ordre des données => faire deux passages Combiner les approches hiérarchiques et nodales D’abord hiérarchique sur un sous-échantillon pour obtenir des centres de classe fiables Puis généralisation avec une méthode nodale Master MARKETING / Pierre Desmet

17 Démarche Typologie nodale
formulation du problème sélection d'une mesure de distance sélection d'une procédure décider le nombre de groupes interprétation et profil des groupes vérifier la validité des groupes Master MARKETING / Pierre Desmet

18 Evaluation de la qualité de la typologie
Variance intra-groupe R2 = % de variance intra-cluster R2=1-wk/VT Pseudo F = {(T-wk) / (G-1) } / {(wk) / (n-G)} Master MARKETING / Pierre Desmet

19 Apport de chaque découpage
S’arrêter à celui qui commence le « plat » juste après une chute Pseudo t carré (appréciation marginale : le dernier découpage) R2 semi-partiel (appréciation globale) Master MARKETING / Pierre Desmet

20 Master MARKETING / Pierre Desmet
Milligan and Cooper (1985) and Cooper and Milligan (1984) compared thirty methods for estimating the number of population clusters using four hierarchical clustering methods. The three criteria that performed best in these simulation studies with a high degree of error in the data were a pseudo F statistic developed by Calinski and Harabasz (1974), a statistic referred to as J_e(2)/J_e(1) by Duda and Hart (1973) that can be transformed into a pseudo t^2 statistic, and the cubic clustering criterion. The pseudo F statistic and the CCC are printed by FASTCLUS; these two statistics and the pseudo t^2 statistic, which can be applied only to hierarchical methods, are printed by CLUSTER. It may be advisable to look for consensus among the three statistics, that is, local peaks of the CCC and pseudo F statistic combined with a small value of the pseudo t^2 statistic and a larger pseudo t^2 for the next cluster fusion. It must be emphasized that these criteria are appropriate only for compact or slightly elongated clusters, preferably clusters that are roughly multivariate normal. Master MARKETING / Pierre Desmet


Télécharger ppt "Master MARKETING / Pierre Desmet"

Présentations similaires


Annonces Google