La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Analyse des données appliquée au marketing 3. Expérimentation

Présentations similaires


Présentation au sujet: "Analyse des données appliquée au marketing 3. Expérimentation"— Transcription de la présentation:

1 Analyse des données appliquée au marketing 3. Expérimentation
Pierre DESMET Master MARKETING / Pierre Desmet

2 Sommaire général 1. Introduction 2. Tests
3. Expérimentation et Analyse de Variance 4. Analyses factorielles et des similarités 5. Typologies et Segmentation 6. Régression logistique et Analyse discriminante 7. Mesure et Méthodes avancées 8. Régression Master Marketing de Paris-Dauphine

3 3. Expérimentation et Analyse de variance
faire varier de manière contrôlée une variable pour mesurer son effet sur une autre Mesurer une relation causale Plan d’expérience Analyse des résultats Une variable à expliquer (métrique) 1 facteur contrôlé nominal : ANOVA Plusieurs facteurs ANOVA 1 facteur + covariable : ANCOVA Plusieurs variables à expliquer (métriques) MANOVA MANCOVA Master Marketing de Paris-Dauphine

4 Causalité et Expérimentation
On cherche à mettre en évidence une relation de cause à effet entre X et Y Conditions à respecter pour établir la relation causale Variation concomitante (dx, dy) Séquence temporelle / Présence manipulée Élimination des autres causes possibles Indépendance (Orthogonalité) des variables dépendantes entre elles Quasi-expérimentation si pas d’affectation aléatoire des individus Exemple mesure Avant-après sur un seul groupe Variables VI (indépendantes, X) VD (dépendante, Y) VI manipulée (pack) ou VI invoquée (groupage des individus sur les modalités) Master Marketing de Paris-Dauphine

5 Procédure Définition de la question marketing :
Quel est l’effet de la mention sur le pack sur les ventes du produit ? Construction de la base théorique Les variables situationnelles : Evaluatives : Attention, perception, préférence, choix Attitude (envers l’annonce, la marque,..) Valeur perçue, satisfaction, fidélité Intermédiaires : risque perçu, Les variables modératrices : Individuelles : genre, revenu, csp,… Psychologiques stables : aversion pour le risque,… Interactives : relation à la marque, implication produit,… Master Marketing de Paris-Dauphine

6 Le modèle Relation de causalité Relation avec médiatrice Relation avec modératrice X Y X Z Y X Y + Z Naturalité perçue Préférence Pour le pack Mention sur Le pack Préférence Pour le pack Mention sur Le pack Sensibilité aux colorants Sensibilité aux colorants Rédiger clairement les hypothèses pour pouvoir les rejeter H1 : La mention « sans colorant » accroît la préférence pour le pack H1a M(sans) > M(avec) - H1b M(sans)<= M(avec) H2 : Plus la sensibilité à la présence de colorants est forte, plus l’effet de la mention sur la préférence est élevé. H2a [M(sans,s+) - M(avec,s+) ] > [M(sans,s-) - M(avec,s-) ] Master Marketing de Paris-Dauphine

7 Construire un modèle utile
De la gauche vers la droite : le chemin de l’influence de X sur Y Puis de la droite vers la gauche : les autres variables importantes qui peuvent influencer Y et qu’il faut mesurer ou contrôler Identifier Les hypothèses « validées » (par les connaissances, l’expérience, le quali..) Les hypothèses « à valider » Exemple : Maggi souhaite lancer un sachet de soupe déshydratée en 5 assiettes au lieu de 4 … Proposez un modèle Master Marketing de Paris-Dauphine

8 Plan Inter ou Intra-sujets
Démarche Un échantillon représentatif : accent sur les relations et l’effet Préférence pour le pack A versus B Des groupes différents : accent sur les modérateurs Clients de la marque / versus concurrence Comment éliminer les spécificités personnelles ? Neutraliser : affectation aléatoire à un groupe Un groupe n’évalue qu’une option les groupes « identiques » Contrôler par des mesures répétées Un seul groupe qui évalue les options Mais effet de la méthodologie (ordre de la présentation,..) Master Marketing de Paris-Dauphine

9 Validité des résultats
Interne : Force de la conclusion Facteurs non pris en compte dans l’analyse Le temps La répétition L’environnement Les mesures L’interaction des répondants avec la méthodologie La modification de l’échantillon (mortalité) L’affectation des répondants Externe : Généralité de la conclusion Représentativité des répondants Représentativité-réalisme des stimulis Contexte expérimental Master Marketing de Paris-Dauphine

10 Les causes possibles des variations
Il faut isoler ces effets Traitement (E) Effet de la manipulation Histoire (H) évolution de l’environnement Contamination (I) Modification des réponses en fonction de la connaissance de l’objet de l’expérimentation (effet de demande) Maturation (M) évolution des sujets (t, t+n) Test (T) Changement des réponses, ou biais, provoqué par la mesure Sélection (S) Variation dans la composition de l’échantillon : Auto-sélection; échantillonnage; non réponse Instrumentation Changement dans l’instrument de mesure (enquêteur,…) Régression statistique Présence de valeurs extrêmes; sélection successive en fonction de réponses précédentes Mortalité Réduction de l’échantillon par le refus de participation : collecte contraignante Master Marketing de Paris-Dauphine

11 Plans expérimentaux Grandes classes Quasi-expérimental : Avant-Après
Double affectation aléatoire des individus aux cellules ; des traitements aux cellules Observation – Mesure Traitement Quelles comparaisons Entre les groupes d’individus Entre les réponses d’un même groupe A Après seulement – Groupe de contrôle Groupe 1 A X O1 Groupe 2 O2 O X Avant - Après – Groupe de contrôle Groupe 1 A O1 X O2 Groupe 2 O3 O4 Solomon 4 groupes Groupe 1 A O1 X O2 Groupe 2 O3 O4 Groupe 3 O5 Groupe 4 O6 Master Marketing de Paris-Dauphine

12 Mesure des effets D1-D3-(D2-D4) X O1 ? O2 O2-O1 E H I M (T) (S) O3 O4
= D3-D5 D1-D3-(D2-D4) D2-D4 D4+D5-D3 Source : Lambin JJ La recherce Marketing, McGraw Hill Master Marketing de Paris-Dauphine

13 Plans statistiques Mise en évidence de l’effet de plusieurs facteurs
Effet du prix sur Des magasins de tailles différentes Situés dans des régions différentes Plans Complet : toutes les possibilités Permet de tester les effets d’interaction Fractionné : combinaison choisie des modalités Moins de cellules donc gourmand en effectifs Master Marketing de Paris-Dauphine

14 Plans statistiques complets
Plan factoriel : 2 variables (X, Y), même nombre de modalités (2) 3 modalités -> 3² groupes = 9 groupes 3 var, 3 modalités ->27 groupes Plan factoriel en blocs aléatoires Groupage des individus selon une variable à contrôler Plan factoriel 2 variables X y Groupe 1 1 Groupe 2 2 Groupe 3 Groupe 4 Master Marketing de Paris-Dauphine

15 Plans statistiques fractionnés
Carré latin : 3 variables (X, Y, Z), même nombre de modalités (3) le groupe 3 reçoit [3, 1, 2] Autres tailles Gréco-latin : 4 variables Hyper-gréco-latin : 5 variables 3 Carré latin 3 variables X1 X2 X3 Y1 Z1 Z3 Z2 Y2 Y3 Master Marketing de Paris-Dauphine

16 Analyse de variance : Postulats
Modèle linéaire d’effets indépendants Une moyenne générale (m) Des effets spécifiques par facteur (ai) pour la modalité i du facteur I Des effets d’interaction (aibi) ) Une variable aléatoire (e) qui dépend des facteurs (i,j) mais aussi de l’observation (k) Mesures dans les cellules (combinaison de traitements) Normalité Égalité des variances, surtout si les effectifs sont différents Homogénéité des covariances (échantillons appariés) Terminologie Variations totales, Factorielles, Résiduelles Variations ou Somme de carrés (ex : VF = S ni (mx1 – mx.)2 ) Master Marketing de Paris-Dauphine

17 Analyse de variance Hypothèse
Les effets sont linéaires : X = Moyenne + effet du facteur + erreur H1a : 1 = 2 =3 pas de différence de moyenne entre niveaux H1b : au moins une moyenne est différente des autres Les facteurs contrôlés sont différents ENTRE les groupes mais identiques à l'intérieur de chaque groupe (VF variations factorielles) Les facteurs incontrôlés ont la même influence quel que soit le groupe (VR variations résiduelles) Le théorème de la décomposition de la variance (intra et inter) VT=VF+VR Master Marketing de Paris-Dauphine

18 Qualité globale : Test F de Fisher
Test de la qualité globale du modèle I = nombre de niveaux du facteur, N= nombre d’observations (I-1; N-1) degrés de liberté Interprétation H0 : aucune effet de X sur Y (moyenne identique) Si F calc > F critique : rejet de H0 Master Marketing de Paris-Dauphine

19 Rapport de corrélation - êta carré (h2)
Si le F diagnostique l’existence d’une relation, eta carré détermine la force de cette relation Mesure d’association entre une variable quantitative et une variable non quantitative (nominale ou ordinale) Ex : pouvoir explicatif du genre sur le montant des dépenses Eta2 = Variations expliquées / Variations totales Eta2 e [0, 1] S’interprète comme le % des variations de la variable quantitative expliquées par la variable nominale/ordinale Master Marketing de Paris-Dauphine

20 Exemple de lecture Effet du prix sur les ventes des magasins (q)
3 niveaux de prix 4 types de magasin, 30 observations par magasin Relation globalement significative (F) Mais Faible (Eta2 ou R2) Effet du prix Significatif (t) Dans quel sens ? (demander solution) Master Marketing de Paris-Dauphine

21 Analyse de variance multivariée : Les interactions
Les effets de variables peuvent se combiner pour S’amplifier ou Se neutraliser Sans interactinn Variable dépendante Variable indépendante Interactinn ordinale Interactinn dis-ordinale Sans croisement Interactinn dis-ordinale Avec croisement Master Marketing de Paris-Dauphine

22 2 facteurs avec interaction
Effet du magasin Significatif Effet de l’interaction Significative Amélioration de la qualité globale Attention ! Les effets d’interaction sont toujours à analyser d’abord Car ils changent l’interprétation des effets directs Master Marketing de Paris-Dauphine

23 Problème des comparaisons multiples
Quand il y a plusieurs groupes, les tests en t (2 groupes) ne sont pas adaptés Car pour chaque test d’hypothèse, on additionne les risques d’erreur alpha pour k groupes : k.(k-1)/2 comparaisons… Pour 3 groupes avec un risque alpha=5%, la probabilité qu’aucune comparaison ne soit significative est (0.95*0.95*0.95)=0.857 soit un risque alpha réel de 14.3% Objectif des corrections Comparer les moyennes des groupes en contrôlant pour l’inflation des risques a (type I) pour toutes les comparaisons Garder un risque a de 5% pour toutes les comparaisons => le risque a pour chaque comparaison sera d’autant plus petit que le nombre de comparaisons est important Master Marketing de Paris-Dauphine

24 Bonferroni, Scheffé, Dunnett
Comparaison a priori ou a posteriori des groupes Corrections pour des comparaisons multiples Dunn-Bonferroni : (la correction plus simple a priori) a corrigé =  / nombre de tests. 5%-> 1% si 5 comparaisons Autres tests ( a posteriori) Dunnett : les groupes sont comparés à un groupe de contrôle Contrastes non orthogonaux - Usage fréquent Tukey HSD: Compare toutes les paires possibles adapté s’il y a de nombreux groupes à comparer Scheffé : très conservateur mais accepte des groupes inégaux. Correction pour toutes les comparaisons possibles (paires ou composées) en augmentant la différence critique. Une différence à elle seule doit être assez grande pour rendre le F global significatif. Master Marketing de Paris-Dauphine

25 Test des différences Bonferroni (test en t) Scheffé (test en F)
Master Marketing de Paris-Dauphine

26 Contrastes un test a priori de différences de moyennes (hypothèse préalable) Un Contraste est une somme pondérée des moyennes dont la valeur attendue sous H0 est nulle C = a1.m1 + a2.m2 + a3.m3 Comparaison sur une combinaison linéaire de plusieurs groupes Test d’une combinaison linéaire des (nb groupes-1) contrastes Si a = [1 0 –1] alors on a C = m1 - m3 Si a = [1 –1/2 –1/2] alors on a C = m m m3 Contrastes particuliers Helmert (groupes ordonné) [ ] [ ] [ ] Contraste polynomial Prise en compte successive d’un trend linéaire, quadratique, cubique Master Marketing de Paris-Dauphine

27 Contrastes orthogonaux
Des Contrastes orthogonaux sont indépendants les uns des autres Pour que 2 contrastes soient orthogonaux, il faut que la Somme des produits des coefficients de chaque variable soit NULLE Somme des coefficients d’un contraste soit NULLE Exemple C1 : [ ] et C2 : [ ] C1 : [ ] et C2 : [ ] Générer des contraste orthogonaux : Tous les contrastes doivent être orthogonaux 2 à 2 Chaque contraste a sa somme des carrés a 1 degré de liberté au numérateur et ddl erreur au dénominateur. Master Marketing de Paris-Dauphine

28 Choix des sommes des carrés de Type I à III
I Hiérarchique : l’ordre détermine la prise en compte des variables. F de l’effet = SC de l’effet / SC des effets précédents II Non expérimental F de l’effet = SC de l’effet / SC des effets de son niveau et des niveaux inférieurs III Régression F de l’effet = SC de l’effet / SC de tous les autres effets Préconisations Type I si les variables ont un ordre d’importance ET les groupes de taille identique Type II déconseillé Type III à privilégier (même si effectifs inégaux) : option par défaut Approfondir : Master Marketing de Paris-Dauphine

29 Moyennes et Moyennes estimées
Moyenne (MEAN) correspond à la moyenne arithmétique C’est la moyenne générale Moyenne estimée (LSMEANS) correspond à la moyenne estimée par le modèle utilisé C’est la moyenne des moyennes des niveaux d’un facteur Elle est ajustée en fonction de la moyenne des variables indépendantes Elles sont différentes S’il y a des valeurs manquantes ou des effectifs différents S’il y a des variables explicatives (covariates) Master Marketing de Paris-Dauphine

30 ANCOVA et MANOVA ANCOVA
Permet de tenir compte d’un facteur/variable que l ’on peut mesurer mais non contrôler L’effet de la variable non contrôlé est éliminé d’abord avant de prendre en compte les facteurs MANOVA Prendre en compte plusieurs variables à expliquer (Y1, Y2, Y3) Voir s’il y a un effet global de la variable explicative Puis chercher sur quelle variable plus particulièrement il y a un effet par des ANOVA Master Marketing de Paris-Dauphine

31 Modèles mixtes Les modèles mixtes prennent en compte la différence des répondants lors d’analyses de mesures répétées Modèle de base Y = a + b.X + e Introduction d’une constante par répondant (i) Yit = a + b.Xit + S b.di + eit Prise en compte des variations des coefficients selon des caractéristiques des répondants (modèles multi-niveaux ou hiérarchiques) Yit = ai + bi.Xit + S b.di + eit ai = a + c.Zi + g0i bi = b + d.Ki + g1i Master Marketing de Paris-Dauphine


Télécharger ppt "Analyse des données appliquée au marketing 3. Expérimentation"

Présentations similaires


Annonces Google