STATISTIQUES COURS 4 La régression
Nous avons vu divers tests statistiques afin de vérifier le degré d ’interdépendance entre 2 variables Test de t (catégorique- continue) Test du Chi-carré (catégorique-catégorique) Corrélation (continue-continue)
Dans certains cas le gestionnaire aura besoin de plus d ’information. Afin de se bâtir un tableau de contrôle, il voudra aussi mesurer l ’impact qu ’aura une (ou plusieurs) variable(s) sur une autre. À titre d ’exemple un gestionnaire voudra savoir quel est l ’impact de son investissement publicitaire sur ses ventes. De sa politique de bonus sur la performance de ses employés. C ’est alors qu ’on aura recours à la régression.
Un modèle de régression comporte toujours deux types de variables La variable dépendante (Y) qui est généralement constituée par le phénomène que l ’on veut expliquer (ventes, satisfaction, absentéisme etc) La ou les variable(s) indépendantes (X; ou X 1, X 2, X 3 etc.) qui, selon le gestionnaire, pourrait(ent) être en mesure d ’expliquer la variation de Y.
Lorsqu ’un modèle de régression ne comporte qu ’une variable indépendante on dit que c ’est une régression simple qui s ’exprime comme suit Y= + x+ Lorsqu ’un modèle comporte plusieurs variables indépendantes on aura Y= + 1 x 1 + 2 x 2 3 x 3 + 4 x 4+
La fonction Y= + x+ sera celle qui passera dans un nuage de points liant les Y au X tout en minimisant la différence entre les Y réels et les Y estimés par la droite de régression
Lien entre la part de marché d ’une marque de bière et le budget total de communication (en milliers$)
Analyse de la corrélation entre la dépense en communication et la part de marché
Impact du budget de communication sur les parts de marché
Le modèle peut alors s ’exprimer comme suit: Part de marché (%)= (X* milliers $ en communication)
Autrement dit Le modèle prédit une part de marché constante de 5% Un accroissement de 1% de P.M. pour chaque 1,000,000$ investit
Impact des trois composantes de la communication sur les parts de marché
Résultats de l ’analyse de régression
De une à trois variables Le pouvoir explicatif et managerial de trois variables est souvent plus grands que celui d ’une seule Mais ce n ’est le cas que si les variables indépendantes ne sont pas corrélées entre elles (D ’où leur nom) Autrement le R va augmenter sans que les ne soient significatifs (C ’est le problème dit de la multicollinéarité)
Extension et implications de l ’analyse. Impact de la promotion sur le % de ceux qui essaient une marque
Lien entre le taux de contact et les parts de marché
Les déterminants d ’un salaire