La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Plan la séance 11 L’analyse multivariée

Présentations similaires


Présentation au sujet: "Plan la séance 11 L’analyse multivariée"— Transcription de la présentation:

1 Plan la séance 11 L’analyse multivariée
Les tableaux croisés L’hypothèse Le test du khi carré Démonstration du logiciel SPSS (tableaux croisés) Autres types d’analyses multivariées Comparaison de moyennes Analyses de variance Analyses de corrélation Analyses de régression Atelier : Réaliser des analyses croisées avec vos données Rencontre de chacune des équipes avec le professeur

2 Les tableaux croisés Analyse des données en fonction de deux variables (parfois plus) Variable indépendante VS variable dépendante Analyse du pourcentage des réponses selon la variable indépendante Comparaison des différences entre deux catégories de la variable indépendante

3 Tableau croisé de la variable « Consommation » selon le sexe
Existe-t-il des différences entre les hommes et les femmes dans le niveau de consommation? Les différences ne sont ni fortes, ni significatives (47,7%, p = 0,523)

4 L’hypothèse Proposition, souvent intuitive, qui permet d’expliquer un phénomène, (p. ex. : Les hommes consomment plus que les femmes) Afin de rejeter ou non une hypothèse, on doit démontrer l’existence de différences significatives entre deux catégories d’une variable (p. ex. féminin ou masculin pour le sexe) par rapport à une autre variable (p. e. le niveau de consommation). Formulation H0 : %F = %M (hypothèse nulle : il n’existe pas de différence entre les femmes et les hommes [quant au niveau de consommation]) H1 : %F ≠ %M (hypothèse alternative il existe une différence entre les femmes et les hommes [quant au niveau de consommation]) Dans cet exemple (diapo précédente), on ne rejette PAS l’hypothèse nulle

5 Test d’hypothèse : le test du khi carré (ou Khi deux – X2)
Un test statistique parmi les plus utiles Utilisable avec tout type de données : PCQ tous les types de données peuvent être transformées en données nominales Détection de différence significatives entre les fréquences observées dans l’étude et les fréquences théoriques attendues Seuil de signification : probabilité permettant de rejeter ou non l’hypothèse nulle H0 usuel ≥ 95% (p ≤ 0,05) Tiré et adapté de: McGown, K.L., Marketing Research: Text and Cases, Winthrop Publishers, 1979, p. 236

6 Tableau croisé de la variable « Restaurant » selon l’estime de soi
H0 : %SEI- = %SEI moyen = %SEI+ Il n’existe pas de différences entre le pourcentage des personnes dont l’estime est faible et celui des personnes dont l’estime est forte (quant à la mention du restaurant) L'estime de soi n'influence pas la mention du restaurant comme produit représentatif de l'image de soi H1 : %SEI- ≠ %SEI moyen ≠ %SEI+ Il existe des différences entre le pourcentage des personnes dont l’estime est faible et celui des personnes dont l’estime est forte (quant à la mention du restaurant) L'estime de soi influence la mention du restaurant comme produit représentatif de l'image de soi

7 Tableau croisé de la variable « Restaurant » selon l’estime de soi
H0 : %SEI - = %SEI moyen = %SEI + H1 : %SEI - ≠ %SEI moyen ≠ %SEI +

8 Tableau croisé de la variable « Restaurant » selon l’estime de soi

9 Tableau croisé de la variable « Restaurant » selon l’estime de soi
On peut rejeter H0 (il existe des différences entre %SEI- et %SEI+) Avec un seuil de signification supérieur à 95 % (p = 0,037) on peut affirmer qu’un pourcentage plus élevé de personnes dont l’estime de soi est faible mentionne le restaurant comme un produit représentatif de l’image de soi L'estime de soi influence la mention du restaurant comme produit représentatif de l'image de soi

10 Tableau croisé de l’usage d’internet selon le sexe Données du tableau 13.1
H0 : %F = %M Il n’existe pas de différences entre le pourcentage des femmes et celui des hommes (quant l’usage d’Internet) Le sexe n'influence pas l’usage d’internet H1 : %F ≠ %M Il existe des différences entre le pourcentage des femmes et celui des hommes (quant l’usage d’Internet) Le sexe influence l’usage d’internet

11 Tableau croisé de l’usage d’internet selon le sexe Données du tableau 13.1
H0 : %F = %H H1 : %F ≠ %H

12 Tableau croisé de l’usage d’internet selon le sexe Données du tableau 13.1

13 Tableau croisé de l’usage d’internet selon le sexe Données du tableau 13.1
On peut rejeter H0 (il existe des différences entre %F = %M) Avec un seuil de signification égal à 99 % (p = 0,010) on peut affirmer que seulement des hommes utilisent l’Internet 11 heures ou plus par semaine Inversement, on peut également affirmer qu’un pourcentage deux fois plus élevé de femmes que d’hommes utilisent l’Internet 5 heures ou moins par semaine Le sexe influence la durée de l’usage d’Internet

14 L’analyse de corrélation linéaire
Relation entre deux variables métriques (intervalle ou de proportion) L’augmentation de la variable 1 correspond-t-il à une augmentation ou à une diminution de la variable 2? Relation linéaire Coefficient de corrélation de Pearson (r) +1 = relation positive parfaite -1 = relation négative parfaite Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS,  5e éd.,  Paris: Pearson Education France.

15 Balises établies par Cohen (1988) pour estimer l’effet de corrélation
Coefficient de Pearson (r) Effet Autour de 0,10 Faible Autour de 0,30 Moyen Supérieur à 0,50 Fort Source :

16 Analyse de corrélation linéaire entre l’âge et l’estime de soi personnelle
Ho : r = 0 (aucune corrélation entre âge et SEI personnel) H1 : r ≠ 0 (corrélation entre âge et SEI personnel)

17 Analyse de corrélation linéaire entre l’âge et l’estime de soi personnelle
On peut rejeter H0 (il existe une corrélation entre l’âge et l’estime de soi personnelle) Avec un seuil de signification supérieur à 95 % (p = 0,027) on peut affirmer que l’âge influence l’estime de soi personnelle La valeur positive de r (= +0,169) indique une relation positive entre les variables En outre, la valeur plus proche de « 0 » que de « +1 » de r indique une corrélation positive imparfaite (plutôt faible) L’estime de soi personnelle augmente un peu avec l’âge

18 Analyse de corrélation linéaire entre l’attitude envers la ville et la durée de résidence Données du tableau 15.1 Ho : r = 0 (aucune corrélation entre attitude et durée) H1 : r ≠ 0 (corrélation entre attitude et durée)

19 Analyse de corrélation linéaire entre l’attitude envers la ville et la durée de résidence Données du tableau 15.1 On peut rejeter H0 (il existe une corrélation entre l’attitude envers la ville et la durée de résidence) Avec un seuil de signification supérieur à 99 % (p = 0,000) on peut affirmer que la durée de résidence influence l’attitude envers la ville La valeur positive de r est (= +0,936) indique une relation positive entre les variables En outre, la valeur très proche de « +1 » de r indique une corrélation positive presque parfaite (très forte) L’attitude envers la ville devient plus favorable avec une augmentation de la durée de résidence

20 Démonstration du logiciel SPSS
Réalisation de plusieurs analyses croisées avec des données fictives : tableau_13_1.sav : restaurants_categories.sav : Source :

21 Les comparaisons de moyennes
Analyser la relation entre une variable non métrique (nominale ou ordinale) et une variable métrique (intervalle ou de proportion) Comparaison de deux moyennes indépendantes Comparaison de deux moyennes appareillées Comparaison de plusieurs moyennes Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS,  5e éd.,  Paris: Pearson Education France.

22 Moyennes indépendantes Test en t (T-Test)
Hypothèse : H0 : μ1 = μ2 (les moyennes sont identiques) H1 : μ1 ≠ μ2 (les moyennes sont différentes) Si les moyennes sont différentes, il existe une relation entre la variable indépendante et la variable dépendante Rejeter H0 si t > 1,98 ou t < -1,98 p ≤ 0,05, seuil de signification ≥ 95 % Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS,  5e éd.,  Paris: Pearson Education France.

23 Moyennes indépendantes Analyse de la variable « Spectacle culturel » selon l’estime de soi
H0 : μ1 = μ2 (Moyenne SEI NON = Moyenne SEI OUI) H1 : μ1 ≠ μ2 (Moyenne SEI NON ≠ Moyenne SEI OUI) Bilatéral

24 Moyennes indépendantes Analyse de la variable « Spectacle culturel » selon l’estime de soi
Les personnes qui mentionnent le spectacle culturel comme un produit représentatif de leur image sont plus nombreuses que celles qui ne mentionnent pas ce produit (136 VS 39) L’écart des moyennes (6,10 VS 5,15) est significatif (t = 2,694) On peut rejeter H0 (les moyennes sont différentes) Avec un seuil de signification supérieur à 99 % (p = 0,008) on peut affirmer que la moyenne de l’estime de soi des personnes qui mentionnent le spectacle culturel comme un produit représentatif de leur image est plus faible L’estime de soi personnelle influence la mention du spectacle culturel comme produit représentatif de l’image de soi

25 Moyennes indépendantes Analyse de l’usage d’Internet selon le sexe Données du Tableau 13.1
H0 : μ1 = μ2 (Moyenne F = Moyenne M) H1 : μ1 ≠ μ2 (Moyenne F ≠ Moyenne M) Bilatéral

26 Moyennes indépendantes Analyse de l’usage d’Internet selon le sexe Données du Tableau 13.1
L’écart des moyennes (9,36 VS 3,87) est significatif (t = 4,354) On peut rejeter H0 (les moyennes sont différentes) Avec un seuil de signification supérieur à 99 % (p = 0,000) on peut affirmer que le nombre d’heures d’usage d’Internet est plus élevé pour les hommes (9,36) que pour les femmes (3,87) Le sexe influence l’usage de l’Internet

27 Moyennes appareillées Test en t (T-Test)
Hypothèse : H0 : μ1 = μ2 (les moyennes sont identiques) H1 : μ1 ≠ μ2 (les moyennes sont différentes) Si les moyennes sont identiques, il existe une relation entre les deux variables Rejeter H0 si t > 1,98 ou t < -1,98 p ≤ 0,05, seuil de signification ≥ 95 % Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS,  5e éd.,  Paris: Pearson Education France.

28 Moyennes appareillées Analyse de l’estime de soi sociale et de l’estime de soi personnelle
H0 : μ1 = μ2 (Moyenne SEI social = Moyenne SEI personnel) H1 : μ1 ≠ μ2 (Moyenne SEI social ≠ Moyenne SEI personnel)

29 Moyennes appareillées Analyse de l’estime de soi sociale et de l’estime de soi personnelle
L’écart des moyennes (6,75 VS 5,37) est significatif (t = 9,317 ) On peut rejeter H0 (les moyennes sont différentes) Avec un seuil de signification supérieur à 99 % (p = 0,000) on peut affirmer que les moyennes de l’estime de soi sociale et de l’estime de soi personnelle sont différentes Il n’existe pas de relation entre ces deux aspects de l’estime de soi

30 Moyennes appareillées Analyse de l’attitude envers Internet et de l’attitude envers la technologie Données du Tableau 13.1 H0 : μ1 = μ2 (Moyenne Internet = Moyenne Technologie) H1 : μ1 ≠ μ2 (Moyenne Internet ≠ Moyenne Technologie)

31 Moyennes appareillées Analyse de l’attitude envers Internet et de l’attitude envers la technologie Données du Tableau 13.1 L’écart des moyennes (5,17 VS 4,10) est significatif (t = 7,059 ) On peut rejeter H0 (les moyennes sont différentes) Avec un seuil de signification supérieur à 99 % (p = 0,000) on peut affirmer que les moyennes de l’attitude envers Internet et de l’attitude envers la technologie sont différentes Il n’existe pas de relation entre les deux attitudes

32 Plusieurs moyennes Analyse de variance
Hypothèse : H0 : μ1 = μ2 = μ3 (les moyennes sont identiques) H1 : μ1 ≠ μ2 ≠ μ3 (les moyennes sont différentes) Si les moyennes sont différentes, il existe une relation entre la variable indépendante et la variable dépendante Rejeter H0 si l’un ou l’autre des critères suivants est satisfait : Fcalculé ≥ Ftable p ≤ 0,05 (seuil de signification ≥ 95 %) Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS,  5e éd.,  Paris: Pearson Education France.

33 Plusieurs moyennes Analyse de variance du niveau de consommation selon le revenu
Ho : μ1 = μ2 = μ3 (Moyenne Plus = Moyenne Comparable = Moyenne Moins) H1 : μ1 ≠ μ2 ≠ μ3 (Moyenne Plus ≠ Moyenne Comparable ≠ Moyenne Moins) Ftable = 3,07 si p = 0,05

34 Plusieurs moyennes Analyse de variance du niveau de consommation selon le revenu

35 Plusieurs moyennes Analyse de variance du niveau de consommation selon le revenu
On peut rejeter H0 (les moyennes sont différentes) Fcalculé = 4,301 ≥ Ftable = 3,07 p = 0,015 ≤ 0,05 L’écart des moyennes (9,14 VS 6,80 VS 6,13) est significatif Avec un seuil de signification supérieur à 95 % (p = 0,015), on peut affirmer que les personnes dont la moyenne du revenu est plus élevée affirment consommer davantage Une augmentation du revenu augmente le niveau de consommation (ce qui n’est pas surprenant à vrai dire)

36 Plusieurs moyennes Analyse de variance de l’usage d’internet selon l’attitude envers Internet Données du Tableau 13.1 Ho : μ1 = μ2 = μ3 (Moyenne 5- = Moyenne 6-10 = Moyenne 11+) H1 : μ1 ≠ μ2 ≠ μ3 (Moyenne 5- ≠ Moyenne 6-10 ≠ Moyenne 11+) Ftable = 3,35 si p = 0,05

37 Plusieurs moyennes Analyse de variance de l’usage d’internet selon l’attitude envers Internet - Données du Tableau 13.1

38 Plusieurs moyennes Analyse de variance de l’usage d’internet selon l’attitude envers Internet Données du Tableau 13.1 On peut rejeter H0 (les moyennes sont différentes) : Fcalculé = 3,700 ≥ Ftable = 3,35 p = 0,038 ≤ 0,05 L’écart des moyennes (4,73 VS 5,13 VS 6,14) est significatif Avec un seuil de signification supérieur à 95 % (p = 0,038), on peut affirmer que les personnes qui font un usage d’Internet de 11 heures ou plus par semaine ont une attitude en moyenne plus positive que celles qui l’utilisent pendant 6 à 10 heures ou 5 heures et moins Une attitude positive envers Internet augmente l’usage d’Internet (ce qui n’est pas surprenant à vrai dire)

39 L’analyse de régression linéaire simple
Relation de dépendance entre deux variables métriques (intervalle ou de proportion) : Modèle de prédiction Yi = β0 + β1Xi + ei Yi = variable dépendante β0 = constante (origine) β1 = coefficient de régression Xi = variable indépendante ou explicative ei = erreur (ou résidus) Variation totale expliquée : r2 = coefficient de détermination r2 varie entre 0 et 1 Rejeter H0 si F ≥ 3,07 Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS,  5e éd.,  Paris: Pearson Education France.

40 Analyse de régression linéaire entre l’estime de soi personnelle et l’âge
β1 Ho : β1 = 0 (aucune relation entre SEI et âge) H1 : β1 ≠ 0 (SEI varie avec âge) β0

41 Analyse de régression linéaire entre l’estime de soi personnelle et l’âge

42 Analyse de régression linéaire entre l’estime de soi personnelle et l’âge
β0

43 Analyse de régression linéaire entre l’estime de soi personnelle et l’âge
On peut rejeter H0 (F = 5,002) L’âge exerce une influence sur l’estime de soi personnelle SEIi = 4, ,038(âgei) + ei Avec un seuil de signification supérieur à 95 % (p = 0,027) on peut affirmer que pour chaque augmentation d’un an de l’âge, l’estime de soi personnelle augmente de 0,038 Le modèle explique 2,8 % de la variation (r2 = 0,028)

44 Analyse de régression linéaire entre l’attitude envers la ville et la durée de résidence
Ho : β1 = 0 (aucune relation entre l’attitude et la durée) H1 : β1 ≠ 0 (attitude varie avec durée) β1 β0

45 Analyse de régression linéaire entre l’attitude envers la ville et la durée de résidence

46 Analyse de régression linéaire entre l’attitude envers la ville et la durée de résidence
β0

47 Analyse de régression linéaire entre l’attitude envers la ville et la durée de résidence
On peut rejeter H0 (F = 70,803) avec un seuil de signification supérieur à 99 % (p = 0,000) La durée de résidence exerce une influence sur l’attitude positive envers la ville Attitudei = 1, ,590(duréei) + ei On peut affirmer que pour chaque augmentation d’un an de la durée de résidence, l’attitude positive envers la ville augmente de 0,590 Le modèle explique 87,6 % de la variation (r2 = 0,876)

48 L’analyse de régression multiple
Relation de dépendance entre trois, ou plus, variables métriques : Modèle de prédiction Yi = β0 + (β1X1)i+ (β2X2)i + (β3X3)i +… + ei Yi = variable dépendante β0 = constante (origine) Β1-n = coefficients de régression X1-n = variables indépendantes ou explicatives ei = erreur (ou résidus) Variation totale expliquée : r2 = coefficient de détermination r2 varie entre 0 et 1 Test t (T-Test) indique l’influence relative de chaque variable Rejeter H0 si F ≥ 3,07 Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS,  5e éd.,  Paris: Pearson Education France.

49 Régression multiple entre les ventes, la publicité, l’expérience du cuisinier et le diplôme ITHQ (Données restaurants.sav) β1 β2 Ho : β1-n = 0 (aucun effet durée pub., expérience et diplôme sur ventes) H1 : β1-n ≠ 0 (ventes varient en fonction pub., expérience et diplôme) β0 β3

50 Régression multiple entre les ventes, la publicité, l’expérience du cuisinier et le diplôme ITHQ (Données restaurants.sav)

51 Régression multiple entre les ventes, la publicité, l’expérience du cuisinier et le diplôme ITHQ (Données restaurants.sav)

52 Régression multiple entre les ventes, la publicité, l’expérience du cuisinier et le diplôme ITHQ (Données restaurants.sav)

53 Régression multiple entre les ventes, la publicité, l’expérience du cuisinier et le diplôme ITHQ (Données restaurants.sav)

54 Le modèle explique 99,9 % de la variation (r2 = 0,999)
Régression multiple entre les ventes, la publicité, l’expérience du cuisinier et le diplôme ITHQ (Données restaurants.sav) On peut rejeter H0 (F = 2814,032) avec un seuil de signification supérieur à 99 % (p = 0,000) La publicité, l’expérience du cuisinier et le diplôme de l’ITHQ exercent une influence sur les ventes d’un restaurant Ventesi = 150, ,094 (publicitéi) + 27,647 (expériencei) + 54,243 (diplômei) + ei On peut affirmer que : pour chaque augmentation de 1$ de publicité, les ventes augmentent de 94$ (t = 11,749; p = 0,000) pour chaque augmentation d’un an d’expérience du cuisinier, les ventes augmentent de $ (t = 5,596; p = 0,001) avec l’obtention d’un diplôme de l’ITHQ, les ventes augmentent en moyenne de $ (t = 5,588; p = 0,001) Le modèle explique 99,9 % de la variation (r2 = 0,999)

55 Régression multiple entre attitude envers la ville, durée de résidence et importance attachée climat (Données Tableau 15.1) β1 β2 Ho : β1-n = 0 (aucun effet durée résid. et import. climat sur attitude) H1 : β1-n ≠ 0 (attitude varie en fonction durée résid. et import. climat) β0

56 Régression multiple entre attitude envers la ville, durée de résidence et importance attachée climat (Données Tableau 15.1)

57 Régression multiple entre attitude envers la ville, durée de résidence et importance attachée climat (Données Tableau 15.1)

58 Régression multiple entre attitude envers la ville, durée de résidence et importance attachée climat (Données Tableau 15.1)

59 Attitudei = 0,337 + 0,481 (duréei) + 0,289 (importancei) + ei
Régression multiple entre attitude envers la ville, durée de résidence et importance attachée climat (Données Tableau 15.1) On peut rejeter H0 (F = 77,294) avec un seuil de signification supérieur à 99 % (p = 0,000) La durée de résidence et l’importance attachée au climat exercent une influence sur l’attitude positive envers la ville Attitudei = 0, ,481 (duréei) + 0,289 (importancei) + ei On peut affirmer que : pour chaque augmentation d’un an de la durée de résidence, l’attitude positive envers la ville augmente de 0,481 (t = 8,160; p = 0,000) pour chaque augmentation de « 1 » de l’importance attachée au climat, l’attitude positive envers la ville augmente de 0,289 (t = 3,353; p = 0,008) Le modèle explique 94,5 % de la variation (r2 = 0,945)

60 Atelier Réaliser des analyses croisées avec vos données
Consignes pour les étudiants : Placer la variable indépendante dans la colonne (position en français dans SPSS) Demander les statistiques khi deux et corrélation Demander le pourcentage de la colonne Rencontre de chacune des équipes avec le professeur


Télécharger ppt "Plan la séance 11 L’analyse multivariée"

Présentations similaires


Annonces Google