La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

© Benoit Duguay, 2013 Plan la séance 11 Lanalyse multivariée Les tableaux croisés Lhypothèse Le test du khi carré Démonstration du logiciel SPSS (tableaux.

Présentations similaires


Présentation au sujet: "© Benoit Duguay, 2013 Plan la séance 11 Lanalyse multivariée Les tableaux croisés Lhypothèse Le test du khi carré Démonstration du logiciel SPSS (tableaux."— Transcription de la présentation:

1 © Benoit Duguay, 2013 Plan la séance 11 Lanalyse multivariée Les tableaux croisés Lhypothèse Le test du khi carré Démonstration du logiciel SPSS (tableaux croisés) Autres types danalyses multivariées Comparaison de moyennes Analyses de variance Analyses de corrélation Analyses de régression Atelier : Réaliser des analyses croisées avec vos données Rencontre de chacune des équipes avec le professeur

2 © Benoit Duguay, 2013 Les tableaux croisés Analyse des données en fonction de deux variables (parfois plus) Variable indépendante VS variable dépendante Analyse du pourcentage des réponses selon la variable indépendante Comparaison des différences entre deux catégories de la variable indépendante

3 © Benoit Duguay, 2013 Tableau croisé de la variable « Consommation » selon le sexe Les différences ne sont ni fortes, ni significatives (47,7%, p = 0,523) Existe-t-il des différences entre les hommes et les femmes dans le niveau de consommation?

4 © Benoit Duguay, 2013 Lhypothèse Proposition, souvent intuitive, qui permet dexpliquer un phénomène, (p. ex. : Les hommes consomment plus que les femmes) Afin de rejeter ou non une hypothèse, on doit démontrer lexistence de différences significatives entre deux catégories dune variable (p. ex. féminin ou masculin pour le sexe) par rapport à une autre variable (p. e. le niveau de consommation). Formulation H 0 : %F = %M (hypothèse nulle : il nexiste pas de différence entre les femmes et les hommes [quant au niveau de consommation]) H 1 : %F %M (hypothèse alternative il existe une différence entre les femmes et les hommes [quant au niveau de consommation]) Dans cet exemple (diapo précédente), on ne rejette PAS lhypothèse nulle

5 © Benoit Duguay, 2013 Test dhypothèse : le test du khi carré (ou Khi deux – X 2 ) Un test statistique parmi les plus utiles Utilisable avec tout type de données : PCQ tous les types de données peuvent être transformées en données nominales Détection de différence significatives entre les fréquences observées dans létude et les fréquences théoriques attendues Seuil de signification : probabilité permettant de rejeter ou non lhypothèse nulle H 0 usuel 95% (p 0,05) Tiré et adapté de: McGown, K.L., Marketing Research: Text and Cases, Winthrop Publishers, 1979, p. 236

6 © Benoit Duguay, 2013 Tableau croisé de la variable « Restaurant » selon lestime de soi H 0 : %SEI- = %SEI moyen = %SEI+ Il nexiste pas de différences entre le pourcentage des personnes dont lestime est faible et celui des personnes dont lestime est forte (quant à la mention du restaurant) L'estime de soi n'influence pas la mention du restaurant comme produit représentatif de l'image de soi H 1 : %SEI- %SEI moyen %SEI+ Il existe des différences entre le pourcentage des personnes dont lestime est faible et celui des personnes dont lestime est forte (quant à la mention du restaurant) L'estime de soi influence la mention du restaurant comme produit représentatif de l'image de soi

7 © Benoit Duguay, 2013 Tableau croisé de la variable « Restaurant » selon lestime de soi H 0 : %SEI - = %SEI moyen = %SEI + H 1 : %SEI - %SEI moyen %SEI +

8 © Benoit Duguay, 2013 Tableau croisé de la variable « Restaurant » selon lestime de soi

9 © Benoit Duguay, 2013 Tableau croisé de la variable « Restaurant » selon lestime de soi On peut rejeter H 0 (il existe des différences entre %SEI- et %SEI+) Avec un seuil de signification supérieur à 95 % (p = 0,037) on peut affirmer quun pourcentage plus élevé de personnes dont lestime de soi est faible mentionne le restaurant comme un produit représentatif de limage de soi L'estime de soi influence la mention du restaurant comme produit représentatif de l'image de soi

10 © Benoit Duguay, 2013 Tableau croisé de lusage dinternet selon le sexe Données du tableau 13.1 H 0 : %F = %M Il nexiste pas de différences entre le pourcentage des femmes et celui des hommes (quant lusage dInternet) Le sexe n'influence pas lusage dinternet H 1 : %F %M Il existe des différences entre le pourcentage des femmes et celui des hommes (quant lusage dInternet) Le sexe influence lusage dinternet

11 © Benoit Duguay, 2013 Tableau croisé de lusage dinternet selon le sexe Données du tableau 13.1 H 0 : %F = %H H 1 : %F %H

12 © Benoit Duguay, 2013 Tableau croisé de lusage dinternet selon le sexe Données du tableau 13.1

13 © Benoit Duguay, 2013 Tableau croisé de lusage dinternet selon le sexe Données du tableau 13.1 On peut rejeter H 0 (il existe des différences entre %F = %M) Avec un seuil de signification égal à 99 % (p = 0,010) on peut affirmer que seulement des hommes utilisent lInternet 11 heures ou plus par semaine Inversement, on peut également affirmer quun pourcentage deux fois plus élevé de femmes que dhommes utilisent lInternet 5 heures ou moins par semaine Le sexe influence la durée de lusage dInternet

14 © Benoit Duguay, 2013 Lanalyse de corrélation linéaire Relation entre deux variables métriques (intervalle ou de proportion) Laugmentation de la variable 1 correspond-t-il à une augmentation ou à une diminution de la variable 2? Relation linéaire Coefficient de corrélation de Pearson (r) +1 = relation positive parfaite -1 = relation négative parfaite Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS, 5e éd., Paris: Pearson Education France.

15 © Benoit Duguay, 2013 Balises établies par Cohen (1988) pour estimer leffet de corrélation Coefficient de Pearson (r)Effet Autour de 0,10Faible Autour de 0,30Moyen Supérieur à 0,50Fort Source : inferentielles/correlation.php?searchresult=1&sstring=corr%C3 %A9lationhttp://pages.usherbrooke.ca/spss/pages/statistiques- inferentielles/correlation.php?searchresult=1&sstring=corr%C3 %A9lation

16 © Benoit Duguay, 2013 Analyse de corrélation linéaire entre lâge et lestime de soi personnelle H o : r = 0 (aucune corrélation entre âge et SEI personnel) H 1 : r 0 (corrélation entre âge et SEI personnel)

17 © Benoit Duguay, 2013 Analyse de corrélation linéaire entre lâge et lestime de soi personnelle On peut rejeter H 0 (il existe une corrélation entre lâge et lestime de soi personnelle) Avec un seuil de signification supérieur à 95 % (p = 0,027) on peut affirmer que lâge influence lestime de soi personnelle La valeur positive de r (= +0,169) indique une relation positive entre les variables En outre, la valeur plus proche de « 0 » que de « +1 » de r indique une corrélation positive imparfaite (plutôt faible) Lestime de soi personnelle augmente un peu avec lâge

18 © Benoit Duguay, 2013 Analyse de corrélation linéaire entre lattitude envers la ville et la durée de résidence Données du tableau 15.1 H o : r = 0 (aucune corrélation entre attitude et durée) H 1 : r 0 (corrélation entre attitude et durée)

19 © Benoit Duguay, 2013 Analyse de corrélation linéaire entre lattitude envers la ville et la durée de résidence Données du tableau 15.1 On peut rejeter H 0 (il existe une corrélation entre lattitude envers la ville et la durée de résidence) Avec un seuil de signification supérieur à 99 % (p = 0,000) on peut affirmer que la durée de résidence influence lattitude envers la ville La valeur positive de r est (= +0,936) indique une relation positive entre les variables En outre, la valeur très proche de « +1 » de r indique une corrélation positive presque parfaite (très forte) Lattitude envers la ville devient plus favorable avec une augmentation de la durée de résidence

20 © Benoit Duguay, 2013 Démonstration du logiciel SPSS Réalisation de plusieurs analyses croisées avec des données fictives : tableau_13_1.sav : /tableau_13_1.sav /tableau_13_1.sav restaurants_categories.sav : /restaurants_categories.sav /restaurants_categories.sav Source :

21 © Benoit Duguay, 2013 Les comparaisons de moyennes Analyser la relation entre une variable non métrique (nominale ou ordinale) et une variable métrique (intervalle ou de proportion) Comparaison de deux moyennes indépendantes Comparaison de deux moyennes appareillées Comparaison de plusieurs moyennes Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS, 5e éd., Paris: Pearson Education France.

22 © Benoit Duguay, 2013 Moyennes indépendantes Test en t (T-Test) Hypothèse : H 0 : μ 1 = μ 2 (les moyennes sont identiques) H 1 : μ 1 μ 2 (les moyennes sont différentes) Si les moyennes sont différentes, il existe une relation entre la variable indépendante et la variable dépendante Rejeter H 0 si t > 1,98 ou t < -1,98 p 0,05, seuil de signification 95 % Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS, 5e éd., Paris: Pearson Education France.

23 © Benoit Duguay, 2013 Moyennes indépendantes Analyse de la variable « Spectacle culturel » selon lestime de soi Bilatéral H 0 : μ 1 = μ 2 (Moyenne SEI NON = Moyenne SEI OUI) H 1 : μ 1 μ 2 (Moyenne SEI NON Moyenne SEI OUI)

24 © Benoit Duguay, 2013 Moyennes indépendantes Analyse de la variable « Spectacle culturel » selon lestime de soi Les personnes qui mentionnent le spectacle culturel comme un produit représentatif de leur image sont plus nombreuses que celles qui ne mentionnent pas ce produit (136 VS 39) Lécart des moyennes (6,10 VS 5,15) est significatif (t = 2,694) On peut rejeter H 0 (les moyennes sont différentes) Avec un seuil de signification supérieur à 99 % (p = 0,008) on peut affirmer que la moyenne de lestime de soi des personnes qui mentionnent le spectacle culturel comme un produit représentatif de leur image est plus faible Lestime de soi personnelle influence la mention du spectacle culturel comme produit représentatif de limage de soi

25 © Benoit Duguay, 2013 Moyennes indépendantes Analyse de lusage dInternet selon le sexe Données du Tableau 13.1 Bilatéral H 0 : μ 1 = μ 2 (Moyenne F = Moyenne M) H 1 : μ 1 μ 2 (Moyenne F Moyenne M)

26 © Benoit Duguay, 2013 Moyennes indépendantes Analyse de lusage dInternet selon le sexe Données du Tableau 13.1 Lécart des moyennes (9,36 VS 3,87) est significatif (t = 4,354) On peut rejeter H 0 (les moyennes sont différentes) Avec un seuil de signification supérieur à 99 % (p = 0,000) on peut affirmer que le nombre dheures dusage dInternet est plus élevé pour les hommes (9,36) que pour les femmes (3,87) Le sexe influence lusage de lInternet

27 © Benoit Duguay, 2013 Moyennes appareillées Test en t (T-Test) Hypothèse : H 0 : μ 1 = μ 2 (les moyennes sont identiques) H 1 : μ 1 μ 2 (les moyennes sont différentes) Si les moyennes sont identiques, il existe une relation entre les deux variables Rejeter H 0 si t > 1,98 ou t < -1,98 p 0,05, seuil de signification 95 % Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS, 5e éd., Paris: Pearson Education France.

28 © Benoit Duguay, 2013 H 0 : μ 1 = μ 2 (Moyenne SEI social = Moyenne SEI personnel) H 1 : μ 1 μ 2 (Moyenne SEI social Moyenne SEI personnel) Moyennes appareillées Analyse de lestime de soi sociale et de lestime de soi personnelle

29 © Benoit Duguay, 2013 Moyennes appareillées Analyse de lestime de soi sociale et de lestime de soi personnelle Lécart des moyennes (6,75 VS 5,37) est significatif (t = 9,317 ) On peut rejeter H 0 (les moyennes sont différentes) Avec un seuil de signification supérieur à 99 % (p = 0,000) on peut affirmer que les moyennes de lestime de soi sociale et de lestime de soi personnelle sont différentes Il nexiste pas de relation entre ces deux aspects de lestime de soi

30 © Benoit Duguay, 2013 H 0 : μ 1 = μ 2 (Moyenne Internet = Moyenne Technologie) H 1 : μ 1 μ 2 (Moyenne Internet Moyenne Technologie) Moyennes appareillées Analyse de lattitude envers Internet et de lattitude envers la technologie Données du Tableau 13.1

31 © Benoit Duguay, 2013 Moyennes appareillées Analyse de lattitude envers Internet et de lattitude envers la technologie Données du Tableau 13.1 Lécart des moyennes (5,17 VS 4,10) est significatif (t = 7,059 ) On peut rejeter H 0 (les moyennes sont différentes) Avec un seuil de signification supérieur à 99 % (p = 0,000) on peut affirmer que les moyennes de lattitude envers Internet et de lattitude envers la technologie sont différentes Il nexiste pas de relation entre les deux attitudes

32 © Benoit Duguay, 2013 Plusieurs moyennes Analyse de variance Hypothèse : H 0 : μ 1 = μ 2 = μ 3 (les moyennes sont identiques) H 1 : μ 1 μ 2 μ 3 (les moyennes sont différentes) Si les moyennes sont différentes, il existe une relation entre la variable indépendante et la variable dépendante Rejeter H 0 si lun ou lautre des critères suivants est satisfait : F calculé F table p 0,05 (seuil de signification 95 %) Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS, 5e éd., Paris: Pearson Education France.

33 © Benoit Duguay, 2013 Plusieurs moyennes Analyse de variance du niveau de consommation selon le revenu H o : μ 1 = μ 2 = μ 3 (Moyenne Plus = Moyenne Comparable = Moyenne Moins) H 1 : μ 1 μ 2 μ 3 (Moyenne Plus Moyenne Comparable Moyenne Moins) F table = 3,07 si p = 0,05

34 © Benoit Duguay, 2013 Plusieurs moyennes Analyse de variance du niveau de consommation selon le revenu

35 © Benoit Duguay, 2013 Plusieurs moyennes Analyse de variance du niveau de consommation selon le revenu On peut rejeter H 0 (les moyennes sont différentes) F calculé = 4,301 F table = 3,07 p = 0,015 0,05 Lécart des moyennes (9,14 VS 6,80 VS 6,13) est significatif Avec un seuil de signification supérieur à 95 % (p = 0,015), on peut affirmer que les personnes dont la moyenne du revenu est plus élevée affirment consommer davantage Une augmentation du revenu augmente le niveau de consommation (ce qui nest pas surprenant à vrai dire)

36 © Benoit Duguay, 2013 Plusieurs moyennes Analyse de variance de lusage dinternet selon lattitude envers Internet Données du Tableau 13.1 H o : μ 1 = μ 2 = μ 3 (Moyenne 5- = Moyenne 6-10 = Moyenne 11+) H 1 : μ 1 μ 2 μ 3 (Moyenne 5- Moyenne 6-10 Moyenne 11+) F table = 3,35 si p = 0,05

37 © Benoit Duguay, 2013 Plusieurs moyennes Analyse de variance de lusage dinternet selon lattitude envers Internet - Données du Tableau 13.1

38 © Benoit Duguay, 2013 Plusieurs moyennes Analyse de variance de lusage dinternet selon lattitude envers Internet Données du Tableau 13.1 On peut rejeter H 0 (les moyennes sont différentes) : F calculé = 3,700 F table = 3,35 p = 0,038 0,05 Lécart des moyennes (4,73 VS 5,13 VS 6,14) est significatif Avec un seuil de signification supérieur à 95 % (p = 0,038), on peut affirmer que les personnes qui font un usage dInternet de 11 heures ou plus par semaine ont une attitude en moyenne plus positive que celles qui lutilisent pendant 6 à 10 heures ou 5 heures et moins Une attitude positive envers Internet augmente lusage dInternet (ce qui nest pas surprenant à vrai dire)

39 © Benoit Duguay, 2013 Lanalyse de régression linéaire simple Relation de dépendance entre deux variables métriques (intervalle ou de proportion) : Modèle de prédiction Y i = β 0 + β 1 X i + e i Y i = variable dépendante β 0 = constante (origine) β 1 = coefficient de régression X i = variable indépendante ou explicative e i = erreur (ou résidus) Variation totale expliquée : r 2 = coefficient de détermination r 2 varie entre 0 et 1 Rejeter H 0 si F 3,07 Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS, 5e éd., Paris: Pearson Education France.

40 © Benoit Duguay, 2013 Analyse de régression linéaire entre lestime de soi personnelle et lâge β1β1 H o : β 1 = 0 (aucune relation entre SEI et âge) H 1 : β 1 0 (SEI varie avec âge) β0β0

41 © Benoit Duguay, 2013 Analyse de régression linéaire entre lestime de soi personnelle et lâge

42 © Benoit Duguay, 2013 Analyse de régression linéaire entre lestime de soi personnelle et lâge β0β0

43 © Benoit Duguay, 2013 Analyse de régression linéaire entre lestime de soi personnelle et lâge On peut rejeter H 0 (F = 5,002) Lâge exerce une influence sur lestime de soi personnelle SEI i = 4, ,038(âge i ) + e i Avec un seuil de signification supérieur à 95 % (p = 0,027) on peut affirmer que pour chaque augmentation dun an de lâge, lestime de soi personnelle augmente de 0,038 Le modèle explique 2,8 % de la variation (r 2 = 0,028)

44 © Benoit Duguay, 2013 Analyse de régression linéaire entre lattitude envers la ville et la durée de résidence H o : β 1 = 0 (aucune relation entre lattitude et la durée) H 1 : β 1 0 (attitude varie avec durée) β1β1 β0β0

45 © Benoit Duguay, 2013 Analyse de régression linéaire entre lattitude envers la ville et la durée de résidence

46 © Benoit Duguay, 2013 Analyse de régression linéaire entre lattitude envers la ville et la durée de résidence β0β0

47 © Benoit Duguay, 2013 Analyse de régression linéaire entre lattitude envers la ville et la durée de résidence On peut rejeter H 0 (F = 70,803) avec un seuil de signification supérieur à 99 % (p = 0,000) La durée de résidence exerce une influence sur lattitude positive envers la ville Attitude i = 1, ,590(durée i ) + e i On peut affirmer que pour chaque augmentation dun an de la durée de résidence, lattitude positive envers la ville augmente de 0,590 Le modèle explique 87,6 % de la variation (r 2 = 0,876)

48 © Benoit Duguay, 2013 Lanalyse de régression multiple Relation de dépendance entre trois, ou plus, variables métriques : Modèle de prédiction Y i = β 0 + (β 1 X 1 ) i + (β 2 X 2 ) i + (β 3 X 3 ) i +… + e i Y i = variable dépendante β 0 = constante (origine) Β 1-n = coefficients de régression X 1-n = variables indépendantes ou explicatives e i = erreur (ou résidus) Variation totale expliquée : r 2 = coefficient de détermination r 2 varie entre 0 et 1 Test t (T-Test) indique linfluence relative de chaque variable Rejeter H 0 si F 3,07 Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS, 5e éd., Paris: Pearson Education France.

49 © Benoit Duguay, 2013 Régression multiple entre les ventes, la publicité, lexpérience du cuisinier et le diplôme ITHQ (Données restaurants.sav) β1β1 β2β2 H o : β 1-n = 0 (aucun effet durée pub., expérience et diplôme sur ventes) H 1 : β 1-n 0 (ventes varient en fonction pub., expérience et diplôme) β0β0 β3β3

50 © Benoit Duguay, 2013 Régression multiple entre les ventes, la publicité, lexpérience du cuisinier et le diplôme ITHQ (Données restaurants.sav)

51 © Benoit Duguay, 2013 Régression multiple entre les ventes, la publicité, lexpérience du cuisinier et le diplôme ITHQ (Données restaurants.sav)

52 © Benoit Duguay, 2013 Régression multiple entre les ventes, la publicité, lexpérience du cuisinier et le diplôme ITHQ (Données restaurants.sav)

53 © Benoit Duguay, 2013 Régression multiple entre les ventes, la publicité, lexpérience du cuisinier et le diplôme ITHQ (Données restaurants.sav)

54 © Benoit Duguay, 2013 Régression multiple entre les ventes, la publicité, lexpérience du cuisinier et le diplôme ITHQ (Données restaurants.sav) On peut rejeter H 0 (F = 2814,032) avec un seuil de signification supérieur à 99 % (p = 0,000) La publicité, lexpérience du cuisinier et le diplôme de lITHQ exercent une influence sur les ventes dun restaurant Ventes i = 150, ,094 (publicité i ) + 27,647 (expérience i ) + 54,243 (diplôme i ) + e i On peut affirmer que : pour chaque augmentation de 1$ de publicité, les ventes augmentent de 94$ (t = 11,749; p = 0,000) pour chaque augmentation dun an dexpérience du cuisinier, les ventes augmentent de $ (t = 5,596; p = 0,001) avec lobtention dun diplôme de lITHQ, les ventes augmentent en moyenne de $ (t = 5,588; p = 0,001) Le modèle explique 99,9 % de la variation (r 2 = 0,999)

55 © Benoit Duguay, 2013 Régression multiple entre attitude envers la ville, durée de résidence et importance attachée climat (Données Tableau 15.1) β1β1 β2β2 H o : β 1-n = 0 (aucun effet durée résid. et import. climat sur attitude) H 1 : β 1-n 0 (attitude varie en fonction durée résid. et import. climat) β0β0

56 © Benoit Duguay, 2013 Régression multiple entre attitude envers la ville, durée de résidence et importance attachée climat (Données Tableau 15.1)

57 © Benoit Duguay, 2013 Régression multiple entre attitude envers la ville, durée de résidence et importance attachée climat (Données Tableau 15.1)

58 © Benoit Duguay, 2013 Régression multiple entre attitude envers la ville, durée de résidence et importance attachée climat (Données Tableau 15.1)

59 © Benoit Duguay, 2013 Régression multiple entre attitude envers la ville, durée de résidence et importance attachée climat (Données Tableau 15.1) On peut rejeter H 0 (F = 77,294) avec un seuil de signification supérieur à 99 % (p = 0,000) La durée de résidence et limportance attachée au climat exercent une influence sur lattitude positive envers la ville Attitude i = 0, ,481 (durée i ) + 0,289 (importance i ) + e i On peut affirmer que : pour chaque augmentation dun an de la durée de résidence, lattitude positive envers la ville augmente de 0,481 (t = 8,160; p = 0,000) pour chaque augmentation de « 1 » de limportance attachée au climat, lattitude positive envers la ville augmente de 0,289 (t = 3,353; p = 0,008) Le modèle explique 94,5 % de la variation (r 2 = 0,945)

60 © Benoit Duguay, 2013 Atelier Réaliser des analyses croisées avec vos données Consignes pour les étudiants : Placer la variable indépendante dans la colonne (position en français dans SPSS) Demander les statistiques khi deux et corrélation Demander le pourcentage de la colonne Rencontre de chacune des équipes avec le professeur


Télécharger ppt "© Benoit Duguay, 2013 Plan la séance 11 Lanalyse multivariée Les tableaux croisés Lhypothèse Le test du khi carré Démonstration du logiciel SPSS (tableaux."

Présentations similaires


Annonces Google