« Méthodes quantitatives » Antoine HARFOUCHE, PHD harfoant@yahoo.com
Résumé The Must
Introduction Léonard De Vinci (1452-1519)
Introduction En sciences de la nature Sciences de la Terre Chimie Biologie Médecine Sciences de l’Univers Zoologie Physique Environnement Botanique
Introduction Selon Albert Einstein (cité in Pearl, 2000) le développement des sciences se base sur deux grandes réalisations : Les relations causales (de la Renaissance) La géométrie euclidienne avec le théorème de Pythagore η ξ Pearl, J. (2000). Causality. New York: Cambridge University Press.
Introduction
Introduction Sciences humaines et sociales Histoire Economie Géographie Psychologie Sciences Politiques Droit Sociologie
Design Quantitatif Identification d’une problèmatique/ Questions de recherche Théories Modèle Collecte de données Formules et calculs Analyse et interprétation Réponses aux questions
Introduction
Opérationnalisation des concepts en Sciences de Gestion Section 1 Opérationnalisation des concepts en Sciences de Gestion
Du concept à la variable opérationnalisation Une variable = une quantité ou qualité susceptible de fluctuer ou de varier. En sciences de gestion, les variables utilisées ne peuvent pas être mesurées de manière « objective » => On mobilise plutôt des variables latentes ou construit Exemple : Notoriété, image de marque, motivation, intention d’achat, implication, fidélité, engagement, confiance, utilité,… CONCEPT VARIABLE Ou CONSTRUIT
Cadre de base Boite : variable Nature : nominale, ordinale, quantitative (ratio/métrique) Fleche : influence directionnelle ou non d’une variable sur une autre Sens, Forme, Force Dépendante (Y) et indépendante (X) X X Y
Variables quantitatives Il existe 2 types de variables : Les variables quantitatives : mesurables sur une échelle … avec une unité: des valeurs réelles : donnée continue âge, CA, Prix ... de valeurs isolées : donnée discrète nombres d’enfants, nombre de voiture par foyer, ... NB. Parfois les variables discrètes sont traitées comme des variables continues
Variables qualitatives Les variables qualitatives : non mesurables sur une échelle (notion de jugement), mais… - avec relation d’ordre : données ordinales (semi-quantitatives) - L’ordre est important Ex : Client classe A, B ou C selon la règle de Pareto - L’ampleur n’est pas importante: le client A n’est pas deux fois plus important que le client B Ex: intention d’achat : faible, modérée, forte sinon : données catégoriques (nominale) homme/femme marié/célibataire
Cadre de base Variable modératrice (1) : elle modifie la relation entre deux autres variables Variable médiatrice (2) : elle est intermédiaire pour expliquer la relation entre deux variables Ce n’est pas parce qu’une variable vous intéresse qu’elle est la plus importante Variables de contrôle 1 Z X Y 2 X Z Y W X Y
Des Variables aux construits latents Des construits de ces variables « latentes » (non mesurables directement) sont obtenus à partir de la moyenne des réponses à des questions (items) Les items retenus forment une « échelle de mesure » Ils doivent correspondre au « construit » Soit en représentant différentes facettes (formative F1) Soit en étant le reflet d’une variable inconnue (approche réflective F2) Comme dans chaque réponse, il y a une part d’aléa, on réduit cet aléa en prenant une synthèse de plusieurs mesures Par une moyenne sur les réponses brutes ou standardisées Par le calcul d’un facteur qui ne reprend que ce que les items ont en commun (analyse factorielle) Par la « formation » du construit (avec PLS par exemple) e X1 X1 F1 F2 X2 X2 e e
Section 2 Statistiques descriptives (the must)
La loi des grands nombres Kerrich (1903–1985) Jacob Bernoulli (1654 –1705) La loi des grands nombres
La distribution binominale Quincunx µ = n p V(x) = s2 = n p (1-p)
La loi Normale ou la loi Laplace-Gauss Quand n ∞
La loi Normale ou la loi Gaussienne Loi normale N(,) La loi Normale ou la loi Gaussienne Une variable aléatoire X suit une loi normale N(, ) si, pour toute valeur de x, x Résultats : - Moyenne de X = - Variance de X = 2 - 95% des valeurs de X sont comprises entre - 1.96 et + 1.96
et le théorème central limite Théorème Central Limite L’échantillonnage et le théorème central limite Echantillon1 Population µ,s X , S1 1 Echantillon2 2, S2 X Echantillon3 3, S3 µ = X Théorème Central Limite X s n S = X = (X1 + X2 + X3) /3 X X X
Moyenne et écart-type
Inférence Population µ,s Echantillon X , S1 1 n N
Intervalle de confiance pour estimer la moyenne n = 50 est assez grand, alors:
Loi de Student Si X N(, ) alors : Gosset (1876-1937) Créa le t -test pour traiter les petits échantillons dans le but de controler la qualité des produits à Guiness à Dublin. Il a publié sous le nom de "Student". Si X N(, ) alors : suit une loi de Student à n-1 degrés de liberté [notée t(n-1)].
Section 3 : Analyse explicative
Analyse explicative RLS RLM Régression ANOVA ANCOVA MANOVA MANCOVA
Covariance = 0 peut signifier une relation non linéaire. La covariance Dividende x Covxy Prix de l’action en bourse y Covariance > 0 les variables ont tendance à varier dans le même sens Covariance < 0 les variables ont tendance à varier en sens opposée Plus la valeur (>0 ou <0) de la covariance est élevée plus la relation entre les variables est forte La covariance est un indicateur de relation linéaire entre les variables Covariance = 0 peut signifier une relation non linéaire.
Coefficient de corrélation Le coefficient de corrélation est défini par Il mesure l’erreur d’estimation Il mesure le lien linéaire entre les variables Il mesure la distance entre la droite de régression et le nuage de points
RLS - Régression linéaire simple Dividende x 1 Prix de l’action en bourse y Modèle de régression linéaire simple y = 0 + 1x + Équation de la régression linéaire simple (comment l'espérance de y est liée à x) E(y) = 0 + 1x Équation estimée de la régression linéaire simple (droite de la régression estimée, modèle empirique)
Estimer les méthodes théoriques Il existe plusieurs méthodes permettant d’estimer le modèle théorique par le modèle empirique Méthode des moindres carrés Méthode de la vraisemblance …
La méthode des moindres carrés => Critère des moindres carrés où: yi = valeur observée de la variable dépendante pour pour la ième observation = valeur estimée de la variable dépendante pour la ième observation
* L’objectif de la méthode des moindres carrés est de déterminer la droite de régression qui minimise On cherche 0 et 1 minimisant valeur observée yi erreur ei valeur prédite * 1 xi
b0 et b1 Autre formule pour b1 Taille de l’échantillon
Le coefficient de détermination fournit une indication de la force de la liaison qui existe entre Y et X
Le R2 mesure la force de la liaison linéaire entre X et Y * Y * * * * * * * * * * * * * * * * X X
Le coefficient de corrélation NB Le coefficient de corrélation peut être déterminé aussi : Ou Sachant que :
La corrélation Cor(X,Y) mesure la force et le sens de la liaison linéaire entre X et Y * * * * * * * * * * * * * * X X 1 1
RLM - La Régression Linéaire Multiple VI1 VI2 VI2 VD VI3 Equation de régression multiple VI2
Graphiques des liaisons deux à deux
Problème de multicolinéarité VI1 VI2 VD VI2 VI1 VI2 VD VI2 r > 0,70
Mesure de la multi-colinéarité : Tolérance et VIF Tolérance (Xj) = 1 - R2(Xj ; Autres X) Il est préférable d’observer une tolérance supérieure à 0.33. VIF = Variance Inflation Factor = 1 / Tolérance Il est préférable d’observer un VIF inférieur à 3.
Peinture représentant un étang (Tombeau de Thèbes, 1400 av. J. -C Peinture représentant un étang (Tombeau de Thèbes, 1400 av. J.-C.) extrait de l’Histoire de l’Art de Ernst Gombrich
Analyse de la variance : ANOVA Sir Ronald Fischer 1890-1962
Introduction C’est une extension du test t (Student) Compare les variances des differents sous- échantillons (groupes) Facteurs = Variables (Exemple : Le genre) Niveaux (levels) = Le nombre d’options que les facteurs possèdent (Exemple : Le genre a deux niveaux : Homme et femme) There is one more point to note: the basic assumptions of the analysis of variance. These are: 1. The general linear model is adequate for the data 2. The values are normally distributed in the population 3. The samples have homogenous variances 4. The samples are independant Violation of assumption 1 is untestabl; however its violatio has serious consequences. violation of assumption 4 is easily avoided. Regarding violations of assumptions 2 and 3. As regards assmption 3 we can say that: 1. if the sample sizes are equal violation of this assmption does not lead to problems. ANOVA is robust against this violation. (ratio largest/smallest = 1.5) 2. If sample sizes and variances are unequal and the larger sample has also the smaller variance than the probability of making a Type 1 error is larger than alpha. 3. If sample sizes and variances are unequal and the larger sample has the greater variance than the probability of making a Type 1 error is smaller than alpha. Regarding assumption 2 - normal distribution of the values in the population, we can say that this effect is minial if the sample is relatively large. In sum, for equal cell sizes ANOVA is robust against violations of the basic assumptions regarding homogeneity of variances and normal distribution of values in the population.
Quand utiliser l’ANOVA Rendement Fréquence mC mN mN+P Pour tester l’effet d’une variable indépendante “discrète” chaque variable indépendante peut avoir deux ou plusieurs niveaux de traitements (ex: Homme/femme…) l’ANOVA teste si toutes les moyennes sont égales On l’utilise quand le nombre de niveaux est supérieur à deux Témoin Expérimental (N) Expérimental (N+P)
ANOVA Population 1 Population 2 M1,s1 M2, s2 m1,s1 m2,s2 Echantillon1 Echantillon2 m1,s1 m2,s2 - Comment comparer les deux populations à partir d'un échantillon réduit? Comparaison de moyennes/ variances
William Sealy Gosset en 1908 Test-t (t de Student) William Sealy Gosset en 1908 À quoi sert cette technique? Vérifier si la moyenne de la variable dépendante varie selon l’état de la variable indépendante Vérifier si la différence des moyennes des deux groupes de la VI est significative (ex.: hommes/femmes)
Test de Khi deux -Chi-squared test Résultats : 61 fois pile 39 fois face Chance ????? Oi Les valeurs observées Σ Ei La somme Les valeurs attendues
Test des Hypothèses On définit alors deux types d'hypothèses: H0: Hypothèse nulle, appelée hypothèse à rejeter => Il n’y a pas de différence entre Oi et Ei H1: Hypothèse alternative à H0, toute hypothèse qui diffère de H0 => Oi est différent de Ei
Test des Hypothèses - t s t s a / 2
LOI du c2 (4) . donne, en fonction du nombre de degrés de liberté, les valeurs limites c2a du c2 correspondant au coefficient de risque a c2 P (c2) c2a a . table à double entrée (du fait de la dépendance en n) La valeur de a est lue en ligne, celle de n en colonne, la valeur recherchée c2a se situant à l’intersection
Exemples
Technology Acceptance Model (TAM) Perceived Usefulness External Behavioral Usage Variables Intention Behavior Perceived e.g., Training Ease of Use System Chars. Usage determined by intention which in turn is determined by U and EOU. Define U and EOU. Explain link between EOU and U. Role of external variables. (Davis 1989--MISQ; Davis et al. 1989--Mgmt Science)
Summary of Key Findings from Early TAM Research Perceived usefulness is key determinant of acceptance Perceived ease of use is a secondary determinant (direct and indirect effect on BI) TAM compares favorably with other models TAM is robust across populations, settings, technologies TAM has been APPLIED a lot, extended very little.
TAM Evolution 1990’s Proliferation Consolidation 1999 antecedents of EOU 2000 antecedents of Usefulness 2003 Unified Theory (UTAUT) Metaanalyses (2003-2007) Citations 1989 MISQ cited 900+ times 1989 Mgt Sci cited 750+ times TAM in Workshop on HCI in MIS, ICIS
Technology Acceptance Model (TAM) Venkatesh 1999 ISR Determinants of EOU Anchors Adjustments Perceived Usefulness Ease of Use Behavioral Intention to Use Experience TAM Process expectancy--has to do with the effort. Much more reliant on direct experience. Individuals bring prior information to setting--classical case of anchoring and adjustment; human decision-making is based on anchoring and adjustment.
Determinants of EOU Anchors Computer Self-Efficacy Perceived Usefulness Perceptions of External Control 2 3 2 Behavioral Intention to Use Computer Anxiety Computer Playfulness Perceived Ease of Use 1 1 Perceived Enjoyment Anchors are individual difference variables. Adjustments are system-specific constructs. Interesting finding: anchors always important (as long as expectations are realistic). Role of PEC: general to system-specific. 1 Objective Usability Adjustments Notes: “1” indicates that experience moderated the relationship between the two constructs, as expected “2” indicates that experience moderated the relationship, though not expected “3” indicates that experience had a a direct effect on the construct, as expected
Venkatesh & Davis 2000 Mgt Sci Determinants of Usefulness Perceived Usefulness Ease of Use Intention to Use Usage Behavior Cognitive Instrumental Processes Social Influence Technology Acceptance Model Experience Use-Performance contingency; outcome expectancy--what results do I get by using the system? Influence of others. Cognitive underpinnings related to the job and the system. Ability to assess without much experience.
Social Influence Processes Image Subjective Norm Voluntariness of Use Experience Perceived Usefulness Cognitive Instrumental Processes Ease of Use Intention to Use Usage Behavior A B C A--compliance. B--internalization. C--identification.
Different Types of Technology Individual productivity tools Groupware Enterprise systems E-Commerce Workflow Mobile technology
Scientific Progress Every scientific truth goes through three states: first, people say it conflicts with the Bible; next, they say it has been discovered before lastly, they say they always believed it. Louis Agassiz
Nature of Scientific Progress Role of Paradigms (e.g., Kuhn 1962) Container (how much can it hold) Vehicle (how far can it go? How fast?) Advantage – enables research progress Disadvantage – constrains research progress Theory can obstruct research progress Selective filter, lens Confirmation bias Revolution vs. Evolution Parsimony, Power, Generality
TAM Research Impasse JAIS Special Issue April 2007 Lucas, Swanson, & Zmud “Implementation…” Benbasat & Barki “Quo Vadis, TAM?” Proliferation of ad hoc incremental extensions with no overarching conceptual structure Successive studies that provide diminishing marginal contributions IS researchers’ attention being overly restricted to minor extensions of TAM
“Restlessness and discontent are the first necessities of progress. “ Thomas Edison
Return to TRA/TPB? Benbasat &Barki 2007 JAIS advocate this Claim that UTAUT does this Provides structure for expanding TAM Pavlou & Fygenson 2006 MISQ B2C top beliefs elicited Usefulness, ease of use, trust TPB omits direct influence of beliefs on BI Bagozzi 2007 JAIS TPB has many same limitations as TAM
Neuro-IS Dimoka, Pavlou, & Davis 2007 ICIS “The potential of cognitive neuroscience for IS Research” Neural underpinnings of cognitive processes Brain scanning (fMRI, etc.) Many recent discoveries Decision making, risk, uncertainty Trust, cooperation, competition Goal self-regulation Automaticity and multitasking
Major Areas of the Brain ACC NA CN IC PCC Limbic System OBF Prefrontal Cortex DLPFC MPFC iPC VM PFC H DLPFC: Dorsolateral Prefrontal Cortex, VMPFC: Ventromedial Prefrontal Cortex, OBF: Orbitofrontal Cortex MPFC: Medial Prefrontal Cortex, ACC/PCC: Anterior/ Posterior Cingulate Cortex, NA: Nucleus Accumbens; A: Amygdala, H: Hippocampus, CN: Caudate Nucleus, IC: Insular Cortex, iPC: Inferior Parietal Cortex Motor Cortex Visual Cortex Cerebellum Brain Stem Other key areas
Brain Areas Activated for Focal Processes Dorsolateral Prefrontal Cortex Ventromedial Prefrontal Cortex Orbitofrontal Cortex Medial Prefrontal Cortex Limbic System Amygdala Anterior Cingulate Cortex Nucleus Accumbens Caudate Nucleus Insular Cortex Inferior Parietal Cortices Decision Making X Risk Uncertainty Ambiguity Loss Rewards Consumer Behavior Theory of Mind Trust Distrust Cooperation Competition
Genetic Epistemology and Piaget’s Philosophy of Science Piaget (vs. Kuhn) on Scientific Progress J.Y. Tsou 2006 Theory and Research Continuity vs. discontinuity Series of successive approximations to truth Equilibration Assimilation and accommodation of existing knowledge structures (reorganization) Progress as integrative, cumulative process
Summary Reaching the limits of TAM++ paradigm Need to identify and remove limitations of TAM++ paradigm Emphasize impact of IT design characteristics Integrate across levels of analysis From static to dynamic analyses of complex adoption processes Neuro-IS Build upon and go beyond accumulated knowledge
“However much our knowledge of human behavior falls short of our need for such knowledge, still it is enormous” Herbert Simon 1978
Les Méthodologies Quantitatives Mon histoire avec Les Méthodologies Quantitatives 1998-1999 DESS 2004- 2005 DEA 2008 Junior Workshop SFB 649 UNICA Doctoral Workshop on Measurement in Marketing Pierre Desmet Professeur en Marketing Université Paris-Dauphine Detmar W. Straub Jr. Distinguished Professor of IS Editor-in-Chief of MIS Quarterly Prof. A. Diamantopoulos, Lutz Hildebrandt Humboldt-Universität zu Berlin CEFAG 2009 PLS for Professional 2009 chercheur invité à Indiana 2010 chercheur invité à Georgia Andrew Burton Jones Joerg Henseler Christian M. Ringle MacKenzie and P. M. Podsakoff Director of the Institute TUHH - Hamburg University of Technology