Structure de causalité bivariée

Slides:



Advertisements
Présentations similaires
Corrélation Position du problème Définition covariance (X,Y) r =
Advertisements

GESTION DE PORTEFEUILLE chapitre n° 7
La régression logistique: fondements et conditions d’application
C1 Bio-statistiques F. KOHLER
David Bounie Thomas Houy
Dr DEVILLE Emmanuelle J D V 12/07/2006
Régression -corrélation
Théorie du consommateur lorsque la richesse dépend des prix
La démarche experimentale
Traitement de données socio-économiques et techniques d’analyse :
Expériences contrôlées Quasi-expériences Études de cas
COURS 5 Les tableaux croisés, le chi-carré et la corrélation
Les liens entre les variables et les tests d’hypothèse
Paul-Marie Bernard Université Laval

La Régression Multiple
Fonction puissance Montage préparé par : André Ross
Objectifs du chapitre 7: Plans corrélationnels
La distinction entre variable modératrice et variable médiatrice
Howell, Chap. 1 Position générale
Corrélation et régression linéaire simple
L’Analyse de Variance 1 Généralités Le modèle Calculs pratiques
Interaction entre les possibles facteurs de risque
Méthodes de prévision (STT-3220) Section 4 Concepts fondamentaux de séries chronologiques Version: 8 novembre 2004.
ELEMENTS DE COURS 1. LERIDON H., TOULEMON L. (1997) – Démographie. Approche Statistiques et dynamique des populations. Paris, Economica. 2. FALISSARD.
Thème 8 : l'observation et l'expérimentation
La méthodologie expérimentale Fondements et bases d’application
Toutes les variables étaient mesurées au niveau intervalle et sans erreur Toutes les variables étaient mesurées au niveau intervalle et sans erreur ->
La corrélation et la régression multiple
La corrélation et la régression
Le test t.
La régression logistique
La corrélation et la régression
Corrélation Principe fondamental d’une analyse de corrélation
La méthodologie expérimentale Fondements et bases d’application
La méthodologie expérimentale Fondements et bases d’application
Expériences contrôlées Rappel du cours d’IHM
Le comportement des coûts Chapitre 3
Structure discriminante (analyse discriminante)
PROGRAMMATION SCIENTIFIQUE EN C PRO Approximation de fonctions et régression u Introduction –Analyse de la corrélation –Régression et méthode des.
Les analyses multivariées
Objectifs du chap. 5: Plans de recherche classiques
Objectifs Chapitre 7: variables indépendantes et dépendantes
Objectifs Chapitre 2: variables
La régression multiple
Régression linéaire multiple : hypothèses & tests. Partie 3.
Méthodes de Biostatistique
Chapitre 11 Modèles expérimentales Académie des Sciences Economiques Faculté d’Administration des Affaires (FABIZ) Section : Français Master année II Papaianulis.
Initiation à la Méthodologie de Recherche
2. Modèles linéaires.
Méthodes 26 novembre Psychologie cognitive Méthodes2 Diversité des méthodes Les différentes écoles ont privilégié telle ou telle méthode.
La facilitation / inhibition sociale
LA POSE D’UN DIAGNOSTIC Jm bouthors - Consultant
M2 Sciences des Procédés - Sciences des Aliments
Séance 8 30 novembre 2005 N. Yamaguchi
Carole Dion, professeure UQAC ACFAS 2006
BIO 4518: Biostatistiques appliquées Le 25 octobre 2005 Laboratoire 6 Corrélation linéaire et régression linéaire simple.
Statistiques analytiques sous STATA
ETUDE DE 2 VARIABLES QUANTITATIVES
Modèle linéaire Relation entre une variable expliquée Y (par exemple le salaire), et p variables explicatives X j, j = 1, …, p (par exemple, p = 5, X 1.
PROGRAMMATION SCIENTIFIQUE EN C PRO Approximation de fonctions et régression u Introduction –Analyse de la corrélation –Régression et méthode des.
1 Licence Stat-info CM5a 2004 V1Christophe Genolini Problème Détection d’un phénomène particulier : –Flûtiste exceptionnelle ou moyenne –Groupe de TD super.
Séries chronologiques univariées (STT-6615)
BIO 4518: Biostatistiques appliquées Le 8 novembre 2005 Laboratoire 8 Regressions multiples.
Détecter les groupes à hauts risques cardiaques à partir de caractéristiques telles que l’alimentation, le fait de fumer ou pas, les antécédents familiaux.
LES VARIABLES Une variable est n’importe quel facteur qui influence les résultats d’une expérience. Les scientifiques cherchent les relations de cause.
Scénario Quatre hipsters entrent en collision un dans l'autre dans un ascenseur plein de personnes. En conséquence ils laissent tomber leurs téléphones.
Corrélation et régression linéaire Mars Modèles de régression  Réponses aux questions du type: ‘Quelle est la nature de la relation entre les variables?’
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
Processus ponctuels Caractéristiques et Modèles de répartitions spatiales.
Transcription de la présentation:

Structure de causalité bivariée La question de recherche porte essentiellement sur deux variables La variable X a-t-elle un effet sur la variable Y ? X est la cause présumée (variable indépendante) Y est la conséquence attendue (variable dépendante) Cette structure est le prototype même de la recherche expérimentale par la simplicité de la question posée Si d’autres variables sont présentes, elles ne sont là que comme « contrôles »

Cas classique à deux groupes La cause X est souvent une variable discrète à deux niveaux (p. ex. présence ou absence d’un traitement expérimental) La conséquence Y est le plus souvent une variable continue mesurée sur une échelle d’intervalles ou de proportions L’assignation au hasard ou l’appariement des deux groupes sur certaines variables permet de contrôler tous les autres facteurs Toutes autres choses étant égales, si X est une cause de Y, le niveau de Y devrait différer entre les deux groupes Ce format le plus simple appelle un test t

Graphique de la structure de causalité bivariée (test t) X Y

Cas classique à trois groupes ou plus La cause X peut être une variable discrète à trois niveaux ou plus (p. ex. traitement A, B ou C) La conséquence Y est encore une variable continue L’assignation au hasard ou l’appariement des deux groupes sur certaines variables est maintenu Toutes autres choses étant égales, si X est une cause de Y, le niveau de Y devrait différer entre les groupes Ce format à trois groupes ou plus appelle une analyse de variance unifactorielle

Graphique de la structure de causalité bivariée (analyse de variance unifactorielle) X Y

Cas classique où la cause présumée (variable indépendante) est continue La cause X est une variable continue (p. ex. la motivation du participant) La conséquence Y est aussi une variable continue (p. ex. le rendement dans une tâche) L’assignation au hasard ou l’appariement des groupes n’est pas possible puisqu’il n’y a pas de groupes comme tels Toutes autres choses étant égales, si X est une cause de Y, le niveau de Y devrait varier en fonction du niveau de X Ce format appelle une analyse de régression simple

Graphique de la structure de causalité bivariée (régression simple) Y X

Structure de causalité convergente La question de recherche vise à expliquer une même conséquence à l’aide de plusieurs causes présumées Les variables X1, X2 et X3 ont-elles un effet sur la variable Y ? Les causes présumées X1, X2 et X3 convergent pour expliquer Y Les causes présumées sont en principe indépendantes les unes des autres: chacune ajoute quelque chose aux contributions des autres (absence de multi-colinéarité) Le modèle est additif: l’effet des variables X1, X2 et X3 ne découle pas de leur présence combinée, mais bien de leur contribution individuelle

Cas classique où la variable à expliquer est continue La variable à expliquer (à prédire) est souvent mesurée de façon continue (p. ex. le niveau de rendement dans une tâche) Les causes présumées sont souvent mesurées de façon continue, mais elles peuvent aussi être discrètes Ce format est très fréquent en psychologie surtout lorsqu’il est impossible de manipuler les causes ou d’assigner les participants à des groupes de façon aléatoire Toutes autres choses étant égales, si X1, X2 et X3 sont des causes de Y, le niveau de Y devrait varier en fonction des poids de ces variables Ce format appelle une analyse de régression multiple

Graphique de la structure de causalité convergente (régression multiple) X1 Y X2 X3

Cas moins fréquent où la variable à expliquer est discrète À l’occasion, la variable à expliquer ou à prédire peut être mesurée de façon discrète (p. ex. réussir ou non dans une tâche) La question revient alors à expliquer ou à prédire l’appartenance à un groupe Ce format appelle une analyse de régression logistique

Graphique de la structure de causalité convergente (régression logistique) X1 Y X2 X3

Structure de causalité factice ou de causalité indirecte La question de recherche vise à expliquer ou à mieux comprendre la relation entre deux phénomènes Pourquoi la variable X influence-t-elle la variable Y ? En d’autres termes, y a-t-il vraiment un effet direct de X sur Y ? Pour répondre à ces questions, le chercheur introduit une 3e variable dont il veut tenir compte

Le cas de la causalité factice Ce qui se présente comme une influence directe de X sur Y est peut-être une relation artificielle ou factice Le chercheur soupçonne que la clé de l’énigme est une 3e variable Z qui agit directement sur X et directement sur Y En d’autres termes, si on contrôlait Z, la relation apparente entre X et Y disparaîtrait-elle? Si oui, alors l’effet de X sur Y était factice («spurious») Ce modèle appelle le calcul de la corrélation partielle entre X et Y en contrôlant pour Z

Graphique de la structure de causalité factice (corrélation partielle) ? X Y Z

Le cas de la causalité indirecte Ce qui se présente comme une influence directe de X sur Y passe peut-être par un autre chemin Le chercheur soupçonne que la relation met en cause une 3e variable Z qui agit comme variable médiatrice entre X et Y En d’autres termes, si on contrôlait Z on pourrait provoquer une diminution importante de l’effet de X sur Y. Si c’est le cas, alors l’effet de X sur Y était indirect Ce modèle appelle lui aussi le calcul de la corrélation partielle entre X et Y en contrôlant pour Z

Graphique de la structure de causalité indirecte (corrélation partielle) ? X Y Z

Le cas des modèles plus complexes Il est possible de vouloir éclairer la relation entre X et Y en contrôlant pour plusieurs variables Il se pourrait qu’une 3e variable Z agisse comme variable médiatrice, alors qu’une 4e variable W viendrait mettre en évidence l’aspect factice de l’influence de X sur Y En présence d’un modèle complexe de ce type, le chercheur choisira une analyse acheminatoire

Graphique de la structure d’un modèle causal plus complexe (analyse acheminatoire) ? X Y W Z