CM Formation Recherche Master 1 Epistémologie et dispositifs quantitatifs : L’attitude expérimentale Frederic.martinez@univ-lyon2.fr.

CM Formation Recherche Master 1 Epistémologie et dispositifs quantitatifs : L’attitude expérimentale

Pré requis d’utilisation de l’attitude expérimentale
Mener une recherche avec pour objectif d’apporter une réponse basée sur des faits (= approche empirique) L’empirisme est une épistémologie qui privilégie l’expérience ou l’observation comme méthode de validation (des théories, des hypothèses, …). En cela, elle est à distinguer du rationalisme qui, lui, insiste sur la préséance d’arguments logiques faisant appel à la raison Soucis de preuve, attitude scientifique, qu’est ce que la science

Points de vue sur la science
C’est dans le rapport observation / théorie que se construit le savoir. Selon C. Bernard : « la simple constatation des faits ne pourra jamais parvenir à constituer une science. On aura beau multiplier les faits ou les observations que cela n’apprendrait pas davantage. Pour s’instruire, il faut nécessairement raisonner sur ce que l’on a observé, comparer les faits et les juger par d’autres faits qui servent de contrôle (in Michiels-Philippe, 1984, p. 106)

Conception classique de la science : Primat de l’observation
Empirisme logique (Vienne, 1920 ; USA, 1930 ) = origine de toute connaissance les données sensorielles puis des lois induites par de multiples observations puis des théories puis des hypothèses puis test puis de nouvelles théories puis d’autres hypothèses Raisonnement inductif Critique = Pas d’observation pure, problème de l’insertion dans un communauté scientifique

2. Popper et la conception critique de la science : Réfutabilité de l’hypothèse
Problème de la preuve = Une observation ne confirme jamais une théorie, elle ne peut que l’infirmer, la réfuter, montrer qu’elle est fausse Ainsi, selon Popper « est scientifique toute affirmation réfutable, c’est-à-dire telle qu’on soit capable d’imaginer un état du monde qui amènerait à conclure qu’elle est fausse » (Ghiglione & Richard, 1992, p. 641) Les critiques portent sur le caractère trop strict de la notion de réfutabilité « … le critère de réfutabilité, s’il paraît trop strict pour définir la science ou la distinguer nettement de ce qui ne l’est pas, constitue, si on ne l’applique pas de façon rigide, un excellent élément d’hygiène intellectuelle (Ghiglione & Richard, 1992, p. 648)

3. Kuhn et la stabilité des visions du monde (plus fondée sur «ce qui se fait » que sur « ce qui doit se faire ») Activité du scientifique ne vise pas à mettre à l’épreuve des hypothèses mais à résoudre des problèmes visant à les enrichir. Un scientifique travaille à l’intérieur d’un paradigme, à savoir un ensemble de théories, de méthodes, de résultats acquis, de présupposés…, partagés par une communauté de scientifiques qui travaille sur un domaine spécifique. Le bon scientifique serait celui, qui tant dans l’observation que dans l’expérimentation, est ouvert aux imprévus, prêt à orienter sa recherche dans une direction nouvelle, parfois très différente de celle qu’il a d’abord entreprise « La science est création, et en cela participe des mêmes sources que l’art, et comme lui fait surgir la nouveauté à travers la maîtrise rigoureuse d’un matériau et de l’outil »

CLAUDE BERNARD : OBSERVATION ET EXPÉRIENCE
Claude Bernard définit la démarche scientifique en trois étapes : Observation —> Hypothèse —> Expérience L'observation vise à décrire la réalité telle qu'elle est, à inventorier, classer les faits remarquables, à les connaître avec précision. Elle joue un rôle capital dans les sciences jeunes et les problèmes nouveaux. En psychologie, la plupart des recherches ne sont encore qu'à la phase de l'observation systématique. L'hypothèse vise à imaginer des relations possibles entre faits, l'expérience à vérifier l'hypothèse.

L’observation Occasionnelle et systématique Naturaliste et clinique L’observation obéît aux principes de la perception. L’observateur sélectionne et interprète les données 2. L’hypothèse Une hypothèse n’est pas une suggestion aléatoire concernant la survenue d’un événement mais une affirmation claire sur ce que l’on s’attend à obtenir, observer, mesurer, constater. Hypothétique que parce que nous ne savons pas, à l’avance, si elle sera vérifiée ou pas mais cela reste une affirmation par anticipation - Induite et déduite

3. L’expérience Expérimenter c'est "intervenir activement pour réaliser les conditions nécessaires à la vérification des hypothèses relatives aux causes ou aux propriétés des phénomènes étudiés" (Ghiglione & Richard p.273). Pour C. Bernard (1865, cité par Reuchlin, 1992, p. 21), "La seule preuve qu'un phénomène joue le rôle de cause par rapport à un autre, c'est qu'en supprimant le premier, on fait cesser le second" . Ainsi, l'expérience vise à vérifier l'existence d'une relation entre deux classes de faits. Le principe est toujours le même, faire varier un fait pour observer ses conséquences sur l'autre.

Remarques sur ce modèle observation –hypothèse– expérience:
l’observation systématique est également un moyen de tester des hypothèses Ex : l’astronomie et la méthode d’exploration critique de Piaget "L'expérience n'est au fond qu'une observation provoquée" (Claude Bernard) Pour C. Bernard (Michiels-Philippe, 1984) "un savant complet est celui qui embrasse à la fois la théorie et la pratique expérimentale. 1° Il constate un fait ; 2° à propos de ce fait, une idée naît dans son esprit ; 3° en vue de cette idée, il raisonne, institue une expérience, en imagine et en réalise les conditions matérielles 4°. De cette expérience résultent de nouveaux phénomènes qu'il faut observer, et ainsi de suite. L'esprit du savant se trouve en quelque sorte toujours placé entre deux observations : l'une qui sert de point de départ au raisonnement, et l'autre qui lui sert de conclusion.

2. Il existe d’autres types de recherche qui ne mettent pas en évidence une relation causale mais toutes aussi importantes Il s’agit de la méthode corrélationnelle qui ne permet pas d’établir une relation de cause à effet mais d’établir un lien entre deux variables Par exemple, « constater que des enfants nourris plus longtemps au sein ont un QI plus élevé à l’âge adulte ne signifie pas nécessairement que le lait maternel explique cet effet. Il est possible que les femmes qui nourrissent plus longtemps leur enfant ont des particularités qui affecteront leur comportement avec leur enfant et que ces particularités affecteront le QI de ce dernier jusqu’à un âge avancé » (Gueguen, 2007, p. 61) Ouvre donc des pistes de recherches ou de réflexion sur le poids de tel ou tel facteur sans rien démontrer

Les étapes d’une recherche
Principes généraux Etude scientifique si à la question "Pourquoi devrais-je vous croire ?" le chercheur peut répondre "Voilà ce que j'ai fait et ce que j'ai observé. Vous pouvez faire la même chose, et vous arriverez aux même conclusions." (Ghiglione & Richard, 1992, p ) Caractère public, reproductible et communicable La généralisation : L'intérêt du chercheur n'est pas de savoir ce qui se passe ici et maintenant, mais de savoir ce qui pourrait se passer sur d'autres individus, sous d'autres conditions et en d'autres moments à l’aide de statistiques inférentielles Un problème = La représentativité des individus

Nécessité de de procéder par étapes chacune précisant la précédente pour structurer le raisonnement
La question de départ L’exploration La problématique et l’hypothèse La construction du dispositif d’observation L’observation ou recueil de données L’analyse des données Discussion

Les étapes de méthode expérimentale de recherche
La question de départ •Objectif : –Se donner un but à atteindre •Sources : –Demande sociale –Observations occasionnelles –Résultats antérieurs

2. L’exploration •Objectif : –Préciser la question •Sources : –Analyse bibliographique –Entretiens exploratoires –Observations exploratoires –Description objective de la situation

3. La problématique et hypothèses
•Objectif : –Définir l'approche théorique adoptée •Trois temps : 1. Répertorier des approches du problème 2. Sélectionner (ou construire) une problématique 3. Préciser la problématique adoptée : Poser et justifier l’hypothèse générale (directrice). C'est - à - dire Prévoir des relations entre faits observables qui confirment ou non la théorie.

4. Construction d’un dispositif expérimental
Imaginer une situation dans laquelle un facteur (la condition) varie et fait varier à lui seul un comportement donné (effet). « toutes choses étant égales par ailleurs » Une hypothèse ? Expérience, observation, questionnaire, méthode clinique : Piaget Variables. Variable Dépendante (VD) –Comportement que l'expérimentateur observe. –Il varie en fonction de la VI •Variable Indépendante (VI) (Manipulation check) –Facteur que l'expérimentateur fait varier •Variable Parasite (VP) –Facteur que l’expérimentateur neutralise ou contrôle

Le dispositif expérimental
•Exemple d'opérationnalisation d'une variable Hypothèse générale : Plus les sujets jugent une tâche intéressante, plus ils participent à cette tâche. Procédure envisagée : Comptabiliser le nombre d'étudiants qui répondent à une offre de participation à une expérimentation en laboratoire VD Participation à la tâche : Indicateur NB d'étudiants se proposant pour participer à une expérience

B. Le dispositif expérimental
VI : Intérêt pour la tâche 2 modalités : - Forte - Faible Opérationnalisation :Thèmes annoncés de l'expérience Thème 1 : sexualité Thème 2 : la perception de la relativité Hypothèse opérationnelle : Il y aura plus d'étudiants qui se proposeront pour participer à une expérimentation sur la sexualité que pour une expérimentation sur la perception de la relativité

Variables Indépendantes •Variables provoquées et invoquées – La variable provoquée est manipulée par l'expérimentateur – La variable invoquée (ou étiquette) correspond à des phénomènes existants (ex : caractéristiques des sujets) Variables indépendantes confondues – Pour conclure que la VI affecte la VD, il faut éviter que les modalités de la VI étudiée recouvrent les modalités d'une autre VI cachée.

Exemple de variables indépendantes confondues –Hypothèse : L'apprentissage de l'arithmétique dépend de la méthode pédagogique. –Procédure : Trois enseignants formés à l'une des méthodes pédagogiques. Chaque enseignant prend une des trois classes différentes. –Résultat : La performance varie d'une classe à l'autre. VI confondues : caractéristiques individuelles des enseignants, Niveau des classes, ...

Variables parasites • On contrôle les Variables Parasites dont on sait (ou on présume) l'effet sur la VD –Neutralisation : on l'empêche de varier (une seule modalité) –Manipulation : on la fait varier comme une variable indépendante •VP fréquemment contrôlées: –les caractéristiques du sujet –la variable expérimentateur : lorsque plusieurs expérimentateurs recueillent les données ; –l'ordre de passation : lorsque un sujet fait plusieurs tâches ou, plus généralement, appartient à plusieurs groupes expérimentaux Variable impérativement neutralisée –Instructions données aux sujets : CONSIGNE

Exercice : Identifier les variables •Hypothèse : Au cours d'un procès, plus un juré estime qu'un accusé est beau, moins il le juge coupable. Dans les éléments qui suivent, définir la VI, la VD, les VP : –A- l'estimation de la beauté de l'accusé –B- L'âge de l'accusé –C- Le jugement de culpabilité de l'accusé –D- Le genre du juré –E- Le genre de l'accusé –F- La beauté du juré

B. Le dispositif expérimental (Validité)
•Rappel : –Pour faire la preuve d'une relation causale, il faudrait ne manipuler qu'un seul facteur (VI) –Mais, risque de mettre en évidence un cas particulier ou d'introduire des biais méthodologiques (VI confondues) •Le choix du nombre de facteurs dépend du but visé : – Montrer sans ambiguïté l'effet d'un facteur (VI) Renforcer la validité interne de l'expérimentation, en neutralisant le maximum de facteurs potentiels. Montrer la généralité, la pertinence du facteur (VI) Renforcer la validité écologique de l'expérimentation, en manipulant plusieurs facteurs. Toutefois, la validité écologique d'une expérience n'est pas proportionnelle au nombre de facteurs manipulés : Si plus de 3 facteurs, c'est la validité de l'expérimentation elle-même qui est remise en cause.

Groupe Contrôle Hypothèse :
Les patients atteints d'un syndrome de Korsakoff présentent une dégradation du stockage en MLT. On fait passer un test de mémorisation à des patients et on constate que les patients retiennent en moyenne 2 mots sur une liste de 30. Ce résultat n'est interprétable que si on a une valeur de comparaison chez des sujets normaux. Ce groupe de sujets normaux, à qui on fera passer le même test, constitue le groupe contrôle. .

Groupe Contrôle Un autre exemple : Dans une expérience sur la perception, on veut montrer que l'identification d'une image ambiguë dépend du contexte dans lequel l'image est présentée. L'expérimentateur utilise une image ambiguë donnant lieu à deux catégories de réponses : vieille femme ou jeune femme. Cette image est associée à un texte qui traite soit de la jeunesse, soit de la vieillesse. L'expérimentateur s'attend à obtenir plus de réponses jeune femme quand l'image est associée à un texte sur la jeunesse et à plus de réponse vieille femme quand l'image est associée à un texte sur la vieillesse. Admettons qu'il obtienne des résultats ci-dessous : .

jeunesse vieillesse Jeune femme 75% 50% Veille femme 25%
Groupe contrôle L'expérimentateur sera tenté de conclure que seul le contexte jeunesse a un effet sur la réponse. Mais si on ajoute un groupe de sujet auquel on présente l'image seule, et qu'on obtienne 75% de réponse jeune femme et 25% de réponse vieille femme. Dans ce cas, seul le contexte vieillesse aurait eu un effet sur la réponse. Ainsi, l'effet du contexte ne peut être évalué qu'en référence aux résultats obtenus sur un groupe contrôle qui n'est pas soumis à un contexte. jeunesse vieillesse Jeune femme 75% 50% Veille femme 25%

Manipu check Fiabilité indicateur

3/ Effet de confirmation d’hypothèses :
- tendance des gens à chercher à confirmer leurs hypothèses plutôt qu’à en éprouver la valeur réelle 3/ 2-4-6 Quelle est la règle, proposez des suites de 3 nombres 2-4-7, informative car infirme l’ hypothèse Snyder et Swann (1978), introversion ou extraversion - Test extraversion = questions extraverties; test intraversion =questions intraversties - TROP confiance en nous ; cherche donc pas à savoir si les infos dispo vont confirmer et non infirmer notre opinion.

La tâche de sélection de Wason
Quatre cartes. une lettre sur un côté et un nombre sur l'autre Indiquer quelle(s) carte(s) il vous faut tourner pour vérifier l'affirmation suivante : Si une carte porte une voyelle d'un côté, alors elle porte un nombre impair de l'autre côté E C 5 4

Tourner E : assure la vérité de la règle
Solution Tourner E : assure la vérité de la règle Tourner 4 : assure que la règle n’est pas contredite Mais tourner 5 ne prouve pas que la règle est respectée ! E C 5 4

Solution évidente (75% de succès vs 25%) Pourquoi ?
Les cartes ci-après contiennent des renseignements sur quatre personnes assises à une table dans votre bar. Sur un côté de chaque carte se trouve la nature de la consommation et sur l'autre, l'âge de la personne. N'identifiez que les cartes que vous devez absolument retourner pour savoir si l'une de ces personnes enfreint la loi. Solution évidente (75% de succès vs 25%) Pourquoi ? 16 ans 25 ans Bière coca

Effet simple Admettons que l'on souhaite étudier l'effet de la familiarité d'une tâche sur la mémoire. On va, par exemple, présenter très rapidement des mots aux sujets : 100 relatifs à une tâche très familière 100 autres relatifs à une tâche peu familière. Les résultats montrent que les sujets reconnaissent plus de mots lorsque la tâche est très familière que lorsque la tâche est peu familière. = Effet simple de la familiarité d’une tâche sur la mémoire Type de Tâche Nombre de mots reconnus sur les 100 mots Très familière 80 Peu familière 30

Effet d’interaction Cependant on peut se demander si l'intérêt pour la tâche modifie l'effet de la familiarité de la tâche. Dans cet objectif, on va étudier l'effet de l'interaction entre familiarité de la tâche et intérêt pour la tâche. Par exemple, on présentera 4 catégories de mots aux sujets : 100 mots relatifs à une tâche très familière et très intéressante, 100 mots relatifs à une tâche très familière et peu intéressante 100 mots relatifs à une tâche peu familière et très intéressante, 100 mots relatifs à une tâche peu familière et peu intéressante. .

Fort intérêt pour la tâche Faible intérêt pour la tâche
Effet d’interaction On peut obtenir différents types de résultats : . Fort intérêt pour la tâche Faible intérêt pour la tâche Tâche très familière 80 Tâche peu familière 30 a) il n'y a pas effet d'interaction entre les facteurs car l'effet de l'intérêt ne modifie pas l'effet de la familiarité. Quel que soit l'intérêt pour la tâche.

Fort intérêt pour la tâche Faible intérêt pour la tâche
Effet d’interaction Fort intérêt pour la tâche Faible intérêt pour la tâche Tâche très familière 80 Tâche peu familière 50 10 . Effet d'interaction entre les facteurs car l'effet de l'intérêt pour la tâche modifie l'effet de la familiarité sur la performance -Lorsque la tâche est très familière, l'intérêt pour la tâche ne modifie pas la performance. - Inversement, lorsque la tâche est peu familière, le fort intérêt pour la tâche améliore la performance, alors que le faible intérêt pour la tâche inhibe la performance.

Variable modulatrice versus médiatrice
Familiarité performance Intérêt Effet d’interaction nous permet que l’intérêt est une variable modulatrice car elle module l’effet de la familiarité sur la performance. Autrement dit, l’effet de la familiarité sur la performance est différent selon les niveaux de la variable modulatrice

Variable modulatrice versus médiatrice
Y X M - Une variable médiatrice (M) est en revanche une variable qui intervient entre la variable indépendante (X) et la variable dépendante (Y) de sorte que la variable indépendante exerce un effet sur la variable médiatrice et la variable médiatrice exercice un effet sur la variable dépendante. L’effet de la variable indépendante sur la variable dépendante est indirect car il transmis par la variable médiatrice Intérêt supplémentaire = Si l’on éliminait l’effet de la variable médiatrice, on n’observerait plus de relation entre X et Y

En résumé : - Une variable modulatrice (effet d’interaction) explique quand et sous quelle conditions un effet se produit - Une variable médiatrice nous renseigne sur comment et pourquoi un certain effet a lieu.

Plan d’expérience et relation entre variables
. Les facteurs ( VI) sont représentés par une lettre majuscule quelconque. Le facteur sujet est toujours représenté par la lettre S. - Le nombre de modalités associé à chaque facteur est indicé à la lettre le représentant. Par exemple, un facteur quelconque "X" à 3 modalités sera noté X3. Les VI peuvent être combinées de différentes façons. Ces combinaisons définissent les plans d’expérience.

Le plan factoriel - Un plan factoriel est un plan dans lequel chaque modalité d’une variable indépendante est combinée avec chaque modalité des autres variables indépendantes pour constituer une condition expérimentale ou un groupe expérimental - Dans un plan factoriel, le nombre de conditions expérimentales (ou de groupes) est égal au produit du nombre de modalités de variables indépendantes.

Le plan factoriel Ex Rossi et Pierandreï (1984) s’intéressant au format du lexique ont voulu vérifier que les sigles stockés en mémoire le sont sous une forme spécifique 2 hypothèses générales : l’identification du sigle est difficile s’il est écrit en minuscule (forme inhabituelle) l’identification mots (rare ou fréquent) est indépendante du type de lettres (majuscules ou minuscules) 2 hypothèses opérationnelles : le seuil d’identification des sigles est plus élevé lorsqu’ils sont écrits en minuscules que lorsqu’ils sont écrits en majuscules le seuil d’identification des mots (rares ou fréquents) est indépendant du type de lettre utilisé (majuscules ou minuscules)

Le plan factoriel complet
variables indépendantes : T3, type de stimuli : T1, mots fréquents T2, mots rares T3, sigles L2, type de lettres : L1, minuscules L2, majuscules Type de stimuli Type de lettre T1 Mots fréquents T2 Mots rares T3 Sigles Minuscules 1 2 3 Majuscules 4 5 6

A) Croisement. On dit de ces deux facteurs type de stimuli et type de lettes qu’ils sont croisés. Deux facteurs sont croisés (on dit aussi contrebalancés) lorsque chaque modalité de l'un se retrouve dans chaque modalité de l'autre. Par exemple (Abdi, 1987), dans une expérience sur l'apprentissage on donne ou non une récompense (facteur R2) à trois moments de la journée (M3), le facteur "Récompense" est dit croisé avec le facteur "Moment de la journée", le plan s'écrit « R2* M3 », ou « M3*R2 » car la relation est symétrique et se lit "R2 croix M3".

Groupes appareillés versus groupes indépendants
Groupes appareillés = plan à mesures répétées Les sujets passent dans toutes les conditions expérimentales Exemple : étude du rôle de la fréquence d’usage sur le seuil d’identification VI : fréquence F2, 2 modalités : mots rares et mots fréquents Groupes appareillés si pour chaque sujet sont enregistrés les seuils d’identification pour les mots rares et les mots fréquents

Groupes appareillés versus groupes indépendants
Groupes indépendants = différents sujets sont affectés aux différentes conditions expérimentales Autant de groupes de sujets que de conditions expérimentales Affectation soit tirage au sort ou utilisation de groupes équivalents Déterminer les seuils des mots rares pour un groupe de sujets et les seuils des mots fréquents pour un autre groupe de sujets

L’expérience de Monteil (1993)
Regardez bien cette figure car je vais la cacher et vous demander de la reproduire

Monteil (1993) La figure de Rey proposée à des élèves de 5ème « bons » et « mauvais » La tâche est proposée comme étant une épreuve de « dessin » pour la moitié et comme une épreuve de « géométrie » pour l’autre moitié

Monteil (1993) Mauvais élèves Bons élèves Dessin Géométrie

Avoir une difficulté … C’est avoir un statut de mauvais élève
C’est avoir appris à échouer C’est être persuadé que l’on va échouer

Principe de l’inférence statistique
Généralisation Principe : En partant d’observations réalisées sur un nombre limité d’individus, savoir dans quelle mesure, on pourra, moyennant des risques connus, généraliser à l’ensemble de la population les caractéristiques observées Imaginons que vous essayiez de savoir si les hommes sont meilleurs que les femmes en mathématiques. Vous soumettez un test de mathématiques à 30 étudiantes et 30 étudiants de psychologie et comparez leurs scores Moyens à ce test. Vous constatez, grâce à un test t pour échantillons indépendants qu'il est significatif à .04 et que les hommes obtiennent des scores plus élevés que les femmes. Mais qu'est-ce que cela signifie réellement?

Le principe général de l'inférence statistique consiste à tirer des conclusions concernant un groupe auquel on ne peut pas accéder directement (généralement parce qu'il est trop grand. Ici, les hommes et les femmes, soit 3 milliards d'individus dans chaque cas; ou plus modestement les "étudiants" et les "étudiantes") à partir d'un sous-groupe auquel on a accès et que l'on considère comme un échantillon aléatoire provenant de cette population. Le groupe "étendu" sur lequel on veut tirer des conclusions s'appelle la "population" et le groupe restreint auquel on a accès l' "échantillon". Les tests de comparaison de moyennes fonctionnent selon un raisonnement par l'absurde: Ils partent du principe que nos deux échantillons proviennent de la même population du point de vue de la variable dépendante qui nous intéresse. En d'autres termes que les hommes et les femmes ont les mêmes niveaux de compétences en mathématiques. Même si on tire deux échantillons au hasard à partir d'une même population, il est peu probable que ces deux échantillons aient exactement la même moyenne (ou obtiennent le même score moyen à un test de mathématiques). Il est également peu probable que les moyennes observées soient très différentes. Grâce à une distribution théorique (celle du t), on peut connaître exactement la probabilité d'obtenir chaque différence possible en fonction de son ampleur et de la variance observée dans chaque échantillon.

La logique est donc la suivante:
On calcule donc cette probabilité et si on constate qu'elle est très basse (inférieure à .05) on en conclut qu'il est peu probable que les deux échantillons proviennent de la même population. Ils doivent provenir donc de deux populations aux moyennes différentes, les hommes et les femmes La logique est donc la suivante: - Je pars du principe que les deux échantillons proviennent de la même population du point de vue de la variable dépendante. - J'examine les implications de cette supposition par rapport à la probabilité d'obtenir les différences de moyenne observées. - Si cette probabilité est très basse, j'en conclus que les deux échantillons proviennent de deux populations différentes et donc que les deux populations dont ils sont issus (les hommes et les femmes) ont des moyennes différentes. - Si cette probabilité est très basse, je ne rejette pas ma supposition de base (hypothèse nulle), à savoir que les deux échantillons proviennent de la même population

Comme ce raisonnement est statistique, et non purement logique, on ne peut jamais être certain que notre décision d'accepter ou de rejeter l'hypothèse nulle (c'est-à-dire notre supposition de départ) soit exacte et reflète adéquatement la réalité. On peut donc effectuer deux types d'erreurs: L'erreur de première espèce consiste à rejeter l'hypothèse nulle (par exemple à décider que les hommes ont des compétences différentes des femmes en mathématiques) alors qu'en réalité elle est vraie (les hommes ne diffèrent pas des femmes au niveau de leur aptitudes en mathématiques). On accepte généralement ce risque a hauteur d'un seuil (alpha) de .05. En d'autres termes, on accepte d'éventuellement se tromper si on a moins de 5% de chances que ce soit le cas. Formulé encore d'une autre façon, si l'hypothèse nulle est vraie, il reste 5% de chances qu'on la rejette à tort. - L'erreur de seconde espèce consiste à ne pas rejeter l'hypothèse nulle bien qu'elle soit fausse. La probabilité d'effectuer cette erreur (appelée beta) est inversement proportionnelle à la puissance du test (1-beta): c'est-à-dire la probabilité de rejeter, à raison, l'hypothèse nulle. La relation entre la puissance et le seuil que l'on choisit (alpha) est en revanche positive: plus on choisit un seuil exigeant (donc faible), moins on a de chance de détecter une différence significative.

Suite à la passation d'une expérience, une fois que l'on dispose enfin de ses données, on est souvent quelque peu démuni. Comment faire face à cette masse de variables? Voici les étapes que je vous recommande de suivre dans l'analyse de données expérimentales ou quasi-expérimentales. Pour ce faire, il vous faudra disposer du logiciel d'analyses de données SPSS Les grandes étapes dans l'analyse de données expérimentales: Encodage: Numérotation des protocoles (un par sujet) On veillera à encoder les données dans SPSS en ménageant une première colonne pour le numéro du sujet, une colonne correspondant à chaque facteur manipulé, une dernière colonne rapportant les problèmes ou observations éventuelles à propos du sujet. - Dans la dénomination des variables, il est souvent préférable de nommer les variables en fonction de ce qu'elle sont censées mesurer, suivies d'un numéro. Par exemple, si vous utilisez quatre items mesurant l'extraversion perçue d'une cible, vous pourrez les nommer extr1, extr2, extr3, extr4. Par ailleurs, vous attribuerez dans SPSS un label à chacune d'elle correspondant à la formulation exacte de l'item. En outre, je vous conseille de vous munir d'un questionnaire (si votre étude a été menée par questionnaire) sur lequel vous noterez à côté de chaque item le nom de la variable associée dans SPSS.

- En ce qui concerne les variables nominales, vous attribuerez à chaque valeur un nombre ("0" = femme, "1" = homme par exemple) et non seulement vous attribuerez un label à la variable mais également à chaque valeur. Ceci est particulièrement important en ce qui concerne les facteurs manipulés, qui sont généralement nominaux (par exemple, "0" = "Contrôle", "1" = "Condition forte", "2" = "Condition faible", etc.). Pour dénommer les variables, il est recommandé d'utiliser des chaînes de caractères de maximum 8 caractères sans accent ni espace et ce afin que le fichier soit facilement transférable d'une version de SPSS à une autre. 2. Écrémer l'échantillon: - Je vous conseille d'ensuite vous centrer sur une variable dépendante à la fois. Généralement, dans un questionnaire, vous aurez conçu plusieurs échelles afin de mesurer de manière valide les variables dépendantes qui vous intéressent. Chacune de ces échelles est composée de plusieurs items. Dans la section suivante, nous verrons comment regrouper ces items de façon à étudier non pas chaque item individuellement mais des scores correspondant aux regroupement de ces items (et qui constituent vos véritables variables dépendantes). Avant de regrouper des items, il est toutefois préférable d'éliminer certaines données que l'on juge peu exploitables et ce sur différentes base.

Sur base des valeurs observées:
On peut examiner la distribution des variables individuelles et ce, notamment, afin d'éventuellement éliminer les sujets qui auraient de nombreuses valeurs extrêmes. A cet égard, une convention largement partagée consiste à éliminer des sujets dont les observations se situeraient à plus de 4 écart-types de la moyenne (McClelland, 2000). Cela permettra également de détecter d'éventuelles erreurs d'encodage qui auraient donné lieu à des valeurs aberrantes. A ce stade, je suis relativement réservé quant à la légitimité d'éliminer des sujets qui n'auraient qu'une valeur extrême (non due à une erreur d'encodage). Après tout, celle-ci peut être légitime et devrait n'avoir que peu d'influence une fois les items agrégés sous formes d'échelles. - Sur base du déroulement de la session: On pourra également éliminer des observations jugées caduques pour des raisons méthodologiques (par exemple, une alarme a sonné pendant que le sujet passait l'expérience; le sujet n'a pas répondu à certaines consignes, etc.) - Sur bases démographiques: le sujet se distingue du reste de l'échantillon par des critères jugés pertinents quant à l'interprétation des résultats - par exemple, il est maghrébin alors que l'étude porte sur les préjugés vis-à-vis des personnes d'origine nord-africaine - ou quant à sa capacité à correctement interpréter les consignes - par exemple, s'il ne maîtrise pas bien l'idiome dans lequel est formulé le questionnaire.

3.Simplification des données et regroupement des items:
Généralement, dans un questionnaire, vous aurez conçu plusieurs échelles afin de mesurer de manière valide les variables dépendantes qui vous intéressent. Chacune de ces échelles est composée de plusieurs items. Avant de tester si vos manipulations expérimentales ont eu un effet sur ces variables, il importe donc de les agréger, de les regrouper afin de disposer d'une mesure unique. Ceci dans un souci de simplification (il serait extrêmement fastidieux d'effectuer et de devoir lire des analyses item par item si les items portent tous sur le même objet) et de validité interne (l'erreur de mesure diminuant lorsque plusieurs items mesurant la même dimension sont agrégés). - Deux stratégies sont envisageables pour regrouper les items. Elles dépendent de la mesure dans laquelle vous vous attendez à ce que vos données soient uni- ou multi-dimensionnelles. Prenons l'exemple d'une série de questions portant sur l'impression que l'on se fait d'une cible - est-il compétent, chaleureux, sympathique, etc. Les réponses à ces questions peuvent soit être "multidimensionnelles" ce qui signifie que plusieurs dimensions organisent la perception de la cible (par exemple, la dimension "compétence intellectuelle" et la dimension "sociabilité"), soit être unidiemensionnelles (par exemple un facteur général "positivité" organise cette représentation). Dans le premier cas, il serait pertinent de construire deux échelles, mesurant la perception de la cible sur chaque dimension. Dans le second cas, une seule échelle suffira.

- Si vous n'êtes pas sûr que vos données sont unidimensionnelles, ou si vous vous attendez à ce qu'elles soient multidimensionnelles, il importe de faire une analyse factorielle en composantes principales (ACP) afin de s'en assurer:

Les indices de dispersion
Comparaison de deux notes : Dans une épreuve A dont les caractéristiques sont M = 10 et s = 1.5, un candidat obtient la note 8. Dans une épreuve B dont les caractéristiques sont M = 150 et s = 10, un candidat obtient 133.5 Dans quelle épreuve est-il le plus faible ? Transformation des notes brutes sur une échelle commune, Z, note centrée réduite : Z = (X-M)/S soit Z A = (8-10)/1.5 = et Z B = ( )/10 = -1.45 C’est donc à l’épreuve B que le candidat est le plus faible, le plus éloigné de la moyenne

Comparaison des notes de deux candidats X et Y notés par des professeurs différents A et B lors d’une même épreuve : Le candidat x obtient la note 15, M = 10, s = 2.5 Le candidat Y obtient la note 18, M = 10, s = 5 Quel est le meilleur candidat ? Transformation des notes brutes sur une échelle commune, Z, note centrée réduite : Z = (X-M)/S soit Z X = (15-10)/2.5 = 2 et Z Y = (18-10)/5 = 1.6 X est en réalité meilleur que Y

L'alpha de Cronbach -Lorsque l'on mesure un construit psychologique (par exemple une attitude, le niveau d'identification, l'orientation politique, le stéréotype d'un groupe, etc.) on recourt souvent à des questionnaires regroupant de nombreuses questions portant sur un même sujet. Effectivement, disposer de plusieurs questions pour évaluer un même concept permet souvent de limiter l'erreur de mesure et de l'évaluer de façon plus précise et générale. Par exemple, pour mesurer l'orientation politique (le degré auquel on est de "gauche" ou "de droite"), on pourrait poser des questions comme "Dans quelle mesure êtes-vous favorable à l'économie de marché?"; "Dans quelle mesure êtes-vous favorable à un contrôle de l'Etat sur le fonctionnement de l'économie?"; etc. sur des échelles à 7 points (1="pas du tout d'accord", 7 = tout à fait d'accord).

Après avoir encodé les réponses des sujets et les avoir transformées de façon à ce que les valeurs élevées représentent la même orientation politique, on pourrait être tenté de calculer leur moyenne ou leur somme afin d'obtenir un "score" correspondant à l'orientation politique des sujets. -Toutefois, d'un point de vue méthodologique, on ne peut pas combiner les réponses à des items différents si l'on ne dispose pas d'arguments empiriques suggérant que ces items mesurent effectivement la même chose. Cela n'aurait pas de sens de combiner des items qui mesurent en réalité des choses différentes. Or si deux items mesurent la même chose, les réponses devraient être corrélées l'une à l'autre. Ainsi si, dans l'exemple précédent, les deux items mesurent bien l'orientation politique, les personnes qui sont fort favorables à la première affirmation devraient être défavorable à la seconde.

-Toutefois, les corrélations ne peuvent être calculées que sur deux items à la fois.
-Que faire lorsqu'on utilise plus de deux items pour mesurer un concept? -C'est à cela que sert l'alpha Cronbach qui varie entre 0 et 1 e t constitue un indice de "consistance" de l'échelle, c'est-à-dire du degré auquel l'ensemble des items qu'elle inclut mesurent bien la même chose. -A partir de quelles valeurs l'alpha est-il suffisamment satisfaisant pour que l'on puisse calculer un score correspondant à l'ensemble de l'échelle (en effectuant la moyenne ou la somme des items)? - Entre 0 et .50: Valeurs insuffisantes. - Entre .50 et .70: Valeurs Limites. - Entre .70 et 99: Valeurs élevée ou très élevées. Attention: l'alpha ne peut se calculer que sur des données continues.

A présent que vous avez regroupé vos variables sous forme de scores, il peut être utile d'examiner la distribution de ces variables globalement ainsi qu'en fonction des facteurs manipulés. Vous pourrez ainsi examiner si elle est raisonnablement normale, ce qui vous autorise à utiliser des techniques paramétriques. A ce stade, il devient encore plus légitime d'éliminer des sujets qui auraient des valeurs extrêmes. Celles-ci reflétant cette fois des scores agrégés sur plusieurs items, elles sont d'autant plus susceptible de refléter le caractère atypique du sujet. - Si la distribution est suffisamment "normale", il devient pertinent d'examiner les moyennes. A vue d'oeil, cela vous permettra d'examiner si les résultats semblent se conformer aux hypothèses ????

Moyenne : Un indicateur non Fiable ?
- En 1991, salaire net moyens des salariés français à temps complet du privé et du semi public (11.8 millions de personnes) = F Salaire médian = F, soit un écart 1742 F On utilisera pour les test de comparaisons de moyennes d’autres indicateurs : des indicateurs de dispersion tels que la variance et l’écart type La variance et l’écart type sont des indices de dispersion qui permettent de voir comment les données sont réparties autour de la moyenne. Ces 2 paramètres sont de même nature puisque la variance est le carré de l’écart type (ou l’écart type est la racine carré de la variance).

Les indices de dispersion sont des mesures de l’amplitude de la variation du phénomène autour de la moyenne Avoir 8 n’a pas la même signification si les notes vont de 2 à 18, avec une moyenne de 10 que si elles vont de 8 à 12 toujours avec une moyenne de 10 Notion de variance et écart-type : Supposons que dans une distribution, on calcule pour chaque donnée par rapport à la moyenne (soit X – M) Ces différences seront soit positives soit négatives et la somme = 0

Pour éviter ce problème, on élèvera au carré et les différences devenues positives pourront s’additionner pour exprimer la dispersion Pour rendre la comparaison possible avec d’autres distributions d’effectifs différents. On divisera par N (taille échantillon). C’est la variance (v) Autre Indice souvent utilisé écart type ( soit racine carré de la variance)

Dans le cas contraire, deux solutions au moins s'offrent au chercheur:
Solution 1 - Transformation: selon la distribution, il peut être pertinent de "transformer" les variables de façon à ce que leur distribution soit plus normale. Par exemple, pour des distributions fortement asymétriques, une transformation logarithmique peut s'avérer bénéfique. Ceci exigera d'utiliser la fonction transform/compute dans SPSS et de définir une fonction correspondant à la nouvelle variable. - Solution 2 - Approche non paramétrique.

5. Inférence statistique
Votre tâche suivante consistera à déterminer s'il existe des différences statistiquement significatives entre vos conditions expérimentales. Ceci implique de recourir à l'inférence statistique. Quelle stratégie adopter? Tout d'abord, examinez bien votre plan expérimental. Pour chaque facteur impliqué, examinez s'il est répété-intra-sujets ("within-subjects") ou s'il est intersujets ("between subjects"). Une fois ceci établi, vous passerez des analyses les plus globales aux analyses les plus spécifiques. Par exemple, imaginez que votre plan expérimental comprenne un facteur intersujets à deux modalités (A) et un facteurs intra-sujets à trois modalités (B). Vous effectuerez d'abord une analyse de variance mixte.

Imaginons que cette analyse ne révèle pas d'interaction mais uniquement deux effets principaux de A et de B. Vous examinerez ces effets principaux. Comme A a deux modalités vous pourrez identifier directement la nature de ces effets (un niveau est plus élevé que l'autre). Pour B, par contre, vous devrez effectuer des comparaisons post hoc ou des contrastes afin de déterminer entre quelles conditions une différence a été observée (car un effet principal ne spécifie pas l'origine de la différence observée). Imaginons en revanche que l'on observe une interaction. Dans ce cas, il faut décomposer l'interaction entre les deux facteurs, par exemple en examinant pour chaque modalité de B, si l'effet de A est significatif (ce qui exigera d'effectuer un test t pour échantillons indépendants). Inversement, on pourra examiner si, pour chaque valeur de A, l'effet de B est significatif (ce qui impliquera d'effectuer une analyse de variance à un facteur après avoir "splitté" le fichier selon les niveau de A). Si ces analyses de variance se révèlent concluantes, il faudra ensuite à nouveau effectuer des tests a posteriori afin d'examiner d'où proviennent les différences observées.

6. Écriture des résultats:
Celle-ci sera guidée par les hypothèses. Nous verrons les consignes après

Quelle méthode choisir
Quelle méthode choisir? Tout dépend de votre Variable dépendante, la variable dont vous souhaitez observer les variations en fonction d'un autre facteur. 1. Est-elle nominale? 2 Variables: Chi carré Plus de 2 Variables: Analyse log-linéaire. Type de question: "Est-ce que la proportion de sujets qui font/pensent/disent x varie en fonction des variables indépendantes"? 2. Peut-elle être considérée comme continue? Par exemple, les réponses à une échelle de Likert sont souvent considéréees comme continues de même que les temps de réaction. Design à 1 Facteur: Inter-sujets: Oneway ANOVA (si plus de deux niveaux), suivi de comparaisons mutliples ou contrastes. Test t pour échantillons indépendants (Si deux niveaux). Intra-sujets: Analyse de variance à mesures répétées (si plus de deux niveaux), suivi de comparaisons multiples (Bonferroni) ou de contrastes. Test t pour échantillons appariés (Si 1 niveau).

Plus d'1 facteur: Tous Inter-Sujets: Analyse de variance factorielle suivie de comparaisons multiples, contrastes ou/et analyses des effets simples. Certains inter, d'autres intra: Analyse de variance mixte suivie de comparaisons multiples, contrastes ou/et analyses des effets simples. Tous intra: Analyse de variance à mesures répétées (si plus de deux niveaux), suivi de comparaisons mutliples (Bonferroni) ou/et analyses des effets simples. Types de questions auxquels ces analyses répondent: "Est-ce que la moyenne observée sur la variable X varie en fonction des facteurs A, B et de leur interaction?" (ANOVA)? "Si oui, Entre quelles conditions y a-t-il des différences?" (Comparaisons multiples, contrastes) Quand effectue-t-on des contrastes? Si on dispose hypothèses précises concernant des comparaisons entre conditions Quand effectue-t-on des comparaisons multiples? Quand analyse-t-on les effets simples? Lorsqu'on souhaite examiner l'effet d'un facteur à un niveau précis d'un autre facteur. Si on ne dispose pas d'une hypothèse précise concernant les comparaisons entre les conditions. Si on souhaite comparer tous les groupes entre eux.

Nominal Intervalle ou Continu
Niveau de mesure de la variable dépendante Nombre et Type de Facteur(s) Nominal Intervalle ou Continu 1 Facteur Tests Globaux Comparaisons Spécifiques Inter-Sujets Chi Carré Test T pour échantillons indépendants (si facteur à deux niveaux) Analyse de Variance à un Facteur Contrastes (si plus de deux niveaux) Tests de comparaisons multiples Intra-Sujets - Test T pour échantillons appariés (si facteur à deux niveaux) Analyse de Variance à mesures répétées (un facteur) Contrastes: Tests T pour échantillons appariés Comparaisons multiples: Tests T appariés avec correction de Bonferroni 2 Facteurs ou + Inter Sujets Chi Carrés ou Analyse loglinéaire Analyse de Variance Factorielle Contrastes Comparaisons Multiples Effets Simples Analyse de Variance à mesures répétées (plusieurs facteurs) Contraste: Tests T pour échantillons appariés

Effet Simples du facteur répété ou du facteur intersujets
Mixte - Analyse de Variance mixte (plusieurs facteurs dont au moins un inter-sujets et au moins un intra-sujets). Effet Simples du facteur répété ou du facteur intersujets Contrastes Comparaisons multiples: Tests T appariés avec correction de Bonferroni

CM Formation Recherche Master 1 Epistémologie et dispositifs quantitatifs : L’attitude expérimentale Frederic.martinez@univ-lyon2.fr.

Présentations similaires

Présentation au sujet: "CM Formation Recherche Master 1 Epistémologie et dispositifs quantitatifs : L’attitude expérimentale Frederic.martinez@univ-lyon2.fr."— Transcription de la présentation:

Présentations similaires

Notre projet

Feed-back

Entrer

S'autoriser via un réseau social:

CM Formation Recherche Master 1 Epistémologie et dispositifs quantitatifs : L’attitude expérimentale Frederic.martinez@univ-lyon2.fr.

Présentations similaires

Présentation au sujet: "CM Formation Recherche Master 1 Epistémologie et dispositifs quantitatifs : L’attitude expérimentale Frederic.martinez@univ-lyon2.fr."— Transcription de la présentation:

Présentations similaires

Notre projet

Feed-back