Partie 5 Les échelles de mesure
Partie 5 - Les échelles de mesure Chapitre 1 : Introduction Chapitre 2 : Echelles de Thurstone Chapitre 3 : Echelles de Likert Chapitre 4 : Echelles de Guttman Chapitre 5 : Modèle de Rasch Chapitre 6 : Conclusion Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Attitude disposition personnelle commune à un ensemble d’individus, possédée à différents degrés, qui les conduit à réagir à des objets, à des situations ou à des propositions d’une façon que l’on peut qualifier de favorable ou de défavorable. tendance à réagir favorablement ou défavorablement à travers une classe désignée de stimuli. L’attitude ne peut pas être directement observée, mais doit être inférée d’après des comportements verbaux ou non verbaux manifestes. Master Université de Bourgogne, 17-20 janvier 2005
Compétence / performance si on observe bel et bien certaines performances, c'est en général aux aptitudes ou aux compétences des sujets que l'on s'intéresse, l’estimation des compétences étant susceptible de permettre la prédiction de nouvelles performances. // attitude Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Objectif des échelles établir un critère pour évaluer la plus ou moins grande adéquation de données empiriques par rapport à un modèle théorique. décrire la structure de données, de façon à mettre en évidence une dimension sous-tendant celles-ci. Dans ce cas, aucune hypothèse n'est nécessairement testée. La perspective est alors principalement exploratoire. situer chaque sujet sur une échelle et l'évaluer par rapport à tous les autres ou d'introduire la valeur individuelle obtenue dans un modèle explicatif ou prédictif. Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Qualités des échelles Unidimensionnalité Linéarité et intervalles égaux Fidélité Validité Reproductibilité Réfléchir au modèle théorique / dimensions sous-jacentes Master Université de Bourgogne, 17-20 janvier 2005
Quatre grandes méthodes La première méthode est basée sur le classement des stimuli à mettre en échelle. La seconde consiste à émettre un jugement sur chacun des items pris séparément. La troisième méthode se base sur la comparaison des stimuli entre eux (en terme de « A est plus... » ou « est moins... que B »). La dernière méthode met en œuvre des comparaisons en terme de similarité (par exemple, « A est plus semblable à B qu'à C »). Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Thurstone L'échelle postulée par Thurstone est une échelle « psychologique » non précisée, contrairement à l'échelle de Fechner qui postule une réelle échelle de sensation. En particulier, l'approche de Thurstone ne nécessite nullement d'utiliser des stimuli possédant une métrique physique. Thurstone (1959) s'intéressait en particulier à l'obtention d'échelles d' « excellence de l'écriture », de la « gravité des crimes », de la « préférence pour les nationalités ». En psychologie sociale, un grand nombre d'échelles d'attitude sont construites sur cette base. (Bonnet, 1986, p. 136) Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Thurstone Ce type d’échelles repose sur deux étapes distinctes : la mise au point de l’échelle ; son utilisation pratique. Master Université de Bourgogne, 17-20 janvier 2005
Mise au point de l’échelle Comparaisons pairées Classement par des juges Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 ? ? Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 La situation: Pour des raisons de simplification, nous allons considérer, pendant la première étape que nous demanderons à un échantillon de 100 personnes, de classer une série de propositions relatives au divorce dans l'une des 7 catégories allant de « propositions acceptées par les personnes les plus défavorables au divorce » à « propositions acceptées par les personnes résolument en faveur du divorce » de manière à dégager un continuum de propositions. Master Université de Bourgogne, 17-20 janvier 2005
Quelques items (exemples) Les conditions actuelles du divorce ne sont pas aussi déshonorantes qu'il apparaît. Le divorce est scandaleux. Une personne devrait avoir le droit de se marier ou de divorcer aussi souvent qu'elle le voudrait. Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Fréquences cumulées Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Notes Z Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Ecarts entre classes Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Critiques Problème d’unidimensionnalité (existence d’un véritable continuum) Complexité de la création d’échelles Utilisation de juges Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 En résumé Deux phases: Mise au point de l’échelle Utilisation de l’échelle Master Université de Bourgogne, 17-20 janvier 2005
Création de l’échelle de Likert 1 seule étape: création et utilisation Définition a priori des valeurs des échelons Validation lors d’un prétest (analyse de l’unidimensionnalité – analyse factorielle) Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Tout à fait d'accord D'accord Sans avis En désaccord en (1) Les enfants rapprochent le mari et la femme l'un de l'autre. 5 4 2 1 (2) Il est amusant de montrer aux enfants comment faire quelque chose. 3 (3) Il est nécessaire de veiller à faire sortir l es enfants de certains de leurs travers naturels (4) Une mère avec son jeune enfant échappe difficilement à la conversation et à la compagnie des adultes. (5) En y réfléchissant, un enfant est plus une bénédiction qu'un fardeau. (6) Il est souvent difficile de garder son calme avec un enfant. (7) M'occuper des enfants me demande réellement beaucoup trop d'efforts. (8) Si nous en avions les moyens, nous préférerions envoyer nos enfants en pension. (9) Quand les choses sont difficiles, les enfants sont souvent une grande source de courage et d'inspiration. (10) Si je devais recommencer ma vie, je souhaiterais encore avoir des enfants. Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Critiques Unidimensionnalité et existence de la dimension Échelons a priori Mais économie et facilité Applications nombreuses Master Université de Bourgogne, 17-20 janvier 2005
Principe général des échelles de Guttman Chaque item peut recevoir une réponse positive ou négative. Les individus peuvent être situés sur l'échelle à partir de leur patron de réponses. A un score donné correspond un seul patron de réponses. Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Echelle de Guttman Mais, il n ’existe aucun sujet - qui aurait réussi l ’item n°3, mais pas le n°1 et le n°2, - qui aurait réussi l ’item n°2, mais pas le n°1. J ’ai réussi l ’item n°1 et l ’item n°2. J ’ai échoué à l ’item n°3. J ’ai reçu 2 points. J ’ai échoué à l ’ensemble du test. J ’ai obtenu 0 point. J ’ai réussi seulement l ’item n°1. J ’ai reçu 1 point. J ’ai réussi les 3 items. J ’ai reçu 3 points. Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Echelle de Guttman J ’ai deux points. Sujet 5 J ’ai trois points. Sujet 6 Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Echelle de Guttman item 4 0000 1000 1100 1111 Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Ordonner les scores de sujets Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Ordonner les proportions de réussite aux items Master Université de Bourgogne, 17-20 janvier 2005
Evaluer la qualité des échelles de Guttman Coefficient de reproductibilité (Goodenough) (cf. exemple p. 5) Coefficient de reproductibilite de Green Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005
Evaluer la qualité des échelles de Guttman Coefficient théorique de reproductibilité Indice de consistance (I) Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Critiques Pas de métrique (les intervalles n’ont pas de taille !) Indices ne permettant pas l’inférence Surtout descriptif et attaché à un échantillon observé Travail fastidieux Master Université de Bourgogne, 17-20 janvier 2005
Modèles de « la réponse à un item » (MRI) La "Théorie de Réponse à un Item" émerge dans les années 1950 et 1960 comme une réaction à la théorie classique des tests. Contrairement à cette dernière, la théorie de réponse à un item n'est pas attachée aux scores obtenus à des tests par des échantillons aléatoires, mais aux réponses individuelles à des items particuliers. Ces réponses sont modélisées comme le résultat d'un processus stochastique dans lequel la probabilité de donner une réponse d'un certain type dépend de plusieurs paramètres. Ces paramètres peuvent soit être liés aux personnes (compétence), soit aux items (difficulté). (VAN DER LINDEN, 1986, p. 329). C'est généralement le terme anglais d'Item Response Theory ou IRT qui est employé, même dans certains textes français. Master Université de Bourgogne, 17-20 janvier 2005
Modèles de « la réponse à un item » (MRI) 1.00 Probabilité de réussite des items Courbe caractéristique de l ’item x Difficulté de l ’item 0.0 Compétence du sujet Modèle général de Birnbaum Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Le « modèle de Rasch » La théorie développée par RASCH (1966) à propos des items dichotomiques est en fait un cas particulier de celle de BIRNBAUM (1968), au même titre que les modèles de LAZARSFELD (1950) et LAZARSFELD & HENRY (1968) (LEVY, 1973). Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Autres modèles Modèle de BIRNBAUM Modèle de RASCH Modèle de GUTTMAN Modèle de LAZARSFELD Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Le « modèle de Rasch » RASCH postule qu'il a affaire à des items de même pouvoir discriminatif, mais ayant un niveau de difficulté distinct (LORD & NOVICK, 1968, p. 402). L'allure théorique de la distribution de probabilité des réponses positives de chaque item est déterminée par une fonction logistique (en forme de S ou d'ogive). Le seul paramètre à estimer dans ce modèle est la valeur de l'abscisse du point d'inflexion de chaque courbe. Dit plus simplement, le modèle suppose que la distribution de probabilité des réponses positives à chaque question peut s'ajuster à une courbe théorique identique. Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Le « modèle de Rasch » Probabilité de réussite des items Courbe caractéristique de l ’item x Difficulté de l ’item Compétence du sujet Modèle de Rasch (à 1 paramètre) Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Le « modèle de Rasch » Ce modèle permet de mettre en relation l'aptitude d'un sujet donné et la difficulté d'un item par le biais de la différence C'est cette différence qui gouverne en fait la probabilité associée à l'observation d'une réponse positive Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Le « modèle de Rasch » Par définition, cette probabilité vaut 0,5 lorsque la différence entre la compétence d'un sujet donné et la difficulté de l'item considéré est nulle. Cette différence peut cependant varier entre - et + . Les probabilités associées tendent alors respectivement vers 0 et vers 1. Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Le « modèle de Rasch » La probabilité qu'un sujet n obtienne une réponse positive à l'item i, connaissant d'une part la difficulté de l'item et d'autre part la compétence du sujet s'exprime donc de la manière suivante: Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Le « modèle de Rasch » Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Le « modèle de Rasch » Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Le modèle à 3 paramètres 1 2 g1 g2 Master Université de Bourgogne, 17-20 janvier 2005
1e application pratique 1e application pratique D’après Fagnant, 1996 C4 Additions Soustractions % de réussite C1 35+7=42 93 97 98 C6 56-7=49 88 94 99 C8 8+24=32 73 86 91 96 C5 32-24=8 49 74 83 C3 48+8=56 78 42-35=7 40 56 82 C9 64-8=56 54 70 81 85 No. Calcul 3e 4e 5e 6e No. Calcul 3e 4e 5e 6e Master Université de Bourgogne, 17-20 janvier 2005
1e application pratique 1e application pratique D’après Fagnant, 1996 Multiplications Divisions % de réussite % de réussite No. Calcul 3e 4e 5e 6e No. Calcul 3e 4e 5e 6e C 10 24x7,5=180 34 58 C 11 52,8:6=8,8 32 55 C 12 48x0,5=24 41 74 C 14 39:6,5=6 20 48 C 13 0,8x32=25,6 32 63 C 16 24:0,6=40 14 37 C 15 30,5x5=152,5 42 70 C2 54:9=6 53 82 90 92 C7 27x9=243 20 50 74 84 Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Résultats obtenus Représentation globale de l’échelle (élèves et items) Master Université de Bourgogne, 17-20 janvier 2005
2e application pratique 2e application pratique La notion d’ « ancrage » Une banque de questions contient typiquement des items provenant de plusieurs tests qui ont été calibrés lors d'administrations à des groupes différents. Les paramètres de ces items doivent alors être rapportés à une échelle commune. Cette technique de mise en rapport implique une procédure d'ancrage et de transformation. (VALE, 1986, p. 333) Un ancrage implique qu'une personne [en pratique, un ensemble de personnes] réponde aux items de plusieurs tests ou qu'un item [dans la pratique, un ensemble d'items] soit administré aux membres de plusieurs groupes. (VALE, 1986, p. 335). Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Critiques Nécessité d’un logiciel de calcul Relativement aisé à interpréter (1 paramètre) Indépendance à l’échantillon et au test Un seul continuum (sujets / items) Complexité de l’ajustement du modèle Encore peu utilisé dans le monde francophone Master Université de Bourgogne, 17-20 janvier 2005
Master Université de Bourgogne, 17-20 janvier 2005 Echelle ou modèle THURSTONE GUTTMAN RASCH LIKERT Postulat(s) Distribution normale, autour d’une valeur estimé par l’échelle, de la probabilité d’obtenir une réponse donnée à une question particulière. Existence pour chaque question d’un seuil de coupure (situé sur le continuum) au-delà duquel la nature de la réponse à une question particulière change brusquement (modèle déterministe). Les probabilités de réponses positives à des items de même pouvoir discriminatif mais de complexité distinctes se distribuent selon une fonction logistique à un seul paramètre. La probabilité d’obtenir un réponse d’un type particulier se distribue selon une ogive dont le point d’inflexion est fonction de la question (existence d’un gradient de réponse). Spécificité(s) Intervalles égaux Univocité (1 score = 1 pattern de réponses unique si échelle parfaite) Une même métrique pour les items (difficulté) et les sujets (compétence) Indépendance de chaque item par rapport aux autres items et aux sujets Possibilité d’ancrages (constitution de banques d’items) Coût relativement faible de mise au point Inconvénient(s) Travail de mise au point très fastidieux et coûteux Importance des juges choisis lors de la mise au point (première phase) Impossibilité de calculer facilement les indices et de pratiquer l'inférence (absence de distributions théoriques) Peu commode et fastidieux Difficulté d’obtenir une hiérarchisation des sujets et une bonne validité si le questionnaire n’est pas assez long Perspective surtout descriptive Nécessite un nombre relativement important de sujets par rapport au nombre d’items Non univocité des scores Valeurs « a priori » des intervalles et poids identique accordé à chaque item Master Université de Bourgogne, 17-20 janvier 2005