Partie 5 Les échelles de mesure.

Slides:



Advertisements
Présentations similaires
Introduction à l’analyse
Advertisements

L’échantillonnage & Ses Fluctuations
Indicateurs de Suivi, Risques & Mesure d’Associations
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Connecteurs entre socle et briques applicatives Journées rencontres du CSIESR 31 janvier et 1 er février 2005 Yohan Colmant Université de Valenciennes.
Apprentissages numériques de l’école au collège
But de la lecture critique
Une approche informationnelle de la restauration d’images
RECONNAISSANCE DE FORMES
Test statistique : principe
Jean-Pierre GIRAUDIN & Agnès FRONT
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
5 critères de qualité d'un test
Collecte de données F. Kohler.
Inférence statistique
C1 Bio-statistiques F. KOHLER
Comparaison de deux moyennes observées
Inférence statistique
Comparaison d'une distribution observée à une distribution théorique
Les TESTS STATISTIQUES
Tests de comparaison de pourcentages
Nombre de sujets nécessaires en recherche clinique
1. Les caractéristiques de dispersion. 11. Utilité.
Mesures et évaluations de compétences
Les TESTS STATISTIQUES
Échantillonnage-Estimation
Dr DEVILLE Emmanuelle J D V 12/07/2006
11/02/20051 Internet Intranet Le portail UNSS. 11/02/20052 Qui peut accéder à Intranet ? Les services UNSS Les coordonnateurs de district Les AS.
L’action de promotion-animation
Laboratoire Inter-universitaire de Psychologie Cours 6
Modélisation des systèmes non linéaires par des SIFs
variable aléatoire Discrète
Master Université de Bourgogne
IAS 16 « Immobilisations corporelles »
Objectifs du chapitre 8: Mesures verbales en psychologie
FERRAFIAT Nicolas Le logiciel d’estimation statistique en fiabilité
Cours Corporate finance Eléments de théorie du portefeuille Le Medaf
Nombre de sujets nécessaires en recherche clinique
Régression linéaire simple
Partie 3 La psychophysique.
L’observation directe du comportement
Tableaux de distributions
Chapitre 5 : Etude de la Stabilité des systèmes dynamiques
La corrélation et la régression
Le test t.
La statistique descriptive
La corrélation et la régression
Les modèles linéaires (Generalized Linear Models, GLM)
Corrélation Principe fondamental d’une analyse de corrélation
La théorie classique des tests
Psychométrie et édumétrie
Les changements de numéraire dans la tarification d’options
Le comportement des coûts Chapitre 3
Structure discriminante (analyse discriminante)
Objectifs Chapitre 8: Mesure en psychologie
La régression multiple
Présentation de la méthode des Eléments Finis
ANALYSE METHODE & OUTILS
1 - Programme de Seconde (juin 2009) Statistique et probabilités
Rappels de statistiques descriptives
Théorème de la limite centrale l’inférence statistique
ANALYSE DE DONNEES TESTS D’ASSOCIATION
Présentation du marché obligataire
STATISTIQUES DESCRIPTIVES
Intervalles de confiance pour des proportions L’inférence statistique
Études de Marché MBA Mars 2005 La recherche par sondage.
Études de Marché MBA Hivers 2006 La recherche par sondage.
ECHANTILLONAGE ET ESTIMATION
Introduction aux statistiques Intervalles de confiance
 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs.
Transcription de la présentation:

Partie 5 Les échelles de mesure

Partie 5 - Les échelles de mesure Chapitre 1 : Introduction Chapitre 2 : Echelles de Thurstone Chapitre 3 : Echelles de Likert Chapitre 4 : Echelles de Guttman Chapitre 5 : Modèle de Rasch Chapitre 6 : Conclusion Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Attitude disposition personnelle commune à un ensemble d’individus, possédée à différents degrés, qui les conduit à réagir à des objets, à des situations ou à des propositions d’une façon que l’on peut qualifier de favorable ou de défavorable. tendance à réagir favorablement ou défavorablement à travers une classe désignée de stimuli. L’attitude ne peut pas être directement observée, mais doit être inférée d’après des comportements verbaux ou non verbaux manifestes. Master Université de Bourgogne, 17-20 janvier 2005

Compétence / performance si on observe bel et bien certaines performances, c'est en général aux aptitudes ou aux compétences des sujets que l'on s'intéresse, l’estimation des compétences étant susceptible de permettre la prédiction de nouvelles performances. // attitude Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Objectif des échelles établir un critère pour évaluer la plus ou moins grande adéquation de données empiriques par rapport à un modèle théorique. décrire la structure de données, de façon à mettre en évidence une dimension sous-tendant celles-ci. Dans ce cas, aucune hypothèse n'est nécessairement testée. La perspective est alors principalement exploratoire. situer chaque sujet sur une échelle et l'évaluer par rapport à tous les autres ou d'introduire la valeur individuelle obtenue dans un modèle explicatif ou prédictif. Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Qualités des échelles Unidimensionnalité Linéarité et intervalles égaux Fidélité Validité Reproductibilité Réfléchir au modèle théorique / dimensions sous-jacentes Master Université de Bourgogne, 17-20 janvier 2005

Quatre grandes méthodes La première méthode est basée sur le classement des stimuli à mettre en échelle. La seconde consiste à émettre un jugement sur chacun des items pris séparément. La troisième méthode se base sur la comparaison des stimuli entre eux (en terme de « A est plus... » ou « est moins... que B »). La dernière méthode met en œuvre des comparaisons en terme de similarité (par exemple, « A est plus semblable à B qu'à C »). Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Thurstone L'échelle postulée par Thurstone est une échelle « psychologique » non précisée, contrairement à l'échelle de Fechner qui postule une réelle échelle de sensation. En particulier, l'approche de Thurstone ne nécessite nullement d'utiliser des stimuli possédant une métrique physique. Thurstone (1959) s'intéressait en particulier à l'obtention d'échelles d' « excellence de l'écriture », de la « gravité des crimes », de la « préférence pour les nationalités ». En psychologie sociale, un grand nombre d'échelles d'attitude sont construites sur cette base. (Bonnet, 1986, p. 136) Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Thurstone Ce type d’échelles repose sur deux étapes distinctes : la mise au point de l’échelle ; son utilisation pratique. Master Université de Bourgogne, 17-20 janvier 2005

Mise au point de l’échelle Comparaisons pairées Classement par des juges Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 ? ? Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005  

Master Université de Bourgogne, 17-20 janvier 2005  

Master Université de Bourgogne, 17-20 janvier 2005 La situation: Pour des raisons de simplification, nous allons considérer, pendant la première étape que nous demanderons à un échantillon de 100 personnes, de classer une série de propositions relatives au divorce dans l'une des 7 catégories allant de « propositions acceptées par les personnes les plus défavorables au divorce » à « propositions acceptées par les personnes résolument en faveur du divorce » de manière à dégager un continuum de propositions. Master Université de Bourgogne, 17-20 janvier 2005

Quelques items (exemples) Les conditions actuelles du divorce ne sont pas aussi déshonorantes qu'il apparaît. Le divorce est scandaleux. Une personne devrait avoir le droit de se marier ou de divorcer aussi souvent qu'elle le voudrait. Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Fréquences cumulées Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Notes Z Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Ecarts entre classes Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Critiques Problème d’unidimensionnalité (existence d’un véritable continuum) Complexité de la création d’échelles Utilisation de juges Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 En résumé Deux phases: Mise au point de l’échelle Utilisation de l’échelle Master Université de Bourgogne, 17-20 janvier 2005

Création de l’échelle de Likert 1 seule étape: création et utilisation Définition a priori des valeurs des échelons Validation lors d’un prétest (analyse de l’unidimensionnalité – analyse factorielle) Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Tout à fait d'accord D'accord Sans avis En désaccord en (1) Les enfants rapprochent le mari et la femme l'un de l'autre. 5 4  2 1 (2) Il est amusant de montrer aux enfants comment faire quelque chose. 3 (3) Il est nécessaire de veiller à faire sortir l es enfants de certains de leurs travers naturels (4) Une mère avec son jeune enfant échappe difficilement à la conversation et à la compagnie des adultes. (5) En y réfléchissant, un enfant est plus une bénédiction qu'un fardeau. (6) Il est souvent difficile de garder son calme avec un enfant. (7) M'occuper des enfants me demande réellement beaucoup trop d'efforts. (8) Si nous en avions les moyens, nous préférerions envoyer nos enfants en pension. (9) Quand les choses sont difficiles, les enfants sont souvent une grande source de courage et d'inspiration. (10) Si je devais recommencer ma vie, je souhaiterais encore avoir des enfants. Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Critiques Unidimensionnalité et existence de la dimension Échelons a priori Mais économie et facilité Applications nombreuses Master Université de Bourgogne, 17-20 janvier 2005

Principe général des échelles de Guttman Chaque item peut recevoir une réponse positive ou négative. Les individus peuvent être situés sur l'échelle à partir de leur patron de réponses. A un score donné correspond un seul patron de réponses. Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Echelle de Guttman Mais, il n ’existe aucun sujet - qui aurait réussi l ’item n°3, mais pas le n°1 et le n°2, - qui aurait réussi l ’item n°2, mais pas le n°1. J ’ai réussi l ’item n°1 et l ’item n°2. J ’ai échoué à l ’item n°3. J ’ai reçu 2 points. J ’ai échoué à l ’ensemble du test. J ’ai obtenu 0 point. J ’ai réussi seulement l ’item n°1. J ’ai reçu 1 point. J ’ai réussi les 3 items. J ’ai reçu 3 points. Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Echelle de Guttman J ’ai deux points. Sujet 5 J ’ai trois points. Sujet 6 Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Echelle de Guttman item 4 0000 1000 1100 1111 Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Ordonner les scores de sujets Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Ordonner les proportions de réussite aux items Master Université de Bourgogne, 17-20 janvier 2005

Evaluer la qualité des échelles de Guttman Coefficient de reproductibilité (Goodenough) (cf. exemple p. 5) Coefficient de reproductibilite de Green Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005

Evaluer la qualité des échelles de Guttman Coefficient théorique de reproductibilité Indice de consistance (I) Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Critiques Pas de métrique (les intervalles n’ont pas de taille !) Indices ne permettant pas l’inférence Surtout descriptif et attaché à un échantillon observé Travail fastidieux Master Université de Bourgogne, 17-20 janvier 2005

Modèles de « la réponse à un item » (MRI) La "Théorie de Réponse à un Item" émerge dans les années 1950 et 1960 comme une réaction à la théorie classique des tests. Contrairement à cette dernière, la théorie de réponse à un item n'est pas attachée aux scores obtenus à des tests par des échantillons aléatoires, mais aux réponses individuelles à des items particuliers. Ces réponses sont modélisées comme le résultat d'un processus stochastique dans lequel la probabilité de donner une réponse d'un certain type dépend de plusieurs paramètres. Ces paramètres peuvent soit être liés aux personnes (compétence), soit aux items (difficulté). (VAN DER LINDEN, 1986, p. 329). C'est généralement le terme anglais d'Item Response Theory ou IRT qui est employé, même dans certains textes français. Master Université de Bourgogne, 17-20 janvier 2005

Modèles de « la réponse à un item » (MRI) 1.00 Probabilité de réussite des items Courbe caractéristique de l ’item x Difficulté de l ’item 0.0 Compétence du sujet Modèle général de Birnbaum Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Le « modèle de Rasch » La théorie développée par RASCH (1966) à propos des items dichotomiques est en fait un cas particulier de celle de BIRNBAUM (1968), au même titre que les modèles de LAZARSFELD (1950) et LAZARSFELD & HENRY (1968) (LEVY, 1973). Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Autres modèles Modèle de BIRNBAUM Modèle de RASCH Modèle de GUTTMAN Modèle de LAZARSFELD Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Le « modèle de Rasch » RASCH postule qu'il a affaire à des items de même pouvoir discriminatif, mais ayant un niveau de difficulté distinct (LORD & NOVICK, 1968, p. 402). L'allure théorique de la distribution de probabilité des réponses positives de chaque item est déterminée par une fonction logistique (en forme de S ou d'ogive). Le seul paramètre à estimer dans ce modèle est la valeur de l'abscisse du point d'inflexion de chaque courbe. Dit plus simplement, le modèle suppose que la distribution de probabilité des réponses positives à chaque question peut s'ajuster à une courbe théorique identique. Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Le « modèle de Rasch » Probabilité de réussite des items Courbe caractéristique de l ’item x Difficulté de l ’item Compétence du sujet Modèle de Rasch (à 1 paramètre) Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Le « modèle de Rasch » Ce modèle permet de mettre en relation l'aptitude d'un sujet donné et la difficulté d'un item par le biais de la différence C'est cette différence qui gouverne en fait la probabilité associée à l'observation d'une réponse positive Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Le « modèle de Rasch » Par définition, cette probabilité vaut 0,5 lorsque la différence entre la compétence d'un sujet donné et la difficulté de l'item considéré est nulle. Cette différence peut cependant varier entre - et + . Les probabilités associées tendent alors respectivement vers 0 et vers 1. Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Le « modèle de Rasch » La probabilité qu'un sujet n obtienne une réponse positive à l'item i, connaissant d'une part la difficulté de l'item et d'autre part la compétence du sujet s'exprime donc de la manière suivante: Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Le « modèle de Rasch » Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Le « modèle de Rasch » Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Le modèle à 3 paramètres 1 2 g1 g2 Master Université de Bourgogne, 17-20 janvier 2005

1e application pratique   1e application pratique D’après Fagnant, 1996 C4 Additions Soustractions   % de réussite C1 35+7=42 93 97 98 C6 56-7=49 88 94 99 C8 8+24=32 73 86 91 96 C5 32-24=8 49 74 83 C3 48+8=56 78 42-35=7 40 56 82 C9 64-8=56 54 70 81 85 No. Calcul 3e 4e 5e 6e No. Calcul 3e 4e 5e 6e Master Université de Bourgogne, 17-20 janvier 2005  

1e application pratique   1e application pratique D’après Fagnant, 1996 Multiplications Divisions   % de réussite   % de réussite No. Calcul 3e 4e 5e 6e No. Calcul 3e 4e 5e 6e C 10 24x7,5=180     34 58 C 11 52,8:6=8,8     32 55 C 12 48x0,5=24     41 74 C 14 39:6,5=6     20 48 C 13 0,8x32=25,6     32 63 C 16 24:0,6=40       14 37 C 15 30,5x5=152,5         42 70 C2 54:9=6 53 82 90 92 C7 27x9=243 20 50 74 84             Master Université de Bourgogne, 17-20 janvier 2005  

Master Université de Bourgogne, 17-20 janvier 2005 Résultats obtenus Représentation globale de l’échelle (élèves et items) Master Université de Bourgogne, 17-20 janvier 2005

2e application pratique   2e application pratique La notion d’ « ancrage » Une banque de questions contient typiquement des items provenant de plusieurs tests qui ont été calibrés lors d'administrations à des groupes différents. Les paramètres de ces items doivent alors être rapportés à une échelle commune. Cette technique de mise en rapport implique une procédure d'ancrage et de transformation. (VALE, 1986, p. 333) Un ancrage implique qu'une personne [en pratique, un ensemble de personnes] réponde aux items de plusieurs tests ou qu'un item [dans la pratique, un ensemble d'items] soit administré aux membres de plusieurs groupes. (VALE, 1986, p. 335). Master Université de Bourgogne, 17-20 janvier 2005  

Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Critiques Nécessité d’un logiciel de calcul Relativement aisé à interpréter (1 paramètre) Indépendance à l’échantillon et au test Un seul continuum (sujets / items) Complexité de l’ajustement du modèle Encore peu utilisé dans le monde francophone Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Echelle ou modèle THURSTONE GUTTMAN RASCH LIKERT Postulat(s) Distribution normale, autour d’une valeur estimé par l’échelle, de la probabilité d’obtenir une réponse donnée à une question particulière. Existence pour chaque question d’un seuil de coupure (situé sur le continuum) au-delà duquel la nature de la réponse à une question particulière change brusquement (modèle déterministe). Les probabilités de réponses positives à des items de même pouvoir discriminatif mais de complexité distinctes se distribuent selon une fonction logistique à un seul paramètre. La probabilité d’obtenir un réponse d’un type particulier se distribue selon une ogive dont le point d’inflexion est fonction de la question (existence d’un gradient de réponse). Spécificité(s) Intervalles égaux Univocité (1 score = 1 pattern de réponses unique si échelle parfaite) Une même métrique pour les items (difficulté) et les sujets (compétence) Indépendance de chaque item par rapport aux autres items et aux sujets Possibilité d’ancrages (constitution de banques d’items) Coût relativement faible de mise au point Inconvénient(s) Travail de mise au point très fastidieux et coûteux Importance des juges choisis lors de la mise au point (première phase) Impossibilité de calculer facilement les indices et de pratiquer l'inférence (absence de distributions théoriques) Peu commode et fastidieux Difficulté d’obtenir une hiérarchisation des sujets et une bonne validité si le questionnaire n’est pas assez long Perspective surtout descriptive Nécessite un nombre relativement important de sujets par rapport au nombre d’items Non univocité des scores Valeurs « a priori » des intervalles et poids identique accordé à chaque item Master Université de Bourgogne, 17-20 janvier 2005