L’analyse d’items une technique docimologique pour valider des questions d’examen
Analyse d’items Ensemble de procédés statistiques dont le but est d ’évaluer la qualité d’un instrument de mesure et des items qui le composent. Ensemble d’opérations qui comporte trois volets : a) une vérification de la congruence entre les items et les objectifs, de la plausibilité des choix Multiples (QCM) et de certains aspects de la validité et de la fidélité b) un calcul d’indices (moyenne, écart-type, indice de difficulté et de discrimination, etc. ) c) une décision en vue de réviser, remplacer ou conserver les items Source : LEGENDRE, R., Dictionnaire actuel de l ’éducation, Larousse, Paris, 1988
Les indices de l’analyse d’items Analyser les résultats de chaque question : Indice de difficulté Indice de discrimination Répartition des choix Multiples ( QCM ) Analyser les résultats de l’ensemble du test : Indice de fidélité (homogénéité interne - alpha Cronbach ) Caractéristiques de la distribution des notes
Un exemple d’analyse d’items serge.normand@umontreal.ca
Quelques avantages de l’analyse d’items Tirer profit des résultats d’un examen Obtenir des indications sur la précision des résultats observés « Valider » un examen en retirant, au besoin, les questions qui présentent des lacunes Améliorer la formulation des questions Calibrer les examens futurs Créer une « banque d’items »
Mode d’emploi d’AnItem Enregistrer les réponses aux questions dans un classeur Excel en respectant le format suivant : La première rangée contient des libellés décrivant le contenu des colonnes et identifiant ainsi les questions La deuxième rangée contient la clé de correction pour les questions QCM; laisser vide pour les questions QROC La troisième rangée contient, pour chaque question, la valeur accordée à la bonne réponse (QCM) ou le nombre maximum de points (QROC) Les rangées 4 et suivantes contiennent les réponses des étudiants : un sujet par rangée, une réponse par colonne Les colonnes contenant les réponses doivent être contigües
Capacité théorique et contraintes Mode d’emploi d’AnItem Format du classeur Excel pour la saisie des données Rangée 1 Libellés Identification QCM QROC Rangée 2 Clé de correction Rangée 3 Pondération Colonnes contigües pour les réponses aux questions Capacité théorique et contraintes 255 questions 65 532 sujets 5 choix Multiples QCM codées en lettres ( A à E ) ou en chiffres ( 1 à 5 ) une seule bonne réponse possible pour les QCM
Mode d’emploi d’AnItem Ouvrir le classeur AnItem.xls et fournir les informations suivantes : Les zones « Titre et Sous Titre » contiennent les libellés qui seront répétés sur les pages de résultats La zone « Total sur » indique sur combien de points sera exprimée la note totale La zone « Décimale » précise le nombre de décimales souhaitées pour l ’affichage de la note totale Dérouler le menu « Item » pour lancer la procédure désirée : Analyse d ’items ou Analyse de distribution Choisir le classeur Excel contenant les réponses Sélectionner la plage de cellules contenant les réponses
Mode d’emploi d’AnItem Déroulez le menu AnItem Saisissez les informations
Mode d’emploi d’AnItem Sélectionnez Analyse d’items
Mode d’emploi d’AnItem Localisez le fichier de réponses
Mode d’emploi d’AnItem Sélectionnez les colonnes contigües de questions
Mode d’emploi d’AnItem Résultats de l’analyse d’items
Indice de difficulté Pourcentage de réussite à la question : nombre de candidats ayant répondu correctement divisé par le nombre total de répondants Moyenne de la question Exprimé avec deux décimales ( ex. 0,64 ) Souvent représenté par le symbole ( p ) En fait c’est un indice de « facilité » Un indice élevé : la question est facile Un indice faible : la question est difficile
Interprétation de l’indice de difficulté Indices inférieurs à 0,50 Pourquoi plus de la moitié des candidats échouent à cette question ? Indices inférieurs à 0,30 Combien y a-t-il de questions avec des indices aussi faibles dans le test ? Est-ce « normal » que tant de candidats n’aient pas atteint l’objectif mesuré par cette question ?
Interprétation de l’indice de difficulté Indices supérieurs à 0,90 Est-ce que cette question correspond à un objectif important ? Faut-il conserver les questions réussies par tous les candidats ?
Interprétation de l’indice de difficulté La somme des indices de difficulté correspond à la moyenne du test Le rendement scolaire se distribue « normalement » Un test composé de questions de difficulté moyenne reproduira plus fidèlement la distribution « normale » des notes
Répartition des choix Multiples ( question QCM ) Distribution du nombre de candidats parmi les choix Multiples Exprimée en fréquences brutes et en pourcentages Les choix autres que la réponse correcte sont appelés des « leurres » Un leurre est-il choisi plus souvent que la bonne réponse ? Des leurres sont-ils complètement ignorés ?
Indice de discrimination Coefficient de corrélation entre les réponses à la question et le total des autres questions Est-ce que les candidats qui réussissent cette question ont aussi un score élevé à l’ensemble des autres questions ? Est-ce que les candidats qui échouent cette question ont aussi un score plus faible à l’ensemble des autres questions ? Exprimé avec deux décimales ( ex. 0,23 ) Souvent représenté par le symbole ( r )
Interprétation de l’indice de discrimination En théorie ce coefficient de corrélation varie de -1,00 à + 1,00 Une balise peut être fixée à 0,20 pour signaler un début de discrimination Une valeur voisine de zéro ( 0 ) indique qu’il n’y a aucune relation entre le score à cette question et le total des autres questions Un indice négatif signale une incohérence : les meilleurs candidats échouent la question, les plus faibles réussissent la question
Interprétation de l’indice de discrimination Les items de difficulté moyenne (0,40 à 0,60 ) maximisent généralement la discrimination Les items très faciles ou très difficiles discriminent habituellement peu L’indice de discrimination est tributaire du test auquel appartient la question et donc moins stable que l’indice de difficulté Le nombre de questions et le nombre de sujets influencent le calcul du coefficient de corrélation
Fidélité Coefficient d ’homogénéité interne Alpha de Cronbach k k - 1 1 - S s 2 j s 2 t où : k : nombre d’items s 2 j : variance des scores à l’item j s 2 t : variance des scores à l ’ensemble du test