Docimologie critique.

Slides:

Advertisements

Présentations similaires

Psychométrie et édumétrie

Advertisements

Évaluation diagnostique

Atelier 1 Le problème du surpoids sur géogébra. Etude de la prévalence du surpoids: (document Ressources pour la classe de terminale) Situation: On souhaite.

EVALUER EN MATERNELLE Novembre 2010 Document produit par l'IEN chargé de mission maternelle 74 à partir d'une proposition de la circonscription de METZ-EST.

Évaluation et compétences. Développer une logique de la "validation de compétences", dans le cadre du socle, en opposition à la "moyenne" et à la compensation.

La psychopédagogie Auteurs G roupe des enseignants de ENEP de Bobo-Dioulasso Durée 60 heures Objectifs Définir la psychopédagogie Connaitre l’utilité de.

Le redoublement au cours de la scolarité obligatoire : nouvelles analyses, mêmes constats Olivier Cosnefroy - Thierry Rocher Bureau de l’évaluation des.

Prérentrée 2016 > Bilan et perspectives 1 Le DNB : ce qui est évalué Enseignements de complément et LSF Examen terminal Maîtrise du socle commun Trois.

I) mesure et erreurs de mesure 1) le vocabulaire à connaitre

Rentrée 2016 Résultats Diplôme National du Brevet.

Utilisation du logiciel EduStat © Analyse classique d’items L’examen du rapport.

Utilisation des signaux sonores et lumineux

EVALUATION DE LA CONNAISSANCE DES INTERNES D’ANESTHÉSIE-RÉANIMATION

Suites ordonnées ou mettre de l’ordre

L’évaluation en Langues Vivantes

Statistiques descriptives univariées

EPREUVES HISTOIRE ET GEOGRAPHIE

Aide à la correction de l’évaluation initiale

Interprétation des indicateurs?

LE CONTRÔLE EN COURS DE FORMATION

L’évaluation et le DNB Rentrée 2016.

Le DNB : Déroulement des épreuves

LIRE ECRIRE au CYCLE 2 Lundi 28 novembre 2016

Enseigner autrement les mathématiques au travers du socle commun et des nouveaux programmes Un collège réformé, adapté et contextualisé.

Année scolaire Résultats de mars 2013 (sixième secondaire)

Nouveaux programmes Éducation Musicale BO spécial août 2008

UNE PRATIQUE ENSEIGNANTE DES SCIENCES DE LA VIE ET DE LA TERRE POUR UN ENSEIGNEMENT, APPRENTISSAGE DE REUSSITE SCOLAIRE.

Evaluation des Unités par les étudiants:

L’ échelle d’évaluation critériée et didactisée

Résultat de d’une étude auprès des membres du Syndicat de Champlain

REFORME DU COLLEGE DNB 2017 Arrêté 31 décembre 2015

Dispersion des notes de près de 20 points Divergences de 1 à 10 points

Précision d'une mesure et chiffres significatifs

Dispersion des notes de près de 20 points Divergences de 1 à 10 points

DESSIN TECHNIQUE Té de dessin Collège technique Sousse Collège technique Sousse.

Coefficient de corrélation linéaire

Le carnet de suivi des apprentissages

Les plans de mélange Les plans d’expérience : Présentée par :

Construire une progression pédagogique en STI2D

Plans d’experiences : plans de melanges

Exemple de bilan de fin de cycle ( Version fin de cycle 4 )

Introduction aux Statistiques Variables aléatoires

HISTOIRE ET GEOGRAPHIE

4.2 Estimation d’une moyenne

EXPOSE DE TECHNIQUE DE COMMUNICATION GROUPE N°2 RAPPORT/MÉMOIRE/THÈSE 2016/2017 Réalisé par : M.Ahmed Mohamed Cheikhany Selame M. Manou Labo Abdoulaye.

Free Powerpoint Templates Page 1 Free Powerpoint Templates L’indicateur technique: Relative Strength Index (RSI)

Comment réussir son diaporama

La mesure de la mobilité sociale

ACP Analyse en Composantes Principales

Statistiques. Moyenne, Moyenne pondérée, Tableur et graphiques.

-Définition -Caractéristiques -Fonctions -Contenus GSD de français- Tiaret - Mars Djoud français

Examen des vœux Réception et acceptation des propositions

COURS D’HERMENEUTIQUE

INFORMATION des parents d’élèves : Baccalauréat 2021

STAGE DAKAR L'évaluation positive.

HISTOIRE ET GEOGRAPHIE

Étude sur la langue française auprès des étudiants du collégial

Position, dispersion, forme

Quel niveau de croissance pro-pauvres

LES AXES TRAITÉS : DÉFINITION D’ÉVALUATION L’ÉVALUATION PEDAGOGIQUE FONCTION DE L’ÉVALUATION CARACTERISTIQUES DE L’ÉVALUATION TYPES D’ÉVALUATION CONCLUSION.

Programme d’appui à la gestion publique et aux statistiques

INFORMATION DES PARENTS D’ÉLÈVES DE 3ÈME : BACCALAURÉAT 2021

Passage primaire-secondaire

L’évaluation positive

Tableau de bord d’un système de recommandation

Diapositives 1A : Valeurs, croyances et perspectives

Le pluriel au sein du groupe nominal

« Le maintien des élèves » Eléments de réflexion

STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES.

Transcription de la présentation:

Docimologie critique

Définitions Science de la mesure et de l’évaluation en éducation qui a comme objets d’études l’élaboration d’instruments de mesure, l’interprétation des informations obtenues par la mesure, le comportement des examinés, de même que l’élaboration et la réalisation de plans d’évacuation. Etym. Du grec dokime, épreuve et logos, science. Mot proposé par Henri PIERON en 1922 pour désigner l’étude systématique des examens. Nature. La docimologie est une discipline éducationnelle qui porte sur l’étude systématique des instruments et des méthodes de mesure et d’évaluation en éducation, ainsi que du comportement des évaluateurs et des évalués, en vue d’améliorer la validité et l’objectivité des pratiques évuluatives. (Dictionnaire actuel de l’Education, 2005)

Techniques (a) Une même série de copies est corrigée plusieurs fois par le même correcteur, à des moments différents, sans que celui-ci s’en rendre compte, ce qui permet de mesurer la stabilité intra-correcteurs;

Techniques (b) Une même série de copies est corrigée par plusieurs correcteurs différents, ce qui permet de mesurer la concordance inter-correcteurs;

Techniques (c) Une même copie est placée dans un ensemble de copies dans des positions différentes (précédée de copies meilleures ou plus faibles), ce qui permet de mesurer l’effet de contraste, ou de séquence;

Techniques (d) Une même copie est placée dans un ensemble de copies dont les valeurs sont plus ou moins dispersées largement (tantôt parmi des copies ayant toutes reçu la même note lors d'une évaluation préalable, tantôt parmi des copies très variées en qualité); etc.

Techniques (e) Une même copie est corrigée par plusieurs groupes de correcteurs auxquels on fournit des informations complémentaires différentes sur l'élèves, ses notes antérieures…

Trois sources d’erreur Le système scolaire Les élèves Les enseignants Les arrangements internes Les arrangements externes Les arrangements pour soi

Quelques exemples de biais mis en évidence par la docimologie critique La distribution forcée (Posthumus) L’effet de tendance centrale La surprenante stabilité des taux de réussite et d'échec d’année en année Les biais résultant de l'interaction entre le correcteur et l'étudiant ou la copie évalué Effet de stéréotype ou d’inertie Effet de halo Effets de contraste entre copies ou entre étudiants L'instabilité d'un même correcteur Les différences entre correcteurs

La distribution forcée (Posthumus) Définition: « Un enseignant tend à ajuster le niveau de son enseignement et ses appréciations des performances des élèves de façon à conserver, d’année en année, approximativement la même distribution (gaussienne) de notes.»

La distribution forcée (Posthumus) Laugier et Weinberg (1927) souscrivent à cette idée: « En gros, les notes [de 166 candidats à un concours universitaire dont les copies ont été jugées par deux correcteurs indépendants, expérimentés et méticuleux] sont distribuées par chaque examinateur à peu près suivant une courbe normale "en cloche": les notes moyennes sont les plus fréquentes, les notes très bonnes ou très mauvaises sont les plus rares. C'est un signe qui atteste de la valeur de la notation, car on sait que si l'on mesure, dans un groupe homogène d'individus, un trait quelconque, - que ce soit la taille ou le poids, ou une fonction mentale au moyen d'un test, - on constate que les résultats se distribuent selon une courbe en cloche. Tout porte à croire qu'il en est de même pour les connaissances dans le groupe d'individus qui se présentent à un concours, et la confirmation en a été donnée par les applications de tests pédagogiques. »

L’effet de tendance centrale 5 correcteurs => 100 copies 4 autres correcteurs => redistribution de 15 copies « bonnes »

Effet d’inertie Caverni, Fabre et Noizet (1975) ont mené l’étude suivante. A des professeurs de sciences de l’enseignement secondaire, ils ont demandé de noter (sur 20) chacun les 4 mêmes copies, accompagnées de « 5 notes censées avoir été obtenues précédemment par l’auteur de la copie ». Chaque série de 5 notes avait deux caractéristiques : sa moyenne (élevée = 13/20 ou faible = 7/20) et sa dispersion, exprimée par la Marge de Variation (MV), c'est-à-dire l’écart entre les notes extrêmes (MV forte = 10 ; MV faible = 2).

Effet d’inertie De Landsheere (1992, p. 47) commente : « La moyenne exprimait le niveau moyen de l’élève, tandis que la dispersion exprimait la régularité ou l’irrégularité de ses performances. Un autre descripteur aurait (encore) pu être utilisé : la succession des notes peut marquer un progrès (ce qui était le cas ici pour toutes les copies) ou, au contraire, une régression. » Le tableau ci-dessous indique le résultat obtenu pour chacune des 4 copies (a, b, c et d) dans deux situations particulières : l'information sur les résultats préalables faisait apparaître une moyenne forte (13/20) et une marge de variation faible (2 points), dans le premier cas, et l'inverse (moyenne faible et marge de variation forte), dans le second cas. Comme on peut le constater, la seconde situation est plus défavorable que la première.

Effet d’inertie

Effet de halo Weiss (1969), de son côté, a fait l’expérience suivante (rapportée par De Landsheere, 1992, p. 50) : Deux rédactions, redactylographiées ont été soumise à 2 groupes de 46 instituteurs de 4° primaire. Au groupe 1, il dit « Le travail 1 est l’œuvre d’un élève moyen qui aime lire des BD ; son père et sa mère sont employés. Le travail 2 a été fait par un enfant doué ; son père est rédacteur d’un quotidien connu ».

Effet de halo Pour le groupe 2, les commentaires ont été inversés. Trois aspects (orthographe, Style, Fond) devaient être jugés indépendamment, en plus d’une « note Globale », chaque fois sur une échelle à 5 niveaux (1 = TB ; 5=insuffisant).

Effet de halo Comme le précise De Landsheere (1971, p. 35), dont nous reproduisons la figure inspirée des résultats de Weiss, « Pour les quatre aspects considérés, les notes attribuées au travail pour lequel on a créé un préjugé favorable ont été significativement supérieures aux autres. Pour l'orthographe, qui semblait le plus devoir échapper à l'effet œdipien de la prédiction, on observe qu'au travail de l'élève présenté comme doué, 16% des correcteurs accordent la note très bien et aucun la note insuffisant; si le même élève est présenté comme moyen, les correcteurs n'accordent aucun très bien, mais 11% notent insuffisant ».

Effet de halo

Les différences entre correcteurs On peut mettre en évidence, en faisant corriger la même copie par plusieurs correcteurs qualifiés, des différences parfois fort importantes entre les notes attribuées à celle-ci. Ce type d'études a été mené très tôt. Dans une expérience, rapportée par Piéron (1963, p. 123), une même composition française a été jugée par 76 professeurs de français. Voici la distribution de leurs notes (NP = Nombre de correcteurs attribuant une note donnée) :

Les différences entre correcteurs

Les différences entre correcteurs Pour calculer la fidélité selon le nombre de correcteurs (Spearman-Brown)

Les différences entre correcteurs Pour calculer le nombre de correcteurs pour une fidélité donnée (Spearman-Brown)

Les différences entre correcteurs

Les différences entre correcteurs

Les notes littérales

La dictée Un animal familier Qui galope les dents en avant et la queue filant derrière ? C’est la souris ! Dans la maisonnette où elle se cache, la souris a toujours des choses à faire. Comme son papa n’est jamais là, elle doit se débrouiller toute seule. Ses grands yeux voient mal, alors elle renifle et elle touche tout avec ses moustaches. Avec ses doigts fins et ses griffes, la souris grimpe partout.