Psychométrie et édumétrie

Slides:

Advertisements

Présentations similaires

Prof. Assist. Dr Penphan THIPKONG

Advertisements

L’échantillonnage & Ses Fluctuations

Indicateurs de Suivi, Risques & Mesure d’Associations

Connecteurs entre socle et briques applicatives Journées rencontres du CSIESR 31 janvier et 1 er février 2005 Yohan Colmant Université de Valenciennes.

METHODOLOGIE DE CO-DÉVELOPPEMENT POUR LES PME

Apprentissages numériques de l’école au collège

Chapitre 5. Description numérique d’une variable statistique.

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

GEF 435 Principes des systèmes d’exploitation

Progression des apprentissages au secondaire

Université de Ouagadougou

Inférence statistique

Les TESTS STATISTIQUES

Des outils de réflexions sur l’évaluation

Licence 3ème année de sociologie Semestre 1

1. Les caractéristiques de dispersion. 11. Utilité.

Mesures et évaluations de compétences

Les TESTS STATISTIQUES

11/02/20051 Internet Intranet Le portail UNSS. 11/02/20052 Qui peut accéder à Intranet ? Les services UNSS Les coordonnateurs de district Les AS.

Introduction à la programmation (420-PK2-SL) cours 15 Gestion des applications Technologie de linformation (LEA.BW)

Évaluer pour faire apprendre dans une approche par compétences

Présentation: NGOK Emmanuel Expert en comptabilité nationale AFRISTAT

Changements au bulletin Présentation sommaire des modifications au régime pédagogique Année scolaire

Les sections européennes et de langues orientales

Why Central Paris is rich and Downtown Detroit

Programme de sixième Présentation du document d’accompagnement

Master Université de Bourgogne

LES ÉLASTICITÉS DE LA DEMANDE ET DE L’OFFRE

Les types d’évaluation pédagogique dans un système d’enseignement/apprentissage La littérature foisonne de typologie d’évaluation dans un système d’enseignement/apprentissage.

la statistique descriptive se compose de 3 domaines distincts :

FERRAFIAT Nicolas Le logiciel d’estimation statistique en fiabilité

Partie 5 Les échelles de mesure.

Des moyens de communication pour le meilleur intérêt de nos enfants.

Vers un cadre unificateur pour l'enseignement des outils et méthodes de gestion de l'information numérique Yves MARCOUX GRDS - EBSI Université de Montréal.

Présentation du lundi 5 décembre PISA 2009 : objectifs et démarches 68 pays concernés en Suisse : jeunes de 15 ans et élèves de 9 ème mesure les.

Partie 3 La psychophysique.

L’observation directe du comportement

Sur la page daccueil dEvaloscope qui a été réservée à votre établissement, vous commencez par créer un compte…

Janvier 2012 Les nouvelles épreuves de Sciences économiques et sociales au baccalauréat.

B Souda Abdelhafidh Mai 2006 Lévaluation est-elle une innovation en Tunisie B souda Abdelhafidh Élève inspecteur au CENAFFE.

Introduire la dérivée en 1re S comme réponse à une question

ELEMENTS DE COURS 1. LERIDON H., TOULEMON L. (1997) – Démographie. Approche Statistiques et dynamique des populations. Paris, Economica. 2. FALISSARD.

Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.

La théorie classique des tests

L’EVALUATION.

La planification globale de l’évaluation des apprentissages

Chapitre 4 L’inertie et le mouvement à deux dimensions

Les interrogations formatives Une nécessité. Public concerné Première baccalauréat en médecine et dentisterie Premier baccalauréat en kinésithérapie et.

Les Technologies de linformation et de la communication dans les programmes de lécole primaire.

Grille d’Appréciation ou d’Evaluation

Equipe LPMFSéminaire de productique 23 février Ingénierie collaborative en classe de terminale STI GMa Application à la potence de VTT amortie Lycée.

Apprentissage des mathématiques Résolution de problèmes

Évaluation par compétences

Précision d'une mesure et chiffres significatifs

Théorème de la limite centrale l’inférence statistique

Micro-intro aux stats.

BACCALAUREAT PROFESSIONNEL

Résultat disciplinaire Règle de réussite disciplinaire

Outils d’analyse: la méthode des moindres carrées

Chapitre 4 Variables aléatoires discrètes

Classe de 2nde.

Statistique Descriptive Les Paramètres de Tendance Centrale

Corrélation et causalité

Introduction aux statistiques Intervalles de confiance

L’évaluation à l’école

Docimologie critique.

Transcription de la présentation:

Psychométrie et édumétrie Partie 6 Psychométrie et édumétrie

Partie 6 – la psychométrie et l’édumétrie Chapitre 1 : Edumétrie et psychométrie: deux disciplines différentes ? Chapitre 2 : Pourquoi faut-il parler d’édumétrie ? Chapitre 3 : Les deux dimensions des tests: psychométrie et édumétrie Chapitre 4 : Docimologie critique : des difficultés de noter des copies et d’attribuer des notes aux élèves Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Edumétrie « Edumétrie. Mot créé par Carver (1974), sur le modèle de psychométrie, pour désigner l’étude quantitative des variables relatives aux apprentissages suscités par l’éducation : influence d’une action pédagogique, performance effective par rapport à une performance attendue, épreuves centrées sur les objectifs… » Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Carver (1970, 1974) « Il ne s’agit pas seulement d’un problème sémantique sous-jacent au mouvement nouveau de création de tests, mais d’un problème essentiel. Le problème réside dans la distinction entre la mesure des différences individuelles et celle de la mesure (des résultats) de l’apprentissage.[…] Le test qui a été développé pour mesurer les différences inter-individuelles a été baptisé du terme de « test psychométrique ». Cette dimension du test est donc logiquement appelée « dimension psychométrique ». Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Carver (1970, 1974) Un test peut ainsi être évalué en fonction de ses qualités psychométriques, c’est-à-dire, la mesure dans laquelle il reflète correctement des différences inter-individuelles stables, ce qui constitue traditionnellement l’intérêt premier du psychologue. L’autre dimension d’un test peut être appelée « dimension édumétrique » (cf. Carver, 1972, 1973). Un test peut être évalué en fonction de ses qualités édumétriques, c’est-à-dire la mesure dans laquelle il reflète les différences intra-individuelles liées aux développements des individus eux-mêmes, ce qui constitue plus généralement l’intérêt premier des tests dans le domaine de l’éducation. » Master Université de Bourgogne, 17-20 janvier 2005

Edumétrie  Psychométrie ? Cardinet (Suisse francophone) Carver (USA) Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 ? Psychométrie Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 ? ? ? Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 ? ? ? ? Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 ? Programme 1 Programme 2 Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 ? Région 1 Région 2 Master Université de Bourgogne, 17-20 janvier 2005

Docimologie critique

Master Université de Bourgogne, 17-20 janvier 2005 Techniques (a) Une même série de copies est corrigée plusieurs fois par le même correcteur, à des moments différents, sans que celui-ci s’en rendre compte, ce qui permet de mesurer la stabilité intra-correcteurs; Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Techniques (b) Une même série de copies est corrigée par plusieurs correcteurs différents, ce qui permet de mesurer la concordance inter-correcteurs; Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Techniques (c) Une même copie est placée dans un ensemble de copies dans des positions différentes (précédée de copies meilleures ou plus faibles), ce qui permet de mesurer l’effet de contraste, ou de séquence; Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Techniques (d) Une même copie est placée dans un ensemble de copies dont les valeurs sont plus ou moins dispersées largement (tantôt parmi des copies ayant toutes reçu la même note lors d'une évaluation préalable, tantôt parmi des copies très variées en qualité); etc. Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Techniques (e) Une même copie est corrigée par plusieurs groupes de correcteurs auxquels on fournit des informations complémentaires différentes sur l'élèves, ses notes antérieures… Master Université de Bourgogne, 17-20 janvier 2005

Trois sources d’erreur Le système scolaire Les élèves Les enseignants Les arrangements internes Les arrangements externes Les arrangements pour soi Master Université de Bourgogne, 17-20 janvier 2005

Quelques exemples de biais mis en évidence par la docimologie critique La distribution forcée (Posthumus) L’effet de tendance centrale La surprenante stabilité des taux de réussite et d'échec d’année en année Les biais résultant de l'interaction entre le correcteur et l'étudiant ou la copie évalué Effet de stéréotype ou d’inertie Effet de halo Effets de contraste entre copies ou entre étudiants L'instabilité d'un même correcteur Les différences entre correcteurs Master Université de Bourgogne, 17-20 janvier 2005

La distribution forcée (Posthumus) Définition: « Un enseignant tend à ajuster le niveau de son enseignement et ses appréciations des performances des élèves de façon à conserver, d’année en année, approximativement la même distribution (gaussienne) de notes.» Master Université de Bourgogne, 17-20 janvier 2005

La distribution forcée (Posthumus) Laugier et Weinberg (1927) souscrivent à cette idée: « En gros, les notes [de 166 candidats à un concours universitaire dont les copies ont été jugées par deux correcteurs indépendants, expérimentés et méticuleux] sont distribuées par chaque examinateur à peu près suivant une courbe normale "en cloche": les notes moyennes sont les plus fréquentes, les notes très bonnes ou très mauvaises sont les plus rares. C'est un signe qui atteste de la valeur de la notation, car on sait que si l'on mesure, dans un groupe homogène d'individus, un trait quelconque, - que ce soit la taille ou le poids, ou une fonction mentale au moyen d'un test, - on constate que les résultats se distribuent selon une courbe en cloche. Tout porte à croire qu'il en est de même pour les connaissances dans le groupe d'individus qui se présentent à un concours, et la confirmation en a été donnée par les applications de tests pédagogiques. » Master Université de Bourgogne, 17-20 janvier 2005

L’effet de tendance centrale 5 correcteurs => 100 copies 4 autres correcteurs => redistribution de 15 copies « bonnes » Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Effet d’inertie Caverni, Fabre et Noizet (1975) ont mené l’étude suivante. A des professeurs de sciences de l’enseignement secondaire, ils ont demandé de noter (sur 20) chacun les 4 mêmes copies, accompagnées de « 5 notes censées avoir été obtenues précédemment par l’auteur de la copie ». Chaque série de 5 notes avait deux caractéristiques : sa moyenne (élevée = 13/20 ou faible = 7/20) et sa dispersion, exprimée par la Marge de Variation (MV), c'est-à-dire l’écart entre les notes extrêmes (MV forte = 10 ; MV faible = 2). Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Effet d’inertie De Landsheere (1992, p. 47) commente : « La moyenne exprimait le niveau moyen de l’élève, tandis que la dispersion exprimait la régularité ou l’irrégularité de ses performances. Un autre descripteur aurait (encore) pu être utilisé : la succession des notes peut marquer un progrès (ce qui était le cas ici pour toutes les copies) ou, au contraire, une régression. » Le tableau ci-dessous indique le résultat obtenu pour chacune des 4 copies (a, b, c et d) dans deux situations particulières : l'information sur les résultats préalables faisait apparaître une moyenne forte (13/20) et une marge de variation faible (2 points), dans le premier cas, et l'inverse (moyenne faible et marge de variation forte), dans le second cas. Comme on peut le constater, la seconde situation est plus défavorable que la première. Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Effet d’inertie Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Effet de halo Weiss (1969), de son côté, a fait l’expérience suivante (rapportée par De Landsheere, 1992, p. 50) : Deux rédactions, redactylographiées ont été soumise à 2 groupes de 46 instituteurs de 4° primaire. Au groupe 1, il dit « Le travail 1 est l’œuvre d’un élève moyen qui aime lire des BD ; son père et sa mère sont employés. Le travail 2 a été fait par un enfant doué ; son père est rédacteur d’un quotidien connu ». Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Effet de halo Pour le groupe 2, les commentaires ont été inversés. Trois aspects (orthographe, Style, Fond) devaient être jugés indépendamment, en plus d’une « note Globale », chaque fois sur une échelle à 5 niveaux (1 = TB ; 5 = insuffisant). Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Effet de halo Comme le précise De Landsheere (1971, p. 35), dont nous reproduisons la figure inspirée des résultats de Weiss, « Pour les quatre aspects considérés, les notes attribuées au travail pour lequel on a créé un préjugé favorable ont été significativement supérieures aux autres. Pour l'orthographe, qui semblait le plus devoir échapper à l'effet œdipien de la prédiction, on observe qu'au travail de l'élève présenté comme doué, 16% des correcteurs accordent la note très bien et aucun la note insuffisant; si le même élève est présenté comme moyen, les correcteurs n'accordent aucun très bien, mais 11% notent insuffisant ». Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Effet de halo Master Université de Bourgogne, 17-20 janvier 2005

Les différences entre correcteurs On peut mettre en évidence, en faisant corriger la même copie par plusieurs correcteurs qualifiés, des différences parfois fort importantes entre les notes attribuées à celle-ci. Ce type d'études a été mené très tôt. Dans une expérience, rapportée par Piéron (1963, p. 123), une même composition française a été jugée par 76 professeurs de français. Voici la distribution de leurs notes (NP = Nombre de correcteurs attribuant une note donnée) : Master Université de Bourgogne, 17-20 janvier 2005

Les différences entre correcteurs Master Université de Bourgogne, 17-20 janvier 2005

Les différences entre correcteurs Pour calculer la fidélité selon le nombre de correcteurs (Spearman-Brown) Master Université de Bourgogne, 17-20 janvier 2005

Les différences entre correcteurs Pour calculer le nombre de correcteurs pour une fidélité donnée (Spearman-Brown) Master Université de Bourgogne, 17-20 janvier 2005

Les différences entre correcteurs Master Université de Bourgogne, 17-20 janvier 2005

Les différences entre correcteurs Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 Les notes littérales Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005 La dictée Un animal familier Qui galope les dents en avant et la queue filant derrière ? C’est la souris ! Dans la maisonnette où elle se cache, la souris a toujours des choses à faire. Comme son papa n’est jamais là, elle doit se débrouiller toute seule. Ses grands yeux voient mal, alors elle renifle et elle touche tout avec ses moustaches. Avec ses doigts fins et ses griffes, la souris grimpe partout. Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005

Master Université de Bourgogne, 17-20 janvier 2005