GTS813: cours #6 Évaluation d’une mesure (Validité, Répétabilité, Fiabilité, précision) Activité. Études de cas #2: Qui pose la question? La question est-elle.

Slides:



Advertisements
Présentations similaires
Base de sondage et Plan de sondage Pres. 5
Advertisements

STATISTIQUE INFERENTIELLE L ’ESTIMATION
5 critères de qualité d'un test
La régression logistique: fondements et conditions d’application
Inférence statistique
Echantillonnage Professeur Francis GUILLEMIN > Ecole de santé publique - Faculté de Médecine.
Les TESTS STATISTIQUES
Tests de comparaison de pourcentages
Les TESTS STATISTIQUES
Les Tests dhypothèses. 1)Définition Un test cest une méthode qui permet de prendre une décision à partir des résultats dun échantillon.
Dr DEVILLE Emmanuelle J D V 12/07/2006
Corrélations et ajustements linéaires.
Régression -corrélation
1 Introduction : Quelles méthodes & techniques de collectes de données ? => Construction méthodologique à partir dinstruments empruntés à divers domaines.
Mesures et incertitudes
Traitement de données socio-économiques et techniques d’analyse :
Un neurone élémentaire
Paul-Marie Bernard Université Laval
Objectifs du chapitre 8: Mesures verbales en psychologie
Régression linéaire simple
Concepts avancés en mathématiques et informatique appliquées MAP-6014.
Objectifs du chapitre 12: Interprétation des résultats
RECONNAISSANCE DE FORMES
Howell, Chap. 1 Position générale
Comprendre la variation dans les données: Notions de base
Méthodes de prévision (STT-3220)
Justification et opérationnalisation des hypothèses
La méthodologie expérimentale Fondements et bases d’application
Prévisions météorologiques, projections climatiques : que peut- on prévoir et avec quelle fiabilité ? Exercice 2: estimation de la prévisibilité dans le.
La corrélation et la régression multiple
La corrélation et la régression
Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte.
Le test t.
La corrélation et la régression
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Etape « 6. Correction et discussion »
La méthodologie expérimentale Fondements et bases d’application
Le comportement des coûts Chapitre 3
Objectifs Chapitre 8: Mesure en psychologie
La régression multiple
Régression linéaire multiple : hypothèses & interprétation. Partie 2.
Méthodologie expérimentale : l’analyse des données
Objectifs du chapitre 4: Mesures verbales en psychologie
Lien entre deux variables
Howell Chap. 11: ANOVA. Du monde connu au monde inconnu Du test t à l’analyse de varianceDu test t à l’analyse de variance Trouvez des nouveaux noms pour.
Echantillonage pour une Evaluation d’Impact
M2 Sciences des Procédés - Sciences des Aliments
Probabilités et Statistiques Année 2010/2011
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 1 Comparaisons multiples Ce qu’elles sont.
Sujets spéciaux en informatique I
Concepts fondamentaux: statistiques et distributions
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :52 1 Comparaisons multiples Ce qu’elles sont.
L’erreur standard et les principes fondamentaux du test de t
GRANDEURS ET MISÈRES DE LA MÉTA-ANALYSE Jimmy Bourque, CRDE.
1.  On souhaite comparer deux traitements dans le cadre d’un essai randomisé sur les lombosciatiques :  corticoïdes par infiltrations  placebo  Critère.
Études de Marché MBA Mars 2005 La recherche par sondage.
Études de Marché MBA Hivers 2006 La recherche par sondage.
Études de Marché Dess communication de masse
Probabilités et statistique MQT-1102
Chapitre 4 Concepts fondamentaux Les composantes d’un test statistique Les hypothèses nulles en statistiques Le sens de p Inférence: comment traduire p.
1_Introduction Toute mesure est entachée d’erreur. Il est impossible d’effectuer des mesures rigoureusement exactes. Pour rendre compte du degré d’approximation.
Examen psychologique de l‘adulte et du sujet âgé Examen psychologique de l‘adulte et du sujet âgé UPJV Département de Psychologie Cours du 6 novembre 2013.
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Statistiques: mesures de liaisons tests d’hypothèse
Académie européenne des patients sur l'innovation thérapeutique Rôle et notions élémentaires des statistiques dans les essais cliniques.
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
Chapitre 12 Des modeles corrélationnelles. A la fin de ce chapitre on sera capable de:  definir le but et l’utilisation des modeles correlationnelles.
Reliability of electronic recording of waiting times in the emergency department : a prospective multicenter study Judith Gorlicki, Pierre-Alexis Raynal,
Transcription de la présentation:

GTS813: cours #6 Évaluation d’une mesure (Validité, Répétabilité, Fiabilité, précision) Activité. Études de cas #2: Qui pose la question? La question est-elle claire?

Concepts de base Pourquoi évaluer un instrument de mesure? Nouvel instrument Instrument existant Validité Apparente : Test la bonne chose? De contenu : Tient compte de tout? Fidélité Répétabilité Indice compris entre 0 et 1 Stabilité Test-retest Homogénéité Consistence

Concepts de base Formes empiriques de validité D’autres échelles existent Validité concourante Pourquoi en développer une nouvelle? Pourquoi comparer à l’ancienne? Validité prédictive Aucune autre mesure n’existe Validité de construit Test du taux de sucre

Concepts de base Deux traditions d’évaluation Modèle catégorique | Modèle dimensionnel Réduction de l’erreur de mesure Formation, connaissances, expérience S’assurer de la cohérence Les choses changent pourtant. On commence à traiter les maladies dans leur ensemble et on traite plusieurs aspect en même temps. On en vient à vouloir mesurer des taux en continu, comme la pression sanguine et on a une approche moins dichotomique. La réduction de l’erreur de mesure: L’erreur de mesure est réduite grâce à la formation, les connaissances pour conduire une bonne entrevue, et surtout l’expérience clinique. En psychométrie, ce sont les patients qui rapportent eux même les informations. L’erreur peut se situer alors au niveau de la transcription, de la compréhension de la question… on remédie à ce type d’erreur en multipliant les items qui couvrent la même dimension et en s’assurant de leur cohérence

Fidélité Erreur systématique et aléatoire Fidélité vs exactitude

Fidélité Patient Obs.1 Obs.2 Obs3 Moyenne 1 6 7 8 7.0 2 4 5 5.0 3 2.0 4.0 9 10 9.0 6.0 8.0 6.00 Calculs

Fidélité Inter et intra-observateur Test-retest Signification des résultats Test-retest Pourquoi faire un test-retest?

Différents coefficients de fidélité Correlation de Pearson Coeffeicient Kappa Méthode de Bland et Altman Coefficient par corrélations multiples (CMC)

Différents coefficients de fidélité Corrélation de Pearson Cherche une relation linéaire Surestime généralement la fidélité Prend un Pearson par paire d’observateurs Version pour valeurs continues : CMC CMC vs ICC

Différents coefficients de fidélité Coefficient Kappa

Interprétation Fidélité et erreur standard de mesure Signification

Interprétation Différence attendue lors d’un re-test

Interprétation Est-ce que la fidélité est acceptable? Fidélité s’applique à une population donnée 100 personnes testées, classées. Une personne classée 25, l’autre 50. r = 0  50% d’être inversé si on recommence r = 0.5  37% r = 0.8  20% r = 0.95  2.2%

Améliorer la fidélité Façon d’améliorer la fidélité: Entraînement des observateurs Utiliser une population moins homogène (non légitime) Augmenter la taille de l’échantillon Variance augmente comme le carré du nombre d’items Variance de l’erreur augmente avec le nombre d’items

Calculer la taille de l’échantillon

Théorie de la généralisabilité La fidélité trouvée est pour une variante et s’applique à la population utilisée Comment connaître LA fidélité? Refaire une étude de fidélité pour chaque source de variabilité?

Théorie de la généralisabilité Identifier les sources d’erreur Déterminer l’influence de chacune Études de généralisabilité Facettes Différentiation Généralisation Fixes Études de décision

Théorie de la généralisabilité Exemple: Thérapeute, occasions et patients Design expérimental Patient Obs1 Obs 2 Obs 3 jour1 jour5 Jour5 1 2 3 4 5 6 7 … 10

Théorie de la généralisabilité Source Somme des carrés d.f Mean Square Expected mean square Patients(p) 3915 9 435 Day(d) 815 1 DayXpatients(dp) 585 65 Observer(o) 960 2 480 Observerxpatient (op) 540 18 30 Dayxobserver(do) 340 170 DayXObsXPatient(dop) 360 20

Théorie de la généralisabilité Coefficient de généralisabilité inter-observateur Coefficient de généralisabilité test-retest Coefficient de généralisabilité

Validité Concept de validité Validité de contenu Validité critérielle (criterion validity) Validité de construit (construct validity)

Validité de contenu Est-ce qu’on tient compte de tout? Notion d’inférence On tire d’une proposition considérée comme vraie, une autre proposition dont la vérité n’est pas directement connue. Si on réduit le nombre d’items pour augmenter la fidélité, les inférences peuvent diminuer la validité de contenu

Validité critérielle Corrélation de l’échelle avec une mesure, idéalement un « golden standard » Validité prédictive Le pronostique se vérifie ou non Plus difficile en sciences humaines Mesure doit posséder 4 qualités: En relation avec la chose prédite Pas de biais Fidèle Facile à obtenir Validité concourante Établie à partir d’un critère actuel éprouvé

Validité critérielle Question: pourquoi développer une nouvelle mesure s’il existe un golden standard? Argent (marché lucratif) Renommée Penser que ce qui existe n’est pas bien Ce qui existe est cher, invasif, dangereux, prend beaucoup de temps Résultats disponibles trop tard

Mesurer la validité Résultats des rayons X TB No TB Mantoux test a b c

Validité de construit Basée sur des hypothèses (contruits) Construit est nouveau Échelles existantes ne sont pas suffisantes On teste à la fois l’hypothèse et la mesure Méthodes Groupes extrêmes Validité convergente et validité discriminante Méthode multitrait-matrice multi-méthodes

Biais dans la détermination de la validité Réduction de l’étendue de la mesure Importance de bien choisir le contexte

Mesurer le changement Le but de mesurer le changement (linn et Slinde, 1977) Mesurer la différence entre individus dans l’amplitude du changement Identifier des corrélations entre des éléments et le changement Déduire des effets de traitements à partir de différences entre groupes

Mesurer le changement Pourquoi ne pas mesurer le changement directement? Dans le contexte d’une mesure qualitative Tendance à sous-estimer l’état de départ donc surestimer le traitement Tendance à être influencé par l’état actuel

Mesures d’association – fidélité et sensibilité au changement Patient Avant Après 2sem Moy Changement 1 150 144 147 -6 2 120 112 116 -8 3 110 108 109 -2 4 140 142 141 +2 5 138 132 135 6 114 -4 Moyenne 129 125 127 -4.0

Sensibilité au changement