ENP 7137 Module 4 Professeur Filip Palda. Objectifs : De façon générale, les études ne sont pas randomisées. La «solution» est de créer un groupe ayant.

Slides:



Advertisements
Présentations similaires
LA CROISSANCE ECONOMIQUE
Advertisements

La mesure des inégalités
D.Gile statscrit1 LUTILISATION DES STATISTIQUES INFERENTIELLES DANS LA RECHERCHE : REFLEXIONS CRITIQUES
GESTION DE PORTEFEUILLE chapitre n° 7
Introduction to Impact Evaluation training HSRC, Pretoria, South Africa April 10, 2008 Induction Causale Florence Kondylis Initiative pour lévaluation.
Cross-Country Workshop for Impact Evaluations in Agriculture and Community Driven Development Addis Ababa, April 13-16, Inference Causale Léandre.
But de la lecture critique
Qu’est-ce que la mobilité sociale ?
Le circuit économique 2012.
Inférence statistique
Les TESTS STATISTIQUES
1 Séminaire de travail « Indicateur de croissance en France et/ou en zone euro : méthodologie et évaluation » 14 juin 2006 Indicator Models of Real GDP.
Les TESTS STATISTIQUES
Dr DEVILLE Emmanuelle J D V 12/07/2006
Représentation du fonctionnement de l’économie
Vérification des données
Tableau‚ Summary of Findings‘
Laccompagnement des jeunes diplômés: evidence basée sur une expérience randomisée B. Crépon, E. Duflo, M. Gurgand, R. Rathelot and P. Zamora Abdul Latif.
Le Tableau économique d’ensemble TEE
Africa Program for Education Impact Evaluation Accra, Ghana May 10-14, 2010 Inférence Causale Aïchatou Hassane May 10,
Objectifs du chapitre 12: Interprétation des résultats
Paul-Marie Bernard Université Laval
Faculté de Médecine Lyon-Sud Module Optionnel de préparation à la lecture critique d articles Multiplicité.
La corrélation et la régression
Chapitre 4 La probabilité
Objectifs: Etudier l’hétérogénéité des caractères au sein de la composante environnementale de la variance résiduelle Pour cela on tente de minimiser les.
Régression linéaire multiple : hypothèses & interprétation. Partie 2.
Test d'hypothèse pour des proportions:
Valeur ou Volume. Prix courants ou Prix constants
Marquez cette valeur sur le diagramme à points de la question 6. La moyenne réelle des nombres de lettres par mots dans la population de l'ensemble des.
Echantillonage pour une Evaluation d’Impact
GTS813: cours #6 Évaluation d’une mesure (Validité, Répétabilité, Fiabilité, précision) Activité. Études de cas #2: Qui pose la question? La question est-elle.
Probabilités et Statistiques Année 2010/2011
Carole Dion, professeure UQAC ACFAS 2006
Doc. p l’hypothèse d’anticipations rationnelles
GRANDEURS ET MISÈRES DE LA MÉTA-ANALYSE Jimmy Bourque, CRDE.
Concepts préliminaires sur les études de recherche Population: le groupe entier de personnes ou d'objets sur lequel un chercheur veut apprendre quelque.
LES RATIOS FINANCIERS Le financement
Cross-Country Workshop for Impact Evaluations in Agriculture and Community Driven Development Addis Ababa, April 13-16, 2009 Léandre Bassolé Africa Impact.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :26 1 Programme Devoir 1 Proposition travail.
* 16/07/96 Cohorte des travailleurs du nucléaire à Électricité de France : mortalité des agents statutaires sur la période 1968–2003 *
Réglementation Module 6. Objectifs Objectifs : –Connaître les divers types de réglementation et comprendre leurs effets attendus et inattendus. –Connaissances.
ENP 7137 Module 8 Professeur Filip Palda.  GENEL88.SAV Dans la banque de données GENEL88.SAV, chaque candidat aux élections de 1988 et les caractéristiques.
L’école de Chicago. Aussi : Les coûts sociaux des monopoles et les différentes manifestations des monopoles. Histoire Université fondée en 1892 avec les.
Échantillonnage (STT-2000) Section 5 Types d’erreur de sondage. Version: 22 août 2003.
Croissance économique: histoire, mesure, enjeux. Qu'est-ce que la croissance économique? La mesure la plus largement utilisée de croissance est basée.
Le prélèvement. Module 4. Quelle est la méthode la plus efficace pour effectuer un prélèvement? Pour répondre à cette question, il faut définir l’efficacité.
Sommaire des deux processus aléatoires Il faut distinguer soigneusement entre l'échantillonnage aléatoire et l'affectation aléatoire. Ceux sont des techniques.
FICHE METHODOLOGIQUE n°3
ENP 7137 Module 10 Professeur Filip Palda. Introduction Objectif : comprendre la méthode de Heckman pour corriger les biais de sélection. Avec le logiciel.
ENP 7137 Module X Professeur Filip Palda. Immigration et emploi.
L ’É VOLUTION DE L ’É TAT ET LE RESPECT DE SES PROMESSES Module 2.
Des expériences comparatives à répartition aléatoire (autrement dit des études expérimentales aléatoires)
CONSTRUCTION DE TABLEAUX CROISES SUR LE LOGICIEL MODALISA MET4 – Avril 2005.
des savoir-faire applicables aux données quantitatives
Détecter les groupes à hauts risques cardiaques à partir de caractéristiques telles que l’alimentation, le fait de fumer ou pas, les antécédents familiaux.
Portrait de la clientèle des programmes d’assistance sociale Direction de la statistique et de l’information de gestion (DSIG) 20 novembre 2012.
L’éfalizumab chez des patients atteints de psoriasis en plaques modéré à sévère Octobre 2009.
Probabilités et statistique MQT-1102
Téléphone mobile, risque de tumeurs cérébrales et du nerf vestibuloacoustique: l’étude cas-témoins INTERPHONE en France. Lecture critique d’article Décembre.
ENP 7137 Module 3 Professeur Filip Palda. Différence entre moyennes On ne peut pas simplement calculer la différence et conclure qu’elle existe si on.
Lecture critique d’article Mars 2014 Pr Ganry. q2. Donner un titre à l’article? Etude du statut sérologique et de l’accouchement par césarienne sur les.
Académie européenne des patients sur l'innovation thérapeutique Rôle et notions élémentaires des statistiques dans les essais cliniques.
Introduction aux statistiques Intervalles de confiance
Risques d’investissement Plus qu’une histoire de marchés boursiers.
INDICATEURS DE PERFORMANCE - I ls permettent de savoir si le but et les objectifs du projet sont atteints ; - ils renseignent sur la réalisation de l’objectif.
Lecture critique des essais cliniques. But Juger de : - La validité scientifique - L’intérêt clinique Modifier ou ne pas modifier la pratique.
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
Transcription de la présentation:

ENP 7137 Module 4 Professeur Filip Palda

Objectifs : De façon générale, les études ne sont pas randomisées. La «solution» est de créer un groupe ayant des caractéristiques (jugées pertinentes à une bonne performance) qui sont semblables. On tire ce groupe dit contrôle d’une banque de données généralement créée à d’autres fins.

La solution est rejetée quand une caractéristique non mesurable mais pertinente (ou performante) existe. Le danger est qu’il est probable d’attribuer au programme un résultat qui est vraiment dû à une caractéristique cachée. Ex.: motivation. Regard critique sur l’étude «Relance» de Lapierre, Beaulieu et Tarte. Reproduire les résultats en utilisant des données de Robert Lalonde.

Application  PAIE est un programme VOLONTAIRE. Les auteurs indiquent que ceci pourrait poser des problèmes. En d’autres termes, cela peut biaiser les résultats. Page 5. En effet, les chercheurs ne contrôlent pas la motivation et les handicaps mentaux et physiques. Ils ne poursuivent pas davantage la discussion sur ce problème potentiel. Le taux de non-réponse après 18 mois est parfois supérieur à 50%. Est-ce problématique? Potentiellement, si la non-réponse est due à des forces systématiques, telle la faible motivation. Dans un premier lieu, les plus motivés participent au programme. Dans un deuxième lieu, les moins motivés parmi les plus motivés quittent l’échantillon expérimental. Ainsi le groupe E est constitué des plus motivés parmi les personnes motivées. Si la non-réponse est due au hasard, ce n’est pas un problème, car le hasard est l’opposé de la sélection.

Le tableau B illustre les raisons de la non-réponse. Leur interprétation est subjective.

Le Tableau D est essentiel pour toute sorte d’évaluation expérimentale. Il montre les moyennes des caractéristiques des groupes E et C, ainsi que la différence entre ces moyennes et la valeur du test t (et sa significativité).

Une question à poser : «Les chercheurs ont-ils inclus toutes les caractéristiques pertinentes?» Si des caractéristiques sont omises, cela pourrait s’expliquer par le fait que les chercheurs n’ont pas bien contrôlé l’expérience. Au niveau des facteurs non mesurables, le problème de biais devient difficile à résoudre. Dans le cas actuel, on doit parler d’une quasi- expérience, car on ne fait pas d’aléation.

Mesure cumulative. Selon le tableau 1A, 4 programmes parmi les 5 ont des effets statistiquement significatifs, mais le niveau n’est pas fourni. Il est essentiel de connaître les résultats du test t et sa significativité.

On n’a pas besoin de tenir compte du taux de chômage ou de la conjoncture économique, car ces effets extérieurs sont les mêmes pour E et C.

Le tableau 1B donne une mesure ponctuelle de la réintégration.

Le tableau 2A indique qu’un pourcentage important d’emplois subventionnés a été créé après le programme. Quelle conclusion peut- on tirer? Il se peut que le programme PAIE et les autres créent en partie des individus qui sont aptes aux recherches de subventions!

DEVOIR 1) Décrivez comment RELANCE a créé le groupe contrôle et expérimental. 2) Quelles sont les forces et les faiblesses de l'approche utilisée par les chercheurs? 3) Est-ce que les chercheurs sont justifiées dans leur conclusion que PAIE a été un succès? 4) Pourquoi les chercheurs n'ont-ils pas utilisé un modèle de recherche randomisée?

Première mesure de performance : Le % de personnes ayant eu au moins un emploi 11 mois après la participation au programme et le % de celles qui n’ont pas participé (non-participants). 47% des participants au programme PAIE ont eu au moins 1 emploi. 24% des non-participants ont eu au moins 1 emploi. Différence statistiquement significative désignée par le symbole *. Ce symbole indique qu’une telle différence entre E et C serait produite par le hasard avec un seuil inférieur à 5 fois sur 100. Autrement dit, une significativité à un niveau de 5%. D’accord, il existe une différence significative, mais doit-on nécessairement l’attribuer au programme?

L’étude «Relance» fournit un excellent tableau de bord pour la conception d’un rapport d’évaluation. La faiblesse centrale est son manque presque total de discussion du problème de biais de sélection. Les biais de sélection ici pourraient s’introduire par le manque de contrôle statistique. Autrement dit, les groupes E et C ne sont peut-être pas semblables quant à la motivation et aux handicaps physiques et mentaux. Donc, une différence de performance entre E et C peut être due aux différences des caractéristiques entre E et C et non pas aux effets du programme.

L’étude de Robert Lalonde, National Supported Work Demonstration (NSW), est semblable à PAIE. Les emplois subventionnés sont temporaires. Objectif : réintégration des chômeurs au marché du travail. L’agence administrative du NSW Manpower Demonstration Research Corporation, située aux É-U, a administré le NSW dans une dizaine de sites. Clients : ex-toxicomanes, ex-criminels, décrocheurs du secondaire. Emploi garanti pour une période qui varie entre 9 et 18 mois. Date de début du programme: NSW est une étude EXPÉRIMENTALE ALÉATOIRE. Ainsi, elle ne souffre pas d’un biais de sélection (présent dans le cas de l’étude «Relance»). Dans quel sens cette étude est-elle expérimentale?

Un groupe de personnes postulent et le gouvernement tient une loterie pour attribuer les postes aux postulants. On trouve qu’aucun biais de sélection n’existe, ainsi la validité interne est bonne. Mais le bassin duquel on tire les groupes E et C n’est pas représentatif de la population totale de personnes qui bénéficient de l’aide sociale, alors on parle d’une mauvaise validité externe. POSTUL ANTS ALÉATION E C

 L’objectif de Lalonde n’était pas d’évaluer le NSW. Cette évaluation avait été menée par des chercheurs impliqués dans l’administration du NSW. Lalonde révèle que le vrai résultat a été connu. Il voulait dire par «vrai» que c’est le résultat d’une étude aléatoire. Utilisons cette constatation pour évaluer la méthode quasi-expérimentale plutôt que le programme lui-même.

 Démarche : créer un groupe quasi- contrôle à la base de 5 ou 6 caractéristiques de performance sur le marché du travail et comparer l’effet net du programme mesuré par une quasi- expérience à l’effet net mesuré par une expérience aléatoire.

Dehejia and Wahba Dehejia et Wahba ont reproduit (presque) les banques de données de Lalonde qui, lui, a tiré ses donnés d’une plus grande banque disponible au ICPSR dans l’État du Michigan.

NSW_CONTROL.SAV NSW_TREATED.SAV Objectif : joindre les 2 banques de données.

Pour joindre les 2 fichiers :

DATA MERGE FILES ADD CASES Ceci produit une base NSW_COMPLET qui unit les groupes E (treatment) et C. Pour reproduire le Tableau 1 de D&W, on utilise la technique AGGREGATE. Ceci nous permet d’enregistrer dans une base de données des statistiques descriptives, ce que ANALYSE MEANS ne permet pas.

Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means FSig.tdfSig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference LowerUpper AGEEqual variances assumed,029,865,357720,721,1792,50143-, ,16364 Equal variances not assumed,356631,223,722,1792,50272-,808001,16640 EDUCEqual variances assumed 4,022,0451,492720,136,1922,12882-,06068,44515 Equal variances not assumed 1,462588,748,144,1922,13149-,06601,45048 NOIREEqual variances assumed,008,929,045720,965,0013,03026-,05807,06076 Equal variances not assumed,045637,876,965,0013,03025-,05806,06075 LATINOEqual variances assumed 2,612,107-,803720,422-,0187,02323-,06428,02695 Equal variances not assumed -,815667,060,415-,0187,02291-,06364,02631 MARIEEqual variances assumed,585,444,384720,701,0107,02791-,04408,06549 Equal variances not assumed,382626,123,703,0107,02804-,04436,06577 SANSDIPEqual variances assumed 27,531,000-2,673720,008-,0835,03123-, ,02217 Equal variances not assumed -2,612582,002,009-,0835,03197-,14626-,02070 REV75Equal variances assumed,324,570,103720,91839, , , , Equal variances not assumed,104661,861,91739, , , ,6762 6

Devoir En utilisant la base de données de DW NSW_COMPLET.SAV, déterminez si le programme a augmenté le salaire des participants en comparant l’augmentation des revenus entre les participants et les non-participants. Calculez cette différence pour les sous-groupes latino, noir et marié pour déterminer si le programme était plus efficace pour un groupe que pour l’autre (filtre). Finalement, éliminez la colonne INCOME74 (colonne H) de CPS_CONTROL.SAV (pseudo groupe contrôle) puis collez CPS_CONTROL.SAV à NWS_TREATED.SAV et analysez l’efficacité du programme (déterminez s’il a augmenté le revenu REV78-REV75 du groupe E plus que celui du groupe quasi- contrôle). Si les résultats sont différents de ceux que vous avez trouvés avec les vrais groupes aléatoires, expliquez pourquoi.