La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

ENP 7137 Module 10 Professeur Filip Palda. Introduction Objectif : comprendre la méthode de Heckman pour corriger les biais de sélection. Avec le logiciel.

Présentations similaires


Présentation au sujet: "ENP 7137 Module 10 Professeur Filip Palda. Introduction Objectif : comprendre la méthode de Heckman pour corriger les biais de sélection. Avec le logiciel."— Transcription de la présentation:

1 ENP 7137 Module 10 Professeur Filip Palda

2 Introduction Objectif : comprendre la méthode de Heckman pour corriger les biais de sélection. Avec le logiciel R, on crée des groupes semblables en utilisant un algorithme de jumelage. Avec la méthode H, on utilise la régression pour pondérer les personnes qui ont une grande tendance à participer. On leur donne un faible poids et ainsi on « filtre » les cas biaisés. Méthodes non expérimentales pour corriger les biais de sélection. Le problème avec les méthodes non expérimentales, c’est le manque de contrôle. Autrement dit, le fait de ne pas prendre en considération tous les facteurs qui peuvent affecter le résultat est un problème.

3 2 méthodes non expérimentales : 1) La régression 2) Les quasi-expériences Chaque méthode est aussi bonne que l’aléation pourvu qu’on ait pris en compte toutes les variables indépendantes pertinentes. Dans les années 1970, un chercheur portant le nom de James Heckman a inventé une méthode non expérimentale pour corriger les biais de sélection: ERROR CORRECTION METHOD

4 Le défi est de trouver une manière de pondérer les résultats (ex.: réintégration des travailleurs au marché du travail) de telle manière que ceux qui avaient une forte tendance à participer reçoivent une pondération plus faible de leur résultat. Exemple : une personne qui voit son salaire augmenter de 10K$ après le programme. Si cette personne a participé volontairement, il est probable que l’augmentation de 10K$ ne soit pas entièrement due au programme gouvernemental, mais aussi à sa motivation. On veut «nettoyer» ou «corriger» le 10K$. On veut le réduire proportionnellement à la motivation de la personne. Plus la personne est motivée, plus on réduit le 10K$.

5 Ceci se fait en calculant la probabilité que cette personne participe au programme et en pondérant son salaire de manière inversement proportionnelle à sa probabilité de participation. Forte probabilité  faible pondération. Cette pondération pourrait corriger les biais de sélection. La pondération est un substitut pour connaître la motivation des individus. La tendance à participer constitue la probabilité qu’une personne participe au programme. Si la probabilité est forte, on déduit une forte motivation et on attribue au résultat de cette personne un faible poids. Ceci «désinfecte» le résultat des effets de motivation et ce qui reste est l’effet du programme.

6 Méthode de Heckman  Aussi connue comme «méthode à 2 étapes».  Une régression de participation. P = 1 si la personne participe et P = 0 dans le cas contraire. X1, X2 sont des variables qui déterminent en partie (une autre partie est déterminée par des forces aléatoires) la participation. P = a0 + a1X1 + a2X2 + erreur a0 + a1X1+ a2X2 est la partie prévisible de la participation (probabilité).

7  Avec les coefficients et les X, on calcule l’erreur (dans SPSS, ils sont connus sous le terme RESIDUALS) et on transforme l’erreur:

8 Ceci est l’erreur standardisée. DANS SPSS C’EST ZRE_1. La moyenne de v est = 0 et son écart type est = 1. Avec v, construire un «inverse Mill’s ratio» f(v) est la fonction de fréquence de v. F(v) est la densité cumulative de v.

9 Deuxième étape 2) Une régression de résultats. Variable dépendante R (résultat). Exemple du salaire après le programme: R = b0+ b1X1 + b3Z1 + b4IMR + b5P P = a0 + a1X1 + a2X2 + erreur Le coefficient de P est notre objectif et devrait être non biaisé si on a bien formulé la première régression. Notez que X2 n’est pas présent dans la régression. Ceci est nécessaire car il nous faut des informations supplémentaires à celles présentes dans la régression des résultats afin d’apporter les corrections (dans mes mots : pondération) nécessaires pour éliminer le biais de sélection.

10 Participation dans la banque de données recidivism.sav : variable REHAB. 1 si la personne a décidé de participer et 0 sinon. Exemple : REHAB = a0 + a1X1 + a2X2 + erreur

11

12 Il faut formuler une équation de participation au programme.

13 REHAB = a 0 + a 1 AGE + a 2 AGE2 + a 3 ED Equation de participation. REHAB ÉQUIVALENT A P Coefficients(a) Model Unstandardized Coefficients Standardized Coefficients t Sig. BStd. Error Beta 1 (Constant),460,189 2,442,015 Age in years -,005,013-,096-,437,663 AGE2 1,205E- 05,000,013,061,952 Level of education -,004,018-,007-,232,817 a Dependent Variable: Rehabilitated

14  Pour calculer IMR, on fait appel à la fonction PDF.NORMAL dans SPSS. Cette fonction donne la fréquence relative de n’importe quel V. f(V) f = PDF.NORMAL(ZRE_1,mean,stdv) SPSS nous demande de fournir 3 chiffres ZRE_ 1 est notre variable V

15 Mean = 0, stdv =1. F = CDF.NORMAL(ZRE _1, mean = 0, stdv = 1) Ceci est la densité cumulative normale.

16 Régression des résultats ARREST2 = f(AGE, ED, EMPLOYED, GENDER, MARITAL, REHAB, IMR) Et notez qu’on a omis AGE2. Et comparez avec la régression sans IMR ARREST2 = f(AGE, ED, EMPLOYED, GENDER, MARITAL, REHAB,)

17 a Dependent Variable: Second arrest

18 Commentaires sur la méthode Problèmes : si l’étape 1 n’est pas bien formulée (si l’on ne contrôle pas tous les facteurs qui peuvent affecter la participation), les prévisions de participation seront biaisées, les IMR seront biaisés et on ne peut plus dire que la correction des erreurs a un sens évident. Il se peut qu’on corrige trop le biais et qu’on cache ainsi dans la 2e étape certains des effets réels du programme gouvernemental. Commentaire : le nombre de termes carrés dans la 1re équation (et non dans la 2e) paraît arbitraire. En pratique, Heckman propose l’inclusion de termes carrés, cubes et logarithmiques sans grande explication malgré le fait que cela semble fonctionner. On trouve dans un grand nombre d’études non contrôlées que la conclusion que le programme est efficace disparaît chaque fois qu’on utilise la méthode de Heckman. Peut-on dire que la méthode est supérieure en pratique ? Théoriquement, elle est sans faute, mais sa propre application dépend de la capacité de bien formuler (contrôle) l’équation de participation. Pour vérifier l’utilité pratique de la méthode de Heckman, les chercheurs commencent avec une vraie expérience aléée. Ainsi ils connaissent le vrai résultat. Ils se débarrassent des informations sur le groupe contrôle des non-participants et le remplace par un groupe de non-participants non contrôlés (différent du groupe expérimental). Ils appliquent la méthode Heckman à ce nouvel échantillon et ils trouvent que les résultats sont semblables aux vrais résultats mais très différents de ceux utilisant des régressions non- Heckman. Critique : les chercheurs connaissaient les vrais résultats et peut-être les ont-ils utilisé comme guide pour formuler une bonne équation de participation. Mais quand les vrais résultats sont inconnus, on se retrouve dans une situation où il faut formuler l’équation de participation au pif.

19 Quand on ne veut pas créer des groupes semblables par des méthodes quasi-expérimentales, on utilise la méthode Heckman. L’idée est de trouver la tendance de chaque personne à participer et d’utiliser ceci pour pondérer les résultats des participants et des non-participants. L’aléation fait en sorte que votre probabilité de vous trouver dans E ou C soit de 50%. Alors si on trouve des personnes avec une prob (E > 50%), on pondère leurs résultats vers le bas. Si une personne possède une prob (E<50%), on pondère le résultat vers le haut. Ceci enlève l’effet des déviations de participation de 50% de la différence finale calculée entre E et C. Le reste est une application de plusieurs étapes (2 étapes). Il faut être conscient de la critique de cette méthode : elle est potentiellement tout aussi arbitraire que n’importe quelle application de régression.

20 Devoir  Utilisez la banque de données WORKPROG.SAV 1.Faites une régression avec REVDIFF (incaft-incbef) comme variable dépendante et identifiez l’effet du programme. 2.Faites une correction par la méthode Heckman pour produire des résultats non biaisés. Comparez le résultat avec celui de la question 1. 3.Commentez les faiblesses potentielles de vos résultats à la question 2. 4.Expliquez votre choix de variables dans les 2 étapes du processus de Heckman. Expliquez pourquoi vos résultats changent entre l’équation de salaire formulée à la question 1 et celle à la question 2.

21


Télécharger ppt "ENP 7137 Module 10 Professeur Filip Palda. Introduction Objectif : comprendre la méthode de Heckman pour corriger les biais de sélection. Avec le logiciel."

Présentations similaires


Annonces Google