1 Bases de sondages multiples et redressement des poids extrêmes Le cas de lenquête auprès des intervenants au domicile de personnes fragilisées (IAD – 2008)
2 Plan de la présentation Protocole denquête Le partage des poids Les premières pondérations Technique de troncature des poids extrêmes
3 Protocole denquête
4 Champ de lenquête Intervenants au domicile de personnes âgées, handicapées, ou de toute autre personne nécessitant de laide de façon temporaire ou durable dans les actes essentiels de la vie quotidienne Trois modes dexercice possibles : Prestataire Mandataire Emploi direct
5 Sélection des intervenants (1) Intervenants en emploi direct Intervenants en emploi mandataire Intervenants en emploi prestataire
6 Couverture commune Sélection des intervenants (2) Base IRCEM Base ANSP
7 Sélection des intervenants (3) passation des questionnaires Questionnaire organismes ANSPANSP IRCEMIRCEM Questionnaire téléphonique des intervenants : Sélection des intervenants auprès de personnes fragiles Questionnaire en face à face des intervenants auprès de personnes fragiles
8 Le partage des poids
9 Principe Constat : on ne connaît pas le recouvrement des bases de sondage Principe : compter les liens entre les deux bases Pour chaque individu tiré Au moment de linterview Diviser le poids total de chaque individu par le nombre de fois où il aurait pu être tiré
10 Dans notre cas… Intervenants en emploi direct exclusif Base IRCEM uniquement Pas de doublon (L i =1) Intervenants en emploi prestataire exclusif Base ANSP uniquement Doublons possibles (si plusieurs organismes) [L i 1] Intervenants en mode mandataire Bases IRCEM ou ANSP Pas de doublon dans la base IRCEM mais doublons possibles dans la base ANSP (si plusieurs organismes) L i 2
11 De façon un peu plus formelle Liens IRCEMLiens ANSP
12 Les premières pondérations
13 Les intervenants de la base IRCEM Tirage à deux degrés et stratifié Départements (PPT) Intervenants (SAS stratifié) Redressements par deux calages successifs Linterview téléphonique (taux de réponse : 30%) Linterview en face à face (taux de réponse : 79%)
14 Les intervenants de la base ANSP Tirage à 3 degrés stratifié Département (PPT) Organismes (PPT et SAS stratifiés) Intervenants (Systématique) Redressements par trois calages successifs Les organismes (taux de réponse : 30%) Linterview téléphonique (taux de réponse : 77%) Linterview en face à face (taux de réponse : 82%)
15 Ça se corse… Ouïe…
16 Le cas des poids extrêmes : que sest-il passé ?
Le cas décole (1) Tirage du 1 er degré : Tirage du 2 nd degré : Tirage du 3 ème degré : 17
Le cas décole (2) Au final : La dispersion ne vient que du redressement de la non réponse totale 18
Ce quil sest passé : information incomplète… La base de sondage ne contenait que des effectifs salariés des organismes (i.e. en mode prestataire) … ce qui pose problème, sauf dans des cas très particuliers En effet, si lon pose : 19
… et imparfaite Les effectifs salariés pouvaient dater de plusieurs années… … dans un contexte institutionnel particulièrement mouvant : 1,18 millions de salariés dans le secteur des services à la personne en ,28 millions en ,32 millions en
21 Régler le problème des poids extrêmes Idée : tronquer les poids les plus élevés Les contraintes : La taille de la population estimée doit rester la même Minimiser les écarts destimation par rapport à la pondération initiale (sans biais) Analyse des écarts absolu et relatif des estimateurs Analyse de lerreur quadratique moyenne
22 La solution de Potter (1990) Problème : 1 ère contrainte non satisfaite avecsi, 0 sinon
23 Garder le principe 1. on garde la forme générale 2. en incluant la contrainte 3. soit
24 Au final Problème : on a des poids supérieurs à Solution : recommencer la troncature en remplaçant par réitérer lopération jusquà vérifier avecsi, 0 sinon
25 Intégrer la troncature dans la pondération 1. Redresser léchantillon par calage 2. Tronquer les poids 1. À partir des centiles des poids initiaux dans lenquête IAD 2. Regarder lévolution de lEQM et des biais relatif et absolu en fonction de la troncature considérée 3. Re-caler léchantillon en fonction : 1. Des premières variables de calage 2. Des variables dintérêt (en prenant comme estimateurs sans biais ceux calculés avec la pondération issue du premier calage)
Exemple dapplication (1) 26
27 Exemple dapplication (2)