1 Modélisation sur « petits domaines » pour des estimations régionales en France de métropole dans lenquête nationale sur les transports et déplacements.

Slides:



Advertisements
Présentations similaires
Système d’information d ’Etude, de Recueil et de recherche Automatique
Advertisements

Comprendre les nouvelles estimations de chômage
Les résultats de l’étude « OBÉSITÉ » menée auprès de patients adultes et de soignants : situation wallonne Pr. M. GUILLAUME C. CRUTZE – S. STREEL – AF.
FICHE TECHNIQUE Sondage effectué pour : Le Progrès
La pondération de l’enquête Sans Domicile 2012
France Journées de l’Afef – 1er octobre 2010
Les enquêtes ménages déplacements en France
Enquête auprès des dirigeants dentreprise de la ZONE économique Québec Chaudière-Appalaches Partenaire et commanditaire principal de lenquête.
STATISTIQUE INFERENTIELLE L ’ESTIMATION
1 La voix des usagers : un levier pour la transformation des services publics 9 La voix des usagers : un levier pour la transformation des services publics.
Eurobaromètre 77.2 Crise et gouvernance économique (V) Sondage commandité par le Parlement européen et coordonné par la Direction générale Communication.
Estimation ponctuelle Estimation par intervalle de confiance
Epifane Etude épidémiologique en France sur l’alimentation et l’état nutritionnel des enfants pendant leur première année de vie Taux d’allaitement à.
Epidémiologie et qualité de la prise en charge du diabète du sujet âgé
Organisation et gestion de données, fonctions
Les Prepositions.
ENQUETE ANNUELLE DENTREPRISES DANS LE SECTEUR DU COMMERCE (EXERCICE 2004) ROYAUME DU MAROC HAUT COMMISSARIAT AU PLAN DIRECTION DE LA STATISTIQUE.
Collecte de données F. Kohler.
Nombre de sujets nécessaires en recherche clinique
1. Les caractéristiques de dispersion. 11. Utilité.
Epidémiologie des cancers digestifs en France
Un exemple d’enquête multimode à l’Insee :
1 Bases de sondages multiples et redressement des poids extrêmes Le cas de lenquête auprès des intervenants au domicile de personnes fragilisées (IAD –
10 place de la Joliette, BP Marseille Cedex 02 Tél CENTRE DÉTUDES ET DE RECHERCHES SUR LES QUALIFICATIONS Pascale.
La santé au travail en Picardie
Analyse de la variance à un facteur
Sondage sur les préjugés Ensemble et l’association d'études canadiennes 20 mars, 2013 Une recherche novatrice sur le lieu, la fréquence et les différents.
La loi normale et l’estimation de paramètres
5 Verbes au passé composé 1.Jai eu avoir 2. Jai du devoir.
Janvier NOTORIETE, AUDIENCE ET IMAGE DES RADIOS CHRETIENNES Résultats densemble.
Partenariat LH2- ZDNet Sujet Omnibus Octobre Partenariat LH2-ZDNet.fr 7 ème Sujet Omnibus Septembre 2012.
Christelle Scharff IFI 2004
L’enquête sur la fréquentation dans les hôtels et les campings ; méthodologie et traitement de la réponse.
Application des algorithmes génétiques
Aide sociale et formation Incidence du niveau de formation sur linsertion professionnelle et sociale Journées suisses de la statistique 2009, Atelier 2.
Le soccer & les turbans Sondage mené par lAssociation détudes canadiennes 14 juin 2013.
1 SERVICE PUBLIC DE LEMPLOI REGION ILE DE France Tableau de bord Juillet- Août 2007.
Service Conseil Médical et Connaissance des handicaps Septembre Papa Abdou Population des personnes handicapées de plus de 60 ans dans les structures.
Secrétariat et coordination
Cours Corporate finance Eléments de théorie du portefeuille Le Medaf
Régression linéaire simple
Échantillonnage (STT-2000)
Accessibilité aux services et choix dun logement Le cas des acheteurs de résidences unifamiliales à Québec Jeanne Robin Marius Thériault François Des Rosiers.
Tableaux de distributions
1.Un rang de données multicolores 2. Deux permutations des n premiers entiers 3. b permutations des k premiers entiers 4. Choix de n points dans [0,1]
La corrélation et la régression
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Les modèles linéaires (Generalized Linear Models, GLM)
Corrélation Principe fondamental d’une analyse de corrélation
Notre calendrier français MARS 2014
Théorie… Inférence statistique: étude du comportement d’une population ou d’un caractère X des membres d’une population à partir d’un échantillon aléatoire.
Département des finances, des institutions et de la santé Service de la santé publique Etat de santé de la population valaisanne Rapport janvier.
Demande stochastique stationnaire
Échantillonnage (STT-2000) Section 2 Tirage de Bernoulli (plan BE). Version: 4 septembre 2003.
ECOLE DES HAUTES ETUDES COMMERCIALES RECHERCHE MARKETING Dr. KHERRI Abdenacer Mai
1 - Programme de Seconde (juin 2009) Statistique et probabilités
Premiers résultats de l’enquête 2011 France Lert, Inserm, CESP, Villejuif Mont-de-Marsan, 25 avril 2013.
Conférence de presse du 21 août 2014 Perspectives démographiques à horizon 2040 Le Valais et ses régions Maurice Tornay Chef du Département des finances.
CALENDRIER-PLAYBOY 2020.
6 Nombres et Heures 20 vingt 30 trente 40 quarante.
Les femmes sont davantage confrontées à la pauvreté Quels facteurs à l’origine de cette disparité ? N. Jourdan - INSEE 10/05/2011.
Les Vendéens et l’avenir du département Juin 2014.
Les Chiffres Prêts?
Rappels de statistiques descriptives
3. La structure du marché par couleur
Parentalité et déficience intellectuelle: Etat des lieux de la recherche et perspectives Luxembourg 9 octobre 2014  
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement.
ECHANTILLONAGE ET ESTIMATION
Transcription de la présentation:

1 Modélisation sur « petits domaines » pour des estimations régionales en France de métropole dans lenquête nationale sur les transports et déplacements (ENTD 2008) dans lenquête handicap-santé auprès des ménages (HSM 2008)

2 Lenquête nationale Transports et Déplacements de Population de référence : personnes âgées de 6 ans ou plus Mesure de la fréquence des déplacements selon : –le motif –le mode de transport utilisé –le jour de la semaine Durée des déplacements Distances parcourues

3

4 Lenquête nationale Transports et Déplacements de Échantillon de ménages répondants en métropole Ile de France et Pays de Loire : échantillons régionaux exploitables (5400 et 2600 répondants) Languedoc-Roussillon, Bretagne,Midi-Pyrénées : un millier de répondants dans chaque région Autres régions : estimateurs Horvitz-Thomson directs non publiables

5 ENTD 2008 : le modèle de comportement Yk=nombre de déplacements du ménage Xk=zone de résidence du ménage (taille dagglomération * centre ou périphérie) type de ménage (structure familiale) nombre de voitures du ménage CSP du chef de ménage nombre de personnes du ménage par sexe*âge nombre de personnes du ménage par CSP

6 ENTD 2008 : le modèle de comportement

7 ENTD 2008 : les méthodes destimation testées Estimateur par calage sur des totaux régionaux avec : Estimateur synthétique par régression avec : Estimateur indirect avec modélisation explicite : modèle avec la région en effet aléatoire

8 ENTD 2008 : mode de validation des résultats Sauf pour lestimateur direct, pas destimateur sans biais de la variance des estimateurs « petits domaines » Régions avec extension déchantillon=zones tests Recouvrement de lestimateur « petit domaine » par lintervalle de confiance à 95 % de lestimateur direct

9 Temps passé dans les déplacements un jour de semaine par habitant Région estimateur direct borne inf. de l'IC estimateur direct (poids nationaux) estimateur direct borne sup. de l'IC estimateur synthétique par régression : Yr=b*Xr b France estimateur synthétique par régression : Yr=a*Xr a province estimateur par modèle mixte effet régional aléatoire Ile de France Pays de la Loire Bretagne Midi-Pyrénées Languedoc-Roussillon

10 régions sans extension

11 Déplacements professionnels : fréquence journalière par habitant Région estimateur direct borne inf. de l'IC estimateur direct (poids nationaux) estimateur direct borne sup. de l'IC estimateur synthétique par régression : Yr=b*Xr b France estimateur synthétique par régression : Yr=a*Xr a France estimateur par modèle mixte effet régional aléatoire Ile de France Pays de la Loire Bretagne Midi-Pyrénées Languedoc-Roussillon

12

Josiane Le Guennec13 Lenquête Handicap-Santé de enquêtes auprès des personnes handicapées : –celles vivant à leur domicile (« ménages ordinaires »)-> HSM –celles résidant en institutions-> HSI Estimations sur « petits domaines » à partir de la 1 ère enquête HSM seule

14 Lenquête HSM 2008 Enquête en deux phases Première phase : vie quotidienne et santé (VQS) –Objectif : repérer les personnes présumées handicapées –Gros échantillon : > personnes répondantes en métropole –Voie postale, avec relances par téléphone ou par enquêteur –Questionnaire : 1 feuille recto-verso avec 1 colonne par membre du ménage questions simples sur les difficultés ressenties réponses par (oui,non) ou (pas de difficultés, quelques difficultés, beaucoup de difficultés)

15 Lenquête HSM 2008 Deuxième phase HSM : –Échantillon stratifié en 4 groupes construits à partir des réponses au questionnaire VQS, avec taux de sondage croissant de la strate1 à la strate 4 Strate 1 : personnes présumées en bonne santé … Strate 4 : personnes présumées handicapées –Enquête en face à face –Questionnaire très détaillé recueillant des données factuelles (la personne fait ou ne fait pas, …) –26400 personnes répondantes en métropole

16 La méthode destimation sur « petit domaine » Strate 2 Strate 3 Strate 4 VQS HSM observé imputé observé Modèle = F(x k ) Strate 1

17 Estimateur de domaine Deux déclinaisons –somme des valeurs prédites dans tout VQS : –somme dans VQS des prédictions et des valeurs observées dans HSM :

18 Estimateur de domaine EQM de lestimateur direct Horvitz-Thomson : –EQM=variance (estimateur sans biais) –Variance : EQM de lestimateur modélisé : –EQM=variance + biais 2 –Variance = variance de sondage due à léchantillonnage de première phase (incluant la variance du coefficient de régression, estimé sur échantillon) => réduite si la part de la 2 ème phase dans la variance totale est importante

19 Les variables estimées par région et département Prévalence du « handicap » (déficience + altération fonctionnelle connexe) : –par genre : sensoriels (auditifs et visuels) moteurs cognitifs –selon lâge : population de 20 à 59 ans population de 60 ans ou plus Prévalence des personnes âgées dépendantes : –part de la population de 60 ans et plus appartenant aux GIR 1 à 4

20 Le modèle –le modèle estime une probabilité dêtre reconnu handicapé ou dépendant dans le questionnaire médical de 2 ème phase, en fonction de létat de santé ressenti déclaré en 1 ère phase –les facteurs « explicatifs » sont recherchés parmi : les réponses au questionnaire VQS de 1 ère phase les critères sociodémographiques présents dans la base de sondage ou relevés dans les deux phases –régression logistique mixte avec le département en effet aléatoire pour lindividu i résidant dans le domaine d :

21 Le modèle : facteurs fixes Les réponses à lenquête VQS de 1 ère phase : quatre groupes de questions –difficultés sensorielles (voir de près, de loin, entendre) –difficultés de mobilité (marcher, se baisser, attraper en hauteur, se servir de ses mains) –difficultés intellectuelles (mémoriser, comprendre, communiquer, prendre des initiatives, être autonome) –avoir besoin dune aide technique (prothèse…) ou humaine (aidant régulier) dans la vie quotidienne, ne pas pouvoir réaliser une activité, se sentir handicapé, avoir une reconnaissance officielle dun handicap

22 Le modèle : facteurs fixes Critères sociodémographiques significatifs : –lâge au-delà de 60 ans –le sexe (handicaps par type des personnes âgées, limitations dactivité)

23 Critères de validation des résultats 4 départements témoins : Nord, Pas-de-Calais, Rhône, Hauts de Seine, qui ont réalisé une extension déchantillon à chaque phase Comparaison de lestimateur direct HT à la somme des valeurs prédites sur des niveaux agrégés : France entière, régions Distribution des domaines selon lestimateur HT et lestimateur modélisé : régression de sur Part de la variance de 2ème phase dans la variance totale de lestimateur direct Horvitz-Thomson

24 Les résultats Les deux méthodes de calcul donnent des résultats presque identiques France entière, écart relatif entre prévalence prédite et estimation directe de lenquête HSM inférieur à 3 %. Lestimateur prédit est inclus dans lIC à 95 % de. Différence absolue entre la proportion estimée par lenquête et celle prédite par le modèle inférieure à 1 dans au moins la moitié des régions pour tous les indicateurs calculés, à 2 dans 80 % des régions Départements témoins : lécart relatif entre lestimation directe et la valeur prédite ne dépasse pas 10 %

25 France de métropole

26 départements témoins : écart entre estimateur direct et estimateur prédit

27 Limitations sensorielles dans la population de 20 à 59 ans Equation de régression : prévalence prédite = * estimation directe

28 Limitations motrices dans la population de 20 à 59 ans Equation de r é gression : pr é valence pr é dite = * estimation directe Sans la Corse et la Loire : pr é valence pr é dite = * estimation directe

29 GIR 1 à 4 dans la population de 60 ans ou plus Equation de régression : prévalence prédite = * estimation directe

30 Publication des estimations départementales Règle de décision : Coefficient de variation de lestimateur direct en phase VQS < 20 %: prévalence départementale prédite publiée sans restriction Coefficient de variation de lestimateur direct en phase VQS compris entre 20 % et 30 % : prévalence départementale prédite publiée avec avertissement De 25 (GIR 1 à 4) à 34 (handicaps moteurs des ans) départements ont été publiés