Échantillonnage (STT-2000) Section 3 Utilisation de variables auxiliaires. Version: 8 septembre 2003.

Slides:



Advertisements
Présentations similaires
L’échantillonnage & Ses Fluctuations
Advertisements

Résolution Graphique d'un Programme Linéaire
Base de sondage et Plan de sondage Pres. 5
Probabilités et statistiques au lycée
Echantillonnage Introduction
Collecte de données F. Kohler.
C1 Bio-statistiques F. KOHLER
Comparaison de deux moyennes observées
Inférence statistique
Les TESTS STATISTIQUES
Nombre de sujets nécessaires en recherche clinique
Les TESTS STATISTIQUES
1 Bases de sondages multiples et redressement des poids extrêmes Le cas de lenquête auprès des intervenants au domicile de personnes fragilisées (IAD –
Échantillonnage-Estimation
Probabilités et statistique en TS
Régression linéaire (STT-2400) Section 3 Tests dhypothèses et lhypothèse linéaire générale Version: 26 janvier 2007.
Méthodes de prévision (STT-3220)
Chapitre 2 Les indices.
Chapitre 10 : La veille mercatique et commerciale
Régression linéaire simple
Échantillonnage (STT-2000)
Groupe 1: Classes de même intervalle
Comprendre la variation dans les données: Notions de base
Corrélation et régression linéaire simple
Échantillonnage (STT-2000)
Régression linéaire (STT-2400)
Méthodes de prévision (STT-3220)
Méthodes de prévision (STT-3220) Section 4 Concepts fondamentaux de séries chronologiques Version: 8 novembre 2004.
Méthodes de prévision (STT-3220)
La corrélation et la régression
Le test t.
La corrélation et la régression
Le comportement des coûts Chapitre 3
Échantillonnage (STT-2000) Section 2 Tirage aléatoire simple (plan SI). Version: 22 août 2003.
Régression linéaire (STT-2400)
STT-3220 Méthodes de prévision Section 2 Modèle avec deux variances inconnues: Méthode reposant sur un test préliminaire Version: 21 janvier 2008.
Théorie de l’échantillonnage (STT-6005)
STT-3220 Méthodes de prévision
Régression linéaire (STT-2400)
STT-3220 Méthodes de prévision Section 5 Estimation de la fonction dautocovariance (k) et de la fonction dautocorrélation (k) Version: 11 décembre 2008.
Régression linéaire (STT-2400)
Échantillonnage (STT-2000) Section 2 Aspects spéciaux de léchantillonnage et de lestimation. Version: 7 septembre 2003.
Régression linéaire (STT-2400)
Méthodes de prévision (STT-3220)
Échantillonnage (STT-2000) Section 2 Tirage de Bernoulli (plan BE). Version: 4 septembre 2003.
Méthodes de prévision (STT-3220)
STT-3220 Méthodes de prévision
Échantillonnage (STT-2000)
Méthodes de prévision (STT-3220) Section 6 Exemple: Prévisions dans un modèle AR(1) Version: 18 décembre 2008.
Méthodes de Biostatistique
La régression simple Michel Tenenhaus
Programmation linéaire en nombres entiers
Échantillonnage (STT-2000)
Chapitre 12 Régression linéaire simple et corrélation linéaire
1 1 Licence Stat-info CM7 a 2004 V1Christophe Genolini Récapitulatif : Variables qualitatives Variables qualitatives : –on se demande si elles sont liées.
Gestion du portefeuille 07A – Modèle à facteurs
Gestion budgétaire des ventes
Outils d’analyse: la méthode des moindres carrées
Échantillonnage (STT-2000)
Échantillonnage (STT-2000) Section 5 Types d’erreur de sondage. Version: 22 août 2003.
Régression linéaire (STT-2400)
STT-3220 Méthodes de prévision Section 1 Évaluation des prévisions: Coefficient de Theil Version: 9 septembre 2004.
Échantillonnage (STT-2000)
STATISTIQUES.
Le modèle de régression linéaire Claude Marois © 2010.
Analyse des données. Plan Lien entre les statistiques et l’analyse des données Propagation des erreurs Ajustement de fonctions.
PROGRAMMATION SCIENTIFIQUE EN C PRO Approximation de fonctions et régression u Approximation linéaire –Méthode du moindre carré u Exemple.
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement.
ECHANTILLONAGE ET ESTIMATION
Jean-Michel FLOCH INSEE DAR 19 mai 2011 Territoires urbains: que peut dire le recensement ?
Transcription de la présentation:

Échantillonnage (STT-2000) Section 3 Utilisation de variables auxiliaires. Version: 8 septembre 2003

STT-2000; Échantillonnage 2 Notations Variable dintérêt: y. Variable auxiliaire: x. Objectif: Il est exactement le même quavant, cest-à-dire estimer ou encore Jusquà maintenant, lestimateur considéré est lestimateur Horvitz-Thompson

STT-2000; Échantillonnage 3 Base de sondage

STT-2000; Échantillonnage 4 Information auxiliaire Les valeurs x k sont supposées connues pour toute la population, avant de faire le sondage. Question: Peut-on améliorer nos estimations à laide de linformation auxiliaire? Autrement dit, au lieu de considérer Horvitz- Thompson, peut-on considérer un estimateur faisant intervenir les x k ?

STT-2000; Échantillonnage 5 Estimation du total t y On sélectionne s dans la base par un plan déchantillonnage p. On obtient: On observe: On se propose de remplacer par une autre méthode destimation. Autres choix possibles: – Estimateur par le ratio, – Estimateur par la régression.

STT-2000; Échantillonnage 6 Estimateur par le ratio Estimateur: Le total est connu. La quantité est calculable sur s.

STT-2000; Échantillonnage 7 Estimateur par la régression Lestimateur peut sécrire des deux façons suivantes: Lestimateur de la pente de régression de y k sur x k est

STT-2000; Échantillonnage 8 Remarque importante sur la disponibilité de linformation auxiliaire On a présumé que x 1,x 2,…,x N sont connues. Est-ce que cest absolument nécessaire de connaître tous les x k pour lensemble de la population? Si on regarde attentivement la forme de lestimateur par le ratio et lestimateur par la régression, on remarque que – nous avons en fait besoin de connaître le total t x de la variable x. Cette information pourrait provenir dun recensement, fichiers administratifs, etc. – Les y k et les x k disponibles pour les k dans léchantillon s, typiquement disponibles lors de la collecte des données.

STT-2000; Échantillonnage 9 Disponibilité de linformation auxiliaire (suite) En pratique, deux situations pourraient survenir: Premier cas: On connaît x 1,x 2,…,x N avant le sondage. Prendre s dans U = {1,2,…, N}. Observer ainsi les données du sondage sont

STT-2000; Échantillonnage 10 Disponibilité de linformation auxiliaire (suite et fin) Second cas: On connaît t x, le total de linformation auxiliaire, avant le sondage (mais on ne connaît pas individuellement x 1,x 2,…,x N avant le sondage). Prendre s dans U = {1,2,…, N}. Lors de la collecte, observer Les données du sondage sont

STT-2000; Échantillonnage 11 Horvitz-Thompson, ratio et régression pour tirage SI, k n/N. Horvitz-Thompson: Par le ratio: Par la régression:

STT-2000; Échantillonnage 12 Coefficient de corrélation Comme on va le voir, les estimateurs par le ratio et la régression trouvent leur justification à laide de modèles. Quand le modèle sera satisfaisant, ces estimateurs seront dautant plus performants (efficaces, avec faibles variances). Le lien linéaire entre y et x est mesuré par le coefficient de corrélation. Cette mesure est une quantité utile pour comparer ces estimateurs.

STT-2000; Échantillonnage 13 Coefficient de corrélation (suite) On a que par Cauchy-Schwartz.