Présentation 9 : Calcul de précision des estimateurs complexes

Slides:



Advertisements
Présentations similaires
Introduction à la notion de fonction 1. Organisation et gestion de données, fonctions 1.1. Notion de fonction ● Déterminer l'image d'un nombre par une.
Advertisements

Utilisation du logiciel EduStat © Analyse classique d’items L’examen du rapport.
Dr. Tarek Barhoumi statistiques descriptives Statistiques descriptives Dr. Tarek Barhoumi.
Application des lois de probabilité -Variable aléatoire discrète-
Approches de modélisation pour la répartition des coûts
Valeurs de toutes les différences observables sous H0
METHODE REALISER UNE ETUDE DES FLUX CLIENTS
Comprendre la définition de bit par seconde à partir
Reprise du cours ( ) Aujourd’hui :
1 - Construction d'un abaque Exemple
Chapitre 4: Variation dans le temps
Contribution: Revue des études, enquêtes et systèmes d’informations disponibles au niveau de l’INS, pour alimenter la méthode d’analyse et la cartographie.
Direction Régionale Tanger- Tétouan مديــرية جهــة طنجــة – تطــوان
Analyse temporelle des systèmes asservis
Chapitre 13 : Echantillonnage
Fonctions.
Principes de programmation (suite)
Exercice 6 :   En novembre 76 au Texas qui compte 25 millions d’habitants, l’avocat d’un inculpé a contesté la sélection des jurés : il y avait 79,1%
Une exploration des écarts menant à l’écart-type :
Les Plans d’expériences: Plans Factoriels
Plans d’expériences: Plans factoriels.
4.3 Estimation d’une proportion
3.4 Lois discrète 2 cours 15.
Méthode Taguchy Analyse de la variance Anavar
Stabilité des porteurs horizontaux (Poutres)
4.2 Estimation d’une moyenne
Méthode d’échantillonnage
Introduction aux statistiques Intervalles de confiance
Lois de probabilités Intervalle de fluctuation
Méthodologie scientifique
Pourquoi étudier la statistique ?
Deuxième partie LE DOSSIER TECHNIQUE DU MARINGOUIN.
LOG770 Annexe A Éléments de probabilité
Calculs des incertitudes Lundi 30 Avril 2018 Master de Management de la Qualité, de la Sécurité et de l’Environnement.
Chapitre 3 : Caractéristiques de tendance centrale
Notion de risque et mesures d’association
Adaptive Neuro Fuzzy Inference System (ANFIS)
4°) Intervalle de fluctuation :
Objectifs du chapitre 4: Mesures verbales en psychologie
Lois de Probabilité Discrètes
Lois de Probabilité Discrètes
Question flash TSTI2D.
Mesures simples & Objet en chute libre
Chapitre 4: Caractéristiques de dispersion
Programme d’appui à la gestion publique et aux statistiques
Présentation 3 : Sondage aléatoire simple
Présentation 5 : Sondage à probabilités inégales
Langages de programmation TP11
Présentation 8 : Redressement des estimateurs
BIO1130 LAB 4 MICROÉVOLUTION.
Présentation 4 : Sondage stratifié
Cartographie de la pauvreté : l’expérience du Burkina Faso
Jean-Sébastien Provençal
Reconnaissance de formes: lettres/chiffres
Exercice 6 :   En novembre 76 au Texas qui compte 25 millions d’habitants, l’avocat d’un inculpé a contesté la sélection des jurés : il y avait 79,1%
Présentation 7 : Sondage en grappe
Présentation 6 : Sondage à plusieurs degrés
Quoi regarder dans un graphique des moyennes ?
Calcul de précision dans le cas d’échantillons rotatifs: le cas des statistiques EU-SILC au Luxembourg 10e COLLOQUE FRANCOPHONE SUR LES SONDAGES, Lyon,
Programme d’appui à la gestion publique et aux statistiques
Exercice 3 : On prend deux groupes A et B de 105 et 95 malades, et on leur administre respectivement des médicaments C et D. Dans le groupe A, 76 personnes.
Analyse des données et complémentarité des sources
Laboratoire II: Le modèle linéaire général (GLM)
Audrey Gervereau, Métis, stage M2
Présentation des nouveaux programmes de mathématiques de première des séries technologiques Jessica Parsis.
INTELLIGENCE ARTIFICIELLE
Construire un graphique
Physique biomédicale : travaux pratiques
Dérivation – Fonctions cosinus et sinus
Transcription de la présentation:

Présentation 9 : Calcul de précision des estimateurs complexes Programme d’appui à la gestion publique et aux statistiques Sous-programme Statistiques (PAGPS/SPS) Atelier de formation sur les techniques d’échantillonnage et le calcul de précision des indicateurs Présentation 9 : Calcul de précision des estimateurs complexes Ousman KORIKO PAGPS/SPS 1 HTD

SOMMAIRE Introduction Indicateurs de précision Coefficient de variation Intervalle de confiance Calcul des variances des estimateurs complexes Méthode analytique ou de linéarisation Méthode de réplication d’échantillon

Introduction Il est important de s’assurer de la fiabilité des estimateurs qui sont calculés à partir des données d’une enquête. On distingue dans une enquête par sondage, les erreurs d’observation et les erreurs aléatoires. Les erreurs d’observation sont généralement difficiles à quantifier. Par contre, les erreurs aléatoires sont dues au plan de sondage mis en œuvre et sont quantifiables. Le calcul de précision des estimateurs se base ainsi sur la quantification des erreurs aléatoires.

Indicateurs de précision La précision d’un estimateur peut être mesurée soit par son coefficient de variation (CV) ou son intervalle de confiance (IC). En sondage, le CV rapporte l'écart-type de l'estimation du paramètre θ à la valeur de cette estimation, qu’il s’agisse de la moyenne, d’un total ou d’une proportion. Plus la valeur du coefficient de variation est faible, plus la précision de l'estimation est bonne

Indicateurs de précision : Coefficient de variation L’expression du CV d’un estimateur est : Selon Statistique Canada : 0% à 4,9%, excellent 5,0% à 9,9%, très bon 10,0% à 14,9, bon 15,0% à 24,9%, acceptable ; Plus de 25% précision faible.

Indicateurs de précision : intervalle de confiance Un intervalle de confiance permet de définir une marge d'erreur entre l’estimateur d’un paramètre calculé sur un échantillon aléatoire et sa vraie valeur inconnue mais qui concerne toute la population. Un intervalle de confiance (IC) à 95% est un intervalle dans lequel il y a 95% de chance de trouver la vraie valeur recherchée d’un paramètre

Indicateurs de précision : intervalle de confiance En règle générale, l’intervalle de confiance s’écrit  Ou Pour α=1, IC(θ) est défini à 68%. Pour α=2, IC(θ) est défini à 95% (c’est la pratique courante). Pour α=3, IC(θ) est défini à 99%.

Calcul de la variance d’un estimateur complexe Deux familles de méthodes de calcul de variance sont exposées dans ce chapitre. Il s’agit des méthodes analytiques ou de linéarisation et des méthodes de réplication.

Méthode analytique de calcul de la variance : cas des moyennes ou ratios La moyenne s’exprime comme un ratio de deux variables : R=X1/X2. L’estimateur du ratio R est le ratio des estimateurs de X1 et de X2  Par contre, la variance de l’estimateur de R n’est pas un simple rapport des variances des estimateurs de X1 et de X2

Méthode analytique de calcul de la variance : cas des moyennes ou ratios Il faut d’abord procéder à une linéarisation de l’expression de R à l’aide d’un développement limité d’ordre 1. Soit   On crée la variable Z au niveau de chaque enregistrement indicé par j : Ou encore, on calcule la variance de la variable Z telle que : en tenant compte du plan de sondage

Méthode analytique de calcul de la variance : cas des proportions La proportion est un cas particulier d’un ratio qui a à son numérateur, une constante non nulle et au dénominateur une variable Y. On écrit R = k/Y. L’estimateur de R est  On crée la variable Z au niveau de chaque enregistrement indicé par j : Ou encore, on calcule la variance de la variable Z telle que :

Méthode de réplication d’échantillon : le bootstrap Notons s l’échantillon de base, de taille n issu d’une population de taille N Etape 1 : on considère que l’échantillon s est représentatif de la population. On décide de substituer l’échantillon s à la population de départ, étant donné qu’il lui est similaire Etape 2 : on tire selon un plan de sondage aléatoire simple et avec remise dans l’échantillon s, des échantillons de taille n, avec i =1, …..k

Méthode de réplication d’échantillon : le bootstrap Etape 3 : Soit θ un paramètre estimé sur l’échantillon s par La variance de l’estimateur sur l’échantillon s est notée Par parallélisme, on note respectivement et L’estimateur du paramètre θ et la variance de l’estimateur sur chacun des échantillons Selon la loi des grands nombres, on estime que :

Méthode de réplication d’échantillon : le bootstrap Selon la loi des grands nombres, on estime que :

Méthode de réplication d’échantillon : le Jackknife Le jackknife est une méthode de ré- échantillonnage qui permet d’estimer la variance d’un estimateur complexe. À partir des années 70, cette méthode de rééchantillonnage a été "remplacée" par une méthode plus sophistiquée, le bootstrap. Soit un échantillon s de taille n permettant d’estimer un paramètre θ. Le principe du Jackknife consiste à estimer la même grandeur selon le même modèle avec (n- 1) observations de l’échantillon. On répète l’expérience n fois.  

Méthode de réplication d’échantillon : le Jackknife Puis on calcule la dispersion des différentes valeurs estimées de θ. De façon pratique, les étapes de calcul sont les suivantes  Etape 1 : Considérer le paramètre θ et son estimateur sur l’échantillon s de taille n. On écrit : Etape 2 : Calculer n pseudo-estimateurs sur le même modèle que en supprimant à chaque fois un individu parmi n tirés.

Méthode de réplication d’échantillon : le Jackknife On note l’estimateur du paramètre θ obtenu en supprimant l’observation j. Etape 3 : Calculer pour tout j = 1 à n, Etape 4 : Calculer l’estimateur Jackknife obtenu par l’expression Etape 5 : Estimer la variance de par :

MERCI DE VOTRE AIMABLE ATTENTION