ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage 4. Intervalle de confiance
Estimation Principe L’estimation est le procédé par lequel on estime les valeurs de paramètres de la population à partir des observations faites dans un échantillon grâce à un estimateur. m s2 p n _ x • Estimation : Lorsque l’estimation est faite, on détermine la précision de l’estimation • Intervalle de confiance de m et de p
Estimateur Un estimateur est une variable aléatoire qui sert à estimer le paramètre q • Absence de biais = justesse : E() = q Peut dépendre de n : par exemple S2 est un estimateur biaisé de s2, mais S2 est asymptotiquement sans biais • Précision : mesurée par l ’erreur quadratique moyenne • Convergence : si C’est notamment le cas si E() = q et si
Estimateur Estimateur de μ Ech. Population, variable X loi (m,s) Ech. VA x1 X1 x2 X2 … … … ... xi Xi xn Xn Population, variable X loi (m,s) Ech. On a X1, X2, … : loi (m,s) avec : E(Xi)=m et V(Xi)=s2
Estimateur Estimateur de μ L’estimation de μ est : C’est la moyenne de l’échantillon
Estimateur Estimateur de 2 Ech. Population, variable X loi (m,s) Ech. VA x1 (x1- )2 X1 x2 (x2- )2 X2 … … … ... xi (xi- )2 Xi xn (xn- )2 Xn s2 Population, variable X loi (m,s) Ech.
Estimateur Estimateur de 2 L’estimation de 2 est : Ce n’est pas la variance de l’échantillon
p Estimateur Estimateur de p X ~ B(n, p) p = proportion d’individus porteurs d’un caractère dans la population NB : au niveau individuel p = probabilité de présence du caractère X = nombre d’individus portant le caractère parmi n Population, p Ech. X ~ B(n, p) Ech. VA x X x = nombre d’individus portant le caractère dans l’échantillon
Estimateur Estimateur de p L’estimation d’une proportion est : C’est la proportion dans l’échantillon
Fluctuation d’échantillonnage Distribution d’échantillonnage Fluctuation d’échantillonnage Ech. 1 Population, variable X loi (m,s) p tirages aléatoires et indépendants Ech. 2 ≠ ... Ech. p Les p moyennes observées sont des réalisations de la variable aléatoire
Distribution d’échantillonnage de la moyenne
Distribution d’échantillonnage de la moyenne X (n=50)
Distribution d’échantillonnage de la variance On étudie toujours X : loi (m,s) : dans les p échantillons, les variances observées sont des réalisations de la variable S2 Loi de S2 : démonstration de Fisher : En développant : Or :
Distribution d’échantillonnage de la variance Donc : = nU2 - U2 = (n-1)U2 suit une loi de C2 à n-1 ddl
Distribution d’échantillonnage Distribution d’échantillonnage d’une proportion
Intervalle de confiance Principe Connaissant la distribution de l’estimateur Θ, on a une certaine confiance (1-) qu’un intervalle autour de , contienne θ Cet intervalle, noté ou plus généralement et appelé intervalle de confiance de θ, est tel que :
Intervalle de confiance de la moyenne X~N(,) et 2 connue On cherche i tel que : On montre que cela revient à : Or, si X normale ou si n ≥ 30 :
Intervalle de confiance de la moyenne ea 1-a a/2 -ea Donc, D’où :
Intervalle de confiance de la moyenne X~N(,) et 2 inconnue Or, 2 inconnue
Intervalle de confiance Intervalle de confiance de la moyenne et : C2 à (n-1) ddl Par définition de la loi de T : D’ou :
Intervalle de confiance Intervalle de confiance de la moyenne Si n est grand, le théorème central limite s’applique et la loi de student tend vers la loi normale donc:
Intervalle de confiance Intervalle de confiance d’une proportion On cherche i tel que : On montre que cela revient à : Si n grand: D’où:
Intervalle de confiance Intervalle de confiance d’une proportion Or, p inconnue