STATISTIQUE INFERENTIELLE L ’ESTIMATION

Slides:



Advertisements
Présentations similaires
Intervalles de confiance
Advertisements

Introduction aux statistiques Intervalles de confiance
L’échantillonnage & Ses Fluctuations
Probabilités et statistiques au lycée
Estimation ponctuelle Estimation par intervalle de confiance
Les tests d’hypothèses (I)
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Echantillonnage Introduction
Inférence statistique
Inférence statistique
Comparaison d'une distribution observée à une distribution théorique
Variable aléatoire, estimation ponctuelle et par intervalle
Echantillonnage Professeur Francis GUILLEMIN > Ecole de santé publique - Faculté de Médecine.
Les TESTS STATISTIQUES
Tests de comparaison de pourcentages
Nombre de sujets nécessaires en recherche clinique
Les TESTS STATISTIQUES
Échantillonnage-Estimation
Dr DEVILLE Emmanuelle J D V 12/07/2006
Les tests d’hypothèses
Probabilités et statistiques en première S, ES, L
Régression -corrélation
variable aléatoire Discrète
Probabilités et statistique en TS
Intervalle de confiance pour p en %
La loi normale et l’estimation de paramètres
AUTOUR DE LA LOI NORMALE
Lectures Volume obligatoire: Chapitre 8
2. Expériences aléatoires et modélisation
Statistiques et Probabilités au lycée
Tests de comparaison de moyennes
Méthodes de Biostatistique
« 90% de nos trains arrivent à lheure! ». énoncé exercice : « Le retard sur un trajet train de 6h15 Marseille-Paris est en moyenne: 10mn avec écart type.
1 - Construction d'un abaque Exemple
Nombre de sujets nécessaires en recherche clinique
Régression linéaire simple
Échantillonnage (STT-2000)
Comprendre la variation
Groupe 1: Classes de même intervalle
Comprendre la variation dans les données: Notions de base
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Théorie… Inférence statistique: étude du comportement d’une population ou d’un caractère X des membres d’une population à partir d’un échantillon aléatoire.
ÉCHANTILLONNAGE AU FIL DES PROGRAMMES Stage : nouveaux programmes de première Novembre 2011.
Lectures Volume du cours : Chapitre 7
Les intervalles de confiance pour la moyenne d’une population
1 - Programme de Seconde (juin 2009) Statistique et probabilités
Méthodes de Biostatistique
ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage
Biostatistiques Quand on souhaite étudier une (ou des) caractéristique(s) sur un ensemble d’individus ou d’objets, il est difficile, voir impossible, d’observer.
Théorème de la limite centrale l’inférence statistique
La régression simple Michel Tenenhaus
Intervalles de confiance pour des proportions L’inférence statistique
Échantillonnage (STT-2000)
Concepts fondamentaux: statistiques et distributions
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Rappel de statistiques
Intervalles de fluctuation et de confiance. Dans une population, la proportion d’individus ayant un caractère donné est notée p Population.
Échantillonnage (STT-2000)
LOI NORMALE LOI STUDENT ECHANTILLONS ET TESTS DE MOYENNE
Probabilités et statistique MQT-1102
ECHANTILLONAGE ET ESTIMATION
Formation Green Belt Lean Six Sigma
Introduction aux statistiques Intervalles de confiance
UED SIM – Département OLCI Année Arts & Métiers ParisTech CER ANGERS Probabilités et statistiques Cours n° 2.
Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.
Seconde 8 Chapitre 10: Echantillonnage M. FELT 1.
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
Bienvenue au cours MAT-350 Probabilités et statistiques.
Transcription de la présentation:

STATISTIQUE INFERENTIELLE L ’ESTIMATION

UN EXEMPLE Montant quotidien des dépôts en liquide dans la banque Ibardinescroak de Saint Jean de Luz. 500 5000 10 000 8000 Comment obtenir une information sur la distribution des dépôts, sur le montant du dépôt moyen, etc….?

UNE SOLUTION SIMPLE Observer tous les dépôts 500 5000 10 000 8000 MAIS IMPOSSIBLE A METTRE EN ŒUVRE …... car le nombre N d’observations est très grand, voire infini!

Statistique descriptive UNE AUTRE SOLUTION On observe un échantillon, c.à.d. une partie de la population 500 5000 10 000 8000 échantillon Statistique descriptive

INTERET DE LA STATISTIQUE DESCRIPTIVE Construction d’un modèle théorique 500 5000 10 000 8000 Echantillon Montant des dépôts Fréquence Dépôt moyen = 7500 € écart-type des dépôts = 2500 €

INTERET DE LA STATISTIQUE DESCRIPTIVE Servir de base à la construction d’un modèle théorique Pourquoi ? Pour faire de la prévision: Quelle quantité de monnaie acheter à la Banque de France en début de semaine? Quelle quantité de liquide va-ton pouvoir faire transiter par la Suisse ?…..

UN MODELE MATHEMATIQUE X = Montant quotidien des dépôts est une variable aléatoire de loi Normale de moyenne E(X) = m de variance V(X) = s² Test d’ajustement : On verra plus tard... 3 affirmations à vérifier Estimation

ESTIMATION DE LA MOYENNE m Comment avoir une idée sur la valeur de la moyenne m ? 1) Prendre rendez-vous avec Irma la voyante Problèmes: ça va me coûter cher. Puis-je lui faire confiance ? 2) Utiliser l’intuition et quelques notions de probabilités Problème: je n’ai rien compris aux probas C’est pas grave car on ne va plus s’amuser à jeter des dés ou tirer des cartes... Avantage: je pourrai préciser la confiance à apporter à mon résultat

UNE METHODE INTUITIVE D’ESTIMATION DE LA MOYENNE Pour estimer la moyenne m inconnue de la population on utilise la moyenne x de l’échantillon. Est-on sûr de faire mieux qu’Irma ?

UNE METHODE INTUITIVE D’ESTIMATION DE LA MOYENNE On observe n dépôts x1,….,xn sur un échantillon et on en fait la moyenne va-t-elle être proche de m inconnue? Loi de Et si j’insiste lourdement ? m Pas mal… mais que se serait-il passé si j’avais pris un autre échantillon ? Moins bien…. Et un autre ? Théorème fondamental: Si X est une v.a. de moyenne m et d’écart-type s, alors la v.a. moyenne, notée , obtenue sur un échantillon de taille n tend vers une Pourquoi les observations de sont-elles concentrées autour de la moyenne inconnue m ?

Fiabilité Probabilité Prendre une décision à partir d’un échantillon, est-ce vraiment fiable ? m Précision Fiabilité Probabilité Quelle est la probabilité que la moyenne inconnue m se trouve pas trop loin de observée ? Il y a 1-a = 95 chances sur 100 que l’intervalle contienne m

UN PEU…….. DE PROBAS…. suit une loi , donc suit une N(0,1) Table u = environ 2 (1,96) P[-u < < u] = 1-a = 0,95 P[-us < -m < us ] = 1-a P[- -us < -m < -X+us ] = 1-a P[ +us > m > -us ] = 1-a P[ - us < m < +us ] = 1-a Il y a 1-a chances que la moyenne inconnue m appartienne à l’intervalle aléatoire

UN PEU…….. DE PROBAS…. FIN Il y a 95 chances sur 100 que la moyenne inconnue m appartienne à l’intervalle aléatoire m Une observation aléatoire nous donne la valeur de . Une autre observation nous aurait donné une autre valeur , ……. et donc un autre intervalle …. qui ne contient pas forcément m Si on peut prendre une infinité d’échantillons, 95% des intervalles contiennent m On dira (pour simplifier) que la moyenne inconnue m a 95 chances sur 100 d’appartenir à l’intervalle numérique

Fiabilité et précision l’intervalle a 1-a chances de contenir m précision fiabilité P[-u < < u] = 1-a 1-a et u sont liés par la relation P[-u < N(0,1) < u] = 1-a Fiablité augmente u augmente Précision diminue 1 - a -u u

On a une forte probabilité que l’observation soit dans cette zone Pour quelles raisons utiliser la moyenne de l’échantillon pour estimer la moyenne de la population ? 1) Pour des raisons intuitives 2) Pour des raisons théoriques Variable T quelconque m On a une forte probabilité que l’observation soit dans cette zone pour m Pour T est un estimateur convergent Plus la taille de l’échantillon grandit plus la variance diminue. Pour n infini, l’observation tombe forcément sur m. est un estimateur sans biais

RESUME SUR L’ESTIMATION D’UNE MOYENNE RESUME SUR L’ESTIMATION D’UNE MOYENNE d’une population Normale de variance connue RESUME SUR L’ESTIMATION D’UNE MOYENNE Pour estimer la moyenne d’une population, on utilise la moyenne de l’échantillon Estimation ponctuelle Pour avoir une idée de la fiabilité et de la précision du résultat on utilise un intervalle de confiance avec u défini par P[-u < N(0,1) < u] = 1-a Estimation par intervalle de confiance précision Coefficient de confiance Détermination de la taille d’échantillon pour une précision et un coefficient de confiance donnés On veut que l’intervalle soit de la forme , donc et

ESTIMATION PONCTUELLE DE LA VARIANCE s² 1) Pour des raisons intuitives Il est naturel d’estimer la variance d’une population, par la variance de l’échantillon On estime la variance d’une population par la variance corrigée de l’échantillon, notée aussi s². 2) Pour des raisons théoriques Pourquoi ? est un estimateur sans biais de s² est un estimateur convergent de s²

D’où un intervalle de confiance ESTIMATION PAR INTERVALLE DE CONFIANCE DE LA VARIANCE s² D’UNE POPULATION NORMALE (n-1) S² s² suit une loi de c² à (n-1) d.d.l. Table a et b (> 0) pour 1-a donné D’où un intervalle de confiance

RESUME SUR L’ESTIMATION D’UNE VARIANCE Pour estimer la variance s² d’une population, on utilise la variance corrigée s² de l’échantillon Estimation ponctuelle Pour avoir une idée de la fiabilité et de la précision du résultat on utilise un intervalle de confiance avec a et b définis par Estimation par intervalle de confiance

ESTIMATION PONCTUELLE D’UNE PROPORTION Dans la population il y a une proportion p d’individus possédant un certain caractère. 1) Pour des raisons intuitives Il est naturel d’estimer la proportion p d’une population par la proportion f de l’échantillon 2) Pour des raisons théoriques F, proportion d’échantillon, est une v.a. qui tend vers une loi F est un estimateur sans biais de p F est un estimateur convergent de p

INTERVALLE DE CONFIANCE D’UNE PROPORTION F tend vers une , ou encore est à peu près une N(0,1) dès que n > 100 et 0,1 < p < 0,9 Table u pour 1-a donné p (dans les bornes de l’intervalle aléatoire) étant inconnu, il est approché par une estimation f, d’où un intervalle de confiance

pour n > 100 et 0,1 < f < 0,9 (sinon utiliser un abaque) RESUME SUR L’ESTIMATION D’UNE PROPORTION Pour estimer la proportion p d’une population, on utilise la proportion f de l’échantillon Estimation ponctuelle Pour avoir une idée de la fiabilité et de la précision du résultat on utilise un intervalle de confiance avec u défini par P[-u < N(0,1) < u] = 1-a pour n > 100 et 0,1 < f < 0,9 (sinon utiliser un abaque) Estimation par intervalle de confiance Détermination de la taille d’échantillon pour une précision et un coefficient de confiance donnés On veut que l’intervalle soit de la forme , donc et

ESTIMATION PONCTUELLE : UNE CONCLUSION X de loi quelconque de moyenne E(X) = m , de variance V(X) = s² s² La moyenne de l’échantillon est une bonne estimation de la moyenne m de la population La variance corrigée s² de l’échantillon est une bonne estimation de la variance s² de la population Proportion p d’un caractère f La proportion f de l’échantillon est une bonne estimation de la proportion p de la population

INTERVALLE DE CONFIANCE D’UNE MOYENNE: EXTENSIONS Pour obtenir un intervalle de confiance de la moyenne nous avons supposé (sans le dire) que La taille d’échantillon est grande La variance s² est connue ( ce qui en pratique est très rare ) Le taux de sondage n/N est faible ( <10% ) Que peut-on faire si ces conditions ne sont pas respectées ?

INTERVALLE DE CONFIANCE D’UNE MOYENNE EXTENSIONS Loi de Student à (n-1) d.d.l.qui est approximativement N(0,1) pour n > 30 Dans ce tableau, on suppose que l’échantillon est prélevé avec remise, ou que l’échantillon est prélevé sans remise et le taux de sondage n/N <10 % Dans le cas d’un échantillon prélevé sans remise, et un taux de sondage n/N >10 %, on multiplie s ou s par le facteur d’exhaustivité Ce correctif doit aussi être apporté pour un intervalle de confiance d’une proportion