La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Description et estimation

Présentations similaires


Présentation au sujet: "Description et estimation"— Transcription de la présentation:

1 Description et estimation
Étude d’une variable numérique, Étude d’une moyenne

2 Cas Rola-Cola n = 40 personnes Boisson préférée 1 = Rola-Cola
2 = Koka-Cola Achat préalable de Rola-Cola 1 = oui 2 = non Goût Sucre 2= indifférent 3 = non

3 Définitions N = Taille de la population
Population : Ensemble des individus (objets de l’étude) auxquels on s’intéresse. N = Taille de la population Échantillon : Une partie de la population n = Taille de l ’échantillon Échantillon représentatif : - Chaque individu de la population a exactement la même probabilité d’appartenir à l ’échantillon. - La taille n de l’échantillon est suffisamment élevée Elle dépend de l’homogénéité de la population et de la précision souhaitée.

4 Étude d’une variable numérique X
Une variable numérique X prend des valeurs x1,…, xi,…, xN sur une population et x1,…, xi,…, xn sur un échantillon. Elle est résumée par des statistiques de tendance centrale (moyenne, médiane) et de dispersion (variance, écart-type). La dispersion de X est visualisée par la boîte-à-moustache et l’histogramme.

5 Moyenne et écart-type

6 Commentaire 1) Plus la taille n de l’échantillon est grande,
alors plus les chances que soit proche de  sont élevées. 2) Plus l’écart-type s est petit,

7 Rola-Cola : Résultats statistiques

8 Propriétés des estimations de  et 2
* (u1,…, un) * (x1,…, xn) Ensemble de tous les échantillons possibles S2

9 Médiane M La médiane M partage l’échantillon ordonné en deux parties égales

10 Échantillon Rola-Cola ordonné
Consommation de boisson NUMÉRO au cola ________ ____________ Consommation de boisson NUMÉRO au cola ________ ____________

11 Quartiles Q1, Q2, Q3 Les quartiles Q1, Q2, Q3 partagent l’échantillon ordonné en quatre parties égales Q3 Q2 = M Q1 25% 25% 25% 25%

12 Rola-Cola : Boîte-à-Moustache
Médiane Q1 Q3 Minimum Maximum

13 Détection des observations atypiques (Outliers)
La longueur de chaque moustache doit être inférieure à Exemple : Max = 13 (Obs n°12) remplacé par Max = 15

14 Rola-Cola : Boîte-à-moustache multiple
La consommation de boissons au cola ne semble pas dépendre pas du goût pour le sucre. La consommation de chips dépend de la boisson préférée.

15 Rola-Cola: Histogramme

16 Rola-Cola : Graphique des histogrammes
La consommation de boissons au cola ne dépend pas du goût pour le sucre. La consommation de chips dépend de la boisson préférée.

17 Rola-Cola : Graphique des histogrammes
La consommation de boissons au cola ne dépend pas du goût pour le sucre. La consommation de chips dépend de la boisson préférée.

18 Loi normale (ou de Laplace-Gauss)

19 LAPLACE à Beaumont-en-Auge

20 Loi normale (ou de Laplace-Gauss)

21 Loi normale N(,) Une variable aléatoire X suit
une loi normale N(, ) si, pour toute valeur de x, x Résultats : - Moyenne de X =  - Variance de X = 2 - 95% des valeurs de X sont comprises entre   et  

22 Exercice 1 Soit X la durée du trajet Paris-HEC à 7 heures du matin.
On suppose que X suit une loi normale N(,). En général, la durée du trajet est comprise entre 30 et 50 minutes. Déterminer la moyenne  et l’écart-type .

23 Précision de l’estimation
Quel est l’ordre de grandeur de l’écart entre et  auquel on peut s’attendre ? Quelle est la précision de l’estimation de la moyenne de la population  à l’aide de la moyenne empirique ?

24 Un résultat très utile S2 * * s2 Ensemble de tous les échantillons
(u1,…, un) * (x1,…, xn) S2 s2 Ensemble de tous les échantillons possibles

25 Loi de Student Si X  N(, ) alors :
Gosset ( ) invented the t -test to handle small samples for quality control in brewing while working at Guiness in Dublin. He wrote under the name "Student". Si X  N(, ) alors : suit une loi de Student à n-1 degrés de liberté [notée t(n-1)].

26 Exercice 2 Soit X la consommation de boisson au cola.
La population étudiée est disponible dans le fichier « rola-cola population.sav » Visualiser l’histogramme et la loi normale associée à cette population. On suppose que X suit une loi normale N(,). Donner les valeurs de  et . Tirer un échantillon de taille 40. Calculer la moyenne et l’écart-type de l’échantillon et la statistique t.

27 Fractile de la loi de Student
Calculer (Table 4) : - t0.975(39) = - t0.975() = 1- Loi t(n-1) =

28 Fractiles de la loi de Student

29 Intervalle de confiance de la moyenne  au niveau 1- 
Il y a (1-)100 chances sur 100 pour que l’intervalle contienne , où est le fractile d’ordre de la loi de Student à n-1 degrés de liberté. La formule est exacte si X suit une loi normale. Sinon, c’est une bonne approximation dés que n  30. Précision de l’estimation de  au niveau 1-

30 Rola-Cola : Consommation de boissons au cola

31 Précision de l’estimation de  par au degré de confiance 1 - 
La quantité est la précision de l’estimation de  par au degré de confiance 1 - . La précision est la demi-largeur de l’intervalle de confiance.

32 n = taille de l’échantillon à définir s = futur écart-type observé
Taille de l’échantillon permettant d’obtenir une précision souhaitée c au niveau de confiance 1 -  n = taille de l’échantillon à définir s = futur écart-type observé Problème : Trouver n tel que

33 Solution approchée On remplace dans la formule
s par la dernière estimation disponible et par

34 Rola-Cola : Graphique des intervalles de confiance
La consommation de boissons au cola ne dépend pas du goût pour le sucre. La consommation de chips dépend de la boisson préférée.


Télécharger ppt "Description et estimation"

Présentations similaires


Annonces Google