Description et estimation

Slides:



Advertisements
Présentations similaires
ORTHOGRAM PM 3 ou 4 Ecrire: « a » ou « à » Référentiel page 6
Advertisements

LES NOMBRES PREMIERS ET COMPOSÉS
[number 1-100].
Qualité du Premier Billot. 2 3 Défauts reliés à labattage.
1. Résumé 2 Présentation du créateur 3 Présentation du projet 4.
Le pluriel des noms
Les numéros
ACTIVITES Les fractions (10).
Est Ouest Sud 11 1 Nord 1 Laval Du Breuil, Adstock, Québec I-17-17ACBLScore S0417 Allez à 1 Est Allez à 4 Sud Allez à 3 Est Allez à 2 Ouest RndNE
Sud Ouest Est Nord Individuel 36 joueurs
Les identités remarquables
ACTIVITES Le calcul littéral (3).
1. Les caractéristiques de dispersion. 11. Utilité.
La diapo suivante pour faire des algorithmes (colorier les ampoules …à varier pour éviter le « copiage ») et dénombrer (Entoure dans la bande numérique.
Construction de Box-Plot ou diagrammes en boîtes ou boîtes à moustaches Construire une boîte à moustaches …
Primitives - Intégration
LA RÉGRESSION MULTIPLE
Analyse des proximités, des préférences et typologie Michel Tenenhaus.
Analyse de la variance à un facteur
Analyse de la variance à deux facteurs (données déséquilibrées) Michel Tenenhaus.
1 Analyse de la variance multivariée Michel Tenenhaus.
La régression simple Michel Tenenhaus
Modèle Linéaire Généralisé (Proc Genmod)
Analyse de la variance à un facteur
1 Test d hypothèse Comparaison dune moyenne à un standard 0.
Comparaison de deux échantillons indépendants au niveau des moyennes
Étude d’un tableau de contingence
2 1. Vos droits en tant quusagers 3 1. Vos droits en tant quusagers (suite) 4.
PARTENARIAT ÉDUCATIF GRUNDTVIG PARTENARIAT ÉDUCATIF GRUNDTVIG REPERES COHESION CULTURELLE ET EXPANSION DES IDEES SUR LE TERRITOIRE EUROPEEN.
Mr: Lamloum Med LES NOMBRES PREMIERS ET COMPOSÉS Mr: Lamloum Med.
-17 Anticipations économiques en Europe Septembre 2013 Indicateur > +20 Indicateur 0 a +20 Indicateur 0 a -20 Indicateur < -20 Union européenne total:
CONCOURS DE CONAISSANCE 4 Français I Mars Il ________ la géographie (to learn).
Titre : Implémentation des éléments finis sous Matlab
LES NOMBRES PREMIERS ET COMPOSÉS
Unit 4: Les animaux Unit 4: Les animaux.
1 INETOP
RACINES CARREES Définition Développer avec la distributivité Produit 1
Représentation des systèmes dynamiques dans l’espace d’état
Représentation des systèmes dynamiques dans l’espace d’état
DUMP GAUCHE INTERFERENCES AVEC BOITIERS IFS D.G. – Le – 1/56.
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
La Distribution des Données
Tournoi de Flyball Bouin-Plumoison 2008 Tournoi de Flyball
Notre calendrier français MARS 2014
Titre : Implémentation des éléments finis en Matlab
C'est pour bientôt.....
1 INETOP
Les Nombres 0 – 100 en français.
Veuillez trouver ci-joint
+21 Anticipations économiques en Europe Decembre 2013 Indicateur > +20 Indicateur 0 á +20 Indicateur 0 á -20 Indicateur < -20 Union européenne total: +14.
Équipe 2626 Octobre 2011 Jean Lavoie ing. M.Sc.A.
P.A. MARQUES S.A.S Z.I. de la Moussière F DROUE Tél.: + 33 (0) Fax + 33 (0)
Voici 36 bonnes raisons de preferer la biere à une femme blonde...
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
Traitement de différentes préoccupations Le 28 octobre et 4 novembre 2010.
1/65 微距摄影 美丽的微距摄影 Encore une belle leçon de Macrophotographies venant du Soleil Levant Louis.
* Source : Étude sur la consommation de la Commission européenne, indicateur de GfK Anticipations.
1 - Programme de Seconde (juin 2009) Statistique et probabilités
1. La bière ne parle pas 2.La bière est toujours prête et humide.
CALENDRIER-PLAYBOY 2020.
6 Nombres et Heures 20 vingt 30 trente 40 quarante.
1 Nestlé – Optifibre Zones administrables via le back-office.
Exercice de vérification 1 p
Les Chiffres Prêts?
Rappels de statistiques descriptives
Les parties du corps By Haru Mehra Le Frehindi 1Haru Mehra, DELF, DALF,CFP.
Transcription de la présentation:

Description et estimation Étude d’une variable numérique, Étude d’une moyenne

Cas Rola-Cola n = 40 personnes Boisson préférée 1 = Rola-Cola 2 = Koka-Cola Achat préalable de Rola-Cola 1 = oui 2 = non Goût Sucre 2= indifférent 3 = non

Définitions N = Taille de la population Population : Ensemble des individus (objets de l’étude) auxquels on s’intéresse. N = Taille de la population Échantillon : Une partie de la population n = Taille de l ’échantillon Échantillon représentatif : - Chaque individu de la population a exactement la même probabilité d’appartenir à l ’échantillon. - La taille n de l’échantillon est suffisamment élevée. Elle dépend de l’homogénéité de la population et de la précision souhaitée.

Étude d’une variable numérique X Une variable numérique X prend des valeurs x1,…, xi,…, xN sur une population et x1,…, xi,…, xn sur un échantillon. Elle est résumée par des statistiques de tendance centrale (moyenne, médiane) et de dispersion (variance, écart-type). La dispersion de X est visualisée par la boîte-à-moustache et l’histogramme.

Moyenne et écart-type

Commentaire 1) Plus la taille n de l’échantillon est grande, alors plus les chances que soit proche de  sont élevées. 2) Plus l’écart-type s est petit,

Rola-Cola : Résultats statistiques

Propriétés des estimations de  et 2 * (u1,…, un) * (x1,…, xn) Ensemble de tous les échantillons possibles S2

Médiane M La médiane M partage l’échantillon ordonné en deux parties égales

Échantillon Rola-Cola ordonné Consommation de boisson NUMÉRO au cola ________ ____________ 1 1 2 2 3 2 4 2 5 2 6 3 7 3 8 3 9 3 10 3 11 4 12 4 13 4 14 4 15 4 16 5 17 5 18 5 19 5 20 5 Consommation de boisson NUMÉRO au cola ________ ____________ 21 6 22 6 23 6 24 6 25 7 26 7 27 7 28 7 29 7 30 8 31 8 32 8 33 9 34 9 35 9 36 10 37 10 38 11 39 12 40 13

Quartiles Q1, Q2, Q3 Les quartiles Q1, Q2, Q3 partagent l’échantillon ordonné en quatre parties égales Q3 Q2 = M Q1 25% 25% 25% 25%

Rola-Cola : Boîte-à-Moustache Médiane Q1 Q3 Minimum Maximum

Détection des observations atypiques (Outliers) La longueur de chaque moustache doit être inférieure à Exemple : Max = 13 (Obs n°12) remplacé par Max = 15

Rola-Cola : Boîte-à-moustache multiple La consommation de boissons au cola ne semble pas dépendre pas du goût pour le sucre. La consommation de chips dépend de la boisson préférée.

Rola-Cola: Histogramme

Rola-Cola : Graphique des histogrammes La consommation de boissons au cola ne dépend pas du goût pour le sucre. La consommation de chips dépend de la boisson préférée.

Rola-Cola : Graphique des histogrammes La consommation de boissons au cola ne dépend pas du goût pour le sucre. La consommation de chips dépend de la boisson préférée.

Loi normale (ou de Laplace-Gauss)

LAPLACE à Beaumont-en-Auge

Loi normale (ou de Laplace-Gauss)

Loi normale N(,) Une variable aléatoire X suit une loi normale N(, ) si, pour toute valeur de x, x Résultats : - Moyenne de X =  - Variance de X = 2 - 95% des valeurs de X sont comprises entre  - 1.96 et  + 1.96

Exercice 1 Soit X la durée du trajet Paris-HEC à 7 heures du matin. On suppose que X suit une loi normale N(,). En général, la durée du trajet est comprise entre 30 et 50 minutes. Déterminer la moyenne  et l’écart-type .

Précision de l’estimation Quel est l’ordre de grandeur de l’écart entre et  auquel on peut s’attendre ? Quelle est la précision de l’estimation de la moyenne de la population  à l’aide de la moyenne empirique ?

Un résultat très utile S2 * * s2 Ensemble de tous les échantillons (u1,…, un) * (x1,…, xn) S2 s2 Ensemble de tous les échantillons possibles

Loi de Student Si X  N(, ) alors : Gosset (1876-1937) invented the t -test to handle small samples for quality control in brewing while working at Guiness in Dublin. He wrote under the name "Student". Si X  N(, ) alors : suit une loi de Student à n-1 degrés de liberté [notée t(n-1)].

Exercice 2 Soit X la consommation de boisson au cola. La population étudiée est disponible dans le fichier « rola-cola population.sav » Visualiser l’histogramme et la loi normale associée à cette population. On suppose que X suit une loi normale N(,). Donner les valeurs de  et . Tirer un échantillon de taille 40. Calculer la moyenne et l’écart-type de l’échantillon et la statistique t.

Fractile de la loi de Student Calculer (Table 4) : - t0.975(39) = - t0.975() = 1- Loi t(n-1)  =

Fractiles de la loi de Student

Intervalle de confiance de la moyenne  au niveau 1-  Il y a (1-)100 chances sur 100 pour que l’intervalle contienne , où est le fractile d’ordre de la loi de Student à n-1 degrés de liberté. La formule est exacte si X suit une loi normale. Sinon, c’est une bonne approximation dés que n  30. Précision de l’estimation de  au niveau 1-

Rola-Cola : Consommation de boissons au cola

Précision de l’estimation de  par au degré de confiance 1 -  La quantité est la précision de l’estimation de  par au degré de confiance 1 - . La précision est la demi-largeur de l’intervalle de confiance.

n = taille de l’échantillon à définir s = futur écart-type observé Taille de l’échantillon permettant d’obtenir une précision souhaitée c au niveau de confiance 1 -  n = taille de l’échantillon à définir s = futur écart-type observé Problème : Trouver n tel que

Solution approchée On remplace dans la formule s par la dernière estimation disponible et par .

Rola-Cola : Graphique des intervalles de confiance La consommation de boissons au cola ne dépend pas du goût pour le sucre. La consommation de chips dépend de la boisson préférée.