Probabilités et Statistiques

Slides:



Advertisements
Présentations similaires
Comparaison d’une moyenne observée à une moyenne théorique
Advertisements

Corrélation Position du problème Définition covariance (X,Y) r =
Probabilités et statistiques au lycée
Gestion de portefeuille Support n° 5 Catherine Bruneau
GESTION DE PORTEFEUILLE chapitre n° 7
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Inférence statistique
Inférence statistique
Scoring Séance II.
Échantillonnage-Estimation
Moyenne, écart type et incertitude de mesure.
Les tests d’hypothèses
Statistique descriptive
Régression -corrélation
variable aléatoire Discrète
Programmes du cycle terminal
Atelier Probabilités et statistiques
Probabilités et Statistiques
« 90% de nos trains arrivent à lheure! ». énoncé exercice : « Le retard sur un trajet train de 6h15 Marseille-Paris est en moyenne: 10mn avec écart type.
ASI 3 Méthodes numériques pour l’ingénieur
Applications des statistiques
Fluctuation d’échantillonnage
Cours Corporate finance Eléments de théorie du portefeuille Le Medaf
Probabilités et Statistiques
Régression linéaire simple
Rappel... Solution itérative de systèmes linéaires (suite et fin).
Comprendre la variation dans les données: Notions de base
Signaux aléatoires.
La corrélation et la régression
La corrélation et la régression
Théorie… Inférence statistique: étude du comportement d’une population ou d’un caractère X des membres d’une population à partir d’un échantillon aléatoire.
Conception et analyse des algorithmes Les algorithmes probabilistes
Algorithmes probabilistes
Régression linéaire (STT-2400)
Probabilités et Statistiques
Probabilités et Statistiques Année 2009/2010
Probabilités et Statistiques
Probabilités et Statistiques Année 2010/2011
Outils mathématiques pour le datamining
Probabilités et Statistiques
Probabilités et Statistiques Année 2009/2010
STATISTIQUES DESCRIPTIVES
Probas-Stats 1A novembre 10 1 Probabilités et Statistiques Année 2010/2011
TD4 : « Lois usuelles de statistiques »
STATISTIQUES – PROBABILITÉS
Probabilités et Statistiques Année 2010/2011
2008/ Plan du cours 1.Introduction –Contenu du cours 2.Logique mathématique –Calcul propositionnel –Calcul des prédicats –Logique floue et aide à.
Atelier Probabilités et statistiques
Les fonctions de référence
Probabilités et Statistiques Année 2009/2010
Probabilités et Statistiques
Rappels Variables nominales :
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Stat-infoCM6a : 1 Rappels.
Analyse de données Cours 3 Analyse en composantes principales (ACP)
Probabilités et Statistiques
Chapitre 4 Variables aléatoires discrètes
Rappel de statistiques
1 1 Licence Stat-info CM6 a 2004 V1Christophe Genolini Rappels 1.Variables nominales : –Oui / Non –Bleu / Brun / Roux / Noir Pour déterminer s’il y a un.
Régression linéaire (STT-2400)
STT-3220 Méthodes de prévision Section 1 Évaluation des prévisions: Coefficient de Theil Version: 9 septembre 2004.
Échantillonnage (STT-2000)
Le modèle de régression linéaire Claude Marois © 2010.
Statistiques à 2 variables
Probabilités et Statistiques
1 1 Licence Stat-info CM6 b 2004 V1Christophe Genolini Régression linéaire : problème On a les notes math et français suivantes : Un élève a 10 en math,
1_Introduction Toute mesure est entachée d’erreur. Il est impossible d’effectuer des mesures rigoureusement exactes. Pour rendre compte du degré d’approximation.
LES POSTULATS DE LA MÉCANIQUE QUANTIQUE
UED SIM – Département OLCI Année Arts & Métiers ParisTech CER ANGERS Probabilités et statistiques Cours n° 2.
Processus ponctuels Caractéristiques et Modèles de répartitions spatiales.
Transcription de la présentation:

Probabilités et Statistiques Année 2010/2011 olivier.roustant@emse.fr laurent.carraro@telecom-st-etienne.fr

Variance – Covariance Variance d’une somme Vers la loi d’une somme Cours n°8 Variance – Covariance Variance d’une somme Vers la loi d’une somme

Des indicateurs de dispersion Sans traitement Avec traitement DISPERSION Ecart-type 1.64 1.60 q(75%) - q(25%) 1.86 1.42 q(5%) - 0.99 - 0.32 q(95%) 3.95 4.86 3

Version probabiliste quantile d’ordre α : q tel que P( X < q ) = α Ou encore : q = FX-1(α) intervalle interquartile : FX-1(0.75) – FX-1(0.25) variance : var(X) = E[ (X – E[X])2 ) écart-type : σ(X) = (var(X))1/2 QUESTION : Quel indicateur est le plus facile à manipuler ? 4

Variance et covariance La variance est une forme quadratique, de forme bilinéaire associée la covariance : cov(X,Y) = E[ (X-E[X])(Y-E[Y]) ] var(X) = cov(X,X) cov est une forme bilinéaire symétrique positive cov(X,Y) = cov(Y,X); cov(X,X) ≥ 0 cov(aX + bY, Z) = a cov(X,Z) + b cov(Y,Z) var(aX) = cov(aX, aX) = a2 var(X) cov(X,X) = 0 -> X = E[X] avec proba. 1

cor(X,Y) = cov[ (X-E[X])/σ(X), (Y-E[Y])/σ(Y) ] Corrélation La corrélation est la covariance des variables centrées et réduites : cor(X,Y) = cov[ (X-E[X])/σ(X), (Y-E[Y])/σ(Y) ] = cov(X,Y)/(σ(X)σ(Y)) Ainsi la corrélation est indépendante de changements d’unité. Comparer : cov(10X, 100Y) = 1.000 cov(X,Y) cor(10X, 1000Y) = cor(X,Y)

Interprétation de la covariance Cours journalier de 2 actions du CAC40 (droite) et leurs taux de rendements (gauche) Lafarge Carrefour cor(X,Y)≈ 0.52

Interprétation de la covariance 500 réalisations d’un vecteur [gaussien] (X,Y), avec cor(X,Y) fixé. cor(X,Y)≈ -0.8 cor(X,Y) = 0.8 cor(X,Y) = 0

Des propriétés bien utiles var(X) = E[X2] – E[X]2 cov(X,Y) = E[XY] – E[X]E[Y] Suggestion pour la démonstration : noter mX = E[X] et mY = E[Y] et remarquer que ce sont des nombres fixés.

Non corrélation ≠ indépendance ! Soit X = U de loi uniforme sur [-1,1], et Y = U2 cor(X,Y) = 0 !!!

Covariance et indépendance Théorème X et Y sont indépendantes ssi pour toutes fonctions f et g ("mesurables"), on a: cov( f(X), g(Y) ) = 0 Corollaire Si X et Y sont indépendantes, alors cov(X,Y)=0 La réciproque est FAUSSE (cf ex. précédent) 11

Variance d’une somme Proposition Si X et Y sont non corrélées, alors : var(X + Y) = var(X) + var(Y) Généralisation. Si X1, …, Xn sont non corrélées, var(X1 + … + Xn) = var(X1) + … + var(Xn) Remarque Cov(X,Y) ≤ 0 -> var(X+Y) ≤ var(X) + var(Y) (diversification -> réduction du risque)

Application On veut estimer la proportion p de pièces défectueuses dans une chaîne de fabrication. Combien de pièces faut-il tester pour que p soit estimée avec une précision (absolue) de 1% ?

Application On veut estimer la proportion p de pièces défectueuses dans une chaîne de fabrication. Combien de pièces faut-il tester pour que p soit estimée avec une précision (absolue) de 1% ? Indications de solution : Estimation de p : pn = (X1 + … + Xn)/n, avec Xi iid de loi B(p) (modèle). Idéalement, on voudrait |pn - p| ≤ 1% avec une bonne probabilité. Aujourd’hui, on va seulement demander σ(pn) ≤ 1%. On calcule var(pn)=p(1-p)/n, d’où n ≥ 104p(1-p) (ex : p=5% -> n ≥ 475)

Vers la loi d’une somme de v.a. i.i.d …

Loi d’une somme de v.a. i.i.d ?

Loi d’une somme de v.a. i.i.d ?