La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 Modeles Lineaires 2 Econometrie Economie+Stats+Algebre Lineaire+Maths+PC Dans la pratique, nous faisons face a une masse enorme de donnees Information.

Présentations similaires


Présentation au sujet: "1 Modeles Lineaires 2 Econometrie Economie+Stats+Algebre Lineaire+Maths+PC Dans la pratique, nous faisons face a une masse enorme de donnees Information."— Transcription de la présentation:

1

2 1 Modeles Lineaires

3 2 Econometrie Economie+Stats+Algebre Lineaire+Maths+PC Dans la pratique, nous faisons face a une masse enorme de donnees Information incomplete Quel est le modele adequat? Comment le specifier et lestimer? Le modele lineaire constitue un outil essentiel dinference Malgre son apparente simplicite, faire attention aux hypotheses sous jacentes La theorie economique/financiere implique les maths, pas le contraire

4 3 Regression: Population Y=variable dependante X= regresseurs, variables explicatives A distinguer: Difference entre population et echantillon Pour une population, nous ecrivons: y = x. 0 est lordonnee a lorigine, et 1 la pente La variable dependante variable change de maniere proportionelle pour toute variation dans les variables independantes Modele economique Expression mathematique

5 4 Regression: Echantillon Nous nobservons pas toute la population Seulement un echantillon tire aleatoirement y = b 0 + b 1 x. b 0 est un estimateur de 0. b 1 est un estimateur de 1.

6 5 Representativite? Meme si lechantillon est tire aleatoirement parmi une population, il ny a pas de garantie absolue que lechantillon soit representatif x y Regression: Population (parametres inconnus) Regression: Echantillon

7 6 Outils Les estimateurs b 0 et b 1 sont ils precis? Deux methodes inferentielles: – Intervalles de confiance – Tests dhypotheses Objectifs: Examiner la qualite de la regression (relation entre y observes et y prevus)

8 7 Hypotheses Inclusion dun terme derreur destimation car dans la pratique aucune paire de variables ne presente une relation lineaire parfaite Modele de regression simple y i = x i + i 1.Les i sont distribues normalement, avec une moyenne de 0 et une variance e 2. 2.Les i sont independants les uns des autres 3.Les i sont independants de X

9 8 Regression Parfaite Y = 1X

10 9 Un Monde Imparfait Y = 1X + e

11 10 Estimation des Parametres 0, 1, et e 2

12 11 Objectif Moindres Carres Ordinaires (MCO): modele lineaire qui a pour objectif de minimiser la somme des erreurs au carre Theoreme de Gauss-Markov: BLUE Best Linear Unbiased Estimator –Lestimateur MCO est celui possedant la plus petite variance parmi tous les estimateurs lineaires

13 12 Autres Objectifs La minimisation des erreurs au carre nest quune fonction-objectif parmi dautres –Minimiser valeur absolue des erreurs –Minimiser erreurs simples Erreurs simples: Leur somme est egale a 0 Des modeles bases sur la deviation absolue minimale existent mais ils sont lourds a manipuler mathematiquement –Algebre avec un operateur de valeur absolue

14 13 Implications du Modele MCO Le modele cherche a eviter les grandes erreurs Une grande valeur de e pour une observation conduit generalement a une grande e 2 finale Les resultats de la regression peuvent etre tres influences par des anomalies (outliers) Toujours examiner les donnees Toujours examiner les residus de la regression

15 14 Derivation Notation –y est le vecteur nx1 de la variable dependante – X est la matrice nxp des variables independantes – est un vecteur px1vector. –Notation transposee: Minimiser la somme des erreurs au carre Min par rapport a = (y X ) (y X ) = y y X y y X + X X

16 15 Derivation Nous devons minimiser 2y X + X X par rapport a Changeons la notation et ecrivons A=y X and C= X X Lexpression sexprime: 2A + C Nous appliquons deux regles de derivation matricielle (1) La derivee de A par rapport a est A (2) La derivee de C par rapport a est 2C

17 16 Derivation A=y X et C= X X Lexpression a minimiser secrit 2A + C La derivee est egale a zero au minimum Par application des deux regles precedentes: 2 A + 2C =0 Substituons A = X y et C= X X 2 X y + 2 X X =0 2 X X = 2 X y X X = X y

18 17 Derivation La solution du probleme de minimisation X X = X y Pre-multiplions les deux cotes par (X X) 1 = (X X) 1 X y Une partie importante de leconometrie se concentre sur lestimateur MCO b = (X X) 1 X y et ses extensions selon differentes hypotheses pour

19 18 Hypotheses Pour une regression bivariee donnee 1. Echantillon aleatoire –Au moins N > La relation entre variable est lineaire –i.e., la moyenne de Y augmente lineairement avec X –Representer graphiquement X et Y –Prendre garde aux relations non lineaires (e.g., forme en U)

20 19 Hypothese 3. Y est distribuee normalement, conditionellement a la valeur de X –Normalite conditionelle Ex: Annees deducation = X, Prestige (Y) Supposons que nous examinons un sous echantillon (X = 12) –Lhistogramme de Y est il normal? –Quen est il pour X=4 ou X=16?

21 20 Hypotheses Normalite: Examiner des sous echantillons pour differentes valeurs de X. Faire des histogramme et verifier la normalite Decent Pas Bon

22 21 Hypotheses 4. Les variances des erreurs destimation sont identiques pour tout valeur de X –Rappel: Lerreur represente la deviation par rapport a la ligne de regression –Definition: homoskedasticite = La dispersion des erreurs est stable quelles que soient les valeurs de X –Oppose: heteroskedasticite, les erreurs varient avec X Test: Comparer les erreurs pour X=12, X=2, X=8, etc

23 22 Homoskedasticite Variance des erreurs identiques Examiner les erreurs pour differentes valeurs de X. Ici, resultat satisfaisant

24 23 Heteroskedasticite La variance des erreurs est fonction de X Les hypotheses de la regression lineaire sont inadequates

25 24 Test dHypothese sur la Pente Exemple: La regression reliant le niveau deducation au prestige de la profession donne un coefficient de 2.47 Question: Cet estimateur est il vraisemblable? –Est il possible que le coefficient observe est en fait tire dune population dont la pente est egale a zero? –Solution: Effectuer un test dhypothesis Notation: pente = b, pente de la population = H0: = 0 H1: 0

26 25 Test dHypothese De quelle information avons nous besoin? Reponse: Lestimateur de la pente (b) a une distribution, comme nimporte quelle autre statistique Si certaines conditions sont remplies, la distribution se rapproche de la distribution de t –Nous pouvons evaluer la probabilite quune certaine valeur de b serait observee si = 0 –Si la probabilite est faible (

27 26 0 Distribution echantillonee de la pente Test dHypothese Representation: Si la pente de la population ( ) est egale a 0, la distribution echantillonee devrait etre centree a 0 –Nous travaillons sur une distribution de probabilite, nous pouvons identifier quelle est la valeur attendue de b si la population a une pente egale a Si =0, la pente estimee devrait etre proche de 0 b Si lestimateur est eloigne, il est improbable que beta=1, rejeter H0

28 27 Test dHypothese La distribution de b doit se rapprocher de la distribution t Ecart type de la pente dans la population( b ): e 2 est la variance des residus N est le nombre dobservations

29 28 Test dHypothese Estimer e 2: Estimer lecart type de la pente:

30 29 Test dHypothese Etape finale: Utiliser la distribution de t –Pente divisee par son ecart type sigma b est lestimateur de lecart type de la pente calcule precedemment Le test est effectue sur la base de N-2 degres de liberte

31 30 Intervalle de Confiance 1 Deux objectifs: –Estimer la valeur de 1 –Estimer la qualite de b 1 Definition Valeur estimee du parametre (x ecarts type selon le degre de confiance desiree) (valeur estimee de lecart type de lestimateur)

32 31 Intervalle de Confiance Definition: Ou t N-2 est la valeur de la statistique t pour un test bivarie et un niveau de confiance alpha Exemple: Coefficient (pente) = 2.5, Ecart type. =.10 95% t-value for 102 deg.lib. Est approx. = 2 95% Intervalle de Confiance = 2.5 +/- 2(.10) i.e. entre 2.3 to 2.7 avec 95% de probabilite

33 32 Outliers Meme si toutes les conditions preliminaires doptimalite des MCO sont remplies, il peut qd meme demeurer dses problemes Exemple: Outliers – valeurs extremes, tres differentes des valeurs moyennes de lechantillon Sources: –Donnee incorrecte –Donnee correcte mais rare Quelques observations de ce type peuvent radicalement modifier les estimations MCO

34 33 Exemple Avec cette observation Sans loutlier: Aucune relation

35 34 Qualite des Regressions Afin destimer la qualite de la regression (I.e. erreurs de prevision) nous avons besoin dune valeur de reference Sans information additionelle, la moyenne de Y (variables dependante) correspond a cette valeur de reference

36 35 Decomposition Variation Totale = Variation expliquee par le modele + Variation residuelle y 2 = 2 + e 2

37 36 R2 R 2 est defini comme 2 / y 2 ou 1 - ( e 2 / y 2 ) Donne la proportion de variance totale ( autour de la moyenne) expliquee par la regression Par definition 0 R 2 1 Correspond au carre de la correlation entre X et Y


Télécharger ppt "1 Modeles Lineaires 2 Econometrie Economie+Stats+Algebre Lineaire+Maths+PC Dans la pratique, nous faisons face a une masse enorme de donnees Information."

Présentations similaires


Annonces Google