Introduction à l’économétrie des séries temporelles: La non-stationnarité
La non-stationnarité: Définition: Une série temporelle Yt est non-stationnaire si la loi de probabilité est variante dans le temps, c’est-à-dire, si la distribution (Ys+1, Ys+2, …, Ys+т) est dépendante de s, quel que soit T. Le couple (Xt, Yt) est conjointement non stationnaire si la distribution de (Xs+1, Ys+1, Xs+2, Ys+2, …, Xs+т, Ys+т) dépend de s, quel que soit T. 2 principales formes de non-stationnarité Les tendances Les ruptures
Les tendances: Définition: C’est un mouvement à LT persistant associé à une variable . Une variable de série temporelle ayant une tendance fluctue autour de celle-ci.
2 exemples contraires: -Exemple de tendance: -Exemple de non tendance : Variation journalière en pourcentage de l’indice composite de la Bourse de New York entre 1990 à2006 -Exemple de tendance: Taux d’inflation aux Etats-Unis entre 1960 à 2004
Les 2 types de tendances: Tendances déterministes: La tendance déterministe est une fonction non aléatoire du temps. Par exemple: une tendance déterministe peut être une fonction linéaire du temps. Si l’inflation augmente de 0.1% par trimestre, la tendance déterministe peut s’écrire 0.1t, où t est mesuré en trimestres. Tendances stochastiques: Elle est aléatoire et va varier dans le temps. Prenons l’exemple d’avant, avec le taux d’inflation aux Etats-Unis, où une hausse prolongée est suivie d’une baisse prolongée dans les années 1980.
Les tendances stochastiques: Pourquoi ce concentrer sur celles-ci? La marche aléatoire: Lorsque l’observation de demain est égale à l’observation d’aujourd’hui plus une variation non prédictible (ut). Cas général: Une série temporelle suit une marche aléatoire si la variation de Y est idd: Yt = Yt-1 + ut Avec E(Yt|Yt-1, Yt-2, …)= Yt-1, et E(ut|Yt-1, Yt-2, …)= 0 La marche aléatoire avec dérive: On introduit un terme de dérive au modèle de marche aléatoire. (ici βο) Yt= βο + Yt-1 + ut Avec E(ut|Yt-1, Yt-2, …)= 0, et βο est la dérive de la marche aléatoire, ainsi si βο > 0 alors Yt croit!
Les 2 manières de démontrer que Yt est non-stationnaire: 1ère méthode: Déterminer la variance de Yt. Comme Yt et ut sont non corrélées, alors var(Yt) = var (Yt-1) + var(ut), ainsi la condition de non stationnarité de Yt est vérifiée que si var(ut)≠ 0 2ème méthode: Supposer que Y₀ = 0 -Calculer Y1 qui donne Y1 = Y₀ + u1 = u1 -Puis, calculer Y2 qui donne Y2 = Y1 + u1 = u1 + u2 -Etc…, jusqu’à Yt = u1 + u2+…+ ut -Ainsi, si ut est non corrélé à Yt, var(Yt)= var(u1 + u2 +…+ ut)=tσ2u -Donc, la variance de Yt dépend de t (elle croît avec t), et la distribution de Yt va aussi dépendre de t. ALORS, Yt est non stationnaire!
La non-stationnarité des tendances stochastiques dans les modèles autorégressifs et les racines unitaires: Avec AR(1): Il existe une tendance stochastique si β₁= 1, et plus généralement si β₁≥ 1. Au contraire, le paramètre autorégressif est stationnaire si β₁ est compris entre -1 et 1, et plus généralement si |β₁|<1, dans le cas où ut est stationnaire. Avec AR(p): Si une série temporelle suit un AR(p) comportant une racine égale à 1, alors elle admet une racine unitaire autorégressive ou racine unitaire. Ainsi, une série temporelle qui admet une racine unitaire comporte une tendance stochastique.
Les 3 problèmes liés aux tendances stochastiques: 1er problème: Les paramètres autorégressifs sont biaisés vers zéro. 2ème problème: Les distributions non normales des statistiques t. 3ème problème: La régression fallacieuse.(R studio)
Détection des tendances stochastiques : test de racine unitaire 2 méthodes : Formelle Informelle Test d’hypothèse Étude approfondie des graphes & des paramètres d’autocorrélation H0 : tendance stochastique H1 : stationnarité Test de Dickey-Fuller (Tester la présence de tendances stochastiques)
Test de Dickey-Fuller Le test de DF est le test le plus utilisé et l’un des plus fiables. Le test de DF est un test unilatéral. La statistique de DF est calculée à partir des erreurs-types homoscédastiques.
Test de Dickey-Fuller Modèle AR(1) Yt = β0 + Yt-1 + ut H0 : β1 = 1 H1 : β1 < 1 Yt = β0 + Yt-1 + ut H0 : δ = β1 – 1 = 0 H1 : δ < 0 ΔYt = β0 + δYt-1 + ut
Programmation sous R
Test de Dickey-Fuller Modèle AR(p) Statistique de Dickey-Fuller augmentée (DFA) H0 : δ = 0 H1 : β1 < 1 ΔYt = β0 + δYt-1 + γ1ΔYt-1 + γ2ΔYt-2 + ...+ γpΔYt-p + ut ΔYt = β0 + αt + δYt-1 + γ1ΔYt-1 + γ2ΔYt-2 +...+ γpΔYt-p + ut
Programmation sous R
Test de racine unitaire vs. Tendance linéaire déterministe Jusqu’à présent : H0 : racine unitaire vs. :H1 stationnarité Ce type d’hypothèse alternative : Approprié aux séries économiques comme le taux d’inflation (car pas de croissance à LT) (Retenir une hypothèse alternative de stationnarité pure) Inapproprié pour les séries comme le PIB Japonais (Retenir une hypothèse alternative de stationnarité autour d’une valeur déterministe) Attention : tendance déterministe pas forcément linéaire. Quadratique ou linéaire avec point de rupture etc..
Valeur critiques de la statistique DFA Statistique DFA : pas de distribution normale (donc pas d’utilisation des valeurs usuelles) Utilisation d’un ensemble spécifique de valeurs critiques basée sous l’hypothèse de la statistique DF sous l’hypothèse nulle. Régrésseurs déterministes 10% 5% 1% Constante - 2.57 - 2.86 - 3.43 Constante et tendances déterministes - 3.12 - 3.41 - 3.96
Régression : Test : le coefficient de Inf t – 1 nul ? Statistique t de DFA = - 0.11 / 0.04 = - 2,69 Valeur critique au seuil de 5 % = - 2.86 Pas de rejet de l’hypothèse nulle de racine unitaire Inflation : tendance stochastique plutôt que déterministe
Régression DFA de l’équation d’ordre 4 (choix arbitraire, AIC retient le retard 3) Régression DFA d’ordre 4 : Statistique t de DFA = - 2.69 Rejet de H0 au seuil de 5 % t DFA 5 % = - 2.86 Régression DFA d’ordre 3 : Statistique t de DFA = - 2.72 Idem, rejet de l’hypothèse nulle pour les modèles DFA(3) & DFA(4) au seuil de 10 % ( t DFA 10 % = - 2.57)
Les ruptures: Définition: Les ruptures peuvent provenir, soit quand on observe un changement discret des paramètres de la fonction de régression théorique, soit lorsqu’on observe une évolution graduelle de ces paramètres sur une longue période de temps. Les tests des ruptures: Pour mettre en pratique ces tests, cela va dépendre de la connaissance ou non des dates auxquelles on suppose qu’une rupture a eu lieu. Ainsi, on peut faire un test d’une rupture à une date connue ou à une date inconnue.
Test de rupture à une date connue Test de Chow On utilise un modèle ARE(1,1) τ : date de rupture supposée Dt(τ) : variable binaire tel que Dt(τ) = 0 si t ≤ τ et Dt(τ) = 1 si t > τ
Test de rupture à une date connue Test de Chow H0 : γ0 = γ1 = γ2 H1 : au moins un paramètre parmi les γ doit être non nul. Yt = β0 + β1Yt-1 + δ1Xt-1 + γ0Dt(τ) + γ1(Dt(τ) × Yt-1) + γ2(Dt(τ) × Xt-1) + ut
Test de rupture Test de rupture à une date inconnue Statistique de vraisemblance de Quandt RVQ τ : date de rupture supposée τ : compris entre τ0 et τ1 En pratique : τ0 = 0,15T et τ1 = 0,85T La statistique RVQ correspond à la valeur de la statistique F parmi toutes les valeurs de F entre τ0 et τ1.
Test de rupture Test de rupture à une date inconnue Statistique de vraisemblance de Quandt RVQ RVQ = max[F(τ0),F(τ0+1),…,F(τ1)] RVQ utilisée pour tester une rupture sur un ensemble ou sous-ensemble de paramètre. Sous H0, distribution asymptotique de la stat RVQ dépend de q à tester et de [τ0, τ1]. Test RVQ permet de détecter 1 rupture discrète, plusieurs et/ou 1 évolution lente de la fonction de régression. Si 1 point distinct dans fonction de régression, date avec valeur de stat F plus grande est estimateur consistent de la date de rupture.
Eviter les problèmes causés par les ruptures Détecter la source et la nature de la rupture. - Si date spécifique > détectable par RVQ - Fonction de régression Yt = β0 + β1Yt-1 + δ1Xt-1 + γ0Dt(τ) + γ1(Dt(τ) × Yt-1) + γ2(Dt(τ) × Xt-1) + ut Si date distincte et connue, inférence statistique sur coefficients de régression normalement effectuée en utilisant valeurs critiques des tests sur statistiques t.
Prévisions hors-échantillon et en pseudo temps réel. Méthode de simulation de la performance du modèle de prévision en temps réel. On choisit une date s proche de la fin Nouvel échantillon de 1 à s Estimation du modèle en prenant les données du nouvel échantillon & construction des prévisions et erreurs de prévisions associés aux horizons temporels compris entre s et la fin de l’échantillon initial Puis augmentation de l’échantillon d’une observation (s+1), ré-estimation du modèle de régression Calcul des prévisions & erreurs correspondantes, etc jusqu’à avoir fait toutes les observations « hors échantillon » Examen des pseudos erreurs de prévisions pour voir si elles correspondent à ce qui est attendu en cas de stationnarité.
Prévisions hors échantillon en pseudos temps réels Prévisions hors échantillon (en temps réel pour de réelles dates futures) Calculées sans informations sur les valeurs futures Valeurs futures disponibles Peuvent être comparées aux pseudos prévisions
(racine carrée de l’erreur quadratique moyenne de prévision) 2e utilisation : Estimation de la REQMP (racine carrée de l’erreur quadratique moyenne de prévision) Prévisions faites avec des données antérieures Reflètent 2 sources d’incertitude : Incertitude liées aux valeurs futures Incertitude de l’estimation des coefficients de régression 3e utilisation : Choix entre 2 ou plusieurs modèles (2 modèles peuvent sembler équivalents en terme de prévisions mais se comporter différemment en prévisions hors-échantillon en pseudo temps réel) Si 2 modèles ≠ par construction des PHOPTR, méthode aisée pour comparer et se concentrer sur la capacité à fournir des prévisions fiables
Tendances et ruptures Approche « historique » Tendances. Comment est-on passé de croyances plutôt déterministes à stochastiques ? Ruptures. Exemple du Luxembourg, comment explique-t-on une réorientation de l’économie ?
Phénomène des ondes longues Les ondes longues = considérées comme un cycle régulier à long terme. Kondratieff Publication de ses travaux en plein âge d’or de l’analyse par les faits empiriques les résultats obtenus par Kondratieff l’ont été à partir d’un processus composé d’une onde longue superposée aux composantes tendancielle et cyclique. On suit une tendance superposée de fluctuations
Décomposition Théories de la croissance => essaient d’expliquer une tendance de long terme Théorie des cycles et des fluctuations => analyse des mouvements de divers agrégats autour de cette tendance
Décomposition Raison technique de la décomposition Les séries sont majoritairement non stationnaires Variance, moyenne, covariance non constante On ne peut alors utiliser les méthodes MCO Il faut alors purger la tendance, rendre la série stationnaire
L’influence néoclassique Années 30 à 80 Croyance d’une tendance déterministe dans les séries Tendance dépendante du temps est un terme aléatoire qui suit distribution stationnaire. Mais on peut aussi envisager des hypothèses de tendance paraboliques, exponentielles, logistiques de dépendance de la série par rapport au temps
L’influence néoclassique Cycles = courts déséquilibres par rapport à une tendance Chocs à une période n’ont aucune incidence sur l’évolution ultérieure Tout mouvement long et permanent est associé à une tendance. - Coïncide avec la vision keynésienne, est donc très populaire
L’influence néoclassique Effets de court terme / transitoires On ne remet pas en cause le mouvement long de la tendance Dissociation entre croissance et cycle
La fin du monopole déterministe Beveridge et Nelson (1981) Mettent en évidence l’hypothèse de tendance stochastique Utilisent pour ceci le modèle (ARIMA) La décomposition permet de distinguer 2 éléments : Marche aléatoire sans dérive Processus stationnaire ARIMA = > généralisation du modèle Arma
La fin du monopole déterministe Nelson et Plosser (1982) Sur la base des travaux de Beveridge et Nelson étude sur un ensemble 14 séries macroéconomiques PNB réel, nominal, production industrielle par tête, diverses séries de prix, de salaire et de rendement, la monnaie et sa vitesse de circulation et le taux de chômage Sur des périodes allant de 60 ans à un siècle
La fin du monopole déterministe Résulat Rejet de l’hypothèse de séries stationnaires autour d’une tendance déterministe une exception, le taux de chômage. On peut donc pas rejeter l’hypothèse de tendances stochastiques
La fin du monopole déterministe Conséquences La variable ne dépend pas du temps Mais du niveau de la variable précédente Préférable de concevoir les séries économiques comme une marche aléatoire. Après un choc un série a tendance ne va pas revenir sur une moyenne de long terme, mais s’en éloigner au fur et à mesure
Programmation sous R
L’effet des ruptures L’exemple luxembourgeois -Très particulier Attention j’ai mis des images. Pourquoi ? Exemple européen, s’étend à la France et à la Belgique Changement radical dans la structure économique du pays. Afin de faire un lien avec le cours d’intégration économique
La situation du pays Avant la première guerre mondiale Pays industrialisé - l’extraction minière - sidérurgie
La situation du pays Dépendance économique - L’Allemagne partenaire commercial - Zollverein (union douanière) - Zulieferer (sous - traitant) - Capitaux allemands
La situation du pays Entre les deux guerres De grands changements - Le Zollverein tombe - Nouveaux partenaires commerciaux nécessaires - La production chute - La France ou la Belgique ? - La Belgique !
Les premiers changements De nombreuses ruptures Economique et internationale Isolement économique L’UEBL Effets d’entrainement moindres Reconfiguration de la production Capitaux moins nombreux Agricole Le secteur de l’agriculture ne fait pas le poids Changements dans le secteur viticole L’Isolement économique après la fin du Zollverein va créer une véritable crise « identitaire » pour le Luxembourg qui avant se trouvait en position de sous-traitant de l’Allemagne. L’export de minerais n’est plus attractif, lors de la collaboration avec la Belgique, le pays se penchera alors sur la production de produits finis un grand changement car l’extraction minière va fortement baisser. On importe du minerais plus riche destiné à la transformation. Le secteur de l’agriculture après la création de l’uebl va prendre un sacré coup, car il est beaucoup trop petit face au secteur belge. On va alors mettre en place des mesures de primes sur les grains afin de protéger la production luxembourgeoise, avec succès mais n’augmentera pas les rendements. Le domaine viticole lui aussi va changer, avant la production de vin était réservée aux Allemands et destinée a être coupée, le secteur viticole doit alors s’adapter en produisant du vin de meilleur qualité et destiné à être vendu en Belgique.
La croissance et la stabilité La sidérurgie Production massive après la seconde guerre mondiale Fierté nationale, représente le pays Investissements en capital fixe élevés Effets importants sur les autres secteurs L’ouverture économique – UE (1951) Pays très intégré Quelque temps après la geurre, le pays commence à fortement se développer dans l’industrie parallèlement aussi dans le secteur des services. L’ouverture économique avec l’arrivé de l’Union européenne des 6 en 1951 va grandement profiter au Luxembourg, il s’agit alors déjà d’un pays très intégré. Les investissements en capital fixe rentrent à nouveau massivement, ce qui permet l’évolution du secteur de la sidérurgie.
Le choc sidérurgique Milieu des années 70 Surproduction mondiale Baisse importante des prix Aggravé par les effets du choc pétrolier de 1973 Tendances inflationnistes récurrentes Une crise longue Détérioration permanente et irréversible 1974 – 1992 baisse de 50% de la production
Le choc sidérurgique Phénomène mondial Effet similaire dans le bassin lorrain France et Belgique Fermetures de grandes aciéries dans la région Problèmes toujours d’actualité aujourd’hui !
Restructuration Mesures prises Plan de diversification Développement du secteur tertiaire particulièrement de la place financière Développement d’une industrie de pointe: Satellites, audiovisuel Recherche d’avantages compétitifs Restructuration et assainissement de la sidérurgie - tripartite