Méthodes de prévision (STT-3220) Section 6 Modélisation de séries chronologiques avec la méthodologie de Box-Jenkins Version: 11 décembre 2008
Identification des modèles ARIMA On désire ajuster un modèle ARMA(p,q): Un autre type de modèles est le modèle ARIMA(p,d,q): Un modèle ARIMA est simplement un modèle dont la dième différence est ARMA. STT-3220; Méthodes de prévision
Méthode de Box et Jenkins Box et Jenkins ont popularisé l’utilisation des modèles ARMA, en insistant sur les étapes nécessaires à la modélisation d’une série chronologique quelconque: Les trois étapes sont: Identification des modèles (choix des ordres p, d et q). Estimation des paramètres; moindres carrés conditionnels, inconditionnels, maximum de vraisemblance. Validation du modèle (statistiques portmanteau; prévisions). STT-3220; Méthodes de prévision
Étape 1: Identification 1. Est-ce que la variance semble constante? On veut s’assurer que le terme de variance dans le modèle est constant, par exemple comme fonction du temps. Transformations populaires: Transformation racine, transformation inverse, transformation logarithmique. Préférablement (mais de manière optionnelle dans le cours), méthodologie de Box-Cox pour trouver la transformation. On veut stabiliser la variance, et en plus, se rapprocher de la normalité des erreurs. STT-3220; Méthodes de prévision
Transformation de Box-Cox La transformation a la forme: Le choix de l se fait souvent en effectuant un graphique de la vraisemblance en fonction de l. STT-3220; Méthodes de prévision
Identification (suite) 2. Choix du niveau de différentiation. Ici on veut une série stationnaire. En particulier la moyenne ne doit pas dépendre du temps. Si la série est stationnaire: Si est ARMA(p,q), alors les autocorrélations r(k) sont en nombre infini et décroissent vers 0 plutôt rapidement. Un estimateur de r(k) est donné par r(k). STT-3220; Méthodes de prévision
Identification (suite) De plus, on devrait avoir que: Cependant, la série est non-stationnaire, que se passe-t-il? On sait que cov(Zt,Zt-k) va dépendre de k, mais aussi de t. Ainsi les autocorrélations r(k) ne sont pas définies. Mais que sera la comportement des statistiques r(k)? STT-3220; Méthodes de prévision
STT-3220; Méthodes de prévision Théorème Soit une série chronologique générée d’un processus ARIMA(p,d,q), où ; on présume que le terme d’erreur est un bruit blanc Gaussien. Alors pour chaque délai k fixé, on a que: STT-3220; Méthodes de prévision
STT-3220; Méthodes de prévision Cas stationnaire versus cas non-stationnaire, comportement des r(k), k fixé, comme fonction de n. Cas stationnaire: Cas non-stationnaire: STT-3220; Méthodes de prévision
Autres éléments d’information Cas stationnaire: Les r(k) comme fonction de k décroissent à 0 de façon exponentielle (décroissance vers 0 très rapide). Cas non-saisonnier: à partir de k = 20, toutes les autocorrélations devraient être très près de 0. Cas non-stationnaire: Décroissance des r(k) de manière linéaire vers 0? Décroissante très lente? Les r(k) sont toutes de même signes? Ce sont tous des indices d’un problème de stationnarité. STT-3220; Méthodes de prévision
Identification: choix de p et de q Ayant identifié d, on a maintenant comme modèle . Important éléments d’information: Pour un autorégressif, toutes les autocorrélations partielles s’annulent après un certain délai. Pour un moyenne-mobile, toutes les autocorrélations s’annulent après un certain délai. Que fait-on si les r(k) et les fkk semblent tous les deux en nombre infini? STT-3220; Méthodes de prévision
Modélisation des résidus Supposons que le processus est: Cependant, le processus n’est pas un bruit blanc mais un ARMA . Donc: STT-3220; Méthodes de prévision
Modélisation des résidus (suite) Quelques manipulations donnent: Ce modèle n’est rien d’autre qu’un ARIMA STT-3220; Méthodes de prévision
Modélisation des résidus: exemple Supposons que vos disposez d’une série. Vous la différenciez une fois pour la rendre stationnaire. Vous disposez à ce stade d’un ARIMA(p,1,q). Vous trouvez que r(1) suggère une composante MA. Vous modéliser un ARIMA(0,1,1). Un examen des résidus suggère une composante AR(1). Vous tentez finalement un ARIMA(1,1,1) qui devrait faire l’affaire. En résumé: ce sont les résidus qui permettent de construire des modèles ARMA en pratique. STT-3220; Méthodes de prévision
STT-3220; Méthodes de prévision Étape 2: Estimation Dans le modèle: On doit procéder à l’estimation de: Paramètres autorégressifs: Paramètres moyenne-mobiles: Paramètre STT-3220; Méthodes de prévision
STT-3220; Méthodes de prévision Estimation de Dans Donc: où Or on a vu On rejette H0 si STT-3220; Méthodes de prévision
Estimation des paramètres autorégressifs et moyenne-mobiles Plusieurs techniques sont possibles: Méthode du maximum de vraisemblance, Méthode par moindres carrés conditionnels, Méthode par moindres carrés inconditionels, Ces techniques sont discutées dans Abraham & Ledolter (pp. 250-258). STT-3220; Méthodes de prévision
Étape 3: Validation du modèle Quand on cherche à valider un modèle de régression, une étape consiste habituellement à analyser les résidus. La situation est similaire en séries chronologiques. Considérons le modèle: Les résidus sont: Les sont obtenus en estimant les divers paramètres. STT-3220; Méthodes de prévision
Test approximatif: test de bruit blanc sur les résidus On se rappelle que si est un bruit blanc, alors les sont asymptotiquement indépendants, admettant pour un k donné une loi normale: Un test de l’hypothèse H0 : r(k) = 0 peut reposer sur le test: et la règle de décision consiste à rejeter la nulle si: STT-3220; Méthodes de prévision
Introduction aux tests de type portemanteau Puisque les sont approximativement de lois N(0,1), et utilisant l’indépendance, lorsque est bruit blanc fort, on trouve que: Pour l’hypothèse nulle d’adéquation, on rejette pour de grandes valeurs, i.e. STT-3220; Méthodes de prévision
Test de Box-Pierce et de Ljung-Box En suivant un raisonnement similaire au test de bruit blanc, mais tenant compte du fait que l’on construit une statistique de test basée sur des résidus, Box et Pierce, ainsi que Ljung et Box ont montré que pour tester l’adéquation d’un modèle ARMA(p,q): La logique des tests est la même: on rejette pour de grandes valeurs. Ex: avec Ljung-Box, on rejette l’adéquation si STT-3220; Méthodes de prévision