Introduction à l’analyse des séries temporelles Ch.3. - Statistiques. Introduction à l’analyse des séries temporelles 1
Introduction Définition d’une série temporelle : Une « série temporelle », « série chronologique » ou encore « chronique » = distribution statistique ayant la particularité de décrire un phénomène repéré dans le temps. Les observations qui composent la série temporelle sont donc repérées par une date ou un instant : années, trimestres, mois, … 2
Analyser des phénomènes dans le temps tient de l’approche dynamique. Introduction Analyser des phénomènes dans le temps tient de l’approche dynamique. ≠ approche statique qui compare des observations à un instant ou une période donnée. ≠ approche « statique comparative » qui compare des données se référant à deux instants (ou périodes) donné(e)s. 3
mais aussi de celui des études de marché. Introduction L’analyse des séries temporelles est utilisée dans l’ensemble des disciplines scientifiques. Dans le domaine des sciences de gestion, on peut noter leur intérêt dans le cadre de l’analyse financière de l’entreprise (par exemple l’analyse de l’évolution des ventes ou des prix), mais aussi de celui des études de marché. 4
tendancielle, cyclique, saisonnière et résiduelle. Introduction Plan du chapitre : 1. Présentation d’une série temporelle et distinction de ces principales composantes : tendancielle, cyclique, saisonnière et résiduelle. 2. Etude de la composante saisonnière de la série. 3. Décomposition de la série temporelle en ces principales composantes, et prévisions. 5
I. Présentation d’une série temporelle et de ses composantes ➥ Présentation de la chronique de la production française de maïs de 2001 à 2008. ➥ Evaluation de la nature des variations de cette production : tendancielles, saisonnières ou accidentelles. 6
I.1. Règles et principes de base de la présentation d’une chronique I. Présentation d’une série temporelle et de ses composantes I.1. Règles et principes de base de la présentation d’une chronique Une série temporelle = succession d’observations au cours du temps d’un phénomène économique ici. ➥ Les intervalles de temps doivent être constants. ➥ Vérifier que la série n’a pas les défauts suivants : valeurs manquantes, aberrantes ou accidentelles. 7
I.1. Règles et principes de base de la présentation d’une chronique Dans notre exemple, l’intervalle de temps est le mois : la série début en janvier 2001 et finit en décembre 2008 ➡ 96 observations au total. On peut noter xt la valeur observée au temps t, avec t=1…n. On peut aller plus loin et noter xij la valeur observée pour la jième période de l’année i, avec i=1…N et j=1…P. Dans notre exemple, N=8 et P=12. 8
I.1. Règles et principes de base de la présentation d’une chronique ➥ Les valeurs observées peuvent être de deux types : « stocks » ou « flux » • Lorsque la valeur observée est mesurée à une date fixe ou est unique pour chaque période envisagée ➡ variable de stock ; • Lorsque la valeur observée est mesurée entre deux dates, période par période ➡ variable de flux. Dans notre exemple ➡ variable de flux. 9
I.1. Règles et principes de base de la présentation d’une chronique Production française de maïs de 2001 à 2008 (en milliers de t.) 10
I.1. Règles et principes de base de la présentation d’une chronique La série est présentée dans le fichier excel déposé sur claroline. On peut néanmoins la présenter sous la forme d’une matrice distinguant années et mois : 11
I.1. Règles et principes de base de la présentation d’une chronique 12
I. Présentation d’une série temporelle et de ses composantes I.2. La décomposition du « mouvement brut » en quatre types d’éléments distincts L’analyse des séries temporelles est classiquement réalisée en 2 temps : 1. La décomposition de la série, 2. Sa reconstitution à des fins de prévision. 13
L’étape 1 - Décomposition de la série I.2. La décomposition du « mouvement brut » en 4 types d’éléments distincts L’étape 1 - Décomposition de la série ➥ Dissocier le « mouvement » (i.e. les fluctuations) de la série « brute » ou « observée » (i.e. non retraitée) en 4 grands « éléments ou composantes caractéristiques » qui renvoient à 2 niveaux de lecture différents : - une lecture de longue période ➡ phénomènes structurels, de LT ; - une lecture de courte période ➡ phénomènes conjoncturels, de CT ; 14
Les variations cycliques, I.2. La décomposition du « mouvement brut » en 4 types d’éléments distincts Ces 2 niveaux de lecture renvoient aux 4 composantes suivantes du mouvement de la série : Le trend, Les variations cycliques, Les variations saisonnières, Les variations accidentelles/résiduelles. 15
➡ Le « trend » ou la tendance de la série (Tt) I.2. La décomposition du « mouvement brut » en 4 types d’éléments distincts ➡ Le « trend » ou la tendance de la série (Tt) Le trend ➡ mouvement à LT de la série = sa tendance générale, structurelle Le trend résume le mouvement brut de la série par une droite (trend linéaire) ou une courbe (trend non linéaire) 16
I.2. La décomposition du « mouvement brut » en 4 types d’éléments distincts Le mouvement à LT de la série peut également prendre la forme de cycles (de LT donc) ➥ succession de trends ou trend sinusoïdal afin de « coller au mieux à la série ». 17
➡ La composante cyclique de la série (Ct) I.2. La décomposition du « mouvement brut » en 4 types d’éléments distincts ➡ La composante cyclique de la série (Ct) La composante cyclique = 1ère composante renvoyant à une lecture de CT, conjoncturelle, exprimant des mouvements autour du trend. ➥ cycles conjoncturels de 3 à 5 ans. ≠ variations saisonnières (cf. composante suivante). 18
➥ fusion de Et et Ct en 1 seule composante : I.2. La décomposition du « mouvement brut » en 4 types d’éléments distincts Même si ces 2 1ères composantes rendent compte de phénomènes de durée différente, elles expriment néanmoins des phénomènes de fond ➥ fusion de Et et Ct en 1 seule composante : l’ « extra-saisonnier » : Et = Tt + Ct 19
➡ La composante saisonnière de la série (St) I.2. La décomposition du « mouvement brut » en 4 types d’éléments distincts ➡ La composante saisonnière de la série (St) = 2ème composante renvoyant à une lecture de CT. La composante saisonnière ➡ variations intra- annuelles régulières, récurrentes expliquées le plus souvent par le rythme des saisons la régularité de certains comportements socio- économiques. 20
➡ La composante résiduelle de la série (Ɛt) I.2. La décomposition du « mouvement brut » en 4 types d’éléments distincts ➡ La composante résiduelle de la série (Ɛt) = 3ème et dernière composante renvoyant à une lecture de CT. La composante résiduelle ➡ variations accidentelles ou exceptionnelles, donc imprévisibles de la série. ➥ Variations n’ayant pu être expliquées par les 3 composantes précédentes. 21
La composante résiduelle est donc considérée comme I.2. La décomposition du « mouvement brut » en 4 types d’éléments distincts Le caractère exceptionnel, accidentel de ces variations ➡ leur effet sur la série est temporaire, va disparaître. La composante résiduelle est donc considérée comme aléatoire car imprévisible mais plus ou moins stable autour d’une moyenne nulle (car corrigée à terme) ➥ 22
En définitive, l’analyse traditionnelle des séries temporelles porte I.2. La décomposition du « mouvement brut » en 4 types d’éléments distincts En définitive, l’analyse traditionnelle des séries temporelles porte dans un 1er temps sur l’existence ou non d’une saisonnalité, puis, dans un 2d temps, sur le choix du schéma explicatif pertinent. 23
II. La détection de la saisonnalité Avant de procéder à la dessaisonnalisation d’une chronique, il convient de tester l’existence de la composante saisonnière au risque de créer un « bruit » dans la chronique en cas de dessaisonnalisation inutile. Ensuite ➡ étude des principales méthodes de dessaisonnalisation. 24
II.1. Le tableau de Buys-Ballot II. La détection de la saisonnalité II.1. Le tableau de Buys-Ballot La méthode la plus immédiate de détection de la saisonnalité est l’observation de la représentation graphique de la série. Dans notre exemple, la saisonnalité est apparente. En complément de l’observation graphique, le tableau de Buys-Ballot permet de comparer année après année les valeurs de chaque sous-période. 25
II.2. Le tableau de Buys-Ballot Reprenons le tableau précédent et complétons-le par le calcul de moyennes et d’écarts types. ➥ Saisonnalité flagrante 26
II.2. Le tableau de Buys-Ballot 27
Le classement decrescendo des mois par année confirme la saisonnalité. II.2. Le tableau de Buys-Ballot Le classement decrescendo des mois par année confirme la saisonnalité. 28
II.2. Le tableau de Buys-Ballot La même analyse en valeurs trimestrielles cette fois confirme également la saisonnalité. 29
II.2. Le tableau de Buys-Ballot 30
II.2. L’analyse de la variance et le test de Fisher II. La détection de la saisonnalité II.2. L’analyse de la variance et le test de Fisher II.2.1. Principe du test de Fisher Même si les examens visuels des graphiques et tableaux nous ont permis de repérer facilement une saisonnalité, il convient de pratiquer le test de Fisher afin de confirmer avec (quasi-)certitude sa présence. 31
Le test de Fisher vérifie l’égalité des 2 variances II.2.1. Principe du test de FIsher Ce test suppose que la chronique doit être sans tendance. Si tel n’est pas le cas, il faut éliminer la tendance. Le test de Fisher vérifie l’égalité des 2 variances en calculant le rapport de l’une sur l’autre, et en comparant le résultat (Fisher empirique ou calculé, Fc) à une valeur théorique ( défini plus bas). 32
• Si le Fisher empirique n’est pas supérieur au Fisher théorique II.2.1. Principe du test de FIsher • Si le Fisher empirique n’est pas supérieur au Fisher théorique ➥ alors l’hypothèse (H0) d’égalité des deux variances est vérifiée. Cependant ce résultat n’est pas certain ➡ risque de première espèce (alpha) = rejet de l’hypothèse H0 alors qu’elle est vraie. v1 et v2 correspondent aux degrés de liberté respectifs de la variance inscrite au numérateur et de celle inscrite au dénominateur. 33
• Si le Fisher empirique est supérieur au Fisher théorique II.2.1. Principe du test de FIsher • Si le Fisher empirique est supérieur au Fisher théorique ➥ alors l’hypothèse (H0) d’égalité des deux variances n’est pas vérifiée. Dans notre cas, l’hypothèse H0 signifie que les deux facteurs considérés n’ont pas plus d’influence l’un que l’autre. Et puisque l’un des facteurs est le facteur résiduel, qui n’a pas d’influence à LT sur la série, H0 vérifiée signifie que le 2d facteur n’a pas non plus d’influence. 34
II.2.2. Le test de Fisher appliqué à notre chronique II.2. L’analyse de la variance et le test de Fisher II.2.2. Le test de Fisher appliqué à notre chronique a) Notations xij est la valeur observée pour le période j de l’année i, i=1…N et j=1…P. Dans notre exemple : N=8 et P=12. 35
Supposons que les valeurs xij de la série soient égales à : II.2. Le test de Fisher appliqué à notre chronique Supposons que les valeurs xij de la série soient égales à : où : ai mesure l’effet année, en ligne du tableau. Si l’effet année est significatif ➡ la chronique présente des changements de tendance (composante de LP de la série). 36
bj mesure l’effet période, en colonne du tableau. II.2. Le test de Fisher appliqué à notre chronique où : bj mesure l’effet période, en colonne du tableau. Si l’effet période est significatif ➡ la chronique présente une saisonnalité (composante de CP de la série). 37
II.2. Le test de Fisher appliqué à notre chronique ɛij représente la composante résiduelle de façon aléatoire par des éléments indépendants : L’effet résiduel va être mesuré comme la part de la variance non expliquée par les effets année et période. 38
b) Le test de Fisher en 3 étapes II.2. Le test de Fisher appliqué à notre chronique b) Le test de Fisher en 3 étapes 1ère étape : Calcul des variances des composantes de la série ➠ Calculs préalables : • Moyenne générale de la chronique (sur les NxP observations) : 39
• Variance de la chronique : II.2. Le test de Fisher appliqué à notre chronique 1ère étape : calcul des variances des composantes ➠ Calculs préalables : • Variance de la chronique : • Moyenne de l’année i : • Moyenne de la période j : 40
Moyennes par période et par année II.2. Le test de Fisher appliqué à notre chronique 1ère étape : calcul des variances des composantes Moyennes par période et par année 41
II.2. Le test de Fisher appliqué à notre chronique 1ère étape : calcul des variances des composantes ➠ Calcul et décomposition de ST, la somme des carrés des écarts à la moyenne : ➥ Décomposition de la série afin de tester les trois effets précédemment identifiés : effets année, période et résiduel. L’effet année ➡ somme des écarts des moyennes annuelles à la moyenne générale. L’effet période ➡ somme des écarts des moyennes mensuelles (ici) à la moyenne générale. L’effet résiduel ➡ somme des écarts des valeurs de la série non expliquée par les deux 1ers effets. 42
Reprenons la somme des carrés des écarts à la moyenne, ST : II.2. Le test de Fisher appliqué à notre chronique 1ère étape : calcul des variances des composantes Reprenons la somme des carrés des écarts à la moyenne, ST : Faisons apparaître les écarts respectifs des moyennes annuelles et mensuelles à la moyenne générale : et Les écarts à la moyenne deviennent : 43
Et la somme des écarts à la moyenne : II.2. Le test de Fisher appliqué à notre chronique 1ère étape : calcul des variances des composantes Et la somme des écarts à la moyenne : 44
4 variances vont être calculées : II.2. Le test de Fisher appliqué à notre chronique 1ère étape : calcul des variances des composantes 4 variances vont être calculées : • La variance année, VA, à partir de SA : avec (N-1) degrés de liberté. Dans notre exemple, VA = 8 074 925,27. 45
4 variances vont être calculées : II.2. Le test de Fisher appliqué à notre chronique 1ère étape : calcul des variances des composantes 4 variances vont être calculées : • La variance période, VP, à partir de SP : avec (P-1) degrés de liberté. Dans notre exemple, VP = 186 670 699,1. 46
4 variances vont être calculées : II.2. Le test de Fisher appliqué à notre chronique 1ère étape : calcul des variances des composantes 4 variances vont être calculées : • La variance résidu, VR, à partir de SR : avec (P-1)(N-1) degrés de liberté. Dans notre exemple, VP = 186 670 699,1. 47
4 variances vont être calculées : II.2. Le test de Fisher appliqué à notre chronique 1ère étape : calcul des variances des composantes 4 variances vont être calculées : • La variance totale, VT, à partir de ST. Dans notre exemple, VT = 22 796 892,74. 48
2ème étape : Test de l’influence du facteur période (mois ici) II.2. Le test de Fisher appliqué à notre chronique 2ème étape : Test de l’influence du facteur période (mois ici) Afin de tester l’influence du facteur période, le Fisher empirique compare la variance période à la variance résidu : L’hypothèse nulle H0 d’égalité des deux variances ➡ « absence d’influence du facteur période ». 49
Dans notre exemple, on obtient : II.2. Le test de Fisher appliqué à notre chronique 2de étape : test de l’influence du facteur période H0 est vérifiée si le Fisher empirique est inférieur au Fisher théorique lu dans la table avec v1=P-1 et v2=(N-1)(P-1). Dans notre exemple, on obtient : Et le Fisher théorique est : ➥ H0 est donc rejetée et l’effet période (i.e. la saisonnalité) amplement confirmé. 50
3ème étape : Test de l’influence du facteur année II.2. Le test de Fisher appliqué à notre chronique 3ème étape : Test de l’influence du facteur année Afin de tester l’influence du facteur année, le Fisher empirique compare la variance année à la variance résidu : L’hypothèse nulle H0 d’égalité des deux variances ➡ « absence d’influence du facteur année ». 51
Dans notre exemple, on obtient : II.2. Le test de Fisher appliqué à notre chronique 2de étape : test de l’influence du facteur année H0 est vérifiée si le Fisher empirique est inférieur au Fisher théorique lu dans la table avec v1=N-1 et v2=(N-1)(P-1). Dans notre exemple, on obtient : Et le Fisher théorique est : 52
➥ H0 est donc rejetée et l’effet année également amplement confirmé. II.2. Le test de Fisher appliqué à notre chronique 2de étape : test de l’influence du facteur période ➥ H0 est donc rejetée et l’effet année également amplement confirmé. Puisque le test de Fisher doit être réalisé sur une chronique sans tendance, il convient de refaire le test après avoir éliminé la tendance. 53
II.3. La sélection du schéma de décomposition de la chronique II. La détection de la saisonnalité II.3. La sélection du schéma de décomposition de la chronique II.3.1. Les 3 principaux schémas de décomposition Rappel : L’analyse des séries temporelles est classiquement réalisée en 2 temps. 1. Décomposition de la série en Tt, Ct, St et Rt. 2. Reconstitution de la série à des fins de prévisions. 54
Les différentes composantes peuvent s’influencer mutuellement ou non. III.3.1. Les 3 principaux schémas de décomposition ➥ Reconstitution réalisée à partir d’hypothèses sur l’indépendance ou l’interdépendance des 4 composantes. Dans la section précédente ➡ la série est affectée par un effet période mais aussi par un effet tendance. Les différentes composantes peuvent s’influencer mutuellement ou non. 55
Ce schéma de décomposition est dit additif. III.3.1. Les 3 principaux schémas de décomposition ➥ Les schémas de décomposition rendent compte des interactions possibles entre les composantes de la série : • Si l’on considère que les 4 composantes sont mutuellement indépendantes, alors la série recomposée s’écrit : Ce schéma de décomposition est dit additif. 56
Ce schéma de décomposition est dit multiplicatif. III.3.1. Les 3 principaux schémas de décomposition ➥ Les schémas de décomposition rendent compte des interactions possibles entre les composantes de la série : • Si l’on considère que les 3 1ères composantes sont interdépendantes*, alors la série recomposée s’écrit : Ce schéma de décomposition est dit multiplicatif. * Saisonnalité d’amplitude croissante (décroissante) en cas d’extra-saisonnier croissant (décroissant). 57
Ce schéma de décomposition est dit multiplicatif complet. III.3.1. Les 3 principaux schémas de décomposition ➥ Les schémas de décomposition rendent compte des interactions possibles entre les composantes de la série : • Si l’on considère que les 4 composantes sont interdépendantes*, alors la série recomposée s’écrit : Ce schéma de décomposition est dit multiplicatif complet. * Composantes saisonnière et résiduelle d’amplitude croissante (décroissante) en cas d’extra-saisonnier croissant (décroissant). 58
Exemples de schémas additif et multiplicatif III.3.1. Les 3 principaux schémas de décomposition Exemples de schémas additif et multiplicatif Source : B. Py (2007) 59
II.3.2. Le choix du schéma grâce au test de Buys-Ballot II.3. La sélection du schéma de décomposition de la chronique II.3.2. Le choix du schéma grâce au test de Buys-Ballot Le test de Buys-Ballot aide au choix du schéma de décomposition à partir du calcul des moyennes et écarts types par année. Le schéma multiplicatif ➡ amplitude croissante (ou décroissante) des données au cours du temps. ➥ Les écats types augmentent (baissent) quand les moyennes par année augmentent (baissent). 60
II.3.2. Le choix du schéma grâce au test de Buys-Ballot Et dans le cas du schéma additif, les amplitudes à peu près constantes ➡ les écarts types seront indépendants des moyennes par année. Le test de Buys-Ballot estime une relation entre σi et xi. par une régression linéaire (MCO) : 61
II.3.2. Le choix du schéma grâce au test de Buys-Ballot Si a1 est significativement ≠ 0 ➡ σi et xi. sont corrélés ➡ le schéma est multiplicatif. Si a1 n’est pas significativement ≠ 0 ➡ σi et xi. ne sont pas corrélés ➡ le schéma est additif. 62
II.3.2. Le choix du schéma grâce au test de Buys-Ballot L’adverbe « significativement » renvoie à l’intensité de la liaison entre σi et xi., mesurée par le coefficient de détermination (R2). En cas de régression linéaire simple, un R2 proche de 1 (proche de 0) suffit à affirmer que la liaison entre les 2 variables est forte (faible). Par exemple, un R2=0,9 signifie que 90% de la variabilité (ou variance) de σi sont expliqués par la liaison avec la variable xi. 63
Moyennes et écarts types par année II.3.2. Le choix du schéma grâce au test de Buys-Ballot Moyennes et écarts types par année 64
➥ Estimation des coefficients a0 et a1 par la méthode MCO : II.3.2. Le choix du schéma grâce au test de Buys-Ballot ➥ Estimation des coefficients a0 et a1 par la méthode MCO : minimisation de la somme des carrés des écarts (verticaux) des points de la série à la droite de régression : 65
➡ Calculs préalables : • Moyenne des xi. : • Moyenne des σi : II.3.2. Le choix du schéma grâce au test de Buys-Ballot ➡ Calculs préalables : • Moyenne des xi. : • Moyenne des σi : • Covariance des xi., σi : • Variance des xi. : 66
➡ Tableau de calculs : II.3.2. Le choix du schéma grâce au test de Buys-Ballot ➡ Tableau de calculs : 67
➡ Valeurs des coefficients a0 et a1 : II.3.2. Le choix du schéma grâce au test de Buys-Ballot ➡ Valeurs des coefficients a0 et a1 : Puisque la droite de régression linéaire passe par le point moyen , on trouve facilement a0 : 68
➡ Valeur du coefficient de corrélation linéaire R : II.3.2. Le choix du schéma grâce au test de Buys-Ballot ➡ Valeur du coefficient de corrélation linéaire R : Compris entre -1 et 1, R est généralement considéré comme significatif lorsque C’est le cas ici où 86,7% de la variabilité de σi sont expliqués par xi. 69
➡ Choix du schéma de décomposition : II.3.2. Le choix du schéma grâce au test de Buys-Ballot ➡ Choix du schéma de décomposition : Puisque la liaison entre σi et xi. est significative, le schéma de décomposition adéquate est le schéma multiplicatif. Cependant nous présenterons les méthodes de dessaisonnalisation pour chacun des deux schémas. 70
III. Lissage, dessaisonnalisation, et ajustement de la série Le lissage et la dessaisonnalisation de la chronique va permettre d’en isoler les 3 principales composantes (extra-saisonnier, saisonnier et résidu). 71
➥ Logique de la démarche : III. Lissage, dessaisonnalisation, et ajustement de la série ➥ Logique de la démarche : 1. Détermination de la tendance (Et) ; 2. Détermination de la saisonnalité (St) et dessaisonalisation de la série ; 3. Détermination du résidu (Rt) ; 4. Elaboration de la série ajustée à des fins de prévisions. 72
Deux méthodes peuvent être utilisées : III. Lissage, dessaisonnalisation, et ajustement de la série Deux méthodes peuvent être utilisées : La méthode analytique (par régression linéaire ou non linéaire) ; La méthode empirique (par lissage par les moyennes mobiles). Nous commencerons par la méthode empirique qui nous paraît plus intuitive et pédagogique. 73
III.1. Méthode empirique d’étude des chroniques et de leur ajustement III. Lissage, dessaisonnalisation, et ajustement de la série III.1. Méthode empirique d’étude des chroniques et de leur ajustement III.1.1. Lissage de la série et détermination du trend Il est parfois difficile d’imaginer visuellement la tendance d’une chronique (c’est le cas dans notre ex.). ➥ trop de pics et de creux pour permettre une détermination immédiate du trend. 74
Le lissage ➡ écrêter, raboter les dents de scie de la série brute afin III.1. Lissage de la série et détermination du trend Le lissage ➡ écrêter, raboter les dents de scie de la série brute afin d’en adoucir l’apparence visuelle, et ainsi résumer la série et rendre compte de l’extra-saisonnier (Et) ➥ 2 méthodes de lissage généralement utilisées : les « moyennes échelonnées » et les « moyennes mobiles » 75
a) Lissage de la série par les « moyennes échelonnées » III.1. Lissage de la série et détermination du trend a) Lissage de la série par les « moyennes échelonnées » Le lissage par les moyennes échelonnées consiste à réaliser des moyennes successives d’un nombre généralement impair de valeurs de la chronique. Exemple : par trimestre (ordre 3). ➥ Série « adoucie » des pics et des creux. 76
III.1. Lissage de la série et détermination du trend Dans le cas de notre chronique de la production française de maïs, on obtient : 77
La 2de méthode, celle des « moyennes mobiles », évite ces écueils. III.1. Lissage de la série et détermination du trend ➥ Méthode de lissage assez appauvrissante puisqu’il réduit énormément le nombre de valeurs. ➥ De plus, la saisonnalité de notre chronique est telle que le trend (d’ordre 3) ainsi calculé conserve des dents de scie. La 2de méthode, celle des « moyennes mobiles », évite ces écueils. 78
Lissage par les « moyennes échelonnées » III.1. Lissage de la série et détermination du trend Lissage par les « moyennes échelonnées » 79
b) Lissage de la série par les « moyennes mobiles » III.1. Lissage de la série et détermination du trend b) Lissage de la série par les « moyennes mobiles » Le lissage par les moyennes échelonnées consiste à réaliser des moyennes non plus successives mais imbriquées d’un nombre généralement impair de valeurs de la chronique. Le choix du lissage dépend du « rythme » apparent des variations régulières de la chronique*. * Constat valable également pour la 1ère méthode de lissage. 80
III.1. Lissage de la série et détermination du trend Dans notre exemple ➡ variations semblant suivre un rythme annuel ➡ (1er) lissage d’ordre 12. Problème : Lissage pair ➡ résultats « entre les lignes » ➡ 2d lissage nécessaire. ➥ Le lissage par moyennes mobiles a l’avantage de produire peu de perte de données. 81
III.1. Lissage de la série et détermination du trend 82
Lissage par les « moyennes mobiles » III.1. Lissage de la série et détermination du trend Lissage par les « moyennes mobiles » 83
III.1.2. La dessaisonnalisation de la chronique III. Lissage, dessaisonnalisation, et ajustement de la série III.1.2. La dessaisonnalisation de la chronique Le trend résume la série. La série « corrigée des variations saisonnières » (CVS), notée , exprime ce qu’aurait été la série s’il n’y avaut pas eu de saisons. ➥ Objectif de la dessaisonnalisation : éliminer la composante saisonnière, gommer l’influence des saisons. 84
III.1.2. La dessaisonnalisation de la chronique Le choix du schéma de décomposition va quelque peu modifier la méthode de dessaisonnalisation. Cependant, dans les 2 cas, la dessaisonnalisation procède par exploitation des écarts des valeurs de la série au trend. Ces écarts de la série au trend sont notés St car sont censés rendre compte de la saisonnalité*. ➥ Application de 2 méthodes à notre chronique. * En négligeant pour l’instant la composante résiduelle. 85
a) Dessaisonnalisation en cas de schéma additif de décomposition III.1.2. La dessaisonnalisation de la chronique a) Dessaisonnalisation en cas de schéma additif de décomposition En cas de schéma additif, les 3 étapes de dessaisonnalisation sont les suivantes : 1. Calcul des écarts de la série brute au trend par soustraction ➥ Calcul des écarts uniquement à partir de juillet 2001 et jusqu’en juin 2008 dans notre exemple. 86
III.1.2. La dessaisonnalisation de la chronique Par souci pédagogique, commençons par le mois de janvier 2002 (cf. tableau suivant). ➥ L’écart de la valeur brute au trend est calculé simplement en ligne : (3)=(1)-(2). On renouvelle ainsi l’opération et obtenons ainsi un écart pour chaque mois : 87
III.1.2. La dessaisonnalisation de la chronique 88
III.1.2. La dessaisonnalisation de la chronique 2. Calcul des « coefficients saisonniers » (Sj) et leur correction éventuelle ➥ Pour chacun des 12 mois, le coefficient saisonnier = moyenne arithmétique de l’ensemble des écarts calculés pour le mois envisagé. Ainsi, le coefficient du mois de janvier (5) = moyenne des écarts (3), (4), … jusqu’à l’écart du mois de janvier 2008. 89
III.1.2. La dessaisonnalisation de la chronique 90
On procède ainsi pour les 12 mois de l’année : III.1.2. La dessaisonnalisation de la chronique On procède ainsi pour les 12 mois de l’année : Puisque les coefficients servent à dessaisonnaliser la chronique, et qu’ils sont calculés à partir des écarts au trend, leur somme doit être égale à 0. Dans le cas contraire, il faut les corriger. 91
Dans notre exemple, la somme des Sj = -297,24. III.1.2. La dessaisonnalisation de la chronique Dans notre exemple, la somme des Sj = -297,24. ➥ Correction nécessaire des Sj, à partir du coefficient correcteur suivant : dans notre exemple ➥ Coefficients saisonniers corrigés, notés S’j : Par exemple pour janvier : (7)=(5)-(6) 92
III.1.2. La dessaisonnalisation de la chronique 93
III.1.2. La dessaisonnalisation de la chronique 3. Correction de la série brute par les coefficients saisonniers corrigés La série CVS est obtenue à partir des valeurs de la série brute diminuées des coefficients saisonniers : 94
La série CVS subit bien une annulation de l’effet saisonnier : III.1.2. La dessaisonnalisation de la chronique La série CVS subit bien une annulation de l’effet saisonnier : Ainsi, la série CVS rend compte uniquement des composantes extra-saisonnière et résiduelle. 95
III.1.2. La dessaisonnalisation de la chronique Dans notre exemple, la valeur CVS de janvier 2001 = différence entre valeur brute - coefficient saisonnier de janvier : (9)=(8)-(7) la valeur CVS de février 2001 = différence entre valeur brute - coefficient saisonnier de février : (12)=(10)-(11) la valeur CVS de janvier 2002 = différence entre valeur brute - coefficient saisonnier de janvier : (13)=(1)-(7) 96
III.1.2. La dessaisonnalisation de la chronique 97
Série brute et série CVS - Schéma additif III.1.2. La dessaisonnalisation de la chronique Série brute et série CVS - Schéma additif 98
Trend et série CVS - Schéma additif III.1.2. La dessaisonnalisation de la chronique Trend et série CVS - Schéma additif 99
4. Estimation de la composante résiduelle III.1.2. La dessaisonnalisation de la chronique 4. Estimation de la composante résiduelle La composante résiduelle est estimée à partir de l’équation de la série CVS : 100
b) Dessaisonnalisation en cas de schéma multiplicatif de décomposition III.1.2. La dessaisonnalisation de la chronique b) Dessaisonnalisation en cas de schéma multiplicatif de décomposition En cas de schéma multiplicatif, les 3 étapes de dessaisonnalisation sont les suivantes : 1. Calcul des écarts de la série brute au trend par division cette fois ➥ Calcul des écarts uniquement à partir de juillet 2001 et jusqu’en juin 2008, comme dans le cas additif. 101
III.1.2. La dessaisonnalisation de la chronique ➥ L’écart de la valeur brute au trend est calculé simplement en ligne : (3)=(1)/(2). On renouvelle ainsi l’opération et obtenons ainsi un écart pour chaque mois : 102
III.1.2. La dessaisonnalisation de la chronique 103
III.1.2. La dessaisonnalisation de la chronique 2. Calcul des « coefficients saisonniers » (Sj) et leur correction éventuelle ➥ Comme dans le modèle additif, pour chacun des 12 mois, le coefficient saisonnier = moyenne arithmétique de l’ensemble des écarts calculés pour le mois envisagé. Ainsi, le coefficient du mois de janvier (5) = moyenne des écarts (3), (4), … jusqu’à l’écart du mois de janvier 2008. 104
III.1.2. La dessaisonnalisation de la chronique 105
On procède ainsi pour les 12 mois de l’année : III.1.2. La dessaisonnalisation de la chronique On procède ainsi pour les 12 mois de l’année : Dans le modèle multiplicatif, la moyenne des coefficients saisonniers doit être égale à 1. Dans le cas contraire, il faut les corriger. 106
Le coefficient de correction reste la moyenne des coefficients Sj. III.1.2. La dessaisonnalisation de la chronique Dans le modèle multiplicatif, les coefficients corrigés S’j sont obtenus en divisant les coefficients saisonniers par le coefficient de correction : Le coefficient de correction reste la moyenne des coefficients Sj. Dans notre exemple, la moyenne des Sj = 0,99994. Inutile donc de corriger les coefficients saisonniers : 107
III.1.2. La dessaisonnalisation de la chronique 3. Correction de la série brute par les coefficients saisonniers corrigés La série CVS est obtenue à partir des valeurs de la série brute divisées par les coefficients saisonniers : 108
III.1.2. La dessaisonnalisation de la chronique Encore une fois, la série CVS subit bien une annulation de l’effet saisonnier : et ne rend compte que des composantes extra- saisonnière et résiduelle. 109
III.1.2. La dessaisonnalisation de la chronique Dans notre exemple, la valeur CVS de janvier 2001 = différence entre valeur brute - coefficient saisonnier de janvier : (7)=(6)/(5) la valeur CVS de février 2001 = différence entre valeur brute - coefficient saisonnier de février : (10)=(8)/(9) la valeur CVS de janvier 2002 = différence entre valeur brute - coefficient saisonnier de janvier : (11)=(1)/(5) 110
III.1.2. La dessaisonnalisation de la chronique 111
Série brute et série CVS - Schéma mutiplicatif III.1.2. La dessaisonnalisation de la chronique Série brute et série CVS - Schéma mutiplicatif 112
Trend et série CVS - Schéma multiplicatif III.1.2. La dessaisonnalisation de la chronique Trend et série CVS - Schéma multiplicatif 113
4. Estimation de la composante résiduelle III.1.2. La dessaisonnalisation de la chronique 4. Estimation de la composante résiduelle La composante résiduelle est ici aussi estimée à partir de l’équation de la série CVS : 114
III.1.3. La série ajustée La série « ajustée », notée , est obtenue III. Lissage, dessaisonnalisation, et ajustement de la série III.1.3. La série ajustée La série « ajustée », notée , est obtenue en ajoutant dans le modèle additif ou en multipliant dans le modèle multiplicatif le trend et les coefficients saisonniers corrigés. 115
Schéma multiplicatif : III.1.3. La série ajustée Schéma additif : Schéma multiplicatif : La série ajustée exprime ce qu’aurait été le mouvement de la chronique en cas de saisonnalité parrfaitement régulière d’année en année. ➥ Calcul de la série ajustée à partir du trend des moyennes mobiles, dans chacun des deux schémas. 116
Série ajustée - Schéma additif III.1.3. La série ajustée Série ajustée - Schéma additif 117
Série ajustée - Schéma multiplicatif III.1.3. La série ajustée Série ajustée - Schéma multiplicatif 118
III.1.3. La série ajustée Dans les 2 schémas, la reconstitution de la série ajustée à partir du trend et des coefficients saisonniers colle vraiment à la série brute. Limite dans le schéma additif : quelques valeurs négatives (lorsque le coefficient saisonnier > trend). En projetant le trend dans le futur, on peut en déduire une série ajustée prévisionnelle. Il est cependant préférable de réaliser une telle projection à partir d’un trend calculé de façon analytique ➡ section suivante. 119
III. Lissage, dessaisonnalisation, et ajustement de la série III.2. Méthode(s) analytique(s) d’étude des chroniques et de leur ajustement Dans un premier temps, l’application des méthodes empiriques nous a permis de mieux cerner les différentes étapes de l’analyse des chroniques. Cependant, l’étude des séries temporelles est réalisée à partir de nombreuses méthodes analytiques. 120
III.2. Méthode(s) analytique(s) d’étude des chroniques et de leur ajustement Nous nous limiterons à la présentation de celle permettant de déterminer un trend linéaire par la méthode MCO. Ce qui nous permettra dans un second temps de réaliser une projection de la chronique dans un futur proche (1 an). 121
III.2.1. Trend par la méthode MCO et série ajustée III.2. Méthode(s) analytique(s) d’étude des chroniques et de leur ajustement III.2.1. Trend par la méthode MCO et série ajustée Dans la section III.1. ➡ Calcul de la composante Et empiriquement grâce aux moyennes mobiles. Dans la présente section ➡ calcul de la composante Et analytiquement grâce à la méthode MCO sous forme d’une équation linéaire. 122
a) MCO et régression linéaire III.2.1. Trend par la méthode MCO et série ajustée a) MCO et régression linéaire Grâce aux moyennes mobiles ➡ trend « relativement » linéaire légèrement décroissant. Grâce à la méthode MCO ➡ trend strictement linéaire adapté à notre exemple, sous forme d’une droite d’équation : 123
Décrivons de près l’équation du trend linéaire : III.2.1. Trend par la méthode MCO et série ajustée Décrivons de près l’équation du trend linéaire : La variable explicative est le temps (t) (le mois dans notre exemple). Les paramètres a0 et a1 vont être estimés par la méthode MCO. Le résidu ɛt est négligé puisqu’il est supposé n’être que transitoire. 124
III.2.1. Trend par la méthode MCO et série ajustée L’équation ➡ comment l’extra-saisonnier (variable expliquée) va évoluer dans le temps (variable explicative) de manière linéaire (relation affine). La méthode MCO ➡ estimation des paramètres a0 et a1 de façon à ce que la somme des carrés des écarts (verticaux) des points de la série brute à la droite de régression soit minimale : 125
• Moyenne de la variable t=1…96 : III.2.1. Trend par la méthode MCO et série ajustée Concernant la variable temps ➡ t=1…96 (de janvier 2001 à décembre 2008). ➠ Calculs préalables : • Moyenne de la variable t=1…96 : • Moyenne de la variable xt : 126
➠ Calculs préalables (suite) : III.2.1. Trend par la méthode MCO et série ajustée ➠ Calculs préalables (suite) : • Covariance des t et xt : • Variance des t : 127
Calcul des paramètres a0 et a1 III.2.1. Trend par la méthode MCO et série ajustée Calcul des paramètres a0 et a1 … 128
➠ Valeurs des paramètres a0 et a1 qui minimisent la somme III.2.1. Trend par la méthode MCO et série ajustée ➠ Valeurs des paramètres a0 et a1 qui minimisent la somme 129
➠ Calcul du coefficient de corrélation linéaire R : III.2.1. Trend par la méthode MCO et série ajustée ➠ Calcul du coefficient de corrélation linéaire R : La faible valeur du R renvoie à la forte dispersion des valeurs de la série brute autour du trend. 130
Trend linéaire calculé grâce aux MCO III.2.1. Trend par la méthode MCO et série ajustée Trend linéaire calculé grâce aux MCO 131
b) Séries ajustée et prévisionnelle III.2.1. Trend par la méthode MCO et série ajustée b) Séries ajustée et prévisionnelle Sur le graphique suivant ➡ série ajustée calculée à partir du trend linéaire dans le cadre du schéma multiplicatif. Comparés aux trends calculés par les moyennes mobiles, le trend linéaire semble renforcer le caractère multiplicatif du schéma. ➥ amplitudes des variations saisonnières diminuant dans le temps. 132
Série ajustée (trend linéaire) - schéma multiplicatif III.2.1. Trend par la méthode MCO et série ajustée Série ajustée (trend linéaire) - schéma multiplicatif 133
III.2.1. Trend par la méthode MCO et série ajustée La régression MCO facilite la projection du trend dans le futur (valeurs de t > 96). Puis l’application des coefficients de saisonnalité permet de prolonger la série ajustée dans le futur. (cf. zone rosée du graphique). Le tableau suivant fournit les valeurs de la série ajustée pour la projection de l’année suivante, i.e. 2009. Des régressions non linéaires peuvent être également réalisées ➡ cf. dernière section. 134
Série ajustée (trend linéaire) - schéma multiplicatif III.2.1. Trend par la méthode MCO et série ajustée Série ajustée (trend linéaire) - schéma multiplicatif 135
Projection de la série ajustée en 2009 III.2.1. Trend par la méthode MCO et série ajustée Projection de la série ajustée en 2009 136
III.2.2. MCO et régressions non linéaires III.2. Méthode(s) analytique(s) d’étude des chroniques et de leur ajustement III.2.2. MCO et régressions non linéaires Le trend d’une série n’est pas forcément linéaire ; il peut prendre les principales autres formes suivantes : exponentielle logarithmique logistique hyperbolique Il est possible de déterminer les paramètres de ces régressions non linéaires par les MCO après avoir (log-)linéariser les relations recherchées. 137
Courbe exponentielle (a=0,2, b=0,1) III.2.2. MCO et régressions non linéaires • Courbe exponentielle d’équation Courbe exponentielle (a=0,2, b=0,1) 138
• Courbe exponentielle d’équation III.2.2. MCO et régressions non linéaires • Courbe exponentielle d’équation Soit la relation linéaire : avec la transformation : 139
Courbe logarithmique (a=1, b=0,5) III.2.2. MCO et régressions non linéaires • Courbe logarithmique d’équation Courbe logarithmique (a=1, b=0,5) 140
• Courbe logarithmique d’équation III.2.2. MCO et régressions non linéaires • Courbe logarithmique d’équation Soit la relation linéaire : avec la transformation : 141
Courbe logistique (a=0,2, b=10, k=100) III.2.2. MCO et régressions non linéaires • Courbe logistique d’équation Courbe logistique (a=0,2, b=10, k=100) 142
• Courbe logistique d’équation III.2.2. MCO et régressions non linéaires • Courbe logistique d’équation Soit la relation linéaire : avec la transformation : 143
Courbe hyperbolique (a=1000) III.2.2. MCO et régressions non linéaires • Courbe hyperbolique d’équation Courbe hyperbolique (a=1000) 144
• Courbe hyperbolique d’équation III.2.2. MCO et régressions non linéaires • Courbe hyperbolique d’équation Soit la relation linéaire : avec la transformation : 145
Conclusion du chapitre 3 et conclusion générale du cours 146