Prévision du nombre de naissances à moyen terme BERGOT Guillaume HAVEZ Maxime
PLAN Présentation du contexte Problématique Mise en place du modèle Endogène Exogènes Résultats Bilan
Présentation La démographie joue un rôle essentiel dans l’économie Démographie => Effet négatif sur la croissance Secteurs concernés => Santé, Education, Protection sociale, … La natalité Mariage Enfant Age moyen premier mariage 2009 => 30 ans Age moyen premier enfant 2009 => 30 ans Pour accueillir un enfant Changement domicile (Corrélation construction ?) Processus relativement long Mortalité ou natalité - Natalité -> On a des variables explicative différentes (maladie pour le décès, nombre de mariage pour les naissances…) L’évolution de la démographie joue un rôle extrêmement important dans l’économie - Pas seulement sur l’économie directement lié aux naissances (ex: vente de couche) On souhaitait évaluer l’impact du nombre de mariage l’année précédente et le cout de la construction sur le nombre de mariage exprimés par Malthus, la croissance de la population aurait un effet négatif sur la croissance des revenus car elle crée une surcharge, au moins à court terme, sur les ressources naturelles peu abondantes ainsi que sur les ressources renouvelables créées par l’homme Processus long -> On ne va pas changer de tendance de manière brutale
Problématique Quel sera le nombre de naissances à moyen terme (4/5 ans) ? Etude basée sur des données trimestrielles de 3 variables quantitatives Une endogène Le nombre de naissances en millier depuis 1975 Deux exogènes Le nombre de mariages en millier depuis 1975 L’indice du cout de construction depuis 1975 La problématique consiste à connaître le nombre de n au cours des 4 prochaines années -> Le premier pb est de savoir quelle fréquence nous souhaitions étudier -> Trimestre bon compromis (pas trop « smooth ») fait apparaitre les saisonnalités L'indice du coût de la construction mesure chaque trimestre l'évolution des prix des bâtiments neufs à usage principal d'habitation. Il s'agit du prix TVA incluse, payé par les maîtres d'ouvrages aux entreprises de construction. Il s'attache exclusivement aux travaux de construction. Il exclut les prix et coûts liés au terrain (viabilisation, fondations spéciales...), ainsi que les honoraires, les frais de promotion et les frais financiers. Il ne couvre pas non plus les opérations d'entretien-amélioration.
Endogène - Nombre de naissances Série Brut - Série saisonnière, saison régulière - Pas de réelle tendance -> Step 1 : Vérifier l’impact des éxogènes -> Step 2 : Ajuster le modèle CVS –> Deterministe ou stochastique ? Série fortement saisonnière -> Si l’on différencie de manière saisonnière on obtient les résidus suivant, et ce sont ces fluctuations que l’on va essayer d’améliorer par le biais des exogènes.
Exogène - Nombre de mariages Série Brut => 2 saisonnalités Série corrigée (tendance et saisonnalité) - Déterministe CVS –> Déterministe ou stochastique ? L’observation de la série brute permet, comme bien souvent, d’observer un nombre important d’élément Ici la série est globalement très régulière, on choisit donc d’essayer de capter via un modèle déterministe. 2 aspects différents : - Une tendance qui change en 1990 - Une variation qui augmente après 1991 - Afin de choisir les dates exactes, on a utiliser les indicateurs du type MSE, AIC On obtient finalement une série quasi stationnaire -> vérifiée par le test de dickey fuler
Exogène – Nombre de mariages Si on observe les prévisions de la méthode déterministe on voit qu’elles collent bien aux données > On introduit donc des dummy, et on teste différents modèles de régression qui valident ou non la prise en compte de tels ou tels information > On regarde pour cela les critères d’information classique (AIC, SBC,…) L’objectif suivant étant de simuler les résidus, on observe les autocorrélations et autocorrélations partielles. On choisit finalement un ARMA(3,3) Remarque : il est difficile de capter toute la saisonnalité avec le modèle déterministe mais on va tenter d’expliquer un peu mieux les résidus
Exogène – Nombre de mariages Prévision intra-échantillon – Méthode déterministe On a donc un modèle qui correspond plutôt bien aux données, un modèle que l’on a souhaité simple puisqu’il s’agit de l’exogène L’ajout de l’ARMA(3,3) permet bien de gagner en précision (moins d’erreur) Bilan sur cette variable : On peut comparer à la méthode en différence stochastique Sans prise en compte de l’ARMA des résidus Critère Sans Fluctuation Avec Fluctuation AIC 20.18 19.49 BIC 20.39 19.83 Standard Error of Estimate 5621 3909
Exogène – Coût de construction Série Brut CVS –> Deterministe ou stochastique ? La série brute en bleue correspond donc à une série avec une forte composante de tendance On observe également une valeur extrême au 3e trimestre de 2008, que l’on va capter par une dummy. Les résidus correspondent à ceux de la régression de tendance. -> On peut clairement discuter la stationnarité Le test du CUSUM est bon alors que celui du cusum square ne l’est pas
Exogène – Coût de construction Analyse des fluctuations stationnaires Nous avons ôté cette tendance de manière déterministe, et l’on obtient un processus quasi stationnaire, qui correspond aux fluctuation On peut voir un modèle AR(2), de part l’analyse des autocorrélations et des autocorrélations partielles… On décide donc d’un AR(2) pour ces fluctuations : et on obtient donc un modèle … Bilan : on voulait volontaire avoir un modèle facil, puisque l’objectif est de s’en servir en tant qu’éxogène du nombre de naissance
Exogène – Coût de construction Prévision intra-échantillon – Méthode déterministe Test du CUSUM et Prévision hors échantillon Visuellement, on voit que notre modèle est stable Les indicateurs, MSE et AIC ….
Le modèle Objectif : Prévoir le nombre de naissances Modèle de l’endogène Fluctuations saisonnières que l’on souhaite capter à l’aide des variables exogènes Utilisation d’une Fonction de Transfert Ajuster le modèle en fonction de l’influence des exogènes Quand est ce que le nombre de mariages (ou l’ICC) a une influence sur l’endogène? Nombre de mariages => t-3 ? t-2 ? Indice de construction => t Déterminer les délais « d’action » des exogènes
Les prévisions des exogènes Nombre de mariages – One-Step Ahead ICC – One-Step Ahead
𝑦 𝑡 (4) =𝛼 𝐼𝐶𝐶 𝑡 + 𝑗=0 3 𝛽 𝑗 𝑁𝐵𝑀 𝑡−𝑗 + 𝜀 𝑡 Le modèle initial 𝑦 𝑡 (4) = 𝑖=𝐼0 𝐼 𝛼 𝑖 𝐼𝐶𝐶 𝑡−𝑖 + 𝑗=𝐽0 𝐽 𝛽 𝑗 𝑁𝐵𝑀 𝑡−𝑗 + 𝜀 𝑡 déterminer I, I0, J, J0 et K On obtient le modèle suivant 𝑦 𝑡 (4) =𝛼 𝐼𝐶𝐶 𝑡 + 𝑗=0 3 𝛽 𝑗 𝑁𝐵𝑀 𝑡−𝑗 + 𝜀 𝑡 Analyse des résidus du modèle
Le modèle Finalement, jusque maintenant on a réussi à améliorer la qualité prédictive, mais ce n’est pas extrêmement significatif parce que nous avons une série qui a là base reste relativement simple et s’explique bien par un modèle simple. On a la stabilité du modèle
Prévision Intra et HorsEchantillon Hors échantillon On a comparer visuellement a la prévision d’un MA 3 et on se rapproche d’avantage de la réalité, se qui est confirmer par les MSE, AIC, … Cependant on voit que certain endroit sont mal prédit… On arrive au but, à savoir la prévision, et on constate évidement l’importance de la saison L’autocorr des réisidus laisse penser qu’il s’agit bien d’un bruit blanc -> optimalité de la prévision
BILAN Modèle qui améliore sensiblement la prévision Une endogène complexe, et des exogènes simples Le gain est il suffisamment important ? Le stochastique ne serait il pas plus simple pour rentrer dans les hypothèses de stationnarité ?
Faire plus de description des données Données numérique Faire des prévisions intra à h périodes en avant Faire de la tendance Déterministe sur la variable NN !