La Méthodologie de Box-Jenkins

Slides:



Advertisements
Présentations similaires
Mais vous comprenez qu’il s’agit d’une « tromperie ».
Advertisements

Le Nom L’adjectif Le verbe Objectif: Orthogram
ORTHOGRAM PM 3 ou 4 Ecrire: « a » ou « à » Référentiel page 6
Reporting de la Cellule Nationale Droit dOption Situation au 31 décembre 2011.
CHAPITRE 8 LES ALIMENTS 3/25/2017 Des fruits Madame Craven.
Présentation de la circonscription Année 2011/2012 Jeudi 24 novembre 2011.
Additions soustractions
Distance inter-locuteur
1 Plus loin dans lutilisation de Windows Vista ©Yves Roger Cornil - 2 août
Le château Clique le plus rapidement possible sur le numéro de la chambre du trésor : 6 ?
ACTIVITES NUMERIQUES Ranger les nombres Trouver le nombre manquant
7 juin 2012 DGAL.
Les numéros 70 –
Les numéros
Les identités remarquables
Le, la, les words Possessive Adjectives MINE!!. 2 My in french is mon, ma,mes... Le word/ begins with a vowel: Mon La word: Ma Les word: Mes.
Xavier Mouranche Registre e-MUST Evaluation en Médecine dUrgence des Stratégies Thérapeutiques de lInfarctus du Myocarde.
LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.
Données statistiques sur le droit doption au 31/01 8 février 2012.
LA RÉGRESSION MULTIPLE
Analyse de la variance à deux facteurs (données déséquilibrées) Michel Tenenhaus.
La régression simple Michel Tenenhaus
Modèle Linéaire Généralisé (Proc Genmod)
Correspondances en Onco-Urologie - Vol. III - n° 3 – juillet-août-septembre VESSIE Daprès James ND et al., N Engl J Med 2012;366:16:
Technologies et pédagogie actives en FGA. Plan de latelier 1.Introduction 2.Les technologies en éducation 3.iPads 4.TNI 5.Ordinateurs portables 6.Téléphones.
Enquête sur le Rapport de la Commission Bouchard-Taylor Jack Jedwab Directeur général Association détudes canadiennes 11 juin 2008.
Révision (p. 130, texte) Nombres (1-100).
La législation formation, les aides des pouvoirs publics
La méthodologie………………………………………………………….. p3 Les résultats
1 Juin 2010 Sondage auprès des jeunes Marocains résidant en Europe ( France, Espagne, Italie, Belgique, Pays-Bas et Allemagne ) Juin 2010 Réf. : TL251.
Structure(djs)TéléphoneFax ADRA R049,96,03,21 CHLEF027,77,22,66 /77,49, LAGHOUAT029,90,41,08029,90,42,47 OUM EL BOUAGHI032,42,16,26032,42,45,32.
La mesure de tendance centrale
Jack Jedwab Association détudes canadiennes Le 27 septembre 2008 Sondage post-Olympique.
Le soccer & les turbans Sondage mené par lAssociation détudes canadiennes 14 juin 2013.
Présentation générale
Le drapeau canadien comme symbole de fierté nationale : une question de valeurs partagées Jack Jedwab Association détudes canadiennes 28 novembre 2012.
Et la disparition de notre
Les nombres.
Les quartiers Villeray – La Petite-Patrie et les voisinages
Fierté envers les symboles et institutions canadiens Jack Jedwab Association détudes canadiennes 26 novembre 2012.
Conseil Administration AFRAC – 2 décembre Toulouse 1 Fermes de références Palmipèdes à foie gras Synthèse régionale – Midi Pyrénées Exercice
La consommation de boissons alcooliques chez les jeunes LICEO SCIENTIFICO N. COPERNICO PRATO ELEVES (age ans): 342 F: 192 M: 150.
LES NOMBRES PREMIERS ET COMPOSÉS
CLL11 : chlorambucil (CLB) versus CLB + rituximab (R)
Les chiffres & les nombres
1.Un rang de données multicolores 2. Deux permutations des n premiers entiers 3. b permutations des k premiers entiers 4. Choix de n points dans [0,1]
Les Monnaies et billets du FRANC Les Monnaies Euro.
RACINES CARREES Définition Développer avec la distributivité Produit 1
DUMP GAUCHE INTERFERENCES AVEC BOITIERS IFS D.G. – Le – 1/56.
La statistique descriptive
Les maths en francais 7ième année.
Année universitaire Réalisé par: Dr. Aymen Ayari Cours Réseaux étendus LATRI 3 1.
Jean-Marc Léger Président Léger Marketing Léger Marketing Les élections présidentielles américaines.
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
1 INETOP
Les Nombres 0 – 100 en français.
Aire d’une figure par encadrement
Écart moyen et écart type
P.A. MARQUES S.A.S Z.I. de la Moussière F DROUE Tél.: + 33 (0) Fax + 33 (0)
Les fondements constitutionnels
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
Traitement de différentes préoccupations Le 28 octobre et 4 novembre 2010.
1/65 微距摄影 美丽的微距摄影 Encore une belle leçon de Macrophotographies venant du Soleil Levant Louis.
Certains droits réservés pour plus d’infos, cliquer sur l’icône.
Nom:____________ Prénom: ___________
Annexe Résultats provinciaux comparés à la moyenne canadienne
La formation des maîtres et la manifestation de la compétence professionnelle à intégrer les technologies de l'information et des communications (TIC)
IMPRESS : y a-t-il un bénéfice à poursuivre le géfitinib en association à la chimiothérapie lors de la résistance acquise ? Essai randomisé Patients Cisplatine.
Bienvenue.
Transcription de la présentation:

La Méthodologie de Box-Jenkins Michel Tenenhaus

1. Les données Une série chronologique assez longue (n  50). Exemple : Ventes d’anti-inflammatoires en France de janvier 1978 à juillet 1982. Objectif : Prévoir les ventes d’août à décembre 1982.

Marché total des anti- inflammatoires

Marché total des anti-inflammatoires

2. Stabiliser la série Il faut TRANSFORMER la série observée de manière à - enlever la tendance, - enlever la saisonnalité, - stabiliser la variance.

Pour enlever la tendance Faire des différences régulières d’ordre d : d = 1 d = 2 Différence régulière d’ordre d : Dans la pratique d = 0,1, rarement 2

Marché total des anti-inflammatoires : Différence régulière d’ordre d = 1

Pour enlever la saisonnalité Ordre de la saisonnalité : s = 12 (mois) ou 4 (trimestre) Faire des différences saisonnières d’ordre D : D = 1 D = 2 Différence saisonnière d’ordre D : Dans la pratique D = 0,1, très très rarement 2

Marché total des anti-inflammatoires : Différence saisonnière (s = 12) d’ordre D = 1

Pour enlever tendance et saisonnalité Formule générale : On peut choisir d et D minimisant l’écart-type de wt. Application Marché total : s = 12, d = 1, D = 1

Marché total des anti-inflammatoires : Différence régulière/saisonnière (s = 12, d = 1, D = 1)

Calcul des séries différenciées

Calcul des écarts-types s = 12, d = 1, D = 1

Développement de zt De On déduit valeur 1 an avant évaluation de la tendance terme aléatoire On va modéliser la série « stationnaire » wt.

Pour stabiliser la variance On utilise souvent les transformations

3. Le modèle statistique On suppose que la série stabilisée (w1,…,wN) provient d’un processus stationnaire (wt) : Indépendant de la période t Dans des conditions assez générales tout processus stationnaire peut être approché par des modèles AR(p), MA(q) ou ARMA(p,q).

AR(p) : Auto-régressif d’ordre p où at est un bruit blanc : Remarque :

MA(q) : Moyenne Mobile d’ordre q Remarque :

ARMA(p,q) Remarque :

Question Réponse Comment choisir le modèle correspondant le mieux aux données étudiées ? Réponse On utilise les autocorrélations k et les autocorrélations partielles kk.

4. Autocorrélation

Exemple : Marché Total Différence régulière/saisonnière : d = 1, D = 1 Autocorrélations calculées

Exemple : Marché Total Différence régulière/saisonnière : d = 1, D = 1 Corrélogramme observé Formule de Bartlett

Variance des autocorrélations rk Formule de Bartlett (Hypothèse : h = 0 pour h  k) Formule de Box-Jenkins pour un bruit blanc (Hypothèse : h = 0 pour h  1)

Test : H0 : k = 0 On rejette H0 : k = 0 au risque  = 0.05 si Application Marché total : Corrélogramme théorique k 1  k 1 = 0, k = 0 pour k > 1

5. Autocorrélation partielle Régression de wt sur wt-1,…,wt-k : Autocorrélation partielle d’ordre k : C’est une corrélation partielle :

Calcul pratique de estimation de kk Soit : Etc… On obtient les estimations des kk en remplaçant les k par rk.

Exemple : Marché Total Différence régulière/saisonnière : d = 1, D = 1 Autocorrélations partielles calculées Rejet de H0 : kk = 0 si:

Corrélogramme partiel observé partiel théorique kk 1 2 14     k

6. Autocorrélations et autocorrélations partielles des modèles AR(p) et MA(q) (b) : AR(1)

AR(2) Le dernier pic significatif du corrélogramme partiel donne (b) : Le dernier pic significatif du corrélogramme partiel donne l’ordre p du modèle AR(p).

MA(1) (a) : (b) :

MA(q) (a) : q = 2 (b) : q = 5 (c) : q = 6 Le dernier pic significatif du corrélogramme donne l’ordre q du modèle MA(q).

7. Étude de la série Marché Total Les autocorrélations suggèrent un modèle MA(1). Les autocorrélations partielles suggèrent un modèle AR(14).

7.1 Étude de la voie moyenne mobile On suppose que wt suit un modèle MA(1) : et on a  = E(wt) = . On choisit les paramètres ,  et 2 à l’aide de la méthode du maximum de vraisemblance.

Maximum de vraisemblance On suppose que le vecteur aléatoire w = (w1,…,wN) suit une loi multinormale. Densité de probabilité de w : On recherche maximisant la vraisemblance

Qualité de l’ajustement dans ARIMA où r est le nombre de paramètres (hors 2). On recherche le modèle minimisant SBC.

Modèle MA(1) avec constante

Modèle MA(1) sans constante

Modélisation de zt De On déduit marché 1 an avant évaluation de la tendance choc aléatoire en t en t-1

Calcul des prévisions et des erreurs Modèle : Prévision de zt réalisée en t-1 : Erreur de prévision à l’horizon 1 : Calcul pratique des prévisions et des erreurs sur l’historique:

Résultats

Résultats (suite)

Résultats (fin) Vérifier les calculs pour

Graphique des ventes observées et prédites

Graphique des résidus

Qualité de l’ajustement dans Time Series Modeler

Validation du modèle Étude des

Validation du modèle Corrélogramme des     Formule de Box-Jenkins théorique des erreurs bt k(bt) 12     k

Validation du modèle : Utilisation de la statistique de Ljung-Box La statistique de Ljung-Box suit une loi du khi-deux à m-r ddl lorsque les résidus forment un bruit blanc. On accepte le modèle étudié si les niveaux de signification sont > .05 pour différentes valeurs de m.

Utilisation du modèle estimé en prévision Prévision de z55+h réalisée en t = 55 : h = 1 h = 2 Et ainsi de suite…

Application

Intervalle de prévision à 95% de z55+h Chaque modèle a sa propre formule de construction de l’intervalle de prévision. Modèle MA(1) :

Amélioration du modèle MA(1) est significatif. On suppose maintenant le modèle De on déduit :

Demande SPSS

Résultats

7.2 Étude de la voie autorégressive On suppose que wt suit un modèle AR(14) :  est appelé Constant dans SPSS et on a  = (1 - 1 -…- 14). On choisit les paramètres , 1,…,14 et 2 à l’aide de la méthode du maximum de vraisemblance.

Résultats

Modèle AR : p = (1,2,12,13,14) avec cste Demande SPSS

Résultats

Modèle AR : p = (1,2,12,13,14) sans cste Demande SPSS

Résultats

Modèle AR : p = 2, P = 1 avec cste Demande SPSS

Résultats

Modèle AR : p = 2, P = 1 sans cste Demande SPSS

Résultats

Résultats

Résultats avec Time Series Modeler

Résultats avec Time Series Modeler

7.3 Étude de la voie AR/MA Modèle avec constante

Résultats

7.3 Étude de la voie AR/MA Modèle sans constante

Résultats

Résultats

Résultats (avec Time Series Modeler)

Résultats (avec Time Series Modeler)

8. Le modèle multiplicatif usuel ARIMA(p,d,q)*(P,D,Q)s bruit blanc wt où : Tous ces polynômes doivent être inversibles.

9. Prévision Le modèle général peut s’écrire :

Prévision à l’horizon h Modèle Prévision avec :

10. Calcul de l’intervalle de prévision on déduit (formellement) :

Prévision de zt+h à l’instant t On a Futur Passé D’où la prévision de zt+h à l’instant t

Erreur de prévision à l’horizon h D’où :

Intervalle de prévision à 95% de zt+h réalisé à l’instant t

Exemple « Marché Total » Modèle : On déduit : Remarque :

Marché Total : Intervalle de prévision à l’horizon h  12

11. Le modèle général de TS Modeler Le modèle à fonction de transfert Nt = « Noise »

Application à la série IPI Indice de la Production Industrielle de la France (1963 - 1982)

Visualisation de la série IPI Cette série présente une tendance et une saisonnalité

Visualisation de la saisonnalité

Visualisation de la tendance Tendance Zt Moyenne mobile centrée d’ordre 4 :

Modèle avec intervention Effet mai 68 Nt = « Noise » = Série corrigée stationnarisée Étapes Construction de la série « Noise » Modélisation de la série « Noise » Estimation du modèle complet

Etape 1 : Construction de la série « Noise »

Étape 2 : Modélisation de la série « Noise » Noise suit un AR(8)

Modélisation de la série « Noise » Noise ~ ARIMA(8,1,0)*(0,1,0)4

Modélisation de la série « Noise » Noise ~ ARIMA(0,1,0)*(2,1,0)4 sans constante

Étape 3 : estimation du modèle complet

Étape 3 : estimation du modèle complet sans constante

Utilisation de Time Series Modeler Fenêtre 1

Utilisation de Time Series Modeler Fenêtre 2

Utilisation de Time Series Modeler Fenêtre 3

Utilisation de Time Series Modeler pour la prévision

Utilisation de Time Series Modeler pour la prévision La syntaxe SPSS PREDICT THRU END. * Time Series Modeler. TSMODEL /MODELSUMMARY PRINT=[ MODELFIT] /MODELSTATISTICS DISPLAY=YES MODELFIT=[ SRSQUARE] /MODELDETAILS PRINT=[ PARAMETERS FORECASTS] /SERIESPLOT OBSERVED FORECAST FIT FORECASTCI /OUTPUTFILTER DISPLAY=ALLMODELS /SAVE NRESIDUAL(NResidual) /AUXILIARY CILEVEL=95 MAXACFLAGS=24 /MISSING USERMISSING=EXCLUDE /MODEL DEPENDENT=ipi INDEPENDENT=i22 PREFIX='Model' /ARIMA AR=[0] DIFF=1 MA=[0] ARSEASONAL=[1,2] DIFFSEASONAL=1 MASEASONAL=[0] TRANSFORM=NONE CONSTANT=NO /TRANSFERFUNCTION VARIABLES=i22 DIFF=1 /AUTOOUTLIER DETECT=OFF.

Utilisation de Expert Modeler

Utilisation de Expert Modeler Réponse :

Utilisation de Expert Modeler

Utilisation de Expert Modeler

Utilisation de Expert Modeler pour « All models » Réponse :