Séries chronologiques et prévision

Slides:



Advertisements
Présentations similaires
Statistique Descriptive Chapitre 2: Paramètres de tendance centrale
Advertisements

5. Statistiques.
CONSTRUCTION DE TRIANGLES
Présentation des données
2-3-4 : Avantages de la médiane.
La propriété de Thalès Thalès mathématicien grec (625 av. J.-C. 547 av. J.-C.)
Statistiques à une variable
Statistique descriptive
Chapitre 5. Description numérique d’une variable statistique.
Les Variables statistiques continues
Licence 3ème année de sociologie Semestre 1
1. Les caractéristiques de dispersion. 11. Utilité.
Statistique et probabilités au collège
variable aléatoire Discrète
INF L14 Initiation aux statistiques
Chapitre 4 Symétrie centrale.
Les principaux résumés de la statistique
Statistique descriptive, analyse de données
Régression linéaire simple
Opération et systèmes de décision Faculté des Sciences de l administration MQT Probabilités et statistique Mesures caractéristiques.
Tableaux de distributions
Lectures Livre du cours :
Tableaux de distributions
Comprendre la variation dans les données: Notions de base
Statistique descriptive
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Quelques propriétés des figures géométriques
Les mesures de la tendance centrale
Géométrie analytique Distance entre deux points.
Chapitre 5 Prévisions.
MATHÉMATIQUES FINANCIÈRES I
Mesures de position Ils s’expriment dans la même unité que les observations Moyenne et moyenne pondérée Exemple : on dispose du nombre moyen d’enfants.
Méthodes de Biostatistique
Statistique descriptive
Cours de mathématiques économiques
Suites numériques Définitions.
Thème: statistiques et probabilités Séquence 3: Statistique descriptive Utiliser un logiciel (par exemple, un tableur) ou une calculatrice pour étudier.
ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage
Rappels de statistiques descriptives
Fabienne BUSSAC STATISTIQUES 1. VOCABULAIRE
COURS STATISTIQUE - DESCRIPTIVE DEFINITIONS
STATISTIQUE DESCRIPTIVE ÉLÉMENTAIRE
Présentation du marché obligataire
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
STATISTIQUES – PROBABILITÉS
Seconde partie Cours de seconde
STATISTIQUE DESCRIPTIVE Dr LEMDAOUI MOHAMED CHERIF
Chapitre 3: Translation et Vecteurs
Introduction à une analyse statistique de données
Statistiques descriptives-Distributions expérimentales à une dimension
Statistiques Licence 2 LEA
1 Licence Stat-info CM1 b 2004Christophe Genolini 2.1. Vocabulaire Individu : objet étudié Population : Ensemble des individus Variable : nom donné à ce.
Méthodologie de l’observation
PARAMETRES STATISTIQUES
Chapitre 4 Variables aléatoires discrètes
STATISTIQUES DESCRIPTIVES
STATISTIQUES.
Statistique Descriptive Les Paramètres de Tendance Centrale
Statistiques Première partie Cours de première S.
BIOSTATISTIQUES Définitions.
Paramètres de position et de dispersion
Mesures de description des valeurs des variables
Les mesures de tendance centrale
Nature de la statistique La statistique est la science qui étudie la collecte, la présentation, l’analyse et l’utilisation des données numériques en vue.
 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs.
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
TP1: Statistique application chapitre 2. Le tableau suivant reprend le taux d'intérêt (en %) payé par 20 banques sur les dépôts d'épargne de leurs clients.
Notions de statistiques et d’analyse de données Master 1 MGS – Sarah MISCHLER –
STATISTIQUE DESCRIPTIVE
Transcription de la présentation:

Séries chronologiques et prévision L3 Gestion

Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques (Statistiques descriptives, indices, séries chronologique, moindres carrés ordinaires). De quelle façon : Sans démonstration et beaucoup d’intuition

Séries chronologiques et prévisions Plan prévisionnel (15 heures) : Chapitre 1 : Statistiques descriptives Chapitre 2 : Taux de croissance et indices Chapitre 3 : Les moindres carrés ordinaires (mco) Chapitre 4 : Les séries chronologiques - Composantes, Dessaisonalisation, Estimation du trend par moyennes mobiles et par les mco Estimation des coefficients saisonniers Prévisions par lissage exponentiel

Chapitre 1 : Statistiques descriptives On distingue deux types de statistiques résumées : Les statistiques qui résument la tendance « centrale » d’une série ( mode, moyenne et médiane) et les statistiques qui résument la dispersion d’une série : Sans référence à aucune statistique de tendance centrale (intervalle interquartile ou interdécile), Qui fait référence à la tendance centrale (variance, écart-type et coefficient de variation).

Statistiques descriptives Il existe aussi des statistiques qui résument la « forme » d’une distribution, mais celles-ci ne sont plus trop utilisées aujourd’hui dans la mesure où il est plus facile d’observer directement le graphique d’une distribution pour en apprécier la forme.

Statistiques descriptives 1. Les statistiques de tendance centrale A – Le mode Le mode d'une série est la valeur la plus fréquente d'une série. Exemple : Soit la série {8,4,4,3,4,3,8,7,5} La valeur la plus fréquente de cette série est 4. Le mode est donc égal à 4. L'effectif associé à ce mode est 3.

Statistiques descriptives Quelques remarques à propos du mode Une série peut avoir plusieurs modes  S = {4, 0, 1, 1, 7, 7, 7, 3, 3, 4, 7, 3, 4, 5, 7, 1, 3, 3, 4, 5}, Cette série a 2 modes, elle est bimodale. Ses deux modes sont : 7 et 3. L'effectif associé à chacun de ces modes est 5. Il existe également des séries multimodales. b) Le mode n’existe pas forcément C'est le cas lorsque toutes les valeurs ont le même effectif. Exemple : S = {4, 0, 1, 2, 5, 6}

Statistiques descriptives c) Le mode n’est pas la valeur la plus élevée. Il ne faut pas confondre le mode, qui est la valeur la plus fréquente, avec la valeur la plus élevée de la série. d) Les caractères quantitatifs et qualitatifs peuvent avoir un mode Le mode existe aussi bien dans le cas d’une série de valeurs que dans le cas d’une série de modalités : la série {A,C,C,D,A,A,C,E,E,B,C} a la modalité C pour mode car c’est la modalité C qui revient le plus souvent.

Chapitre 1 B – La moyenne arithmétique Soit un échantillon de n valeurs observées x1, x7, ….,xi,….,xn d’un caractère quantitatif X, on définit sa moyenne observée comme la moyenne arithmétique des n valeurs : Exemple avec S= {4, 0, 1, 1, 2, 2, 2, 3, 3, 4, 2, 3, 4, 5, 2, 1, 3, 3, 4, 5}

Statistiques descriptives Une des propriétés de la moyenne arithmétique est que la somme des écarts à la moyenne est nulle :

Statistiques descriptives Si les données observées xi sont regroupées en k classes d’effectifs ni (variable continue regroupée ou variable discrète), il faut les pondérer par les effectifs correspondants : Avec

Statistiques descriptives Exemple précédent regroupé :

Statistiques descriptives Remarque : La moyenne obtenue après regroupement des données en classe peut différer légèrement en raison d’une perte d’information. Exemple : supposons que les données précédentes soient regroupées en classe de la façon suivante :

Statistiques descriptives Pour calculer la moyenne, nous devons déterminer les centres de classe et appliquer la formule où les xi sont les centres de classe (nommés Ci) : La différence ici est de 0.5 et cette différence dépend de la définition des classes : amplitude et nombres de classes.

Statistiques descriptives Décomposition de moyenne : Soit une population totale de n individus, composée de k groupes. Les groupes sont désignés par des lettres. La population totale est égale à la somme des populations des groupes : Notons la moyenne de la variable X du groupe m :

Statistiques descriptives La moyenne globale se calcule ainsi Ou encore

Statistiques descriptives La formule s’écrit en définitive : Exemple :

Statistiques descriptives Les effets de structure : les moyennes de chaque classe possèdent des pondérations très différentes secteurs régions Emploi VA R1 5 400 60 13000 450 70 13850 R2 15 1700 10 3800 1200 35 6700 Total 20 2100 16800 1650 105 20550 S1 S2 S3 total secteurs Prod S1 Prod S2 Prod S3 total régions R1 80 217 90 198 R2 113 380 120 191 Total 105 240 110 196

Statistiques descriptives Deux autres moyennes : Moyenne géométrique Avec les notations précédentes : est la moyenne géométrique de la série statistique. Même convention que précédemment si l’on ne dispose que du regroupement en classes : on prend pour xi le centre de la ième classe.

Statistiques descriptives Exemple L’essence a augmenté de 10% l’an dernier et de 30% cette année. Quelle est le taux d’augmentation annuelle ? Ce n’est pas 20% ! La moyenne arithmétique ne convient pas. Si t est ce taux, on a bien sûr : et donc t =0,196=19,6%. La « bonne » moyenne est ici la moyenne géométrique. L’utilisation de la moyenne géométrique est toutefois beaucoup plus marginale que celle de la moyenne arithmétique. Mais il est bon d’en avoir entendu parler ! Elle est bien entendu très adaptée aux séries statistiques dont les valeurs sont en progression géométrique, comme dans cet exemple.

Statistiques descriptives Moyenne harmonique Toujours avec les notations précédentes : est la moyenne harmonique de la série statistique. Même convention que précédemment si l’on ne dispose que du regroupement en classes : on prend pour xi le centre de la ième classe.

Statistiques descriptives Exemple Si je fais un trajet aller-retour avec une vitesse v1 à l’aller et une vitesse v2 au retour, quelle est ma vitesse moyenne sur l’ensemble du trajet ? La réponse n’est pas Mais qui est la moyenne harmonique de v1 et v2. Même marginalité que pour la moyenne géométrique. L’étudiant qui a des doutes refera le calcul, ce qui lui rappellera sa tendre enfance puisque l’on fait ce type de moyenne (certes sans le dire) en troisième…

Statistiques descriptives C – La médiane Définition Si F désigne la fonction des fréquences cumulées, la médiane d’une série statistique sera la plus petite valeur x telle que F(x) ≥ 0,5. Autrement dit : La médiane est la valeur du caractère pour laquelle la fréquence cumulée est égale à 0,5 ou 50 %. Interprétation :Elle correspond donc au centre de la série statistique classée par ordre croissant, ou à la valeur pour laquelle 50 % des valeurs observées sont supérieures et 50 % sont inférieures.

Statistiques descriptives Avantages Contrairement à la moyenne, la médiane n’est pas sensible aux valeurs extrêmes. dans une entreprise où les 10 salariés gagnent chacun 1500€ par mois et le patron 7000€ par mois, le salaire médian mensuel est de 1500€. La médiane a une signification concrète.

Statistiques descriptives Détermination pratique : caractère discret Si l’effectif total n est impair, i.e. n = 2k + 1, la médiane sera le k+1ème terme de la série. La médiane est la valeur du milieu. EX : 17, 15, 18. n= 3, k=(n-1)/2=(3-1)/2=1 : k+1ème terme est donc le deuxième => M=15. Si n est pair, i.e. n = 2k, la médiane sera le kème terme de la série. EX : 17, 15, 16, 18 =>M=15. Mais, si n est pair, une médiane est aussi une valeur quelconque entre le kème et k+1ème terme de la série (M entre 15 et 16). Dans ce cas il peut être commode de prendre le milieu (15,5).

Statistiques descriptives On peut déterminer la médiane graphiquement

Statistiques descriptives Détermination de la médiane : caractère continu On commence par déterminer la classe médiane, i.e. la première classe où la fréquence cumulée dépasse 0,5. Ensuite, on calcule la médiane par interpolation linéaire.

Statistiques descriptives Interpolation linéaire (Théorème de Thales) ABC est un triangle. M se trouve sur le segment [AB] et N sur le segment [AC]. D'après le théorème de Thalès, si les droites (BC) et (MN) sont parallèles, alors on a l'égalité :

Statistiques descriptives Le théorème de Thalès permet de calculer des longueurs. Pour calculer une longueur dans la configuration représentée ci-dessus, il suffit de connaître trois des longueurs figurant dans deux des rapports. C N

Statistiques descriptives Classes Effectif Fréquences cumulées croissantes Moins de 25 ans 18 0,06 25≤X <30 54 0,24 30≤X < 35 72 0,48 35≤X <40 84 0,76 40≤X < 45 36 0,88 45≤X < 50 22 0,95 50 ans et plus 14 1 Dans le cas de valeurs groupées, on pose l'hypothèse selon laquelle les valeurs sont uniformément réparties à l'intérieur de chaque classe. = 35,36

Statistiques descriptives

Statistiques descriptives 2. b)

Résumé des caractéristiques des indicateurs

Statistiques descriptives 2. Les indicateurs de dispersion Deux séries statistiques peuvent avoir les mêmes paramètres de tendance centrale mais pas la même « dispersion ». Exemple : Notes de Ruby : 7 , 8 , 11 , 12 , 13 , 13 et 13 (moyenne : 11) Notes de Iris : 4 , 7 , 9 , 12 , 13 , 13 et 19 (moyenne 11) Il est donc nécessaire d’adjoindre à un paramètre de tendance centrale(moment 1), un ou des paramètres de dispersion (moment 2).Ces paramètres ont pour objectif dans le cas d'un caractère quantitatif de caractériser la variabilité des données dans l’échantillon. Les indicateurs de dispersion fondamentaux sont la variance observée et l’écart-type observé.

Statistiques descriptives Quelques indicateurs de dispersion Étendue. L’écart interquartile Écart absolu. La variance et l’écart type. Coefficient de variation

Statistiques descriptives 1. L’étendue L’étendue d’une série statistique est la différence entre la plus grande valeur de la série et la plus petite. Remarque - Très simple à calculer et à interpréter. - Par nature très sensible aux valeurs extrêmes.

Statistiques descriptives 2. L’écart interquartile : Q3-Q1 Si F désigne la fonction des fréquences cumulées, le premier (resp. troisième) quartile d’une série statistique sera la plus petite valeur x telle que F(x) ≥ 0,25 (resp. 0,75) . On le note Q1 (resp. Q3). Q1 et Q3 se calculent comme la médiane. Q1 est la valeur qui coupe la distribution en deux : 25 % en dessous et 75 % au dessus. Q3 75 % et 25 %. L’écart interquartile contient au moins 50% des valeurs de la série. L’écart interquartile mesure la dispersion sans tenir compte des valeurs extrêmes.

Statistiques descriptives Après les quartiles, on peut définir de la même façon les déciles (voire les centiles) d’une série statistique. Il s’agit de regarder les valeurs de la série correspondant à des fréquences cumulées de 0,1 ; 0,2 … 0,9. Pour visualiser la dispersion d’une série statistique, on peut alors représenter une « Box plot » (« boîte à moustache »).

Statistiques descriptives Min Max Q1 Médiane Q3

Statistiques descriptives 3. L’écart absolu moyen moyenne des valeurs absolues des écarts à la moyenne. Intérêts - Paramètre simples à calculer, prenant en compte l’ensemble des données. Très facile d’interprétation. Inconvénient Mauvaises propriétés calculatoires (non linéaire). Peu utilisés par les logiciels de statistiques.

Statistiques descriptives 4. Variance et écart-type On définit la variance comme la moyenne arithmétique des carrés des écarts à la moyenne.

Statistiques descriptives Dans le cas de données regroupées en k classes d'effectif ni (variable continue regroupée en classes ou variable discrète), la formule de la variance est la suivante :

Statistiques descriptives L’écart-type observé correspond à la racine carrée de la variance observée : Remarque : De part sa définition, la variance est toujours un nombre positif. Sa dimension est le carré de celle de la variable. Il est toutefois difficile d’utiliser la variance comme mesure de dispersion car le recours au carré conduit à un changement d’unités. Elle n’a donc pas de sens direct contrairement à l'écart-type qui s’exprime dans les mêmes unités que la moyenne.

Statistiques descriptives 5. Le coefficient de variation La variance et l’écart-type observée sont des paramètres de dispersion absolue qui mesurent la variation absolue des données indépendamment de l’ordre de grandeur des données. Le coefficient de variation noté C.V. est un indice de dispersion relatif prenant en compte ce biais et est égal à : Exprimé en pour cent, il est indépendant du choix des unités de mesure permettant la comparaison des distributions de fréquence d’unité différente.

Statistiques descriptives Exercice 1 : La présence des clients dans un magasin 1.Calculer la moyenne et la médiane. 2. Calculer la variance et l’écart-type

Statistiques descriptives Moyenne et médiane Moyenne : On calcule le centre de chaque classe ci (i=1,..,5).

Statistiques descriptives 2. La médiane On calcule les fréquences et les fréquences cumulées et on détermine la classe médiane (25.5 ; 30,5). On fait une interpolation linéaire : Classes effecctif Fréquence Freq cumul [15,5;20,5[ 200 0,08 [20,5;25,5[ 500 0,2 0,28 [25,5;30,5[ 1000 0,4 0,68 [30,5;35,5[ 600 0,24 0,92 [35,5;40,5[ 1 2500

Statistiques descriptives Exercice 2 : Variation du CAC 40 au cours d’une semaine (en points). Il y a 8 observations journalières. Calculer la moyenne, la variance et l’écart-type Sur le nouveau marché, la même semaine on observait une moyenne de 0.8 et un écart-type de 26,05. Est-il préférable d’investir sur le nouveau marché ? Certains analystes se fient au coefficient de variation. Le calculer pour les 2 marchés. Est-il un bon estimateur du risque ?