STATISTIQUES DESCRIPTIVES. INTRODUCTION Population statistique : Une population statistique est l'ensemble sur lequel on effectue des observations. Individu.

Slides:



Advertisements
Présentations similaires
Statistique et probabilités au collège
Advertisements

1 Licence Stat-info CM1 b 2004Christophe Genolini 2.1. Vocabulaire Individu : objet étudié Population : Ensemble des individus Variable : nom donné à ce.
STATISTIQUES DESCRIPTIVES
PARAMETRES STATISTIQUES
ETUDE DE 2 VARIABLES QUANTITATIVES
STATISTIQUES DESCRIPTIVES
SERIES CHRONOLOGIQUES
Mesures de description des valeurs des variables
STATISTIQUES DESCRIPTIVES
Auteur : Patrice LEPISSIER La prévision de la demande  Définitions Définitions  Méthodes qualitatives Méthodes qualitatives  Méthodes quantitatives.
CINI – Li115 1 Semaine 9 Algorithmes de tri ● Introduction ● Tri à bulle ● - principe ● - algorithme ● - efficacité ● Tri par sélection ● - principe, algorithme,
Du chapitre 1 au chapitre 2 1. Les graphiques : introduction (p.15)  Pour prendre possession des données o des chiffres dans un tableau, c’est bien o.
Auteur : Patrice LEPISSIER Les probabilités  Notions de base Notions de base  Variable aléatoire Variable aléatoire  La loi Normale La loi Normale.
Organisation, gestion de données Les connaissances que l'enseignant doit maîtriser à son niveau Présentation réalisée à partir de l'ouvrage de Roland Charnay.
Dr. Tarek Barhoumi statistiques descriptives Statistiques descriptives Dr. Tarek Barhoumi.
Et maintenant, le mode : fastoche !
V Suite géométrique : 1°) Définition : un+1
Suites ordonnées ou mettre de l’ordre
Corrélation et régression linéaire simple
Tableau à double entrée
Chapitre 1 Généralités sur les données
Statistiques descriptives univariées
Loi Normale (Laplace-Gauss)
4°) Intervalle de fluctuation :
Reprise du cours ( ) Aujourd’hui :
Une grande partie des données que nous serons amenés cette année à étudier sera exprimée en unités monétaires. Or, nous le savons, il existe un phénomène.
Statistique descriptive
par nature une discipline quantitative
Analyse en Composantes Principales A.C.P. M. Rehailia Laboratoire de Mathématiques de l’Université de Saint Etienne (LaMUSE).
Lecture et interprétation des Taux de Croissance Moyens
Coefficient de corrélation linéaire
chapitre 3 Les Statistiques
Organisation des Données et Représentations Graphiques
Plans d’experiences : plans de melanges
Comment mesurer les inégalités ?
Technologies de l’intelligence d’affaires Séance 11
Introduction aux Statistiques Variables aléatoires
Technologies de l’intelligence d’affaires Séance 12
Scénario Quatre hipsters entrent en collision un dans l'autre dans un ascenseur plein de personnes. En conséquence ils laissent tomber leurs téléphones.
Statistiques Sociales LC3
4.3 Estimation d’une proportion
C1 – Interpolation et approximation
Statistique Descriptive chapitre 0 : Introduction
Pourquoi étudier la statistique ?
ACP Analyse en Composantes Principales
Statistiques. Moyenne, Moyenne pondérée, Tableur et graphiques.
Calculs des incertitudes Lundi 30 Avril 2018 Master de Management de la Qualité, de la Sécurité et de l’Environnement.
 1____Probabilité  2______variables aléatoires discrètes et continues  3______loi de probabilités d’une v a  4_______les moyens et les moyens centraux.
Chapitre 3 : Caractéristiques de tendance centrale
Statistiques.
I Définition : Elle est définie ...
P LAMBOLEZ Partie maths V GILLOT Partie anglais
2.4 La loi de vitesse d’une réaction chimique
Mesures de Position Dispersion et Forme
Chapitre 7: Séries chronologiques
L’ANALYSE DES DONNEES Samuel MAYOL S. Mayol - L’analyse des données.
Position, dispersion, forme
Le risque de taux d’intérêt Jean-Marcel Dalbarade.
Chapitre 8 : Organisation et gestion de données
Chapitre 2 La prévision des composantes de l’activité Octobre 2018
Des chiffres pour être compris
Programme d’appui à la gestion publique et aux statistiques
Conception cartographique
PROGRAMMATION SCIENTIFIQUE EN C
Des chiffres pour être compris
Statistiques et probabilités
μ = N 3) Moyenne d’une série discrète : ∑ ni xi que l’on peut noter
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES.
Évaluation des Actifs Financiers 1. 2 Valeur capitalisée: Valeur d’un investissement après une ou plusieurs périodes Intérêts simples: Intérêts calculés.
Transcription de la présentation:

STATISTIQUES DESCRIPTIVES

INTRODUCTION

Population statistique : Une population statistique est l'ensemble sur lequel on effectue des observations. Individu (ou unités statistiques) : Les individus sont les éléments de la population statistique étudiée. Caractère statistique ou variable statistique : C'est ce qui est observé ou mesuré sur les individus d'une population statistique. INTRODUCTION L ’opérateur sommeVocabulaire statistique VOCABULAIRE STATISTIQUE

VARIABLES QUANTITATIVES Variable quantitative : Une variable statistique est quantitative si ses valeurs sont des nombres exprimant une quantité, sur lesquels les opérations arithmétiques (somme, etc...) ont un sens. Variable quantitative discrète: Une variable quantitative est discrète si elle ne peut prendre que des valeurs isolées, généralement entières. Variable quantitative continue: Une variable quantitative est continue si ses valeurs peuvent être n'importe lesquelles d'un intervalle réel. INTRODUCTION L ’opérateur sommeVocabulaire statistique

VARIABLES QUALITATIVES Variable qualitative : Une variable statistique est qualitative si ses valeurs, ou modalités, s'expriment de façon littérale ou par un codage sur lequel les opérations arithmétiques telles que moyenne, somme,..., n'ont pas de sens. Variable qualitative nominale : C'est une variable qualitative dont les modalités ne sont pas ordonnées. Variable qualitative ordinale : C'est une variable qualitative dont les modalités sont naturellement ordonnées INTRODUCTION L ’opérateur sommeVocabulaire statistique

DEFINITION: p et q étant 2 entiers relatifs REMARQUE 1: i est une variable muette REMARQUE 2: Quand il n’y a pas d’ambiguïté sur le domaine de variation de i, celui-ci peut être omis INTRODUCTION L ’opérateur sommeVocabulaire statistique L ’opérateur somme (1) UN OUTIL : L ’OPERATEUR SOMME 

(2) UN OUTIL : L ’OPERATEUR SOMME  INTRODUCTION L ’opérateur sommeVocabulaire statistique

TABLEAUX ET GRAPHIQUES

Qualitative nominaleQualitative ordinaleQuantitative discrèteQuantitative continue Qualitative nominale (1) VARIABLES QUALITATIVES NOMINALES Qualitative nominale

(2) VARIABLES QUALITATIVES NOMINALES Bleu 20% Noir 54% Noisette 13% Vert 13% Diagramme circulaire ou camembert TABLEAUX ET GRAPHIQUES Qualitative nominaleQualitative ordinaleQuantitative discrèteQuantitative continueQualitative nominale Diagramme en barres

ABCDE Les modalités sont présentées dans l’ordre TABLEAUX ET GRAPHIQUES 130 personnes ont été interrogées sur leur addiction au chocolat Qualitative nominaleQualitative ordinaleQuantitative discrèteQuantitative continue Qualitative ordinale VARIABLES QUALITATIVES ORDINALES

TABLEAUX ET GRAPHIQUES Qualitative ordinaleQualitative nominaleQuantitative discrète Quantitative continue Quantitative discrète (1) VARIABLES QUANTITATIVES DISCRETES EFFECTIFS ET FREQUENCES

(2) VARIABLES QUANTITATIVES DISCRETES REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES Diagramme en bâtons TABLEAUX ET GRAPHIQUES Qualitative nominaleQualitative ordinaleQuantitative discrèteQuantitative continue

(3) VARIABLES QUANTITATIVES DISCRETES EFFECTIFS ET FREQUENCES CUMULES Effectifs cumulés croissants: Nombre d'individus pour lesquels la variable est inférieure ou égale à x i. Résultat de l'addition, de proche en proche, des effectifs d'une distribution observée en commençant par le 1er. Effectifs cumulés décroissants: Nombre d'individus pour lesquels la variable est supérieure ou égale à x i. Résultat de l'addition, de proche en proche, des effectifs d'une distribution observée en commençant par le dernier. TABLEAUX ET GRAPHIQUES Qualitative nominaleQualitative ordinaleQuantitative discrèteQuantitative continue

(4) VARIABLES QUANTITATIVES DISCRETES EFFECTIFS ET FREQUENCES CUMULES Combien de clients possédant un nombre de produits financiers inférieur ou égal à 2 Combien de clients possédant un nombre de pro. fin. supérieur ou égal à 3 La proportion de clients possédant un nombre de pro. fin. supérieur ou égal à 1 est de 71,39% La proportion de clients possédant un nombre de pro. fin. inférieur ou égal à 4 est de 99,44% TABLEAUX ET GRAPHIQUES Qualitative nominaleQualitative ordinaleQuantitative discrèteQuantitative continue Il y a 313 Il y a 47

(5) VARIABLES QUANTITATIVES DISCRETES COURBES CUMULATIVES On appelle courbe cumulative croissante le tracé de la fonction N (ou F pour les fréquences) qui à tout réel x associe N( x ) = nombre d'observations inférieur ou égal à x. TABLEAUX ET GRAPHIQUES On appelle courbe cumulative décroissante le tracé de la fonction N' (ou F’ pour les fréquences) qui a tout réel x associe N'( x ) = nombre d'observations supérieur strictement à x. Les courbes cumulatives N(x) et N’(x) sont symétriques par rapport à n/2 : N(x) + N’(x) = n Les courbes cumulatives F(x) et F’(x) sont symétriques par rapport à 0,5 : F(x) + F’(x) = x N(x) 360 N ’(x) Qualitative nominaleQualitative ordinaleQuantitative discrèteQuantitative continue

Remarque1 : la variable augmentation moyenne mensuelle peut être considérée comme continue. En arrondissant à l’euro, on l’a discrétisée. Une augmentation de 10 € est en fait une augmentation comprise entre 9,5 € et 10,5 €. Remarque2 : Une variable continue ne prend pas des valeurs isolées, mais des valeurs appartenant à des intervalles. C'est pourquoi, au lieu de définir des effectifs par valeurs, on définira des effectifs par intervalles, appelés classes. Remarque3 : Une variable discrète comportant trop de valeurs est aussi traitée comme une variable continue. TABLEAUX ET GRAPHIQUES Variable observée: augmentation moyenne mensuelle du salaire, en €, des employés d’une multinationale au cours de l’année Qualitative nominaleQualitative ordinaleQuantitative discrèteQuantitative continue (1) VARIABLES QUANTITATIVES CONTINUES

(2) VARIABLES QUANTITATIVES CONTINUES Remarque 1: Le choix des classes et arbitraire, mais elles doivent être contigües et recouvrir l’ensemble des valeurs. Remarque 2: Il est préférable de prendre des classes d’amplitudes égales. Remarque 3: Il ne faut prendre ni trop ni trop peu de classes. Remarque 4: Le choix et le nombre de classes influent sur les représentations graphiques. TABLEAUX ET GRAPHIQUES Qualitative nominaleQualitative ordinaleQuantitative discrèteQuantitative continue

(3) VARIABLES QUANTITATIVES CONTINUES REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES TABLEAUX ET GRAPHIQUES effectif Effectif rectifié HISTOGRAMME Qualitative nominaleQualitative ordinaleQuantitative discrèteQuantitative continue

Effectif rectifié HISTOGRAMME (4) VARIABLES QUANTITATIVES CONTINUES REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES Dans un histogramme, ce sont les surfaces des rectangles (ce que l’œil voit), qui sont proportionnelles aux effectifs, et non les hauteurs de ces rectangles Remarque: Le tracé de l’histogramme des fréquences est identique. Il suffit de porter en ordonnées la fréquence rectifiée d i = f i /a i, appelée densité. TABLEAUX ET GRAPHIQUES La surface = a i (n i /a i ) est de 830 unités La surface = a i (n i /a i ) est de 615 unités Qualitative nominaleQualitative ordinaleQuantitative discrèteQuantitative continue

(5) VARIABLES QUANTITATIVES CONTINUES EFFECTIFS ET FREQUENCES CUMULES Variable observée: augmentation moyenne mensuelle du salaire, en €, des employés d’une multinationale au cours de l’année Il y a 1445 employés dont l’augmentation est strictement inférieure à 5 Il y a 170 employés dont l’augmentation est supérieure ou égale à 10 Combien y-a-t-il d’employés dont l’augmentation est inférieure à 17 ? TABLEAUX ET GRAPHIQUES Qualitative nominaleQualitative ordinaleQuantitative discrèteQuantitative continue

(6) VARIABLES QUANTITATIVES CONTINUES COURBES CUMULATIVES TABLEAUX ET GRAPHIQUES 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0, FiFi F’ i x On appelle courbe cumulative croissante le tracé de la fonction F (N pour les effectifs) qui à tout réel x associe F( x ) = nombre d'observations inférieur ou égal à x. Remarque: Pour une variable continue, il est indifférent de dire « inférieur ou égal » ou « strictement inférieur ». Il en est de même pour « supérieur ou égal » ou « strictement supérieur ». Il n’y a aucune chance qu’une observation tombe sur une borne. C’est l’imprécision de l’instrument de mesure et un mauvais choix des bornes qui pourrait conduire à ce résultat. F(x) 0 0,391 0,680 0,920 0,963 0,993 1 ? A l’intérieur de chaque classe, on fait l’hypothèse que la répartition est uniforme ? ? On appelle courbe cumulative décroissante le tracé de la fonction F’ (N’ pour les effectifs) qui a tout réel x associe F’( x ) = nombre d'observations supérieur strictement à x. F’(x) 1 0,609 0,320 0,080 0,037 0,007 0 ? ? Les courbes cumulatives F(x) et F’(x) sont symétriques par rapport à 0,5 : F(x) + F’(x) = 1 Qualitative nominaleQualitative ordinaleQuantitative discrèteQuantitative continue

(7) VARIABLES QUANTITATIVES CONTINUES COURBES CUMULATIVES Quelle est la proportion p d’employés dont l’augmentation est inférieure à 17 € ? p - 0, ,963-0, ,95 TABLEAUX ET GRAPHIQUES x 0 0,391 0,680 0,920 0,963 0,993 1 F(x) 17 p Qualitative nominaleQualitative ordinaleQuantitative discrèteQuantitative continue

RESUME VARIABLE QUALITATIVE TABLEAUX ET GRAPHIQUES NominaleOrdinale VARIABLE QUANTITATIVE DiscrèteContinue Effectifs ou Fréquences Courbes cumulatives des effectifs ou des fréquences Modalités dans l ’ordre Diagramme en barres Diagramme circulaire Diagramme en bâtonsHistogramme

PARAMETRES STATISTIQUES

Les représentations graphiques ont permis une première synthèse visuelle de la distribution des observations Un paramètre statistique permet de résumer par une seule quantité numérique une information contenue dans une distribution d’observations. Les paramètres statistiques ne concernent que les variables quantitatives N° individu Variable Tendance centrale N° individu Variable Position 100 % - A % A % N° individu Variable Dispersion

PARAMETRES STATISTIQUES Une distribution est unimodale si elle présente un maximum marqué, et pas d'autres maxima relatifs. La lecture s’effectue sur le diagramme en bâtons ou l'histogramme. Le mode correspond à l'abscisse du maximum, c.à.d. la valeur la plus fréquente Mode Classe modale Mode Tendance centrale PositionDispersion (1) PARAMETRES DE TENDANCE CENTRALE LE MODE Tendance centrale

(2) PARAMETRES DE TENDANCE CENTRALE LE MODE Si la distribution présente 2 ou plus maxima relatifs, on dit qu'elle est bimodale ou plurimodale. La population est composée de plusieurs sous-populations ayant des caractéristiques de tendance centrale différentes Mode 1Mode 2 Mode 1 Mode 2 PARAMETRES STATISTIQUES Tendance centrale PositionDispersion

(3) PARAMETRES DE TENDANCE CENTRALE LA MEDIANE Les valeurs observées doivent être rangées par ordre croissant. La médiane M est la valeur du milieu de la série d’observations, c.à.d. telle qu'il y ait autant d'observations "au-dessous" que "au-dessus". M Nombre impair d’observations Nombre pair d’observations Intervalle médian M = milieu = 5,5 4 valeurs PARAMETRES STATISTIQUES Tendance centrale PositionDispersion

(4) PARAMETRES DE TENDANCE CENTRALE LA MEDIANE à partir d’une distribution discrète 0, , M 0,5 Intervalle médian M = milieu = 1,5 F(x) 0 0,606 0,286 0,994 0, ,869 M F(x) 0 0,500 0,286 0,889 0, ,764 PARAMETRES STATISTIQUES Tendance centrale PositionDispersion

(5) PARAMETRES DE TENDANCE CENTRALE LA MEDIANE à partir d’une distribution continue 0,5-0,391M - 3 0,5 3,22 M ,680-0, x 0 0,391 0,680 0,920 0,963 0,993 1 F(x) 0,5 M PARAMETRES STATISTIQUES Tendance centrale PositionDispersion

(6) PARAMETRES DE TENDANCE CENTRALE LA MOYENNE ARITHMETIQUE La moyenne arithmétique est notée Série groupée Série brute x 1, x 2, …, x n PARAMETRES STATISTIQUES Tendance centrale PositionDispersion

(7) PARAMETRES DE TENDANCE CENTRALE LA MOYENNE ARITHMETIQUE Série classée PARAMETRES STATISTIQUES Tendance centrale PositionDispersion

(8) PARAMETRES DE TENDANCE CENTRALE LA MOYENNE ARITHMETIQUE Comment faire la moyenne de plusieurs populations ? P opulation P 1 Effectif n 1 Moyenne P opulation P 2 Effectif n 2 Moyenne P opulation Effectif n = n 1 + n 2 Moyenne Moyenne globale = moyenne des moyennes PARAMETRES STATISTIQUES Tendance centrale PositionDispersion

(9) PARAMETRES DE TENDANCE CENTRALE PROPRIETES GENERALES PARAMETRES STATISTIQUES Tendance centrale PositionDispersion x P (x) = moyenne, médiane, mode y = a x P (y) = a P (x) z = a x + b P (z) = a P (x) + b

(10) PARAMETRES DE TENDANCE CENTRALE MOYENNES GEOMETRIQUE ET HARMONIQUE Moyenne géométrique Moyenne harmonique Utilisée dans le cas de phénomènes multiplicatifs (taux de croissance moyen) Utilisée dans le cas où l’on combine 2 variables sous forme de rapport (pièces/heure, km/litre,…) PARAMETRES STATISTIQUES Tendance centrale PositionDispersion

PARAMETRES STATISTIQUES On appelle fractiles ou quantiles d'ordre k les (k-1) valeurs qui divisent les observations en k parties d'effectifs égaux. 1 médiane M qui divise les observations en 2 parties égales 3 quartiles Q 1, Q 2, Q 3 qui divisent les observations en 4 parties égales 9 déciles D 1, D 2, …, D 9 qui divisent les observations en 10 parties égales 99 centiles C 1, C 2, …, C 99 qui divisent les observations en 100 parties égales PositionDispersion Tendance centrale (1) PARAMETRES DE POSITION LES FRACTILES OU QUANTILES Position

0,5 M 0,75 Q3Q3 0,2 D2D2 (2) PARAMETRES DE POSITION LES FRACTILES OU QUANTILES Variable continue Variable discrète PARAMETRES STATISTIQUES Quartiles, déciles, centiles s’obtiennent de la même façon que la médiane. 0,5 M Q3Q3 0,75 0,9 D9D9 Tendance centrale PositionDispersion

(3) PARAMETRES DE POSITION PROPRIETES GENERALES PARAMETRES STATISTIQUES Tendance centrale PositionDispersion x Q (x) = quantile A % 100 % - A % y = a x Q (y) = a Q (x) A % 100 % - A % z = a x + b Q (z) = a Q (x) + b A % 100 % - A %

PARAMETRES STATISTIQUES Etendue : R = x max - x min Intervalle interquartile : IQ = Q 3 - Q 1 Variance : Série brute : Série groupée ou classée : = Moyenne des carrés - Carré de la moyenne Ecart-type : Tendance centrale PositionDispersion (1) PARAMETRES DE DISPERSION

(2) PARAMETRES DE DISPERSION PARAMETRES STATISTIQUES Comment faire la variance de plusieurs populations ? P opulation P 1 Effectif n 1 Moyenne Variance V 1 P opulation P 2 Effectif n 2 Moyenne Variance V 2 P opulation Effectif n = n 1 + n 2 Moyenne Variance V ? Variance globale = Moyenne des variances + Variance des moyennes Tendance centrale PositionDispersion

(3) PARAMETRES DE DISPERSION PROPRIETES GENERALES PARAMETRES STATISTIQUES x P (x) = étendue, écart-type, intervalle interquartile Tendance centrale PositionDispersion y = a x P (y) = a P (x) P (z) = a P (x)

PROPRIETES IMPORTANTES DE LA MOYENNE ET DE LA VARIANCE PARAMETRES STATISTIQUES Comment se comportent la moyenne et la variance lorsqu’on fait subir un changement de variable aux observations? xixi y i = a x i + b Comment se comportent la moyenne et la variance de la somme de deux séries d’observations? xiyixiyi z i = x i + y i

ETUDE DE 2 VARIABLES QUANTITATIVES

(1) MESURE DE LA LIAISON ENTRE 2 VARIABLES QUANTITATIVES ETUDE DE 2 VARIABLES QUANTITATIVES Taille Poids La connaissance de la taille x apporte une certaine information sur le poids y Il existe une relation de dépendance entre x et y

(2) MESURE DE LA LIAISON ENTRE 2 VARIABLES QUANTITATIVES ETUDE DE 2 VARIABLES QUANTITATIVES La connaissance de x n’apporte aucune certaine information sur y x et y sont indépendantes La connaissance de x permet de connaître exactement la valeur de y Il existe une relation fonctionnelle entre x et y

(3) MESURE DE LA LIAISON ENTRE 2 VARIABLES QUANTITATIVES ETUDE DE 2 VARIABLES QUANTITATIVES Covariance : Propriétés : x et y varient dans le même sens x et y varient en sens contraire

(4) MESURE DE LA LIAISON ENTRE 2 VARIABLES QUANTITATIVES ETUDE DE 2 VARIABLES QUANTITATIVES Propriétés : Ne pas confondre causalité et corrélation Corrélation linéaire: Il existe une relation fonctionnelle entre x et y x et y sont indépendantes Il existe une dépendance linéaire d’autant plus forte que |  | est grand

(1) AJUSTEMENT LINEAIRE ETUDE DE 2 VARIABLES QUANTITATIVES x = Taille y = Poids Est-il possible de trouver une fonction numérique f telle que y = f (x) ? Si une telle fonction existe, on dit que f est un modèle du phénomène étudié. x est la variable explicative. y est la variable expliquée.

x = Taille y = Poids (2) AJUSTEMENT LINEAIRE ETUDE DE 2 VARIABLES QUANTITATIVES On désire trouver la droite qui passe « au mieux » à l’intérieur du nuage de points

(3) AJUSTEMENT LINEAIRE x = Taille y = Poids x = Taille y = Poids « au mieux » ETUDE DE 2 VARIABLES QUANTITATIVES Droite de régression de y en xDroite de régression de x en y Minimiser eiei

(4) AJUSTEMENT LINEAIRE REGRESSION LINEAIRE DE Y EN X ETUDE DE 2 VARIABLES QUANTITATIVES x = Taille y = Poids Droite de régression linéaire de y en x y = f(x) = ax + b La droite de régression linéaire de y en x, notée D y/x, minimise D y/x passe par le point moyen f(x) = y = ax+b xixi yiyi ax i +b e i = |y i -ax i -b|

(5) AJUSTEMENT LINEAIRE REGRESSION LINEAIRE DE Y EN X ETUDE DE 2 VARIABLES QUANTITATIVES x = Taille y = Poids Droite de régression linéaire de y en x y = f(x) = ax + b f(x) = y = ax+b xixi yiyi ax i +b e i = |y i -ax i -b| = résidu de la ième observation définit un modèle affine = valeur de y i prévue par le modèle = erreur due au modèle

(6) AJUSTEMENT LINEAIRE REGRESSION LINEAIRE DE X EN Y ETUDE DE 2 VARIABLES QUANTITATIVES x = Taille y = Poids Droite de régression linéaire de x en y x = f(y) = a’y + b’ D x/y passe par le point moyen La droite de régression linéaire de x en y, notée D x/y, minimise yiyi xixi f(y) = x = a’y+b’ a’y i +b’ e i ’ = |x i -a’y i -b’|

LIENS ENTRE CORRELATION ET DROITES DE REGRESSION ETUDE DE 2 VARIABLES QUANTITATIVES  ² = a a’  ² = a a’ = 1 Liaison fonctionnelle linéaire  ² = a a’ = 0 Indépendance linéaire Le degré de dépendance linéaire se mesure à la proximité des droites de régression  ² = a a’ < 1 D y/x : y = ax + b D x/y : x = a’y + b’

(1) AJUSTEMENT A UNE FONCTION EXPONENTIELLE ETUDE DE 2 VARIABLES QUANTITATIVES droite de régression linéaire de y en x Les résidus devraient se répartir au hasard autour de l’axe des abscisses: le modèle affine ne convient pas Analyse des résidus

(2) AJUSTEMENT A UNE FONCTION EXPONENTIELLE ETUDE DE 2 VARIABLES QUANTITATIVES Modèle exponentiel exponentielle de base e Forme exponentielle générale exponentielle de base a Changement de variable ln y = ln b + x ln a Y = A X + B avec Y = ln y X = x A = ln a B = ln b L’ajustement affine de Y en fonction de X donne A et B, d ’où,, et le modèle

(3) AJUSTEMENT A UNE FONCTION EXPONENTIELLE ETUDE DE 2 VARIABLES QUANTITATIVES Série initiale (x i,y i ) Série prévue par le modèle Analyse des résidus Le modèle exponentiel est mieux adapté que le modèle affine

(1) AJUSTEMENT A UNE FONCTION PUISSANCE ETUDE DE 2 VARIABLES QUANTITATIVES Droite de régression linéaire de y en x Le modèle affine ne convient pas Analyse des résidus

(2) AJUSTEMENT A UNE FONCTION PUISSANCE ETUDE DE 2 VARIABLES QUANTITATIVES Changement de variable ln y = ln b + a ln x Y = A X + B avec Y = ln y X = ln x A = a B = ln b Modèle puissance L’ajustement affine de Y en fonction de X donne A et B, d ’où a = A,, et le modèle

(3) AJUSTEMENT A UNE FONCTION PUISSANCE ETUDE DE 2 VARIABLES QUANTITATIVES Série initiale (x i,y i ) Série prévue par le modèle Le modèle puissance est mieux adapté que le modèle affine Analyse des résidus

QUALITE D’UN AJUSTEMENT ETUDE DE 2 VARIABLES QUANTITATIVES On montre que L’ajustement est d’autant meilleur que SCR est proche de 0, c.à.d. que SCR/SCT est proche de 0 ou SCM/SCT est proche de 1. = proportion de la variation totale due à l'ajustement SCT = SCM + SCR Somme des carrés des écarts à la moyenne Somme des carrés des écarts du modèle Somme des carrés des résidus += = Coefficient de détermination =  ² = (coef. de corrélation)²

LES INDICES

INDICES ELEMENTAIRES LES INDICES Un indice est le rapport d’une variable mesurée à deux instants différents. Un indice est représentatif d’une évolution y 1 = valeur de la variable y à la date t 1 y 0 = valeur de la variable y à la date t 0 Indice élémentaire de la variable y à la date t 1 par rapport à la date de référence t 0 Indice élémentaire de la variable y à la date t 1 par rapport à la date de référence t 0, base 100. Propriétés Identité Réversibilité Circularité

INDICES ET TAUX DE VARIATION LES INDICES Taux de variation ou taux de croissance de la variable y entre la date t 0 et la date t 1 r = i - 1 i = 1 + r i = 1 + r = coefficient multiplicateur Pas d’évolution Croissance Décroissance

INDICES ET TAUX DE VARIATION MOYENS LES INDICES y 0, y 1, ….., y n les valeurs prises par une variable aux dates t 0, t 1, ….., t n i l’indice moyen i 1, i 2, ….., i n les indices élémentaires sur chacune des périodes i G l’indice élémentaire global entre t 0 et t n i 1, i 2, ….., i k indices élémentaires sur des périodes de n 1, n 2, ….., n k unités (jour, mois, année…) Moyenne géométrique des indices élémentaires r 1, r 2, ….., r n les taux de croissance sur chacune des périodes r G le taux de croissance entre t 0 et t n r le taux de croissance moyen r 1, r 2, ….., r k indices élémentaires sur des périodes de n 1, n 2, ….., n k unités (jour, mois, année…)

INDICES USUELS LES INDICES Indice élémentaire des prix Indice élémentaire des quantités (ou des volumes) Indice élémentaire de valeur (ou de dépense)

INDICES SYNTHETIQUES LES INDICES Un indice synthétique mesure l’évolution simultanée de plusieurs produits Un indice synthétique est une moyenne pondérée des indices élémentaires des différents produits Remarque : Coefficient de pondération (ou budgétaire) du produit j à la date t n

(1) INDICES SYNTHETIQUES DE LASPEYRES LES INDICES Indice de Laspeyres des prix Moyenne arithmétique des indices élémentaires des prix, base 100, pondérés par des coefficients de pondération relatifs à la date de référence t 0 Comment s’en souvenir ? 1 seul indice sur 4 doit être modifié 0

(2) INDICES SYNTHETIQUES DE LASPEYRES LES INDICES Indice de Laspeyres des quantités Moyenne arithmétique des indices élémentaires des quantités, base 100, pondérés par des coefficients de pondération relatifs à la date de référence t 0 Comment s’en souvenir ? 1 seul indice sur 4 doit être modifié 0

(1) INDICES SYNTHETIQUES DE PAASCHE LES INDICES Indice de Paasche des prix Moyenne harmonique des indices élémentaires des prix, base 100, pondérés par des coefficients de pondération relatifs à la date courante t 1 Comment s’en souvenir ? 1 seul indice sur 4 doit être modifié 1

(2) INDICES SYNTHETIQUES DE PAASCHE LES INDICES Indice de Paasche des quantités Moyenne harmonique des indices élémentaires des quantités, base 100, pondérés par des coefficients de pondération relatifs à la date courante t 1 Comment s’en souvenir ? 1 seul indice sur 4 doit être modifié 1

SERIES CHRONOLOGIQUES

LES DONNEES SERIES CHRONOLOGIQUES Y = série initiale Y temps Y = prix d’un bien en fonction du temps

LES COMPOSANTES Y = série initiale Tendance ou Trend T Composante Saisonnière S Composante Aléatoire A SERIES CHRONOLOGIQUES

MODELES DE DECOMPOSITION Modèle additif Y = T + S + A Modèle multiplicatif Y = T. S. A SERIES CHRONOLOGIQUES

(1) DETERMINATION DE LA TENDANCE REGRESSION LINEAIRE Il s’agit de faire un lissage du nuage des points par une fonction connue. Lorsque le nuage est linéaire on utilise la droite de régression de y en fonction du temps T = tendance Avantages: Expression analytique Inconvénients: Un nuage ne se présente pas toujours sous une forme analytique simple Le calcul de la tendance peut être affecté par des valeurs extrêmes ou par les valeurs de début et de fin de série. SERIES CHRONOLOGIQUES

(2) DETERMINATION DE LA TENDANCE MOYENNES MOBILES Moyennes mobiles d’ordre impair Moyennes mobiles d’ordre pair. On utilise une observation supplémentaire (y 2 +y 3 +y 4 )/3 (y 1 +y 2 +y 3 )/3 SERIES CHRONOLOGIQUES 2 Moy. Mobiles d’ordre 3 3 Moy. Mobiles d’ordre 2 2 (y 1 /2+y 2 +y 3 /2)/2 3 (y 2 /2+y 3 +y 4 /2)/2

(3) DETERMINATION DE LA TENDANCE MOYENNES MOBILES Choix de l’ordre des moyennes mobiles : égal au nombre de saisons Avantages du lissage par moyennes mobiles : Permet de se faire une idée de la tendance lorsque le nuage ne présente pas une tendance algébrique claire Inconvénients: La tendance est estimée sur une partie de la période étudiée et non sur la totalité Ne donne pas une expression analytique de la tendance en fonction du temps Approximation pas très bonne lorsqu’il y a de fortes courbures Sensible aux valeurs extrêmes SERIES CHRONOLOGIQUES

DETERMINATION DES COMPOSANTES SAISONNIERES Modèle multiplicatif Y = T.S.AModèle additif Y = T+S+A SERIES CHRONOLOGIQUES Rapports Y/T = S.ADifférences Y-T = S+A = Moyenne des rapports de la saison j= Moyenne des différences de la saison j Coefficients saisonniers bruts Coefficients saisonniers Rque: cette transformation permet de respecter le principe de conservation des aires

DETERMINATION DE LA COMPOSANTE ALEATOIRE SERIES CHRONOLOGIQUES Modèle multiplicatif Y = T.S.AModèle additif Y = T+S+A A = Y - T - S La composante aléatoire, ou résidu, permet d’analyser la qualité du modèle de décomposition

DESAISONNALISATION SERIES CHRONOLOGIQUES Y CVS = série désaisonnalisée ou Corrigée des Variations Saisonnières, exprime ce qu’aurait été l’évolution du phénomène sans effet saisonnier. Modèle multiplicatif Y = T.S.AModèle additif Y = T+S+A

PREVISION SERIES CHRONOLOGIQUES Lissage obtenu par T = droite de régression D Y/t - Régression linéaire de Y sur le temps t - Moyennes mobiles(Moyennes mobiles = T provisoire) Régression linéaire de sur le temps tT = droite de régression Prévision à la date future t, correspondant à la saison j: Modèle multiplicatif Y = T.S.AModèle additif Y = T+S+A