La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

STATISTIQUES DESCRIPTIVES

Présentations similaires


Présentation au sujet: "STATISTIQUES DESCRIPTIVES"— Transcription de la présentation:

1 STATISTIQUES DESCRIPTIVES

2 INTRODUCTION

3 VOCABULAIRE STATISTIQUE
INTRODUCTION Vocabulaire statistique VOCABULAIRE STATISTIQUE Vocabulaire statistique L ’opérateur somme Population statistique : Une population statistique est l'ensemble sur lequel on effectue des observations. Individu (ou unités statistiques) : Les individus sont les éléments de la population statistique étudiée. Caractère statistique ou variable statistique : C'est ce qui est observé ou mesuré sur les individus d'une population statistique.

4 VARIABLES QUANTITATIVES
INTRODUCTION Vocabulaire statistique L ’opérateur somme VARIABLES QUANTITATIVES Variable quantitative : Une variable statistique est quantitative si ses valeurs sont des nombres exprimant une quantité, sur lesquels les opérations arithmétiques (somme, etc...) ont un sens. Variable quantitative discrète: Une variable quantitative est discrète si elle ne peut prendre que des valeurs isolées, généralement entières. Variable quantitative continue: Une variable quantitative est continue si ses valeurs peuvent être n'importe lesquelles d'un intervalle réel.

5 VARIABLES QUALITATIVES
INTRODUCTION Vocabulaire statistique L ’opérateur somme VARIABLES QUALITATIVES Variable qualitative : Une variable statistique est qualitative si ses valeurs, ou modalités, s'expriment de façon littérale ou par un codage sur lequel les opérations arithmétiques telles que moyenne, somme, ... , n'ont pas de sens. Variable qualitative nominale : C'est une variable qualitative dont les modalités ne sont pas ordonnées. Variable qualitative ordinale : C'est une variable qualitative dont les modalités sont naturellement ordonnées

6 (1) UN OUTIL : L ’OPERATEUR SOMME S
INTRODUCTION L ’opérateur somme (1) UN OUTIL : L ’OPERATEUR SOMME S Vocabulaire statistique L ’opérateur somme DEFINITION: p et q étant 2 entiers relatifs REMARQUE 1: i est une variable muette REMARQUE 2: Quand il n’y a pas d’ambiguïté sur le domaine de variation de i, celui-ci peut être omis

7 (2) UN OUTIL : L ’OPERATEUR SOMME S
INTRODUCTION Vocabulaire statistique L ’opérateur somme (2) UN OUTIL : L ’OPERATEUR SOMME S

8 TABLEAUX ET GRAPHIQUES

9 TABLEAUX ET GRAPHIQUES
Qualitative nominale (1) VARIABLES QUALITATIVES NOMINALES Qualitative nominale Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue

10 (2) VARIABLES QUALITATIVES NOMINALES
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (2) VARIABLES QUALITATIVES NOMINALES Bleu 20% Noir 54% Noisette 13% Vert Diagramme circulaire ou camembert Diagramme en barres

11 TABLEAUX ET GRAPHIQUES
Qualitative ordinale VARIABLES QUALITATIVES ORDINALES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue 130 personnes ont été interrogées sur leur addiction au chocolat Les modalités sont présentées dans l’ordre 10 25 40 32 23 5 15 20 30 35 45 A B C D E

12 TABLEAUX ET GRAPHIQUES
Quantitative discrète (1) VARIABLES QUANTITATIVES DISCRETES EFFECTIFS ET FREQUENCES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue

13 TABLEAUX ET GRAPHIQUES
Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (2) VARIABLES QUANTITATIVES DISCRETES REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES Diagramme en bâtons

14 (3) VARIABLES QUANTITATIVES DISCRETES EFFECTIFS ET FREQUENCES CUMULES
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (3) VARIABLES QUANTITATIVES DISCRETES EFFECTIFS ET FREQUENCES CUMULES 103 360 142 257 47 Effectifs cumulés croissants: Nombre d'individus pour lesquels la variable est inférieure ou égale à xi. Résultat de l'addition, de proche en proche, des effectifs d'une distribution observée en commençant par le 1er. 218 313 348 358 360 12 2 Effectifs cumulés décroissants: Nombre d'individus pour lesquels la variable est supérieure ou égale à xi. Résultat de l'addition, de proche en proche, des effectifs d'une distribution observée en commençant par le dernier.

15 (4) VARIABLES QUANTITATIVES DISCRETES EFFECTIFS ET FREQUENCES CUMULES
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (4) VARIABLES QUANTITATIVES DISCRETES EFFECTIFS ET FREQUENCES CUMULES Il y a 313 clients possédant un nombre de produits financiers inférieur ou égal à 2 Il y a 47 clients possédant un nombre de pro. fin. supérieur ou égal à 3 La proportion de clients possédant un nombre de pro. fin. inférieur ou égal à 4 est de 99,44% La proportion de clients possédant un nombre de pro. fin. supérieur ou égal à 1 est de 71,39%

16 (5) VARIABLES QUANTITATIVES DISCRETES COURBES CUMULATIVES
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (5) VARIABLES QUANTITATIVES DISCRETES COURBES CUMULATIVES x 1 2 3 4 5 103 218 313 348 358 N(x) 360 N ’(x) 257 360 47 142 12 2 1 2 3 4 5 On appelle courbe cumulative croissante le tracé de la fonction N (ou F pour les fréquences) qui à tout réel x associe N( x ) = nombre d'observations inférieur ou égal à x. On appelle courbe cumulative décroissante le tracé de la fonction N' (ou F’ pour les fréquences) qui a tout réel x associe N'( x ) = nombre d'observations supérieur strictement à x. Les courbes cumulatives N(x) et N’(x) sont symétriques par rapport à n/2 : N(x) + N’(x) = n Les courbes cumulatives F(x) et F’(x) sont symétriques par rapport à 0,5 : F(x) + F’(x) = 1

17 TABLEAUX ET GRAPHIQUES
Quantitative continue (1) VARIABLES QUANTITATIVES CONTINUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue Variable observée: augmentation moyenne mensuelle du salaire, en €, des employés d’une multinationale au cours de l’année 2005. Remarque1 : la variable augmentation moyenne mensuelle peut être considérée comme continue. En arrondissant à l’euro, on l’a discrétisée. Une augmentation de 10 € est en fait une augmentation comprise entre 9,5 € et 10,5 €. Remarque2 : Une variable continue ne prend pas des valeurs isolées, mais des valeurs appartenant à des intervalles. C'est pourquoi, au lieu de définir des effectifs par valeurs, on définira des effectifs par intervalles, appelés classes. Remarque3 : Une variable discrète comportant trop de valeurs est aussi traitée comme une variable continue.

18 (2) VARIABLES QUANTITATIVES CONTINUES
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (2) VARIABLES QUANTITATIVES CONTINUES Remarque 1: Le choix des classes et arbitraire, mais elles doivent être contigües et recouvrir l’ensemble des valeurs. Remarque 2: Il est préférable de prendre des classes d’amplitudes égales. Remarque 3: Il ne faut prendre ni trop ni trop peu de classes. Remarque 4: Le choix et le nombre de classes influent sur les représentations graphiques.

19 TABLEAUX ET GRAPHIQUES
Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (3) VARIABLES QUANTITATIVES CONTINUES REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES effectif Effectif rectifié HISTOGRAMME

20 TABLEAUX ET GRAPHIQUES
Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (4) VARIABLES QUANTITATIVES CONTINUES REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES Effectif rectifié HISTOGRAMME La surface = ai (ni/ai) est de 615 unités La surface = ai (ni/ai) est de 830 unités Dans un histogramme, ce sont les surfaces des rectangles (ce que l’œil voit), qui sont proportionnelles aux effectifs, et non les hauteurs de ces rectangles Remarque: Le tracé de l’histogramme des fréquences est identique. Il suffit de porter en ordonnées la fréquence rectifiée di = fi/ai, appelée densité.

21 (5) VARIABLES QUANTITATIVES CONTINUES EFFECTIFS ET FREQUENCES CUMULES
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (5) VARIABLES QUANTITATIVES CONTINUES EFFECTIFS ET FREQUENCES CUMULES Variable observée: augmentation moyenne mensuelle du salaire, en €, des employés d’une multinationale au cours de l’année 2005. Il y a 1445 employés dont l’augmentation est strictement inférieure à 5 Il y a 170 employés dont l’augmentation est supérieure ou égale à 10 Combien y-a-t-il d’employés dont l’augmentation est inférieure à 17 ?

22 (6) VARIABLES QUANTITATIVES CONTINUES COURBES CUMULATIVES
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (6) VARIABLES QUANTITATIVES CONTINUES COURBES CUMULATIVES x 3 5 10 20 30 50 ? F(x) 0,391 0,680 0,920 0,963 0,993 1 F’(x) 1 0,609 0,320 0,080 0,037 0,007 ? 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 -10 10 20 30 40 50 60 Fi F’i ? A l’intérieur de chaque classe, on fait l’hypothèse que la répartition est uniforme ? A l’intérieur de chaque classe, on fait l’hypothèse que la répartition est uniforme ? On appelle courbe cumulative croissante le tracé de la fonction F (N pour les effectifs) qui à tout réel x associe F( x ) = nombre d'observations inférieur ou égal à x. On appelle courbe cumulative décroissante le tracé de la fonction F’ (N’ pour les effectifs) qui a tout réel x associe F’( x ) = nombre d'observations supérieur strictement à x. Remarque: Pour une variable continue, il est indifférent de dire « inférieur ou égal » ou « strictement inférieur ». Il en est de même pour « supérieur ou égal » ou « strictement supérieur ». Il n’y a aucune chance qu’une observation tombe sur une borne. C’est l’imprécision de l’instrument de mesure et un mauvais choix des bornes qui pourrait conduire à ce résultat. Les courbes cumulatives F(x) et F’(x) sont symétriques par rapport à 0,5 : F(x) + F’(x) = 1

23 (7) VARIABLES QUANTITATIVES CONTINUES COURBES CUMULATIVES
TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (7) VARIABLES QUANTITATIVES CONTINUES COURBES CUMULATIVES Quelle est la proportion p d’employés dont l’augmentation est inférieure à 17 € ? 3 5 10 20 30 50 x 0,391 0,680 0,920 0,963 0,993 1 F(x) 0,95 p - 0,92 0,963-0,920 17 p 17

24 TABLEAUX ET GRAPHIQUES
RESUME VARIABLE QUALITATIVE VARIABLE QUANTITATIVE Nominale Ordinale Discrète Continue Diagramme circulaire Diagramme en barres Modalités dans l ’ordre Diagramme en barres Diagramme en bâtons Histogramme Effectifs ou Fréquences Effectifs ou Fréquences Courbes cumulatives des effectifs ou des fréquences

25 PARAMETRES STATISTIQUES

26 PARAMETRES STATISTIQUES
Les représentations graphiques ont permis une première synthèse visuelle de la distribution des observations Un paramètre statistique permet de résumer par une seule quantité numérique une information contenue dans une distribution d’observations. Les paramètres statistiques ne concernent que les variables quantitatives N° individu Variable Tendance centrale N° individu Variable Position 100 % - A % A % N° individu Variable Dispersion

27 PARAMETRES STATISTIQUES
(1) PARAMETRES DE TENDANCE CENTRALE LE MODE Tendance centrale Tendance centrale Position Dispersion Une distribution est unimodale si elle présente un maximum marqué, et pas d'autres maxima relatifs. La lecture s’effectue sur le diagramme en bâtons ou l'histogramme. Mode Classe modale Mode Le mode correspond à l'abscisse du maximum, c.à.d. la valeur la plus fréquente

28 (2) PARAMETRES DE TENDANCE CENTRALE LE MODE
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (2) PARAMETRES DE TENDANCE CENTRALE LE MODE Si la distribution présente 2 ou plus maxima relatifs, on dit qu'elle est bimodale ou plurimodale. La population est composée de plusieurs sous-populations ayant des caractéristiques de tendance centrale différentes. 20 40 60 80 100 120 140 1 2 3 4 5 6 Mode 1 Mode 2 Mode 1 Mode 2

29 (3) PARAMETRES DE TENDANCE CENTRALE LA MEDIANE
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (3) PARAMETRES DE TENDANCE CENTRALE LA MEDIANE Les valeurs observées doivent être rangées par ordre croissant. La médiane M est la valeur du milieu de la série d’observations, c.à.d. telle qu'il y ait autant d'observations "au-dessous" que "au-dessus". Nombre impair d’observations Nombre pair d’observations M Intervalle médian M = milieu = 5,5 4 valeurs 4 valeurs

30 PARAMETRES STATISTIQUES
Tendance centrale Position Dispersion (4) PARAMETRES DE TENDANCE CENTRALE LA MEDIANE à partir d’une distribution discrète F(x) 0,606 0,286 0,994 0,967 1 0,869 F(x) 0,500 0,286 0,889 0,861 1 0,764 M 0,5 Intervalle médian M = milieu = 1,5 0,5 0,5 1 -2 -1 2 3 4 5 6 0,5 1 -2 -1 2 3 4 5 6 M Intervalle médian M = milieu = 1,5

31 PARAMETRES STATISTIQUES
Tendance centrale Position Dispersion (5) PARAMETRES DE TENDANCE CENTRALE LA MEDIANE à partir d’une distribution continue 3 5 10 20 30 50 x 0,391 0,680 0,920 0,963 0,993 1 F(x) 0,5-0,391 M - 3 5 - 3 0,680-0,391 M 0,5 0,5 3,22 M

32 (6) PARAMETRES DE TENDANCE CENTRALE LA MOYENNE ARITHMETIQUE
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (6) PARAMETRES DE TENDANCE CENTRALE LA MOYENNE ARITHMETIQUE La moyenne arithmétique est notée Série brute x1, x2, … , xn Série groupée

33 (7) PARAMETRES DE TENDANCE CENTRALE LA MOYENNE ARITHMETIQUE
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (7) PARAMETRES DE TENDANCE CENTRALE LA MOYENNE ARITHMETIQUE Série classée

34 (8) PARAMETRES DE TENDANCE CENTRALE LA MOYENNE ARITHMETIQUE
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (8) PARAMETRES DE TENDANCE CENTRALE LA MOYENNE ARITHMETIQUE Comment faire la moyenne de plusieurs populations ? Population P2 Effectif n2 Moyenne Population P1 Effectif n1 Moyenne Population Effectif n = n1+ n2 Moyenne Moyenne globale = moyenne des moyennes

35 (9) PARAMETRES DE TENDANCE CENTRALE PROPRIETES GENERALES
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (9) PARAMETRES DE TENDANCE CENTRALE PROPRIETES GENERALES z = a x + b P (z) = a P (x) + b y = a x x P (x) = moyenne, médiane, mode P (y) = a P (x)

36 PARAMETRES STATISTIQUES
Tendance centrale Position Dispersion (10) PARAMETRES DE TENDANCE CENTRALE MOYENNES GEOMETRIQUE ET HARMONIQUE Moyenne géométrique Utilisée dans le cas de phénomènes multiplicatifs (taux de croissance moyen) Moyenne harmonique Utilisée dans le cas où l’on combine 2 variables sous forme de rapport (pièces/heure, km/litre,…)

37 PARAMETRES STATISTIQUES
(1) PARAMETRES DE POSITION LES FRACTILES OU QUANTILES Position Tendance centrale Position Dispersion On appelle fractiles ou quantiles d'ordre k les (k-1) valeurs qui divisent les observations en k parties d'effectifs égaux. 1 médiane M qui divise les observations en 2 parties égales 3 quartiles Q1, Q2, Q3 qui divisent les observations en 4 parties égales 9 déciles D1, D2, …, D9 qui divisent les observations en 10 parties égales 99 centiles C1, C2, …, C99 qui divisent les observations en 100 parties égales

38 (2) PARAMETRES DE POSITION LES FRACTILES OU QUANTILES
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (2) PARAMETRES DE POSITION LES FRACTILES OU QUANTILES Quartiles, déciles, centiles s’obtiennent de la même façon que la médiane. 1 -2 -1 2 3 4 5 6 Variable discrète Variable continue 0,9 D9 Q3 0,75 0,75 Q3 0,5 M 0,5 M 0,2 D2

39 (3) PARAMETRES DE POSITION PROPRIETES GENERALES
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (3) PARAMETRES DE POSITION PROPRIETES GENERALES z = a x + b Q (z) = a Q (x) + b A % 100 % - A % y = a x Q (y) = a Q (x) A % 100 % - A % x Q (x) = quantile A % 100 % - A %

40 PARAMETRES STATISTIQUES
Dispersion (1) PARAMETRES DE DISPERSION Tendance centrale Position Dispersion Etendue : R = xmax - xmin Intervalle interquartile : IQ = Q3 - Q1 Variance : Série brute : Série groupée ou classée : = Moyenne des carrés - Carré de la moyenne Ecart-type :

41 (2) PARAMETRES DE DISPERSION
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (2) PARAMETRES DE DISPERSION Comment faire la variance de plusieurs populations ? Population P2 Effectif n2 Moyenne Variance V2 Population P1 Effectif n1 Moyenne Variance V1 Population Effectif n = n1+ n2 Moyenne Variance V ? Variance globale = Moyenne des variances + Variance des moyennes

42 (3) PARAMETRES DE DISPERSION PROPRIETES GENERALES
PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (3) PARAMETRES DE DISPERSION PROPRIETES GENERALES z = a x + b P (z) = a P (x) y = a x P (y) = a P (x) x P (x) = étendue, écart-type, intervalle interquartile

43 PROPRIETES IMPORTANTES DE LA MOYENNE ET DE LA VARIANCE
PARAMETRES STATISTIQUES PROPRIETES IMPORTANTES DE LA MOYENNE ET DE LA VARIANCE Comment se comportent la moyenne et la variance lorsqu’on fait subir un changement de variable aux observations? xi yi = a xi + b Comment se comportent la moyenne et la variance de la somme de deux séries d’observations? xi yi zi = xi + yi

44 ETUDE DE 2 VARIABLES QUANTITATIVES

45 (1) MESURE DE LA LIAISON ENTRE 2 VARIABLES QUANTITATIVES
ETUDE DE 2 VARIABLES QUANTITATIVES (1) MESURE DE LA LIAISON ENTRE 2 VARIABLES QUANTITATIVES Taille Poids La connaissance de la taille x apporte une certaine information sur le poids y Il existe une relation de dépendance entre x et y

46 (2) MESURE DE LA LIAISON ENTRE 2 VARIABLES QUANTITATIVES
ETUDE DE 2 VARIABLES QUANTITATIVES (2) MESURE DE LA LIAISON ENTRE 2 VARIABLES QUANTITATIVES La connaissance de x n’apporte aucune certaine information sur y La connaissance de x permet de connaître exactement la valeur de y x et y sont indépendantes Il existe une relation fonctionnelle entre x et y

47 (3) MESURE DE LA LIAISON ENTRE 2 VARIABLES QUANTITATIVES
ETUDE DE 2 VARIABLES QUANTITATIVES (3) MESURE DE LA LIAISON ENTRE 2 VARIABLES QUANTITATIVES Covariance : Propriétés : x et y varient dans le même sens x et y varient en sens contraire

48 (4) MESURE DE LA LIAISON ENTRE 2 VARIABLES QUANTITATIVES
ETUDE DE 2 VARIABLES QUANTITATIVES (4) MESURE DE LA LIAISON ENTRE 2 VARIABLES QUANTITATIVES Corrélation linéaire: Propriétés : Il existe une relation fonctionnelle entre x et y x et y sont indépendantes Il existe une dépendance linéaire d’autant plus forte que |r| est grand Ne pas confondre causalité et corrélation

49 (1) AJUSTEMENT LINEAIRE
ETUDE DE 2 VARIABLES QUANTITATIVES (1) AJUSTEMENT LINEAIRE x = Taille y = Poids Est-il possible de trouver une fonction numérique f telle que y = f (x) ? Si une telle fonction existe, on dit que f est un modèle du phénomène étudié. x est la variable explicative. y est la variable expliquée.

50 (2) AJUSTEMENT LINEAIRE
ETUDE DE 2 VARIABLES QUANTITATIVES (2) AJUSTEMENT LINEAIRE x = Taille y = Poids On désire trouver la droite qui passe « au mieux » à l’intérieur du nuage de points

51 (3) AJUSTEMENT LINEAIRE
ETUDE DE 2 VARIABLES QUANTITATIVES (3) AJUSTEMENT LINEAIRE « au mieux » Minimiser ei Minimiser x = Taille y = Poids x = Taille y = Poids Droite de régression de y en x Droite de régression de x en y

52 (4) AJUSTEMENT LINEAIRE REGRESSION LINEAIRE DE Y EN X
ETUDE DE 2 VARIABLES QUANTITATIVES (4) AJUSTEMENT LINEAIRE REGRESSION LINEAIRE DE Y EN X x = Taille y = Poids f(x) = y = ax+b Droite de régression linéaire de y en x y = f(x) = ax + b yi ei = |yi-axi-b| xi axi+b La droite de régression linéaire de y en x, notée Dy/x , minimise Dy/x passe par le point moyen

53 (5) AJUSTEMENT LINEAIRE REGRESSION LINEAIRE DE Y EN X
ETUDE DE 2 VARIABLES QUANTITATIVES (5) AJUSTEMENT LINEAIRE REGRESSION LINEAIRE DE Y EN X x = Taille y = Poids f(x) = y = ax+b = valeur de yi prévue par le modèle définit un modèle affine Droite de régression linéaire de y en x y = f(x) = ax + b yi ei = |yi-axi-b| xi = erreur due au modèle axi+b = résidu de la ième observation

54 (6) AJUSTEMENT LINEAIRE REGRESSION LINEAIRE DE X EN Y
ETUDE DE 2 VARIABLES QUANTITATIVES (6) AJUSTEMENT LINEAIRE REGRESSION LINEAIRE DE X EN Y x = Taille y = Poids ei’ = |xi-a’yi-b’| f(y) = x = a’y+b’ Droite de régression linéaire de x en y x = f(y) = a’y + b’ yi xi a’yi+b’ La droite de régression linéaire de x en y, notée Dx/y , minimise Dx/y passe par le point moyen

55 LIENS ENTRE CORRELATION ET DROITES DE REGRESSION
ETUDE DE 2 VARIABLES QUANTITATIVES LIENS ENTRE CORRELATION ET DROITES DE REGRESSION Dy/x : y = ax + b Dx/y : x = a’y + b’ r² = a a’ r² = a a’ = 1 r² = a a’ = 0 0< r² = a a’ < 1 Le degré de dépendance linéaire se mesure à la proximité des droites de régression Indépendance linéaire Liaison fonctionnelle linéaire

56 (1) AJUSTEMENT A UNE FONCTION EXPONENTIELLE
ETUDE DE 2 VARIABLES QUANTITATIVES (1) AJUSTEMENT A UNE FONCTION EXPONENTIELLE Analyse des résidus droite de régression linéaire de y en x Les résidus devraient se répartir au hasard autour de l’axe des abscisses: le modèle affine ne convient pas

57 (2) AJUSTEMENT A UNE FONCTION EXPONENTIELLE
ETUDE DE 2 VARIABLES QUANTITATIVES (2) AJUSTEMENT A UNE FONCTION EXPONENTIELLE Modèle exponentiel exponentielle de base e exponentielle de base a Forme exponentielle générale Changement de variable ln y = ln b + x ln a Y = A X + B avec Y = ln y X = x A = ln a B = ln b L’ajustement affine de Y en fonction de X donne A et B, d ’où , , et le modèle

58 (3) AJUSTEMENT A UNE FONCTION EXPONENTIELLE
ETUDE DE 2 VARIABLES QUANTITATIVES (3) AJUSTEMENT A UNE FONCTION EXPONENTIELLE Série initiale (xi,yi) Série prévue par le modèle Analyse des résidus Le modèle exponentiel est mieux adapté que le modèle affine

59 (1) AJUSTEMENT A UNE FONCTION PUISSANCE
ETUDE DE 2 VARIABLES QUANTITATIVES (1) AJUSTEMENT A UNE FONCTION PUISSANCE Droite de régression linéaire de y en x Analyse des résidus Le modèle affine ne convient pas

60 (2) AJUSTEMENT A UNE FONCTION PUISSANCE
ETUDE DE 2 VARIABLES QUANTITATIVES (2) AJUSTEMENT A UNE FONCTION PUISSANCE Modèle puissance Changement de variable ln y = ln b + a ln x Y = A X + B avec Y = ln y X = ln x A = a B = ln b L’ajustement affine de Y en fonction de X donne A et B, d ’où a = A , , et le modèle

61 (3) AJUSTEMENT A UNE FONCTION PUISSANCE
ETUDE DE 2 VARIABLES QUANTITATIVES (3) AJUSTEMENT A UNE FONCTION PUISSANCE Série initiale (xi,yi) Série prévue par le modèle Analyse des résidus -80 -60 -40 -20 20 40 60 80 10 30 50 Le modèle puissance est mieux adapté que le modèle affine

62 QUALITE D’UN AJUSTEMENT
ETUDE DE 2 VARIABLES QUANTITATIVES QUALITE D’UN AJUSTEMENT On montre que SCT = SCM SCR Somme des carrés des écarts à la moyenne Somme des carrés des écarts du modèle Somme des carrés des résidus + = L’ajustement est d’autant meilleur que SCR est proche de 0, c.à.d. que SCR/SCT est proche de 0 ou SCM/SCT est proche de 1. = Coefficient de détermination = r² = (coef. de corrélation)² = proportion de la variation totale due à l'ajustement

63 LES INDICES

64 LES INDICES INDICES ELEMENTAIRES Un indice est le rapport d’une variable mesurée à deux instants différents. Un indice est représentatif d’une évolution y1 = valeur de la variable y à la date t1 y0 = valeur de la variable y à la date t0 Indice élémentaire de la variable y à la date t1 par rapport à la date de référence t0 Indice élémentaire de la variable y à la date t1 par rapport à la date de référence t0, base 100. Propriétés Identité Réversibilité Circularité

65 INDICES ET TAUX DE VARIATION
LES INDICES INDICES ET TAUX DE VARIATION Taux de variation ou taux de croissance de la variable y entre la date t0 et la date t1 r = i i = 1 + r i = 1 + r = coefficient multiplicateur Pas d’évolution Croissance Décroissance

66 INDICES ET TAUX DE VARIATION MOYENS
LES INDICES INDICES ET TAUX DE VARIATION MOYENS y0, y1, ….., yn les valeurs prises par une variable aux dates t0, t1, ….., tn r1, r2, ….., rn les taux de croissance sur chacune des périodes i1, i2, ….., in les indices élémentaires sur chacune des périodes rG le taux de croissance entre t0 et tn iG l’indice élémentaire global entre t0 et tn r le taux de croissance moyen i l’indice moyen r1, r2, ….., rk indices élémentaires sur des périodes de n1, n2, ….., nk unités (jour, mois, année…) i1, i2, ….., ik indices élémentaires sur des périodes de n1, n2, ….., nk unités (jour, mois, année…) Moyenne géométrique des indices élémentaires

67 INDICES USUELS Indice élémentaire des prix
LES INDICES INDICES USUELS Indice élémentaire des prix Indice élémentaire des quantités (ou des volumes) Indice élémentaire de valeur (ou de dépense)

68 LES INDICES INDICES SYNTHETIQUES Un indice synthétique mesure l’évolution simultanée de plusieurs produits Un indice synthétique est une moyenne pondérée des indices élémentaires des différents produits Coefficient de pondération (ou budgétaire) du produit j à la date tn Remarque :

69 (1) INDICES SYNTHETIQUES DE LASPEYRES
LES INDICES (1) INDICES SYNTHETIQUES DE LASPEYRES Indice de Laspeyres des prix Moyenne arithmétique des indices élémentaires des prix, base 100, pondérés par des coefficients de pondération relatifs à la date de référence t0 Comment s’en souvenir ? 1 seul indice sur 4 doit être modifié

70 (2) INDICES SYNTHETIQUES DE LASPEYRES
LES INDICES (2) INDICES SYNTHETIQUES DE LASPEYRES Indice de Laspeyres des quantités Moyenne arithmétique des indices élémentaires des quantités, base 100, pondérés par des coefficients de pondération relatifs à la date de référence t0 Comment s’en souvenir ? 1 seul indice sur 4 doit être modifié

71 (1) INDICES SYNTHETIQUES DE PAASCHE
LES INDICES (1) INDICES SYNTHETIQUES DE PAASCHE Indice de Paasche des prix Moyenne harmonique des indices élémentaires des prix, base 100, pondérés par des coefficients de pondération relatifs à la date courante t1 Comment s’en souvenir ? 1 seul indice sur 4 doit être modifié 1

72 (2) INDICES SYNTHETIQUES DE PAASCHE
LES INDICES (2) INDICES SYNTHETIQUES DE PAASCHE Indice de Paasche des quantités Moyenne harmonique des indices élémentaires des quantités, base 100, pondérés par des coefficients de pondération relatifs à la date courante t1 Comment s’en souvenir ? 1 seul indice sur 4 doit être modifié 1

73 SERIES CHRONOLOGIQUES

74 SERIES CHRONOLOGIQUES
LES DONNEES Y = prix d’un bien en fonction du temps Y = série initiale Y temps

75 SERIES CHRONOLOGIQUES
LES COMPOSANTES Y = série initiale Tendance ou Trend T Composante Saisonnière S Composante Aléatoire A

76 MODELES DE DECOMPOSITION
SERIES CHRONOLOGIQUES MODELES DE DECOMPOSITION Modèle multiplicatif Y = T . S . A Modèle additif Y = T + S + A

77 (1) DETERMINATION DE LA TENDANCE REGRESSION LINEAIRE
SERIES CHRONOLOGIQUES (1) DETERMINATION DE LA TENDANCE REGRESSION LINEAIRE Il s’agit de faire un lissage du nuage des points par une fonction connue. Lorsque le nuage est linéaire on utilise la droite de régression de y en fonction du temps T = tendance Avantages: Expression analytique Inconvénients: Un nuage ne se présente pas toujours sous une forme analytique simple Le calcul de la tendance peut être affecté par des valeurs extrêmes ou par les valeurs de début et de fin de série.

78 (2) DETERMINATION DE LA TENDANCE MOYENNES MOBILES
SERIES CHRONOLOGIQUES (2) DETERMINATION DE LA TENDANCE MOYENNES MOBILES 2 (y1+y2+y3)/3 3 (y2+y3+y4)/3 Moyennes mobiles d’ordre impair Moy. Mobiles d’ordre 3 2 Moyennes mobiles d’ordre pair. On utilise une observation supplémentaire (y1/2+y2+y3/2)/2 3 (y2/2+y3+y4/2)/2 Moy. Mobiles d’ordre 2

79 (3) DETERMINATION DE LA TENDANCE MOYENNES MOBILES
SERIES CHRONOLOGIQUES (3) DETERMINATION DE LA TENDANCE MOYENNES MOBILES Choix de l’ordre des moyennes mobiles : égal au nombre de saisons Avantages du lissage par moyennes mobiles : Permet de se faire une idée de la tendance lorsque le nuage ne présente pas une tendance algébrique claire Inconvénients: La tendance est estimée sur une partie de la période étudiée et non sur la totalité Ne donne pas une expression analytique de la tendance en fonction du temps Approximation pas très bonne lorsqu’il y a de fortes courbures Sensible aux valeurs extrêmes

80 DETERMINATION DES COMPOSANTES SAISONNIERES
SERIES CHRONOLOGIQUES DETERMINATION DES COMPOSANTES SAISONNIERES Modèle multiplicatif Y = T.S.A Modèle additif Y = T+S+A Rapports Y/T = S.A Différences Y-T = S+A = Moyenne des rapports de la saison j = Moyenne des différences de la saison j Coefficients saisonniers bruts Coefficients saisonniers Rque: cette transformation permet de respecter le principe de conservation des aires

81 DETERMINATION DE LA COMPOSANTE ALEATOIRE
SERIES CHRONOLOGIQUES DETERMINATION DE LA COMPOSANTE ALEATOIRE Modèle multiplicatif Y = T.S.A Modèle additif Y = T+S+A A = Y - T - S La composante aléatoire, ou résidu, permet d’analyser la qualité du modèle de décomposition

82 SERIES CHRONOLOGIQUES
DESAISONNALISATION YCVS = série désaisonnalisée ou Corrigée des Variations Saisonnières, exprime ce qu’aurait été l’évolution du phénomène sans effet saisonnier. Modèle multiplicatif Y = T.S.A Modèle additif Y = T+S+A

83 SERIES CHRONOLOGIQUES
PREVISION Lissage obtenu par T = droite de régression DY/t - Régression linéaire de Y sur le temps t - Moyennes mobiles (Moyennes mobiles = T provisoire) Régression linéaire de sur le temps t T = droite de régression Prévision à la date future t, correspondant à la saison j: Modèle multiplicatif Y = T.S.A Modèle additif Y = T+S+A


Télécharger ppt "STATISTIQUES DESCRIPTIVES"

Présentations similaires


Annonces Google