STATISTIQUES DESCRIPTIVES

Slides:



Advertisements
Présentations similaires
Pr. Abdelkrim EL MOUATASIM EST de Guelmim Maroc
Advertisements

Corrélation Position du problème Définition covariance (X,Y) r =
Présentation des données
Statistique descriptive
Chapitre 5. Description numérique d’une variable statistique.
Les Variables statistiques continues
C1 Bio-statistiques F. KOHLER
Inférence statistique
Licence 3ème année de sociologie Semestre 1
1. Les caractéristiques de dispersion. 11. Utilité.
Statistique et probabilités au collège
FONCTIONS EXPONENTIELLES ET LOGARITHMES
Statistiques descriptives
Chapitre 2 Les indices.
Les principaux résumés de la statistique
Fonction puissance Montage préparé par : André Ross
Groupe 1: Classes de même intervalle
Opération et systèmes de décision Faculté des Sciences de l administration MQT Probabilités et statistique Mesures caractéristiques.
Lectures Livre du cours :
Comprendre la variation dans les données: Notions de base
LES INDICES STATISTIQUES.
La régression multiple
CHAPITRE 2 LES SITUATIONS FONCTIONNELLES
Les séries chronologiques
Séries chronologiques et prévision
Mesures de position Ils s’expriment dans la même unité que les observations Moyenne et moyenne pondérée Exemple : on dispose du nombre moyen d’enfants.
Thème: statistiques et probabilités Séquence 3: Statistique descriptive Utiliser un logiciel (par exemple, un tableur) ou une calculatrice pour étudier.
Rappels de statistiques descriptives
COURS STATISTIQUE - DESCRIPTIVE DEFINITIONS
La régression simple Michel Tenenhaus
STATISTIQUE DESCRIPTIVE ÉLÉMENTAIRE
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
STATISTIQUES – PROBABILITÉS
Seconde partie Cours de seconde
STATISTIQUE DESCRIPTIVE Dr LEMDAOUI MOHAMED CHERIF
Introduction à une analyse statistique de données
Statistiques descriptives-Distributions expérimentales à une dimension
Statistiques Licence 2 LEA
REVISIONS POINTS COMMUNS
1 Licence Stat-info CM1 b 2004Christophe Genolini 2.1. Vocabulaire Individu : objet étudié Population : Ensemble des individus Variable : nom donné à ce.
Méthodologie de l’observation
STATISTIQUES DESCRIPTIVES
PARAMETRES STATISTIQUES
ETUDE DE 2 VARIABLES QUANTITATIVES
Chapitre 4 Variables aléatoires discrètes
STATISTIQUES DESCRIPTIVES
SERIES CHRONOLOGIQUES
Chapitre 2 La statistique descriptive I
STATISTIQUES.
STATISTIQUE DESCRIPTIVE Dr LEMDAOUI MOHAMED CHERIF
Les fonctions Les propriétés. Chaque fonction possède ses propres caractéristiques: Ainsi l’analyse de ces propriétés permet de mieux cerner chaque type.
Statistique Descriptive Les Paramètres de Tendance Centrale
Seconde 8 Chapitre 4: Les statistiques
CHAPITRE 2 LES SITUATIONS FONCTIONNELLES
Statistiques Première partie Cours de première S.
Corrélation et causalité
Opération et systèmes de décision Faculté des Sciences de l ’administration MQT Probabilités et statistique Les statistiques descriptives.
BIOSTATISTIQUES Définitions.
BIOSTATISTIQUES Définitions.
Mesures de description des valeurs des variables
Les mesures de tendance centrale
Nature de la statistique La statistique est la science qui étudie la collecte, la présentation, l’analyse et l’utilisation des données numériques en vue.
 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs.
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
LES FONCTIONS REVISIONS POINTS COMMUNS Vous connaissez Les fonctions linéaires & affines : Les droites les fonctions du second degré : Les paraboles.
Notions de statistiques et d’analyse de données Master 1 MGS – Sarah MISCHLER –
1 M1 MQSE Cours n°2 1 - Rappels du cours n°1 2 - La statistique: un outil pour décrire.
STATISTIQUE DESCRIPTIVE
STATISTIQUES DESCRIPTIVES. INTRODUCTION Population statistique : Une population statistique est l'ensemble sur lequel on effectue des observations. Individu.
Transcription de la présentation:

STATISTIQUES DESCRIPTIVES

INTRODUCTION

VOCABULAIRE STATISTIQUE INTRODUCTION Vocabulaire statistique VOCABULAIRE STATISTIQUE Vocabulaire statistique L ’opérateur somme Population statistique : Une population statistique est l'ensemble sur lequel on effectue des observations. Individu (ou unités statistiques) : Les individus sont les éléments de la population statistique étudiée. Caractère statistique ou variable statistique : C'est ce qui est observé ou mesuré sur les individus d'une population statistique.

VARIABLES QUANTITATIVES INTRODUCTION Vocabulaire statistique L ’opérateur somme VARIABLES QUANTITATIVES Variable quantitative : Une variable statistique est quantitative si ses valeurs sont des nombres exprimant une quantité, sur lesquels les opérations arithmétiques (somme, etc...) ont un sens. Variable quantitative discrète: Une variable quantitative est discrète si elle ne peut prendre que des valeurs isolées, généralement entières. Variable quantitative continue: Une variable quantitative est continue si ses valeurs peuvent être n'importe lesquelles d'un intervalle réel.

VARIABLES QUALITATIVES INTRODUCTION Vocabulaire statistique L ’opérateur somme VARIABLES QUALITATIVES Variable qualitative : Une variable statistique est qualitative si ses valeurs, ou modalités, s'expriment de façon littérale ou par un codage sur lequel les opérations arithmétiques telles que moyenne, somme, ... , n'ont pas de sens. Variable qualitative nominale : C'est une variable qualitative dont les modalités ne sont pas ordonnées. Variable qualitative ordinale : C'est une variable qualitative dont les modalités sont naturellement ordonnées

(1) UN OUTIL : L ’OPERATEUR SOMME S INTRODUCTION L ’opérateur somme (1) UN OUTIL : L ’OPERATEUR SOMME S Vocabulaire statistique L ’opérateur somme DEFINITION: p et q étant 2 entiers relatifs REMARQUE 1: i est une variable muette REMARQUE 2: Quand il n’y a pas d’ambiguïté sur le domaine de variation de i, celui-ci peut être omis

(2) UN OUTIL : L ’OPERATEUR SOMME S INTRODUCTION Vocabulaire statistique L ’opérateur somme (2) UN OUTIL : L ’OPERATEUR SOMME S

TABLEAUX ET GRAPHIQUES

TABLEAUX ET GRAPHIQUES Qualitative nominale (1) VARIABLES QUALITATIVES NOMINALES Qualitative nominale Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue

(2) VARIABLES QUALITATIVES NOMINALES TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (2) VARIABLES QUALITATIVES NOMINALES Bleu 20% Noir 54% Noisette 13% Vert Diagramme circulaire ou camembert Diagramme en barres

TABLEAUX ET GRAPHIQUES Qualitative ordinale VARIABLES QUALITATIVES ORDINALES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue 130 personnes ont été interrogées sur leur addiction au chocolat Les modalités sont présentées dans l’ordre 10 25 40 32 23 5 15 20 30 35 45 A B C D E

TABLEAUX ET GRAPHIQUES Quantitative discrète (1) VARIABLES QUANTITATIVES DISCRETES EFFECTIFS ET FREQUENCES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue

TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (2) VARIABLES QUANTITATIVES DISCRETES REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES Diagramme en bâtons

(3) VARIABLES QUANTITATIVES DISCRETES EFFECTIFS ET FREQUENCES CUMULES TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (3) VARIABLES QUANTITATIVES DISCRETES EFFECTIFS ET FREQUENCES CUMULES 103 360 142 257 47 Effectifs cumulés croissants: Nombre d'individus pour lesquels la variable est inférieure ou égale à xi. Résultat de l'addition, de proche en proche, des effectifs d'une distribution observée en commençant par le 1er. 218 313 348 358 360 12 2 Effectifs cumulés décroissants: Nombre d'individus pour lesquels la variable est supérieure ou égale à xi. Résultat de l'addition, de proche en proche, des effectifs d'une distribution observée en commençant par le dernier.

(4) VARIABLES QUANTITATIVES DISCRETES EFFECTIFS ET FREQUENCES CUMULES TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (4) VARIABLES QUANTITATIVES DISCRETES EFFECTIFS ET FREQUENCES CUMULES Il y a 313 clients possédant un nombre de produits financiers inférieur ou égal à 2 Il y a 47 clients possédant un nombre de pro. fin. supérieur ou égal à 3 La proportion de clients possédant un nombre de pro. fin. inférieur ou égal à 4 est de 99,44% La proportion de clients possédant un nombre de pro. fin. supérieur ou égal à 1 est de 71,39%

(5) VARIABLES QUANTITATIVES DISCRETES COURBES CUMULATIVES TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (5) VARIABLES QUANTITATIVES DISCRETES COURBES CUMULATIVES x 1 2 3 4 5 103 218 313 348 358 N(x) 360 N ’(x) 257 360 47 142 12 2 1 2 3 4 5 On appelle courbe cumulative croissante le tracé de la fonction N (ou F pour les fréquences) qui à tout réel x associe N( x ) = nombre d'observations inférieur ou égal à x. On appelle courbe cumulative décroissante le tracé de la fonction N' (ou F’ pour les fréquences) qui a tout réel x associe N'( x ) = nombre d'observations supérieur strictement à x. Les courbes cumulatives N(x) et N’(x) sont symétriques par rapport à n/2 : N(x) + N’(x) = n Les courbes cumulatives F(x) et F’(x) sont symétriques par rapport à 0,5 : F(x) + F’(x) = 1

TABLEAUX ET GRAPHIQUES Quantitative continue (1) VARIABLES QUANTITATIVES CONTINUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue Variable observée: augmentation moyenne mensuelle du salaire, en €, des employés d’une multinationale au cours de l’année 2005. Remarque1 : la variable augmentation moyenne mensuelle peut être considérée comme continue. En arrondissant à l’euro, on l’a discrétisée. Une augmentation de 10 € est en fait une augmentation comprise entre 9,5 € et 10,5 €. Remarque2 : Une variable continue ne prend pas des valeurs isolées, mais des valeurs appartenant à des intervalles. C'est pourquoi, au lieu de définir des effectifs par valeurs, on définira des effectifs par intervalles, appelés classes. Remarque3 : Une variable discrète comportant trop de valeurs est aussi traitée comme une variable continue.

(2) VARIABLES QUANTITATIVES CONTINUES TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (2) VARIABLES QUANTITATIVES CONTINUES Remarque 1: Le choix des classes et arbitraire, mais elles doivent être contigües et recouvrir l’ensemble des valeurs. Remarque 2: Il est préférable de prendre des classes d’amplitudes égales. Remarque 3: Il ne faut prendre ni trop ni trop peu de classes. Remarque 4: Le choix et le nombre de classes influent sur les représentations graphiques.

TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (3) VARIABLES QUANTITATIVES CONTINUES REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES effectif Effectif rectifié HISTOGRAMME

TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (4) VARIABLES QUANTITATIVES CONTINUES REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES Effectif rectifié HISTOGRAMME La surface = ai (ni/ai) est de 615 unités La surface = ai (ni/ai) est de 830 unités Dans un histogramme, ce sont les surfaces des rectangles (ce que l’œil voit), qui sont proportionnelles aux effectifs, et non les hauteurs de ces rectangles Remarque: Le tracé de l’histogramme des fréquences est identique. Il suffit de porter en ordonnées la fréquence rectifiée di = fi/ai, appelée densité.

(5) VARIABLES QUANTITATIVES CONTINUES EFFECTIFS ET FREQUENCES CUMULES TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (5) VARIABLES QUANTITATIVES CONTINUES EFFECTIFS ET FREQUENCES CUMULES Variable observée: augmentation moyenne mensuelle du salaire, en €, des employés d’une multinationale au cours de l’année 2005. Il y a 1445 employés dont l’augmentation est strictement inférieure à 5 Il y a 170 employés dont l’augmentation est supérieure ou égale à 10 Combien y-a-t-il d’employés dont l’augmentation est inférieure à 17 ?

(6) VARIABLES QUANTITATIVES CONTINUES COURBES CUMULATIVES TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (6) VARIABLES QUANTITATIVES CONTINUES COURBES CUMULATIVES x 3 5 10 20 30 50 ? F(x) 0,391 0,680 0,920 0,963 0,993 1 F’(x) 1 0,609 0,320 0,080 0,037 0,007 ? 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 -10 10 20 30 40 50 60 Fi F’i ? A l’intérieur de chaque classe, on fait l’hypothèse que la répartition est uniforme ? A l’intérieur de chaque classe, on fait l’hypothèse que la répartition est uniforme ? On appelle courbe cumulative croissante le tracé de la fonction F (N pour les effectifs) qui à tout réel x associe F( x ) = nombre d'observations inférieur ou égal à x. On appelle courbe cumulative décroissante le tracé de la fonction F’ (N’ pour les effectifs) qui a tout réel x associe F’( x ) = nombre d'observations supérieur strictement à x. Remarque: Pour une variable continue, il est indifférent de dire « inférieur ou égal » ou « strictement inférieur ». Il en est de même pour « supérieur ou égal » ou « strictement supérieur ». Il n’y a aucune chance qu’une observation tombe sur une borne. C’est l’imprécision de l’instrument de mesure et un mauvais choix des bornes qui pourrait conduire à ce résultat. Les courbes cumulatives F(x) et F’(x) sont symétriques par rapport à 0,5 : F(x) + F’(x) = 1

(7) VARIABLES QUANTITATIVES CONTINUES COURBES CUMULATIVES TABLEAUX ET GRAPHIQUES Qualitative nominale Qualitative ordinale Quantitative discrète Quantitative continue (7) VARIABLES QUANTITATIVES CONTINUES COURBES CUMULATIVES Quelle est la proportion p d’employés dont l’augmentation est inférieure à 17 € ? 3 5 10 20 30 50 x 0,391 0,680 0,920 0,963 0,993 1 F(x) 0,95 p - 0,92 17 - 10 20 - 10 0,963-0,920 17 p 17

TABLEAUX ET GRAPHIQUES RESUME VARIABLE QUALITATIVE VARIABLE QUANTITATIVE Nominale Ordinale Discrète Continue Diagramme circulaire Diagramme en barres Modalités dans l ’ordre Diagramme en barres Diagramme en bâtons Histogramme Effectifs ou Fréquences Effectifs ou Fréquences Courbes cumulatives des effectifs ou des fréquences

PARAMETRES STATISTIQUES

PARAMETRES STATISTIQUES Les représentations graphiques ont permis une première synthèse visuelle de la distribution des observations Un paramètre statistique permet de résumer par une seule quantité numérique une information contenue dans une distribution d’observations. Les paramètres statistiques ne concernent que les variables quantitatives N° individu Variable Tendance centrale N° individu Variable Position 100 % - A % A % N° individu Variable Dispersion

PARAMETRES STATISTIQUES (1) PARAMETRES DE TENDANCE CENTRALE LE MODE Tendance centrale Tendance centrale Position Dispersion Une distribution est unimodale si elle présente un maximum marqué, et pas d'autres maxima relatifs. La lecture s’effectue sur le diagramme en bâtons ou l'histogramme. Mode Classe modale Mode Le mode correspond à l'abscisse du maximum, c.à.d. la valeur la plus fréquente

(2) PARAMETRES DE TENDANCE CENTRALE LE MODE PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (2) PARAMETRES DE TENDANCE CENTRALE LE MODE Si la distribution présente 2 ou plus maxima relatifs, on dit qu'elle est bimodale ou plurimodale. La population est composée de plusieurs sous-populations ayant des caractéristiques de tendance centrale différentes. 20 40 60 80 100 120 140 1 2 3 4 5 6 Mode 1 Mode 2 Mode 1 Mode 2

(3) PARAMETRES DE TENDANCE CENTRALE LA MEDIANE PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (3) PARAMETRES DE TENDANCE CENTRALE LA MEDIANE Les valeurs observées doivent être rangées par ordre croissant. La médiane M est la valeur du milieu de la série d’observations, c.à.d. telle qu'il y ait autant d'observations "au-dessous" que "au-dessus". Nombre impair d’observations Nombre pair d’observations M Intervalle médian M = milieu = 5,5 4 valeurs 4 valeurs

PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (4) PARAMETRES DE TENDANCE CENTRALE LA MEDIANE à partir d’une distribution discrète F(x) 0,606 0,286 0,994 0,967 1 0,869 F(x) 0,500 0,286 0,889 0,861 1 0,764 M 0,5 Intervalle médian M = milieu = 1,5 0,5 0,5 1 -2 -1 2 3 4 5 6 0,5 1 -2 -1 2 3 4 5 6 M Intervalle médian M = milieu = 1,5

PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (5) PARAMETRES DE TENDANCE CENTRALE LA MEDIANE à partir d’une distribution continue 3 5 10 20 30 50 x 0,391 0,680 0,920 0,963 0,993 1 F(x) 0,5-0,391 M - 3 5 - 3 0,680-0,391 M 0,5 0,5 3,22 M

(6) PARAMETRES DE TENDANCE CENTRALE LA MOYENNE ARITHMETIQUE PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (6) PARAMETRES DE TENDANCE CENTRALE LA MOYENNE ARITHMETIQUE La moyenne arithmétique est notée Série brute x1, x2, … , xn Série groupée

(7) PARAMETRES DE TENDANCE CENTRALE LA MOYENNE ARITHMETIQUE PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (7) PARAMETRES DE TENDANCE CENTRALE LA MOYENNE ARITHMETIQUE Série classée

(8) PARAMETRES DE TENDANCE CENTRALE LA MOYENNE ARITHMETIQUE PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (8) PARAMETRES DE TENDANCE CENTRALE LA MOYENNE ARITHMETIQUE Comment faire la moyenne de plusieurs populations ? Population P2 Effectif n2 Moyenne Population P1 Effectif n1 Moyenne Population Effectif n = n1+ n2 Moyenne Moyenne globale = moyenne des moyennes

(9) PARAMETRES DE TENDANCE CENTRALE PROPRIETES GENERALES PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (9) PARAMETRES DE TENDANCE CENTRALE PROPRIETES GENERALES z = a x + b P (z) = a P (x) + b y = a x x P (x) = moyenne, médiane, mode P (y) = a P (x)

PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (10) PARAMETRES DE TENDANCE CENTRALE MOYENNES GEOMETRIQUE ET HARMONIQUE Moyenne géométrique Utilisée dans le cas de phénomènes multiplicatifs (taux de croissance moyen) Moyenne harmonique Utilisée dans le cas où l’on combine 2 variables sous forme de rapport (pièces/heure, km/litre,…)

PARAMETRES STATISTIQUES (1) PARAMETRES DE POSITION LES FRACTILES OU QUANTILES Position Tendance centrale Position Dispersion On appelle fractiles ou quantiles d'ordre k les (k-1) valeurs qui divisent les observations en k parties d'effectifs égaux. 1 médiane M qui divise les observations en 2 parties égales 3 quartiles Q1, Q2, Q3 qui divisent les observations en 4 parties égales 9 déciles D1, D2, …, D9 qui divisent les observations en 10 parties égales 99 centiles C1, C2, …, C99 qui divisent les observations en 100 parties égales

(2) PARAMETRES DE POSITION LES FRACTILES OU QUANTILES PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (2) PARAMETRES DE POSITION LES FRACTILES OU QUANTILES Quartiles, déciles, centiles s’obtiennent de la même façon que la médiane. 1 -2 -1 2 3 4 5 6 Variable discrète Variable continue 0,9 D9 Q3 0,75 0,75 Q3 0,5 M 0,5 M 0,2 D2

(3) PARAMETRES DE POSITION PROPRIETES GENERALES PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (3) PARAMETRES DE POSITION PROPRIETES GENERALES z = a x + b Q (z) = a Q (x) + b A % 100 % - A % y = a x Q (y) = a Q (x) A % 100 % - A % x Q (x) = quantile A % 100 % - A %

PARAMETRES STATISTIQUES Dispersion (1) PARAMETRES DE DISPERSION Tendance centrale Position Dispersion Etendue : R = xmax - xmin Intervalle interquartile : IQ = Q3 - Q1 Variance : Série brute : Série groupée ou classée : = Moyenne des carrés - Carré de la moyenne Ecart-type :

(2) PARAMETRES DE DISPERSION PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (2) PARAMETRES DE DISPERSION Comment faire la variance de plusieurs populations ? Population P2 Effectif n2 Moyenne Variance V2 Population P1 Effectif n1 Moyenne Variance V1 Population Effectif n = n1+ n2 Moyenne Variance V ? Variance globale = Moyenne des variances + Variance des moyennes

(3) PARAMETRES DE DISPERSION PROPRIETES GENERALES PARAMETRES STATISTIQUES Tendance centrale Position Dispersion (3) PARAMETRES DE DISPERSION PROPRIETES GENERALES z = a x + b P (z) = a P (x) y = a x P (y) = a P (x) x P (x) = étendue, écart-type, intervalle interquartile

PROPRIETES IMPORTANTES DE LA MOYENNE ET DE LA VARIANCE PARAMETRES STATISTIQUES PROPRIETES IMPORTANTES DE LA MOYENNE ET DE LA VARIANCE Comment se comportent la moyenne et la variance lorsqu’on fait subir un changement de variable aux observations? xi yi = a xi + b Comment se comportent la moyenne et la variance de la somme de deux séries d’observations? xi yi zi = xi + yi

ETUDE DE 2 VARIABLES QUANTITATIVES

(1) MESURE DE LA LIAISON ENTRE 2 VARIABLES QUANTITATIVES ETUDE DE 2 VARIABLES QUANTITATIVES (1) MESURE DE LA LIAISON ENTRE 2 VARIABLES QUANTITATIVES Taille Poids La connaissance de la taille x apporte une certaine information sur le poids y Il existe une relation de dépendance entre x et y

(2) MESURE DE LA LIAISON ENTRE 2 VARIABLES QUANTITATIVES ETUDE DE 2 VARIABLES QUANTITATIVES (2) MESURE DE LA LIAISON ENTRE 2 VARIABLES QUANTITATIVES La connaissance de x n’apporte aucune certaine information sur y La connaissance de x permet de connaître exactement la valeur de y x et y sont indépendantes Il existe une relation fonctionnelle entre x et y

(3) MESURE DE LA LIAISON ENTRE 2 VARIABLES QUANTITATIVES ETUDE DE 2 VARIABLES QUANTITATIVES (3) MESURE DE LA LIAISON ENTRE 2 VARIABLES QUANTITATIVES Covariance : Propriétés : x et y varient dans le même sens x et y varient en sens contraire

(4) MESURE DE LA LIAISON ENTRE 2 VARIABLES QUANTITATIVES ETUDE DE 2 VARIABLES QUANTITATIVES (4) MESURE DE LA LIAISON ENTRE 2 VARIABLES QUANTITATIVES Corrélation linéaire: Propriétés : Il existe une relation fonctionnelle entre x et y x et y sont indépendantes Il existe une dépendance linéaire d’autant plus forte que |r| est grand Ne pas confondre causalité et corrélation

(1) AJUSTEMENT LINEAIRE ETUDE DE 2 VARIABLES QUANTITATIVES (1) AJUSTEMENT LINEAIRE x = Taille y = Poids Est-il possible de trouver une fonction numérique f telle que y = f (x) ? Si une telle fonction existe, on dit que f est un modèle du phénomène étudié. x est la variable explicative. y est la variable expliquée.

(2) AJUSTEMENT LINEAIRE ETUDE DE 2 VARIABLES QUANTITATIVES (2) AJUSTEMENT LINEAIRE x = Taille y = Poids On désire trouver la droite qui passe « au mieux » à l’intérieur du nuage de points

(3) AJUSTEMENT LINEAIRE ETUDE DE 2 VARIABLES QUANTITATIVES (3) AJUSTEMENT LINEAIRE « au mieux » Minimiser ei Minimiser x = Taille y = Poids x = Taille y = Poids Droite de régression de y en x Droite de régression de x en y

(4) AJUSTEMENT LINEAIRE REGRESSION LINEAIRE DE Y EN X ETUDE DE 2 VARIABLES QUANTITATIVES (4) AJUSTEMENT LINEAIRE REGRESSION LINEAIRE DE Y EN X x = Taille y = Poids f(x) = y = ax+b Droite de régression linéaire de y en x y = f(x) = ax + b yi ei = |yi-axi-b| xi axi+b La droite de régression linéaire de y en x, notée Dy/x , minimise Dy/x passe par le point moyen

(5) AJUSTEMENT LINEAIRE REGRESSION LINEAIRE DE Y EN X ETUDE DE 2 VARIABLES QUANTITATIVES (5) AJUSTEMENT LINEAIRE REGRESSION LINEAIRE DE Y EN X x = Taille y = Poids f(x) = y = ax+b = valeur de yi prévue par le modèle définit un modèle affine Droite de régression linéaire de y en x y = f(x) = ax + b yi ei = |yi-axi-b| xi = erreur due au modèle axi+b = résidu de la ième observation

(6) AJUSTEMENT LINEAIRE REGRESSION LINEAIRE DE X EN Y ETUDE DE 2 VARIABLES QUANTITATIVES (6) AJUSTEMENT LINEAIRE REGRESSION LINEAIRE DE X EN Y x = Taille y = Poids ei’ = |xi-a’yi-b’| f(y) = x = a’y+b’ Droite de régression linéaire de x en y x = f(y) = a’y + b’ yi xi a’yi+b’ La droite de régression linéaire de x en y, notée Dx/y , minimise Dx/y passe par le point moyen

LIENS ENTRE CORRELATION ET DROITES DE REGRESSION ETUDE DE 2 VARIABLES QUANTITATIVES LIENS ENTRE CORRELATION ET DROITES DE REGRESSION Dy/x : y = ax + b Dx/y : x = a’y + b’ r² = a a’ r² = a a’ = 1 r² = a a’ = 0 0< r² = a a’ < 1 Le degré de dépendance linéaire se mesure à la proximité des droites de régression Indépendance linéaire Liaison fonctionnelle linéaire

(1) AJUSTEMENT A UNE FONCTION EXPONENTIELLE ETUDE DE 2 VARIABLES QUANTITATIVES (1) AJUSTEMENT A UNE FONCTION EXPONENTIELLE Analyse des résidus droite de régression linéaire de y en x Les résidus devraient se répartir au hasard autour de l’axe des abscisses: le modèle affine ne convient pas

(2) AJUSTEMENT A UNE FONCTION EXPONENTIELLE ETUDE DE 2 VARIABLES QUANTITATIVES (2) AJUSTEMENT A UNE FONCTION EXPONENTIELLE Modèle exponentiel exponentielle de base e exponentielle de base a Forme exponentielle générale Changement de variable ln y = ln b + x ln a Y = A X + B avec Y = ln y X = x A = ln a B = ln b L’ajustement affine de Y en fonction de X donne A et B, d ’où , , et le modèle

(3) AJUSTEMENT A UNE FONCTION EXPONENTIELLE ETUDE DE 2 VARIABLES QUANTITATIVES (3) AJUSTEMENT A UNE FONCTION EXPONENTIELLE Série initiale (xi,yi) Série prévue par le modèle Analyse des résidus Le modèle exponentiel est mieux adapté que le modèle affine

(1) AJUSTEMENT A UNE FONCTION PUISSANCE ETUDE DE 2 VARIABLES QUANTITATIVES (1) AJUSTEMENT A UNE FONCTION PUISSANCE Droite de régression linéaire de y en x Analyse des résidus Le modèle affine ne convient pas

(2) AJUSTEMENT A UNE FONCTION PUISSANCE ETUDE DE 2 VARIABLES QUANTITATIVES (2) AJUSTEMENT A UNE FONCTION PUISSANCE Modèle puissance Changement de variable ln y = ln b + a ln x Y = A X + B avec Y = ln y X = ln x A = a B = ln b L’ajustement affine de Y en fonction de X donne A et B, d ’où a = A , , et le modèle

(3) AJUSTEMENT A UNE FONCTION PUISSANCE ETUDE DE 2 VARIABLES QUANTITATIVES (3) AJUSTEMENT A UNE FONCTION PUISSANCE Série initiale (xi,yi) Série prévue par le modèle Analyse des résidus -80 -60 -40 -20 20 40 60 80 10 30 50 Le modèle puissance est mieux adapté que le modèle affine

QUALITE D’UN AJUSTEMENT ETUDE DE 2 VARIABLES QUANTITATIVES QUALITE D’UN AJUSTEMENT On montre que SCT = SCM + SCR Somme des carrés des écarts à la moyenne Somme des carrés des écarts du modèle Somme des carrés des résidus + = L’ajustement est d’autant meilleur que SCR est proche de 0, c.à.d. que SCR/SCT est proche de 0 ou SCM/SCT est proche de 1. = Coefficient de détermination = r² = (coef. de corrélation)² = proportion de la variation totale due à l'ajustement

LES INDICES

LES INDICES INDICES ELEMENTAIRES Un indice est le rapport d’une variable mesurée à deux instants différents. Un indice est représentatif d’une évolution y1 = valeur de la variable y à la date t1 y0 = valeur de la variable y à la date t0 Indice élémentaire de la variable y à la date t1 par rapport à la date de référence t0 Indice élémentaire de la variable y à la date t1 par rapport à la date de référence t0, base 100. Propriétés Identité Réversibilité Circularité

INDICES ET TAUX DE VARIATION LES INDICES INDICES ET TAUX DE VARIATION Taux de variation ou taux de croissance de la variable y entre la date t0 et la date t1 r = i - 1 i = 1 + r i = 1 + r = coefficient multiplicateur Pas d’évolution Croissance Décroissance

INDICES ET TAUX DE VARIATION MOYENS LES INDICES INDICES ET TAUX DE VARIATION MOYENS y0, y1, ….., yn les valeurs prises par une variable aux dates t0, t1, ….., tn r1, r2, ….., rn les taux de croissance sur chacune des périodes i1, i2, ….., in les indices élémentaires sur chacune des périodes rG le taux de croissance entre t0 et tn iG l’indice élémentaire global entre t0 et tn r le taux de croissance moyen i l’indice moyen r1, r2, ….., rk indices élémentaires sur des périodes de n1, n2, ….., nk unités (jour, mois, année…) i1, i2, ….., ik indices élémentaires sur des périodes de n1, n2, ….., nk unités (jour, mois, année…) Moyenne géométrique des indices élémentaires

INDICES USUELS Indice élémentaire des prix LES INDICES INDICES USUELS Indice élémentaire des prix Indice élémentaire des quantités (ou des volumes) Indice élémentaire de valeur (ou de dépense)

LES INDICES INDICES SYNTHETIQUES Un indice synthétique mesure l’évolution simultanée de plusieurs produits Un indice synthétique est une moyenne pondérée des indices élémentaires des différents produits Coefficient de pondération (ou budgétaire) du produit j à la date tn Remarque :

(1) INDICES SYNTHETIQUES DE LASPEYRES LES INDICES (1) INDICES SYNTHETIQUES DE LASPEYRES Indice de Laspeyres des prix Moyenne arithmétique des indices élémentaires des prix, base 100, pondérés par des coefficients de pondération relatifs à la date de référence t0 Comment s’en souvenir ? 1 seul indice sur 4 doit être modifié

(2) INDICES SYNTHETIQUES DE LASPEYRES LES INDICES (2) INDICES SYNTHETIQUES DE LASPEYRES Indice de Laspeyres des quantités Moyenne arithmétique des indices élémentaires des quantités, base 100, pondérés par des coefficients de pondération relatifs à la date de référence t0 Comment s’en souvenir ? 1 seul indice sur 4 doit être modifié

(1) INDICES SYNTHETIQUES DE PAASCHE LES INDICES (1) INDICES SYNTHETIQUES DE PAASCHE Indice de Paasche des prix Moyenne harmonique des indices élémentaires des prix, base 100, pondérés par des coefficients de pondération relatifs à la date courante t1 Comment s’en souvenir ? 1 seul indice sur 4 doit être modifié 1

(2) INDICES SYNTHETIQUES DE PAASCHE LES INDICES (2) INDICES SYNTHETIQUES DE PAASCHE Indice de Paasche des quantités Moyenne harmonique des indices élémentaires des quantités, base 100, pondérés par des coefficients de pondération relatifs à la date courante t1 Comment s’en souvenir ? 1 seul indice sur 4 doit être modifié 1

SERIES CHRONOLOGIQUES

SERIES CHRONOLOGIQUES LES DONNEES Y = prix d’un bien en fonction du temps Y = série initiale Y temps

SERIES CHRONOLOGIQUES LES COMPOSANTES Y = série initiale Tendance ou Trend T Composante Saisonnière S Composante Aléatoire A

MODELES DE DECOMPOSITION SERIES CHRONOLOGIQUES MODELES DE DECOMPOSITION Modèle multiplicatif Y = T . S . A Modèle additif Y = T + S + A

(1) DETERMINATION DE LA TENDANCE REGRESSION LINEAIRE SERIES CHRONOLOGIQUES (1) DETERMINATION DE LA TENDANCE REGRESSION LINEAIRE Il s’agit de faire un lissage du nuage des points par une fonction connue. Lorsque le nuage est linéaire on utilise la droite de régression de y en fonction du temps T = tendance Avantages: Expression analytique Inconvénients: Un nuage ne se présente pas toujours sous une forme analytique simple Le calcul de la tendance peut être affecté par des valeurs extrêmes ou par les valeurs de début et de fin de série.

(2) DETERMINATION DE LA TENDANCE MOYENNES MOBILES SERIES CHRONOLOGIQUES (2) DETERMINATION DE LA TENDANCE MOYENNES MOBILES 2 (y1+y2+y3)/3 3 (y2+y3+y4)/3 Moyennes mobiles d’ordre impair Moy. Mobiles d’ordre 3 2 Moyennes mobiles d’ordre pair. On utilise une observation supplémentaire (y1/2+y2+y3/2)/2 3 (y2/2+y3+y4/2)/2 Moy. Mobiles d’ordre 2

(3) DETERMINATION DE LA TENDANCE MOYENNES MOBILES SERIES CHRONOLOGIQUES (3) DETERMINATION DE LA TENDANCE MOYENNES MOBILES Choix de l’ordre des moyennes mobiles : égal au nombre de saisons Avantages du lissage par moyennes mobiles : Permet de se faire une idée de la tendance lorsque le nuage ne présente pas une tendance algébrique claire Inconvénients: La tendance est estimée sur une partie de la période étudiée et non sur la totalité Ne donne pas une expression analytique de la tendance en fonction du temps Approximation pas très bonne lorsqu’il y a de fortes courbures Sensible aux valeurs extrêmes

DETERMINATION DES COMPOSANTES SAISONNIERES SERIES CHRONOLOGIQUES DETERMINATION DES COMPOSANTES SAISONNIERES Modèle multiplicatif Y = T.S.A Modèle additif Y = T+S+A Rapports Y/T = S.A Différences Y-T = S+A = Moyenne des rapports de la saison j = Moyenne des différences de la saison j Coefficients saisonniers bruts Coefficients saisonniers Rque: cette transformation permet de respecter le principe de conservation des aires

DETERMINATION DE LA COMPOSANTE ALEATOIRE SERIES CHRONOLOGIQUES DETERMINATION DE LA COMPOSANTE ALEATOIRE Modèle multiplicatif Y = T.S.A Modèle additif Y = T+S+A A = Y - T - S La composante aléatoire, ou résidu, permet d’analyser la qualité du modèle de décomposition

SERIES CHRONOLOGIQUES DESAISONNALISATION YCVS = série désaisonnalisée ou Corrigée des Variations Saisonnières, exprime ce qu’aurait été l’évolution du phénomène sans effet saisonnier. Modèle multiplicatif Y = T.S.A Modèle additif Y = T+S+A

SERIES CHRONOLOGIQUES PREVISION Lissage obtenu par T = droite de régression DY/t - Régression linéaire de Y sur le temps t - Moyennes mobiles (Moyennes mobiles = T provisoire) Régression linéaire de sur le temps t T = droite de régression Prévision à la date future t, correspondant à la saison j: Modèle multiplicatif Y = T.S.A Modèle additif Y = T+S+A