La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Statistiques Licence 2 LEA

Présentations similaires


Présentation au sujet: "Statistiques Licence 2 LEA"— Transcription de la présentation:

1 Statistiques Licence 2 LEA
Caroline Tahar

2 Plan du cours Introduction
Les données statistiques et leur représentation Les valeurs caractéristiques des séries statistiques Indices et taux de croissance

3 Introduction

4 Chapitre 1 : les données statistiques et leur représentation

5 1-Le vocabulaire statistique
1.1-Les notions de base Population : ensemble des individus étudiés, Échantillon : partie de la population considérée, Caractère ou variable : grandeur ou caractéristique étudiée Exemple : on étudie l’âge moyen d’obtention du bac dans une académie. Cet âge constitue la variable, La population est constituée de tous les candidats « admis », Le responsable de l’étude décide d’interroger 200 admis, ils constituent l’échantillon.

6 1-Le vocabulaire statistique (suite)
1.2-Les variables statistiques On distingue : Variables quantitatives et qualitatives, : Une variable est quantitative si sa valeur est mesurable. Exemple : revenu d’une famille, nombre de voitures par foyer … Une variable est qualitative si sa valeur n’est pas mesurable. Exemple : couleur des yeux, marque de voiture … Variables discrètes et continues : Une variable est discrète si elle prend ses valeurs parmi un ensemble de nombres définis. Exemple : nombre d’enfants par famille … Une variable est continue si elle peut prendre toute valeur sur un intervalle. Elle est alors présentée en classes. Exemple : revenu moyen par foyer, chiffre d’affaires …

7 1-Le vocabulaire statistique (suite)
1.3-Les effectifs et les fréquences L’effectif est le nombre de réalisations de chaque valeur possible de la variable. Exemple avec une variable discrète : On a recensé le nombre d’enfants par employé d’une entreprise, on obtient les effectifs suivants :

8 1-Le vocabulaire statistique (suite)
1.3-Les effectifs et les fréquences (suite) L’effectif est le nombre de réalisations de chaque valeur possible de la variable. Exemple avec une variable continue : Voici la répartition des revenus dans une zone d’habitation :

9 1-Le vocabulaire statistique (suite)
1.3-Les effectifs et les fréquences (suite) Les fréquences relatives : effectif associé à une valeur/effectif total, Les fréquences en pourcentage : FR x 100, Les fréquences cumulées : croissantes et décroissantes

10 1-Le vocabulaire statistique (suite)
17% des ménages ont un revenu compris entre 1400 et 1800 €, 26% des ménages ont un revenu inférieur à 1800€, 91% des ménages ont un revenu supérieur à 1400€.

11 2-La présentation des données
2.1-La présentation en tableaux On présente les données statistiques dans des tableaux. Les séries à une variable (séries simple), voir exemples précédents, Les séries à deux variables : elles sont présentées dans des tableaux à double entrée. Exemple : les prix moyens d’une nuitée relevés en fonction de la zone géographique.

12 2-La présentation des données (suite)
2.2-La présentation des données chronologiques Les séries chronologiques : la variable étudiée évolue en fonction du temps. Exemple : l’évolution du chiffre d’affaires mensuel sur l’année 2009.

13 3-Les représentations graphiques
3.1-La représentation d’une répartition La représentation d’une variable discrète: les représentations en bâtons sont bien adaptées.

14 3-Les représentations graphiques (suite)
3.1-La représentation d’une répartition (suite) La représentation d’une variable continue : l’histogramme permet de prendre en compte la largeur de la classe. La superficie du rectangle est proportionnelle à l’effectif.

15 3-Les représentations graphiques (suite)
3.1-La représentation d’une répartition (suite) Une répartition en fréquences fait souvent l’objet d’un diagramme circulaire : les angles des différents secteurs correspondent à la fréquence (360° x fréquence).

16 3-Les représentations graphiques (suite)
3.1-La représentation d’une répartition (suite) Il est parfois nécessaire de procéder à des regroupements pour simplifier la représentation. Les regroupements ne sont jamais neutres. Pour les variables quantitatives, on parle de classes. Le choix du nombre de classes et de la largeur des classes ont une incidence sur les interprétations. Pour le calcul, on utilisera souvent le centre de classe.

17 3-Les représentations graphiques (suite)
3.2-La représentation de l’évolution d’une variable L’évolution d’une variable peut être représentée par un diagramme en bâtons ou par un graphique en courbes.

18 3-Les représentations graphiques (suite)
3.3-La représentation de plusieurs séries chronologiques sur un même graphique On peut utiliser un diagramme en bâtons ou un graphique en courbes.

19 Chapitre 2 : les valeurs caractéristiques des séries statistiques
Méthodes numériques permettant de résumer une série.

20 1-La moyenne 1.1-Définition
Elle permet de résumer la tendance centrale. C’est la somme des valeurs de la variable/nombre d’observations. Il peut s’agir d’une moyenne simple ou pondérée. La moyenne simple est égale au quotient de la somme des valeurs par le nombre de valeurs. Si à chaque valeur possible correspond un nombre variable de réalisations, on calcule une moyenne pondérée

21 1-La moyenne (suite) 1.2-Calcul de la moyenne simple
La moyenne simple est égale au quotient de la somme des valeurs par le nombre de valeurs. Moyenne arithmétique simple : x = ∑xi/N Exemple : voici le nombre de commandes prises par un représentant pendant une semaine. Le nombre moyen de commande par jour est égal à : ( ) / 5 = 14.6 commandes / jour Jour Lundi Mardi Mercredi Jeudi vendredi Nombre de commandes 18 14 9 17 15

22 Moyenne arithmétique pondérée : x = nixi/N ou x = fixi
1-La moyenne (suite) 1.3-Calcul de la moyenne pondérée La moyenne pondérée est égale au quotient de la somme des valeurs par le nombre total de valeurs, en tenant compte du nombre de réalisations de chacune des valeurs. Moyenne arithmétique pondérée : x = nixi/N ou x = fixi Exemple : voici les salaires relevés dans une entreprise. Le salaire moyen est égal à : (1200x10) + (1600x20) + (2000x25) + (2400x10) + (2800x10) /75= euros

23 1-La moyenne (suite) 1.4-Calcul de la moyenne dans le cas d’une variable continue Pour chaque classe, on retiendra simplement le centre de classe comme valeur pour réaliser les calculs. Exemple : à partir du tableau ci-dessous, on calcule le chiffre d’affaires moyen mensuel des succursales d’une grande enseigne : 41050/84 = K€. CA [ [ [ [ [ [ [ [ [ [ Total xi (centre de classe) 200 400 550 650 800 ni (nb succursales) 14 22 25 18 5 84 Xi x ni 2800 8800 13750 11700 4000 41050

24 2-La médiane et les quantiles
La médiane est la valeur de la variable pour laquelle 50% des observations ont une valeur supérieure et 50% des observations ont une valeur inférieure. Pour la calculer, il faut classer les observations par ordre croissant, calculer les fréquences cumulées croissantes puis déterminer la médiane par interpolation linéaire.

25 2-La médiane et les quantiles (suite)
2.1-La médiane (suite) Exemple d’une variable continue : le responsable d’un supermarché étudie la valeur du caddie (150 relevés). La médiane est égale à : 60 + (75-60) x ( )/( ) = € Valeur 10 à 30€ 30 à 50€ 50 à 60€ 60 à 75€ 75 à 100 € 100 à 150 € 150 à 250 € Total Nb de caddies 12 21 36 51 6 3 150 Fréquence 8% 14% 24% 34% 4% 2% 100% Cumul croissant 22% 46% 80% 94% 98%

26 2-La médiane et les quantiles (suite)
2.2-Les quantiles (quartiles, déciles et centiles) généralisent la logique de la médiane Les quartiles partagent les observations en 4 groupes égaux, chacun représentant 25% des observations : Le premier quartile est la valeur telle que 25% des observations aient une valeur inférieure (Q1 = €), Le troisième quartile est la valeur telle que 75% des observations aient une valeur inférieure (Q3 = €), Le deuxième correspond à la médiane. Les déciles partagent les observations en 10 groupes égaux, chacun représentant 10% des observations, Les centiles partagent les observations en 100 groupes égaux, chacun représentant 1% des observations.

27 3-Le mode 3.1-Dans le cas d’une variable discrète
Le mode est une caractéristique de position, comme la moyenne, la médiane ou les quantiles. Il s’agit de la valeur la plus fréquente prise par la variable. C’est celle pour laquelle on a le plus fort effectif. 3.2-Dans le cas d’une variable continue On parle alors de classe modale, celle à laquelle correspond le plus grand nombre d’observations. Ici, il s’agit de la classe 60 à 75€.

28 4-La variance et l’écart-type
4.1- Définition et calcul L’écart-type peut être défini comme la moyenne des écarts de chaque donnée à la moyenne arithmétique. Comme cette somme serait nulle (écarts + et – se compensant), on calcule la moyenne des carrés des écarts (variance), puis la racine carrée de la variance. La variance : L’écart-type : Le coefficient de variation :

29 4-La variance et l’écart-type (suite)
4.2- Exemple Voici l’exemple des notes de 3 étudiants.

30 4-La variance et l’écart-type (suite)
4.3- Exemple avec un regroupement par classes

31 5-Quelques éléments supplémentaires
Valeur maximale et valeur minimale Intervalle de variation : valeur max. – valeur min. Problème : les valeurs extrêmes peuvent être très différentes des autres valeurs. Intervalle interquartile ou interdécile : Q3 – Q1 ou D9 – D1 Ils délimitent la plage au sein de laquelle 50% ou 80% des valeurs sont regroupées. Plus ces plages sont larges, plus les valeurs sont dispersées. Problème : ce calcul ne pas prend en compte toutes les valeurs.

32 Chapitre 3 : indices et taux de croissance

33 1-Comparaison de données
1.1- Calcul de parts Lorsqu’une variable est égale à la somme de plusieurs composantes, on peut calculer la part de chaque composante par rapport à l’ensemble pour une même date.

34 1-Comparaison de données (suite)
1.1- Calcul de parts (suite) Part = CA ville / CA total * 100 Elle permet de visualiser la structure du chiffre d’affaire de cette entreprise et ses modifications.

35 1-Comparaison de données (suite)
1.2-Ecarts relatifs et écarts absolus Permet de comparer des variables à une même date pour des individus différents.  Ecart absolu = valeur i – valeur j Ecart relatif = ((valeur i – valeur j)/valeur j)*100 = (valeur i/valeur j – 1)*100 Remarque : Attention au sens du calcul de l’écart relatif

36 1-Comparaison de données (suite)
1.3-Ratios  Un ratio est un rapport significatif entre 2 variables. Il permet d’affiner l’analyse à une même date.

37 2-Mesure de l’évolution
2.1-Calcul du taux de croissance Il mesure l’évolution d’une variable entre deux dates différentes pour un même individu V0 : valeur à la date t = 0 Vt : valeur à la date t g : taux de croissance Variation absolue = Vt – V0 Variation relative = taux de croissance g

38 2-Mesure de l’évolution (suite)
2.1-Calcul du taux de croissance (suite) V2008 = (1+g)*V2000 V2000 = V2008/ (1+g) Villes 2000 2008 Ecart absolu(en millions d'euros) Taux de croissance (en %) Brest 10000 11000 1000 10 Caen 8000 9000 12,5 Nantes 20000 27000 7000 35 Rennes 15 000 18000 3000 20 Total 53000 65000 12000 22,64 Evolutions CA (en millions d'euros)

39 2-Mesure de l’évolution (suite)
2.1-Calcul du taux de croissance (suite) V2008 = (1+g)*V2000 V2000 = V2008/ (1+g) Attention : Les taux de croissance ne sont pas additifs Points de croissance = différence entre deux taux de croissance Le taux de croissance de Brest est 2,5 points plus élevé que le taux de croissance de Rennes

40 2-Mesure de l’évolution (suite)
2.2-Taux de croissance annuel moyen On cherche le taux de croissance théorique identique pour chaque année qui donnerait la même évolution sur la période totale. V1 = (1+g)*V0 V2 = (1+g)*V1 = (1+g)2 *V0 V3 = (1+g)*V2 = (1+g)3 *V0 V9 = (1+g)9 *V0  g = (V9/V0)1/9 - 1

41 2-Mesure de l’évolution (suite)
2.2-Taux de croissance annuel moyen (suite) g = (1892,24/1315,26)1/9 – 1 = 0,0412 Le taux de croissance annuel moyen est de 4,12% Taux de croissance annuel moyen

42 2-Mesure de l’évolution (suite)
2.3-Taux de croissance d’un produit et d’un quotient Taux de croissance d’un produit  = x*y g = (1+gx)(1+gy) – 1 Approximation : Pour de faibles taux de croissance (< 10%) : g  gx + gy Ex : en 2009, une entreprise a vendu 100 articles à 5 € l’unité. En 2010, les quantités ont augmenté de 10 % et le prix de vente de 2%. Le taux de croissance du chiffre d’affaire : (Q*PV)= (1.1*1.02)-1 = = 12.20%

43 2-Mesure de l’évolution (suite)
2.3-Taux de croissance d’un produit et d’un quotient (suite) Taux de croissance d’un quotient (ou d’un ratio) Q = x/y gQ = (1+gx)/(1+gy) – 1 Approximation : Pour de faibles taux de croissance (< 10%) : gQ  gx – gy Ex : en 2009, la ville de A. avait habitants et ses dépenses d’investissement étaient de €. Son ratio Investissement/habitant était donc de 200 €/habitant. Si en 2010, l’investissement total augmente de 10% et le nombre d’habitants s’accroit de 5%, le taux de croissance du ratio sera de 1.1/ = = 4.76%

44 2-Mesure de l’évolution (suite)
2.4-Contribution à la croissance Question : quelle la contribution de chaque ville à la croissance du CA de l’hypermarché Machin ? Ou quel est le magasin qui entraîne le plus la croissance du groupe ? CC = part * taux de croissance CAtotal = CABrest + CACaen + CANantes + CARennes gCAtotal = PartCABrest2000*gCABrest + PartCACaen2000 *gCABrest + PartCANantes2000 *gCABrest + PartCARennes2000 *gCABrest

45 3-Les indices 3.1-Définition et calcul Ils permettent de mesurer deux grandeurs en les rendant comparables, c’est-à-dire en leur donnant une unité de mesure commune. De nombreuses variables sont exprimées sous forme d’indices. Un indice évalue une variation et non un niveau. Il existe des indices élémentaires et des indices synthétiques. Exemple L’indice du taux de change €/$ en 2008 base 100 en 2002 est 160, alors l’ s’est apprécié de 60% par rapport au $.

46 3-Les indices (suite) 3.2-Indices élémentaires (ou indices simples)
Ils sont utilisés pour comparer des données à une donnée de référence (appelée « base »). Ceux-ci représentent simplement un pourcentage par rapport à la donnée de référence. Un indice élémentaire est un rapport de la même variable prise à deux dates différentes ou lieux distincts. L’indice est calculé en effectuant le rapport : donnée de l’année étudiée / donnée de l’année de base.  Indice élémentaire de la variable G, à la date t, base 1 en t = 0, est It/0 = Gt/G0 Indice élémentaire de la variable G, à la date t, base 100 en t = 0, est It/0 = Gt/G0 *100

47 3-Les indices (suite) 3.2-Indices élémentaires (ou indices simples)
Exemple du prix de la baguette de pain

48 3-Les indices (suite) 3.2-Les propriétés des indices élémentaires
Ces indices simples ont des propriétés intéressantes que n’ont pas les indices synthétiques la circularité et la réversibilité.  Circularité (ou enchaînement ou transitivité) Cette propriété permet de changer de base. Pour un indice donné, on peut être amené à changer de période de référence afin de se ramener à une époque plus proche. Soit i les indices divisés par 100 : Ce qui nous permet de déduire les indices base 0 des indices base1 sans avoir à recourir aux prix.  Réversibilité Si l’on permute l’année de base et l’année courante, le nouvel indice s’obtient à l’aide de l’inverse de l’ancien. It1/t0= 1/ It0/t1

49 3-Les indices (suite) 3.2-Les propriétés des indices élémentaires (suite)    Réversibilité Si l’on permute l’année de base et l’année courante, le nouvel indice s’obtient à l’aide de l’inverse de l’ancien.

50 3-Les indices (suite) 3.3-Les indices synthétiques
Ils permettent de synthétiser l’évolution simultanée de plusieurs variables.

51 3-Les indices (suite) 3.3-Les indices synthétiques (suite)
Indice de valeur : Cet indice mesure globalement l’évolution des prix et des quantités. Il est nécessaire de calculer des indices qui fixent les quantités et qui mesurent donc uniquement l’évolution des prix.

52 3-Les indices (suite) 3.3-Les indices synthétiques (suite)
Indice de Laspeyres : L’indice de Laspeyres des prix fixe les quantités à l’année de départ (2000)  Seuls les prix évoluent Indice de Laspeyres = moyenne pondérée des indices élémentaires par les coefficients budgétaires calculés à la date de la base

53 3-Les indices (suite) 3.3-Les indices synthétiques (suite)
Indice de Laspeyres (suite) : L’INSEE utilise l’indice de Laspeyres pour calculer l’indice des prix à la consommation.

54 3-Les indices (suite) 3.3-Les indices synthétiques (suite)
Indice de Paasche L’ indice de Paasche des prix fixe les quantités à l’année finale ou année courante (2008).

55 Chapitre 4 : liaisons et corrélation entre des variables

56 Introduction Dans ce chapitre nous étudierons le croisement de deux ou plusieurs variables. Le but du croisement de variables est de déterminer l’existence (ou non) d’un lien de dépendance entre ces variables ou d’une liaison. Exemples : PIB et gaz à effets de serre ? Salaire et âge des salariés ? Montant R et D et bénéfice ? Attention à ne pas confondre causalité et corrélation.

57 1-Représentation graphique de la série
Question : existe-t-il une liaison statistique entre le nombre de spots et le CA ? Le CA et le nombre de spots évoluent-ils de manière concomitante ?

58 1-Représentation graphique de la série (suite)
Une représentation graphique du nuage de points (ou diagramme de corrélation) permet : D’apprécier l’existence ou non d’une éventuelle liaison De déterminer la forme de la liaison

59 1-Représentation graphique de la série (suite)
La forme du nuage de point suggère les interprétations suivantes : Il existe une liaison entre les 2 variables : si le nombre de spots varie alors le CA a tendance à varier aussi Cette liaison est linéaire : les points sont à peu près alignés sur une droite Cette liaison est positive : plus le nombre de spots s’accroît, plus le CA augmente.

60 Nuages de points : formes de liaison

61 2-La covariance Pour le magasin, le nuage de points montre que les variables ont tendance à covarier (varier ensemble) La covariance est un indicateur qui mesure la variabilité conjointe des 2 variables. Mesure descriptive de la relation entre les 2 variables Mesure les fluctuations simultanées de chaque variable par rapport à sa moyenne

62 2-La covariance (suite)
COV (X,Y) = moyenne du produit XY – produit des moyennes de X et de Y

63 2-La covariance (suite)
Interprétation des résultats : Covariance > 0  les variables ont tendance à varier dans le même sens Covariance < 0  les variables ont tendance à varier en sens opposée  Plus la valeur absolue de la covariance est élevée plus la relation entre les variables est forte  S’il n’y a pas de tendance à la croissance ou à la décroissance entre les variables covariance nulle  La covariance est un indicateur de relation linéaire entre les variables  Covariance = 0 peut signifier une relation non linéaire.

64 3- Le coefficient de corrélation linéaire
Covariance dépend des unités des variables  coefficient de corrélation linéaire. Coefficient de corrélation linéaire : -1 < r < 1 Si r = 1 ou r = -1 alors les points sont parfaitement alignés.

65 4- La régression linéaire
Elle permet de caractériser quantitativement le lien entre deux variables afin d’établir des prévisions. On cherche donc à déterminer l’équation de la droite qui «s’ajuste » le mieux au nuage :

66 4- La régression linéaire
Notation : y : valeurs réelles (observées) de la variable y, il s’agit de la variable expliquée, : valeurs estimées de la variable y obtenues à l’aide du modèle (l’équation de la droite), X : variable explicative.

67 4- La régression linéaire
Représentation graphique

68 4- La régression linéaire
La droite de régression a pour équation

69 4-Régression linéaire : coefficient de détermination
Cette droite explique-t-elle de façon satisfaisante les variations de y (ou la variance de y) La droite de régression passe par la covariance  moy (ŷ) =

70 4-Régression linéaire : coefficient de détermination

71 Régression linéaire : coefficient de détermination
R2 représente la part de la variabilité de Y « expliquée » par la droite de régression. R2  1 Si les observations sont parfaitement alignées, il n’y a pas de différence entre y et ŷ  pas de résidu  SCT = SCE  R2 = 1 Donc R2 exprime la qualité du modèle. Plus est proche de 1, meilleure est la qualité du modèle linéaire Ici le nombre de spots publicitaires « explique » 81,61% de la dispersion des CA Remarque : R2 = r2, uniquement pour un modèle linéaire

72 Statistiques Licence 2 LEA
Caroline Tahar


Télécharger ppt "Statistiques Licence 2 LEA"

Présentations similaires


Annonces Google