Méthodes statistiques. Ajustements et corrélation
1. Introduction.
2. Ajustement et corrélation linéaire.
Type 1. Les points sont alignés, les variables évoluent dans le même sens ou en sens contraire. De la connaissance de l ’une des deux variables on déduit l ’autre.
Exemple:. On donne dans le tableau suivant:. a Exemple: On donne dans le tableau suivant: a. Les heures passées par les salariés à réaliser un certain travail X; b. Les heures facturées aux clients Y.
Une représentation graphique de la variable Y en fonction de la variable X peut-être réalisée:
Type 2 Les points sont plus dispersés, par rapport à une droite; mais l ’ajustement semble encore possible.
Exemple:. On dispose des informations suivantes concernant:. a Exemple: On dispose des informations suivantes concernant: a. le chiffre d ’affaires d ’une entreprise en millions d ’euros X; b. Le résultat réalisé sur la même période Y exprimé dans la même unité.
La représentation graphique du résultat en fonction du chiffre d ’affaires peut-être réalisée:
Type 3 X Y Pas d ’ajustement linéaire possible; mais peut-être l ’étude d’une saisonnalité.
Exemple: Les ventes journalières de la référence 00000000013122 sur une semaine sont représentées de la manière suivante:
On doit noter que les nombres r, a et b sont des fonctions qui existent dans toutes les machines, même la plus simple. Ils sont également disponibles dans Excel, ou peuvent être calculés de la manière suivante: a = index(droitereg(zoneY ;zoneX) ; 1) b = index(droitereg(zoneY ;zoneX) ; 2)
Remarques.
3. Ajustements non linéaires mais s’y ramenant 3. Ajustements non linéaires mais s’y ramenant. Certaines fonctions comme les exponentielles, les puissances, les paraboles ou les hyperboles ont des rôles particuliers en gestion. Reconnaître ces modèles est fréquement utile pour le décideur. Il est, pour ces modèles, toujours possible de se ramener aux ajustements linéaires.
31. Ajustement exponentiel ou semi-logarthmique 31. Ajustement exponentiel ou semi-logarthmique. Le problème posé est le suivant : Existe t’il entre les deux variables une relation du type:
log(Y) = log(b)+ X log(a) Si les deux variables sont liées de cette manière, après application d’une fonction logarithme (base quelconque) aux deux membres de l’égalité, on trouve la relation: log(Y) = log(b)+ X log(a)
Nous constatons que c’est l’équation d’une droite Nous constatons que c’est l’équation d’une droite. Cela signifie que si l’expression entre les variables est une exponentielle, l’expression de la fonction logatithme est une droite. Ce problème a été traité dans le paragraphe précédent.
Exemple. Le chiffre d’affaires d’une entreprise a évolué de la manière suivante sur 5 ans. Année 1 2 3 4 5 C.A. 1000 1100 1200 1400 1700
32. Ajustement puissance ou log-log 32. Ajustement puissance ou log-log. La relation recherchée est du type: L’application d’une fonction log des deux côtés de l’égalité nous permet de répondre à la question.
Exemple. Le volume des ventes d’un produit a évolué en fonction du prix de vente unitaire de la manière suivante: Nombre d’articles Vendu 1000 2000 4000 5000 Prix de vente unitaire 170 75 20 10
4. Ajustement linéaire sur tableau de contingence 4. Ajustement linéaire sur tableau de contingence. Dans ce cas, la corrélation ne peut-être étudiée directement car chaque couple de modalités se retrouve plusieurs fois dans l’étude. La meilleure façon de procéder consiste à présenter les calculs sous forme de tableau.
Les définitions sont les mêmes que dans les paragraphes précédents ; mais la forme de chacun des coefficients r, a, b, a’, b’ est plus complexe et les moyens mis en place pour les déterminer plus lourds
La représentation graphique est nécessaire pour se faire une idée du type d’ajustement. Pour le valider, nous utilisons le coefficient de corrélation dont la forme est donnée ci-après :
La règle de décision concernant ce coefficient est la même que celle précédemment éditée. Les coefficients a et b (ou a’ et b’) des ajustements sont donnés par:
Comment calculer ces nombres Comment calculer ces nombres? La meilleure méthode consiste à présenter les calculs sous forme de tableau, en utilisant la forme développée de chacun des coefficients.
Exemple. On dispose de l’information suivante:
On calcule les moyennes arithmétiques de la manière suivante: et
Calcul des variances:
Calcul de la covariance: et le coefficient de corrélation:
Remarque. On peut utiliser cette méthode pour des ajustements non linéaires mais s’y ramenant..
5. Test d’un coefficient de corrélation. On dispose d’une information concernant deux variables X et Y mesurées sur un échantillon de n individus. La question qui se pose est alors: est ce que la valeur du coefficient de corrélation est significative?
On démontre qu’elle l’est avec un risque donné de se tromper, si où n est le nombre d’observations, r le coefficient de corrélation et le risque. La valeur étant lue dans la table de la loi de Student à n-1 degrés de liberté.