Corrélations et ajustements linéaires. Chapitre 3 Corrélations et ajustements linéaires.
Le but de nombreux travaux est d ’établir des lois ou des corrélations entre différentes grandeurs mesurables ou différents événements. Ce problème se pose dans divers domaines scientifiques ou pseudo-scientifiques. En physique on cherche à établir des lois entre des variables : relations du type y= f(x) . Ce n ’est pas toujours évident à cause des incertitudes de mesure et des erreurs systématiques. Dans la pratique, on choisit une fonction, réputée donner satisfaction pour les grandeurs étudiées et on ajuste les paramètres pour qu’elle passe le plus près possible des points de mesure. Nous nous limiterons à un ajustement linéaire du type y=ax+b . Les paramètres a et b seront déterminés par la méthode des moindres carrés.
3.1.1 Variables indépendantes et variables corrélées. 3.1 Notion de corrélation 3.1.1 Variables indépendantes et variables corrélées. On mesure U et I aux bornes d ’un dipôle avec des incertitudes faibles par rapport aux valeurs moyennes couples (uk, ik) On trace uk=f( ik) approximativement une droite. Les variables U et I sont corrélées par la relation U=RI Dans beaucoup de cas, pour des raisons diverses, la corrélation est moins évidente.
3.1.2 Covariance et coefficient de corrélation. On cherche une fonction capable de traduire les corrélations entre deux variables aléatoires X et Y. E (X+Y) =E(X)+E(Y) ne convient pas. On essaye: Il apparaît un terme la covariance qui n’est nul que si X et Y sont indépendantes:
Pour des raisons pratiques, on normalise ce coefficient C(X,Y): r(X,Y) est le coefficient de corrélation, il est compris entre -1 et +1. r =1 pour des variables parfaitement corrélées; r=0 pour des variables sans corrélation. Ex: X et Y avec la relation y=a.x+b V(Y)=a2.V(X)
Remarque: On ne dispose généralement que d ’un nombre limité N de réalisations. Dans la suite on supposera que C(X,Y)CN(x,y) Comme on a déjà posé sN(x) s(X), il vient: r(X,Y) rN(x,y)
3-2-1. Droites de régression. 3-2. Ajustement linéaire. Lorsque la corrélation entre deux variables est prouvée, il reste à déterminer la relation qui les lie. Ex: Dans le cas de la probabilité d ’absorption du photon p(x)=(1/L).exp(-x/L) On tracera Ln(p(x)) en fonction de x avec les résultats expérimentaux pour essayer d ’obtenir une droite. 3-2-1. Droites de régression. Cas particulier: on suppose que les valeurs de X sont connues avec précision; l ’incertitude est seulement sur les valeurs de Y: yi= a.xi+b+ei ei est positive négative ou nulle. On peut la considérer comme une variable aléatoire.
On cherche les coefficients a et b de la droite qui minimisent x1 x y yi a.xi+b ei On cherche les coefficients a et b de la droite qui minimisent les distances ei aux point expérimentaux: D(a,b) caractérise la dispersion des points autour de la droite y=a.x+b.
Pour minimiser cette dispersion on annule les dérivées partielles de D(a,b) La droite de régression passe par le centre M du nuage de points, de coordonnées On remplace b par sa valeur:
[Si r=1 (corrélation parfaite) D(a) = 0] Equation de la droite: y=a.x+b On remplace a et b: Remarques: 1- La droite D ( X,Y) passe bien par le point (<X>,<Y>). 2- Si on avait minimisé l ’incertitude sur les xi, la droite de régression linéaire D (Y,X) aurait eu pour équation:
3-2-2. Droite des moindres carrés normalisés. Cas général: Incertitude sur les mesures des variables aléatoires X et Y. exI sur xi et eyi sur yi sont définies par : ( yi+eyi)=a(xi+exi)+b et Pour comparer ces incertitudes on les normalise avec s(X) et s(Y). La droite D qui minimise cette dispersion a pour équation:
Y eyi yi exi xi X
La droite D est comprise entre D(U,I) et D(I,U) elle donne une meilleure représentation du nuage de points. Les 3 droites passent par le point fixe M(<X>,<Y>).