Régression linéaire
Problème On a les notes math et français suivantes : Un élève a 10 en math, on voudrait estimer sa note probable de français
Solution graphique Si on connaît la « droite moyenne » : on peut « lire » la note probable Ici, 10 en math donne 11,2 en français
Solution arithmétique Equation d’une droite : y=ax+b. On cherche a et b Plusieurs solutions possibles
Solution arithmétique On considère les écarts entre la droite et les vrais points : on veut LA droite qui minimise ces écarts au carré :
Calcul (optionnel) L’écart entre un point (xi,yi) et la droite est : yi-y ou encore yi-axi-b L’écart au carré est donc (yi-axi-b)2 On cherche a et b tel que la somme des écarts au carré soit minimun, c’est-à-dire tel que soit minimum Pour cela, on dérive G, on trouve son minimum ce qui nous donne la valeur de a et de b
Equation de droite y=ax+b
Exemple On calcule la covariance : cov=12,27 On obtient a : On obtient b : b= 10,17 – 1,10 x 9,63 = - 0,46 L a droite est : Y=1,10 X – 0,46
Estimation Si quelqu’un qui a 10 en math, on peut penser qu’il aura Y=1,10 x15 – 0,46=16,04 en français
Régression non linéaires
Régressions non linéaires
Pas la peine de calculer a et b Examen des données r est petit : il n’y a pas de lien linéaire entre X et Y Pas la peine de calculer a et b
Modification
Modification
Lien entre X et Z
Lien entre X et Z r=0,97, il y a donc un lien linéaire très fort a=0,4 b=0,7 Donc Z = 0,4 X + 0,7
Au final, on peut prédire Y à partir de X Conclusion X et Z sont donc liées linéairement Comme Z=1/Y, on a que l’on peut ré-écrire : Au final, on peut prédire Y à partir de X grâce à l’équation :