1 1 Licence Stat-info CM6 b 2004 V1Christophe Genolini Régression linéaire : problème On a les notes math et français suivantes : Un élève a 10 en math, on voudrait estimer sa note probable de français
2 2 Licence Stat-info CM6 b 2004 V1Christophe Genolini Solution graphique Si on connaît la « droite moyenne » : on peut « lire » la note probable Ici, 10 en math donne 11,2 en français
3 3 Licence Stat-info CM6 b 2004 V1Christophe Genolini Solution arithmétique Equation d’une droite : y=ax+b. On cherche a et b Plusieurs solutions possibles
4 4 Licence Stat-info CM6 b 2004 V1Christophe Genolini Solution arithmétique On considère les écarts entre la droite et les vrais points : on veut LA droite qui minimise ces écarts au carré :
5 5 Licence Stat-info CM6 b 2004 V1Christophe Genolini Calcul (optionnel) L’écart entre un point (x i,y i ) et la droite est : y i -y ou encore y i -ax i -b L’écart au carré est donc (y i -ax i -b) 2 On cherche a et b tel que la somme des écarts au carré soit minimun, c’est-à-dire tel que soit minimum Pour cela, on dérive G, on trouve son minimum ce qui nous donne la valeur de a et de b
6 6 Licence Stat-info CM6 b 2004 V1Christophe Genolini Equation de droite y=ax+b
7 7 Licence Stat-info CM6 b 2004 V1Christophe Genolini Exemple On calcule la covariance : cov=12,27 On obtient a : a = 12,27 / 11,11=1,10 On obtient b : b= 10,17 – 1,10 x 9,63 = - 0,46 L a droite est : Y=1,10 X – 0,46
8 8 Licence Stat-info CM6 b 2004 V1Christophe Genolini Estimation Si quelqu’un qui a 10 en math, on peut penser qu’il aura Y=1,10 x15 – 0,46=16,04 en français
9 9 Licence Stat-info CM6 b 2004 V1Christophe Genolini Régressions non linéaires
10 Licence Stat-info CM6 b 2004 V1Christophe Genolini Examen des données r est petit : il n’y a pas de lien linéaire entre X et Y Pas la peine de calculer a et b
11 Licence Stat-info CM6 b 2004 V1Christophe Genolini Modification
12 Licence Stat-info CM6 b 2004 V1Christophe Genolini Modification
13 Licence Stat-info CM6 b 2004 V1Christophe Genolini Lien entre X et Z
14 Licence Stat-info CM6 b 2004 V1Christophe Genolini r=0,97, il y a donc un lien linéaire très fort a=0,4 b=0,7 Donc Z = 0,4 X + 0,7 Lien entre X et Z
15 Licence Stat-info CM6 b 2004 V1Christophe Genolini Conclusion X et Z sont donc liées linéairement Comme Z=1/Y, on a que l’on peut ré-écrire : Au final, on peut prédire Y à partir de X grâce à l’équation :