La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Montage préparé par : André Ross Professeur de mathématiques Cégep de Lévis-Lauzon André Ross Professeur de mathématiques Cégep de Lévis-Lauzon Régression.

Présentations similaires


Présentation au sujet: "Montage préparé par : André Ross Professeur de mathématiques Cégep de Lévis-Lauzon André Ross Professeur de mathématiques Cégep de Lévis-Lauzon Régression."— Transcription de la présentation:

1 Montage préparé par : André Ross Professeur de mathématiques Cégep de Lévis-Lauzon André Ross Professeur de mathématiques Cégep de Lévis-Lauzon Régression affine

2 Lorsquon obtient des données à partir dune expérience de laboratoire, dun sondage ou dune recherche, même si le phénomène peut être décrit par un modèle affine, il faut sattendre à ce quil y ait une différence entre les valeurs observées et les valeurs décrites par le modèle. Introduction Aucun modèle nest une description exacte dun phénomène expérimental. Lorsquon étudie la relation entre les variables dun phénomène pour lequel on dispose de données empiriques, la représentation graphique se révèle un moyen efficace pour déceler si le phénomène est descriptible par un modèle affine car, visuellement, il est facile de détecter si le nuage de points suggère une droite.

3 Méthode graphique La façon la plus simple et la plus rapide consiste à représenter les points sur un papier quadrillé et à choisir parmi toutes les droites possibles passant par deux des points représentés (à laide dune règle transparente) celle qui semble la plus satisfaisante pour décrire le phénomène. On choisit ainsi parmi les données deux points (x 1 ; y 1 ) et (x 2 ; y 2 ) dont les coordonnées vont nous permettre de trouver léquation de la droite à laide de lexpression : On peut également trouver les valeurs de a et b en solutionnant le système déquations suivant : y 1 = ax 1 + b y 2 = ax 2 + b = y 2 – y 1 x 2 – x 1 y – y 1 x – x 1

4 S Le tableau ci-contre donne la solubilité du bromure de potassium dans leau en fonction de la température de leau. La température T est donnée en degrés centigrades et la concentration c est donnée en grammes de soluté par cent grammes deau. Application de la méthode graphique ,9 57,8 63,7 69,2 74,0 78,7 83,8 88,6 T i cici Utiliser la méthode graphique pour trouver un modèle décrivant la relation entre la température T et la solubilité c. Représentons graphiquement les données. Température (°C) Solubilité (g/100 g) T c Supposons que la droite passant par les points (20; 63,7) et (70; 88,6) nous semble la plus apte à décrire la relation entre les variables. = 88,6 – 63,7 70 – 20 c – 63,7 T – 20 et : c(T) = 0,498T + 53,74 Alors :

5 ,9 57,8 63,7 69,2 74,0 78,7 83,8 88,6 T i cici On peut mesurer la précision du modèle obtenu en calculant pour chaque valeur de la variable indépendante la différence entre la valeur observée (c i ) et la valeur donnée par le modèle mathématique (c m ), ces différences sont appelées les résidus. Calcul des résidus 53,74 58,72 63,70 68,68 73,66 78,64 83,62 88,60 r c i – c m –1,84 –0,92 0,00 0,52 0,34 0,06 0,18 0,00 La somme des carrés des résidus est la mesure de précision du modèle mathématique. Effectuons le calcul des résidus pour le modèle c(T) = 0,498T + 53,74 4,6540 Somme des carrés cmcm r2r2 3,3856 0,8464 0,0000 0,2704 0,1156 0,0036 0,0324 0,0000 Méthode graphique

6 Méthode des données regroupées Cette méthode consiste à regrouper les points en deux groupes contenant chacun la moitié ou environ la moitié des données. On peut également trouver les valeurs de a et b en solutionnant le système déquations suivant : On détermine alors la valeur moyenne pour la variable indépendante et pour la variable dépendante dans chaque groupe. Ces valeurs moyennes représentées par (x 1 ; y 1 ) et (x 2 ; y 2 ) servent alors pour trouver léquation dune droite à laide de la proportion : = y 2 – y 1 x 2 – x 1 y – y 1 x – x 1 y 1 = ax 1 + b y 2 = ax 2 + b

7 S Application de la méthode des données regroupées T i cici Utiliser la méthode des données regroupées pour trouver un modèle décrivant la relation entre la température T et la solubilité c à partir des données ci-contre. S ,9 57,8 63,7 69,2 74,0 78,7 83,8 88,6 = 81,275 – 60,65 55 – 15 c – 60,65 T – 15 En regroupant les données et en calculant les moyennes, on obtient : = 15 x1 =x1 = = 55 x2 =x2 = = 60,65 y1 =y1 = 51,9 + 57,8 + 63,7 + 69,2 4 = 81,275 y2 =y2 = 74,0 + 78,7 + 83,8 + 88,6 4 En déterminant léquation de la droite par ces deux points, on obtient : et : c(T) = 0,516T + 52,92

8 ,9 57,8 63,7 69,2 74,0 78,7 83,8 88,6 T i cici Calcul des résidus 52,92 58,08 63,24 68,40 73,56 78,72 83,88 89,04 r c i – c m –1,02 –0,28 0,46 0,80 0,44 –0,02 –0,08 –0,44 Effectuons le calcul des résidus pour le modèle c(T) = 0,516T + 52,92 2,3644 Somme des carrés cmcm r2r2 1,0404 0,0784 0,2116 0,6400 0,1936 0,0004 0,0064 0,1936 Méthode des données regroupées On constate que la somme des carrés des résidus est inférieure à celle du modèle obtenu par la méthode graphique. Cela signifie que e modèle donne une meilleure description du lien entre les variables.

9 Méthode des moindres carrés Cette méthode consiste à calculer : Les paramètres a et b de la droite cherchée sont alors obtenus en solutionnant le système déquations :, la moyenne des valeurs de la variable indépendante; x, la moyenne des carrés des valeurs de la variable indépendante; x2x2, la moyenne des valeurs de la variable dépendante; y, la moyenne des produits des valeurs des deux variables.xy y = ax + b xy = ax 2 + bx En pratique, on détermine les valeurs moyennes dans un tableau en utilisant de préférence un tableur électronique.

10 S Application de la méthode des moindres carrés Utiliser la méthode des moindres carrés pour trouver un modèle décrivant la relation entre la température T et la solubilité c à partir des données ci-contre. S Déterminons les valeurs moyennes ,9 57,8 63,7 69,2 74,0 78,7 83,8 88,6 T i cici T i c i T i 2 c = 567,7 8 = 70,9625 T =T = = 35 T2 =T2 = =1750 Tc = = 2757,625 On doit alors résoudre le système déquations : 70,9625 = 35a + b 2756,625 = 1750a + 35b ,7 En isolant b dans la première équation : En substituant dans la deuxième équation : 2756,625 = 1750a + 35(70,9625 – 35a) b = 70,9625 – 35a 2756,625 = 1750a ,6875 – 1225a 272,9375 = 525a et a = 0, Par substitution, on a alors : b = 52, En arrondissant, le modèle affine est alors : c(T) = 0,520T + 52,77

11 ,9 57,8 63,7 69,2 74,0 78,7 83,8 88,6 T i cici Calcul des résidus 52,77 57,97 63,17 68,37 73,57 78,77 83,97 89,17 r c i – c m –0,87 –0,17 0,53 0,83 0,43 –0,07 –0,17 –0,57 Effectuons le calcul des résidus pour le modèle c(T) = 0,520T + 52,77 2,2992 Somme des carrés cmcm r2r2 0,7569 0,0289 0,2809 0,6889 0,1849 0,0049 0,0289 0,3249 Méthode des moindres carrés On constate que la somme des carrés des résidus est inférieure à celle des deux autres modèles. Cela signifie que ce modèle donne une meilleure description du lien entre les variables. En fait, on peut démontrer que la méthode des moindres carrés donne toujours le modèle pour lequel la somme des carrés des résidus est minimale.

12 S Application de la méthode des moindres carrés En résolvant les équations : ,9 57,8 63,7 69,2 74,0 78,7 83,8 88,6 T i cici T i c i T i ,7 y = ax + b xy = ax 2 + bx on obtient les expressions suivantes : a =a = n x i y i – ( x i )( y i ) n x i 2 – ( x i ) 2 b =b = y i – a x i n a = – , – b = 8 = 0, – 8 = 52, Le modèle affine est alors : c(T) = 0,520T + 52,77

13 S Exemple Le constructeur dhabitations pour lequel vous travaillez a décidé dévaluer le coût de chauffage des maisons quil construit afin de se servir de ce renseignement dans sa publicité. Il a fait relever, pour des périodes de 24 heures, la consommation moyenne de mazout en fonction de la température extérieure. Les relevés ont été faits en fonction de la température moyenne durant ces 24 heures. Les données obtenues ont été compilées dans le tableau ci-contre : S –13 –8 – ,0 44,0 36,8 28,0 18,0 6,8 TQ –676,0 –352,0 –147,2 56,0 144,0 102,0 T2T TQ 0185,6–873,2542 Trouver, par la méthode des moindres carrés, le modèle affine décrivant la relation entre la température et la quantité de mazout consommée. a =a = n T i Q i – ( T i )( Q i ) n T i 2 – ( T i ) 2 b =b = Q i – a T i n a = 6 (–873,2) – 0 185, – 0202 b = 6 = –1,611 – (–1,611) 6 = 30,93 Le modèle affine est alors : Q(T) = –1,611T + 30,93 On peut alors calculer les paramètres : Température (°F) Mazout consommé (L) –12–8–44812 T Q

14 S Mesures de la précision du modèle Le calcul des résidus est une des mesures de précision utilisées, mais on utilise également le coefficient de corrélation et le coefficient de détermination. S Le coefficient de corrélation est donné par : r =r = n x i y i – ( x i )( y i ) n x i 2 – ( x i ) 2 n y i 2 – ( y i ) 2 Cela peut sembler affolant à première vue, mais quatre de ces sommes sont déjà effectuées en dressant le tableau pour déterminer les paramètres a et b. Il ne reste quà calculer la somme des carrés des y i.

15 S Calcul du coefficient de corrélation Considérons le tableau obtenu à lexemple r =r = n T i Q i – ( T i )( Q i ) n T i 2 – ( T i ) 2 n Q i 2 – ( Q i ) 2 –13 –8 – ,0 44,0 36,8 28,0 18,0 6,8 TQ –676,0 –352,0 –147,2 56,0 144,0 102,0 T2T TQ 2704, , ,24 784,00 324,00 46,24 Q2Q2 Pour calculer le coefficient de corrélation, il nous manque la somme des carrés de la variable indépendante. Déterminons cette somme. Calculons le coefficient : r =r = 6 (–873,2) – 0 185,6 0 –873, , ,58 – (185,6) – 0 2 = –0,9998

16 Interprétation du coefficient de corrélation Le coefficient de corrélation linéaire r est un nombre compris entre –1 et 1 (–1 r 1). Lorsque r = 0 (corrélation nulle), le modèle affine nest pas du tout indiqué pour modéliser le phénomène. Lorsque r est proche de 1 ou de –1, le regroupement des points dans le voisinage de la droite est important. r > 0 corrélation positive r = 1 corrélation positive parfaite r < 0 corrélation négative r = –1 corrélation négative parfaite

17 Droite de tendance La droite de régression permet de construire des modèles simples qui sont utilisés pour analyser des situations ou pour décrire une tendance. On lappelle alors droite de tendance. On distingue deux cas dans lanalyse de tendance, selon que les valeurs estimées sont à lintérieur ou à lextérieur de lensemble des données observées. Lorsque les prévisions portent sur des valeurs à lintérieur de lintervalle des données, le processus est appelé interpolation. Généralement, les estimations provenant dune interpolation sont plutôt fiables. Lorsque les prévisions portent sur des valeurs à lextérieur de lensemble des données, le processus est appelé extrapolation. Il faut noter que la fiabilité est plus grande lorsquon fait des prédictions pour des valeurs proches de lensemble des données observées. Les prédictions portant sur des valeurs éloignées de cet intervalle donnent une estimation qui, sans être à rejeter, doit être considérée de façon plus critique.

18 Lors dune expérience de polarimétrie du sucrose, on a noté langle de rotation des solutions étalon dans une cellule de 2,00 dm. Les couples obtenus sont donnés dans la tableau ci- contre. La concentration c est en grammes par 100 mL et langle de rotation est en degrés. Déterminer un modèle mathématique décrivant la correspondance entre la concentration et langle de rotation en utilisant la méthode des moindres carrés. S Exemple S a =a = n c i i – ( c i )( i ) n c i 2 – ( c i ) 2 b =b = i – a c i n a = ,05 – 60,5 80, ,25 – 60,5 2 b = 5 = 1, – 5 = 0, Le modèle affine est alors : (c) = 1,30c + 0,38 On peut calculer les paramètres : Concentration (g/100 mL) Angle de rotation (degrés) c ,25 – 60,5 2 Calculons le coefficient de corré- lation : r =r = n c i i – ( c i )( i ) n c i 2 – ( c i ) 2 n i 2 – ( i ) 2 r =r = = 0, ,05 – 60,5 80, ,3 – 80,4 2 On a une corrélation positive très forte. Le modèle affine est donc très approprié dans cette situation. SS Déterminons la préimage de 15,85 par ce modèle. (c) = 1,30c + 0,38 = 15,85 doù c = 11,9. La concentration qui donne un angle de rotation de 15,85° est de 11,9 g/100 ml. 20,88 89,6 192,2 336,0 551,45 ci2ci2 16,0 64,0 144,0 256,0 420,25 c i i 60,580,41191,05 900,25 i 2 27,04 125,44 259,21 441,00 723, ,30 4,0 8,0 12,0 16,0 20,5 ? 5,2 11,2 16,1 21,0 26,9 15,85 cici i Conclusion

19 On peut utiliser différentes méthodes pour déterminer un modèle affine décrivant la relation entre des données expérimentales, méthode graphique, méthode des données regroupées et méthode par régression. La méthode la plus précise est celle par régression. Cependant, la précision du modèle dépend également de la précision des mesures expérimentales. Par le calcul des résidus, du coefficient de corrélation et du coefficient de détermination, on peut chiffrer la précision du modèle et lintensité du lien de linéarité entre les variables.

20 Exercices Mathématiques pour la chimie et la biologie, section 2.4, p. 63 et 64. Lecture Mathématiques pour la chimie et la biologie, section 2.3, p.54 à 62.


Télécharger ppt "Montage préparé par : André Ross Professeur de mathématiques Cégep de Lévis-Lauzon André Ross Professeur de mathématiques Cégep de Lévis-Lauzon Régression."

Présentations similaires


Annonces Google