Etalonnage et modélisation

Etalonnage et modélisation
11ème MIEC - 21ème JIREC Multimédia et Informatique dans l'Enseignement de la Chimie Journées pour l'innovation et la Recherche dans l'Enseignement de la Chimie er, 2 et 3 Juin 2005 à Autrans

Etalonnage/modélisation en sciences analytiques
Impuretés Produits de dégradation OBJECTIFS Déterminer une procédure d’étalonnage inverse adapté. 1a. Intervalle de dosage 1b. Fonction réponse Evaluation des limites de détection et de quantification Prédire une incertitude de mesure à l’aide de QC (exactitude et précision) Simulation du travail de routine à l'aide d'échantillons de concentrations connues. signal domaine Standards de calibration: Fonction réponse Contrôle qualité: Linéarité, Répétabilité, fidélité intermédiaire, exactitude

Détermination de la borne supérieure du domaine linéaire
Domaine d’analyses Réponse analytique Teneur LOQ Gamme linéaire Gamme dynamique LOD Détermination de la borne supérieure du domaine linéaire Estimation LOD/LOQ Permission J. Vial – Paris

Le modèle mathématique postulé peut être :
Modélisation Modéliser : utiliser des données expérimentales pour prévoir une information quantitative inconnue Y à partir de mesures de X via une certaine « fonction mathématique » : Le modèle mathématique postulé peut être : Une droite si Y varie linéairement avec X. Ajustement linéaire Y X Y= b1X + b0 Modèle Sinon un polynôme de degré convenable. Ajustement polynomial Y X Modèle Y = f(X) avec un polynôme de degré convenable

Etalonnage/Relation linéaire
Dans le cas les plus simple il existe une relation linéaire entre : la grandeur à quantifier X (ici la teneur de l’échantillon en un composant donné) et une seule grandeur physique Y généralement donnée par un appareil. Y = b1X + b0

Conclusion : les deux variables X et Y ne jouent pas le même rôle.
Régression Quand on trace la courbe d’étalonnage d’une méthode d’analyse à partir d’étalons choisis par l’expérimentateur, la concentration X de l’analyte n’est pas considérée comme variable aléatoire puisqu’elle est connue avec précision. En revanche, la réponse Y obtenue est une variable aléatoire dans la mesure où elle dépend non seulement de X, mais aussi de l’aléa de l’erreur expérimentale. Conclusion : les deux variables X et Y ne jouent pas le même rôle.

Régression linéaire (Y = ß1X + ß0) yi = ß1xi + ß0 + εi
X représente une teneur connue en analyte Y représente le résultat observé, On peut disposer de n couples [xi,yi] pour deux variables X et Y que l’on suppose liées : à chaque valeur de X est associée une valeur de Y avec la relation : (Y = ß1X + ß0) Mais, expérimentalement, à chaque valeur xi de X, on obtient une valeur yi entachée de l’erreur expérimentale εi. On a en réalité : yi = ß1xi + ß0 + εi

Analyse Quantitative et Etalonnage
Ces données sont toujours en nombre limité, elles ne représentent donc qu’un échantillon de la population de toutes les mesures de la teneur en analyte de l’étalon que l’on pourrait effectuer. X représente une teneur connue en analyte Y représente le résultat observé, la relation linéaire postulée devient : Y = b1X + b0 Avec uniquement une « estimation » des coefficients a et b du modèle postulé. Y = ß1X + ß0

Régression linéaire A cause de cette erreur εi associée à chaque couple [xi,yi], si on représente graphiquement yi en fonction de xi, on ne va pas obtenir des points “idéalement alignés”, mais un «nuage» de points plus ou moins écartés de cette droite idéale.

Modèle linéaire Y = b0 + b1 X + r Y Y5 Y4 Y2 Y3 Y1 X1 X2 X3 X4 X5 X
Avec une seule variable X le modèle s ’écrit : Y = b0 + b1 X + r Y Y5 Y4 Y2 Y3 Y1 X1 X2 X3 X4 X5 X

Ajustement linéaire Y = b0 + b1 X + r Y Y5 Y4 Y2 Y3 Y1 ^ Y1
Avec une seule variable X le modèle s ’écrit : Y = b0 + b1 X + r Y Y5 r5 r4 Y4 On mesure la somme des carrés des écarts ri (écarts appelés "résidus") entre la valeur vraie et la valeur estimée ŷn sur la courbe. r2 Y2 r3 Y3 Y1 ^ r1 Y1 Faire un ajustement c'est minimiser la "distance" S =  [Yi -f( Xi)]2 = r i2 X1 X2 X3 X4 X5 X

Droite des moindres carrés et efficacité d’un ajustement
La somme S des carrés des écarts entre les valeurs expérimentales et les valeurs calculées par le modèle s’écrit : S = Σ [yi - (b0 + b1xi )]2 est une fonction de b0 et b1. Pour minimiser S, il suffit d'annuler les dérivées partielles de S par rapport à b0 et à b1 : S/b0 = S/b1 = 0.

Régression linéaire exemple : Fluorescence
Soit un jeu de calibration dans la gamme de 0 à 6 nanomoles N° des essais Conc. X en nM Unités de Fluoresc. Y 1 2 3 4 5 6 7 0,1 3,8 10,0 14,4 20,7 26,9 29,1 (les unités de fluorescence mesurées sont exprimées dans une échelle arbitraire dépendante de la gamme de concentration).

Régression linéaire exemple : Fluorescence
Droite d’étalonnage 10 20 30 1 2 3 4 5 6 7 nM Unité de fluorescence La droite des moindres carrés correspondant aux données a donc pour équation : Y = 5,139 X – 0,418

Estimation des coefficients
Dans ce système les bi sont les inconnues que nous devons estimer : (bi est l ’estimation calculée de bi ). 1. Au sens des moindres carrés (résolution algébrique) : S(yi - y)(xi - x) b1 = b1 = ^ S (xi - x)2 b0 = b0 = y - b1 X et 2. Au sens des moindres carrés (résolution matricielle) :

Fonction graphique : courbe de tendance
Régression linéaire Avec Excel: Fonction graphique : courbe de tendance Fonctions algébriques (pente, ordonnee.origine) Fonction matricielle : Droitereg Y = 5,139 X – 0,418

Analyse de la régression linéaire
Les variations observées pour Y sont-elles dues globalement, aux variations de X ou bien ne sont-elles que du bruit expérimental ? Quelle confiance peut-on avoir : Ŷi = b1Xi + b0 d’une part globalement pour la régression, Analyse de variance / coefficients Examen des résidus Manque d’ajustement (Lack of fit) d’autre part individuellement pour les estimateurs ? Simplification du modèle Pertinence quadratique (global)

Analyse globale : Analyse de variance
Variation due à la liaison S(yi - y)2 = S(yi - y)2 ^ SCEL = SCER Variation résiduelle S(yi - yi)2 ^ + S(yi - y)2 Variation totale SCET r1 r2 r3 r4 r5 Y -

Analyse globale : Analyse de variance Base de l’analyse de variance
Toute dispersion d’une série de données étant exprimée par la somme des carrés des écarts à la moyenne, on démontre la relation suivante sur laquelle est basée l’analyse de variance : SCET = SCEL + SCER Base de l’analyse de variance Variation totale S(yi - y)2 Variation résiduelle S(yi - yi)2 ^ Variation due à la liaison S(yi - y)2 = S(yi - y)2 ^

Fluorescence : Analyse de la variance
Régression Sources de variation Sommes des Carrés des Ecarts Degrés de lib. Carrés moyens Résidus Total 2-1=1 7-2=5 7-1=6 SCEL = 739,56 739,56 SCER = 6,175 1,235 SCET = 745,72

s12 = F (n12 , n22) s22 Test de comparaison des variances
Pour savoir si les variances des deux échantillons sont identiques ou différentes, il faut effectuer un test de comparaison de variances. Loi de Fisher (dite aussi de Fisher-Snedecor) Si deux échantillons de tailles n1 et n2 proviennent de lois normales de même variance, le rapport F des variances estimées suit une loi de Fisher avec ν1 = n1 – 1 et ν2 = n2 – 1 qui sont les degrés de liberté pour chacun des échantillons s12 s22 = F (n12 , n22)

Test de comparaison des variances
Les distributions de la loi F sont caractérisées par une dissymétrie gauche. S21 > S22 la plus grande variance au numérateur Fcalculé = Variance s21 Variance s22 estimée avec ν1 degrés de liberté estimée avec ν2 degrés de liberté On détermine la probabilité pour qu’une valeur de F soit inférieure à la valeur Fi portée en abscisse

Fluorescence : Analyse de la variance
Régression Sources de variation Sommes des Carrés des Ecarts Degrés de lib. Carrés moyens Résidus Total 2-1=1 7-2=5 7-1=6 SCEL = 739,56 739,56 SCER = 6,175 1,235 SCET = 745,72 F 1;5;0,05 = 6,608 Signif. 2, Fcalc 598,8

Analyse globale : coefficients de régression
La mesure de l'efficacité de l'ajustement peut être exprimée par un coefficient appelé “coefficient de détermination” ou “coefficient de régression multiple”. Si le modèle expliquait “idéalement” les résultats expérimentaux, nous aurions SCET = SCEL SCET = SCEL + SCER Pour un modèle parfait : SCER = 0 (il n'y a pas de différence entre valeurs expérimentales et valeurs calculées). ou sous une autre forme SCEL/SCET =1

Coefficient de détermination R²
R2 = SCEL / SCET SCEL=SCET – SCER R2 = (SCET–SCER)/ SCET R2 = 1 - SCER SCET R2 est la part de la dispersion expliquée par le modèle. Pour un modèle parfait, R2 = 1 car SCER = 0 (il n'y a pas de différence entre valeurs expérimentales et valeurs calculées).

Fonction réponse : R² R2 = 0.820 R2 = 0.820 R2 = 0.820 R2 = 0.820

Coefficient de détermination ajusté R²a
Le rapport R2 n’est pas une garantie de la qualité d’un modèle (dépendance du nombre d’essais et du modèle choisi) Ex. Avec deux points, droite; R2 = 1 Avec trois points , droite; R2 < 1 mais 2ème degré R2 = 1 Pour tenir compte du nombre d'essais, c'est à dire du nombre de degrés de liberté, il existe un coefficient de régression "ajusté" symbolisé par R2a et défini par : SCER /(n-p) SCET /(n-1) R2a = 1-

Fluorescence : coefficients de régression
R2a = 1 – ((6,175/5)/(745,72/6) = 0,9900

Analyse globale : examen des résidus
Résidus = écarts entre les points expérimentaux et la droite de régression En fait pour les visualiser il suffit de faire pivoter la droite de régression jusqu’à l’horizontale et d’effectuer un zoom. Dans le cas où la le modèle linéaire est bien adapté, la répartition des résidus doit présenter un caractère aléatoire. Les résidus devraient suivre une loi normale centrée sur 0. Un examen visuel permet généralement de déceler un problème de modèle (homoscédasiticité, courbure, ordre supérieur, etc.).

Propriétés de la loi Normale
Moyenne Variance Le graphe de la Loi Normale est caractérisé par : Une courbe en cloche asymptotique à l’axe des x, dont le maximum est pour x = x , Une symétrie par rapport à l’axe x = x , Deux points d’inflexion à une distance de x égale à σ.

Propriétés de la loi Normale
0,9545 Probabilité = 95,45% pour que x soit compris dans l’intervallex  2 s Probabilité = 68,27% pour que x soit compris dans l’intervallex  1 s 0,6827 0,9973 Probabilité = 99,73% pour que x soit compris dans l’intervallex  3 s

Caractéristiques de l’erreur expérimentale ri
Distribution de Gauss centrée sur zéro (échelle des abscisses en unités d’écart-type) En moyenne, l’erreur est nulle : o -3 -2 -1 1 2 3 l’espérance mathématique E(ri) =0. 99,73 % 95,45 % 68,27 % ou par l’écart-type s. s La dispersion de « ri" est mesurée par sa variance : var(ri) = s2

Analyse des résidus 0.15 0.15 0.1 0.1 0.05 0.05 Résidus Résidus 200
200 400 600 800 1000 1200 1400 1600 5 10 15 20 25 30 35 40 45 -0.05 -0.05 -0.1 -0.1 -0.15 Ceci est confirmé par l'analyse des résidus. On voit que sur le modèle simple, les résidus sont distribué d’une manière peu homogène autour de 0. Avec la transformation de variable, les résidus sont distribué équitablement autour du zéro. Cette analyse visuelle a été confirmé par un test de Cochran démontrant que les variances sont homogènes lors de l’utilisation de la transformation de variable. -0.15 Concentration [ng/ml] Concentration transformée [ng/ml]

Fluorescence : examen des résidus
En fait pour les visualiser il suffit de faire pivoter la droite de régression jusqu’à l’horizontale et d’effectuer un zoom. Dans le cas où la le modèle linéaire est bien adapté, la répartition des résidus doit présenter un caractère aléatoire.

Analyse de la régression linéaire
Les variations observées pour Y sont-elles dues globalement, aux variations de X ou bien ne sont-elles que du bruit expérimental ? Quelle confiance peut-on avoir : Ŷi = b1Xi + b0 d’une part globalement pour la régression, Analyse de variance / coefficients Examen des résidus Manque d’ajustement (Lack of fit) d’autre part individuellement pour les estimateurs ? Simplification du modèle Pertinence quadratique (global)

Significativité des coefficients
b1 estimation de β1 de moyenne β1 et de variance var(b1) b0 estimation de β0 de moyenne β0 et de variance var(b0) Comme la variable Y qui intervient dans ces calculs est une variable aléatoire de variance σ2exp. cette dispersion va se répercuter sur les variances de b0 et b1. S(xi - x)2 Var(b1) = s2exp. [ ] s2 1 n + et Var(b0) = x2

Estimation de la variance expérimentale
La variance expérimentale peut être obtenue par 1. la répétition des essais ou 2. « estimée » à partir des résidus, selon la relation suivante : n-2 ^ s2 = S ri2 n-2 ^ s2 = s2 = S (yi-b0 - b1xi)2 On appelle cette estimation variance de la régression ou variance résiduelle

Fluorescence : Significativité des coefficients
Calcul de la variance des estimateurs (coefficients) (en utilisant la variance résiduelle comme estimation de σ2exp. ) var(b1) = σ2résid . * (1/28) = 1,235 * 0,036 = 0,044 var(b0) = σ2résid . * (1/7 + 3*3/28) = 1,235* 0,464 = 0,574 Coefficient Ecart-type b0 -0,418 0.757 b1 5,139 0.21

Le coefficient bi est distribué selon une distribution de Student de moyenne bi, d'écart-type e.t.(bi) et (n-2) degrés de liberté. -tc tc Moyenne = b i pour n = n-2 Intervalle de confiance pour bi : bi  tc e.t.(bi)

b0 ± tc e.t. (b0) Intervalles de confiance des bi : b1 ± tc e.t. (b1) -0,418 ± 2,57*0,757 Il s’agit ici du tthéorique avec ν = 5 Pour le risque choisi (0,05)  t = 2,57) 5,139 ± 2,57*0,21 -2,36 < b0 < 1,53 4,98 < b1 < 5,30 Si l’intervalle inclus le zéro, le coefficient n’est pas significatif (au risque choisi)

D’où le test suivant : la différence bi - βi0 suit une statistique de Student à ν = (n-2) degrés de liberté avec : t = bi - β0i é.type (bi) La significativité va être déterminée en prenant βi0 = 0 d’où : t = bi é.type (bi)

Etalonnage de la méthode d’analyse de traces par fluorescence, avec un risque a=0,05 et avec n=7-2=5 degrés de liberté, t5, 0.05 =2,57 (calculé avec LOI.STUDENT.INVERSE d'EXCEL). coefficients écart-type tcalculé significativité -0,418 5,139 0,757 0,210 -0,552 24,41 0,6046 0,0036 b0 b1

Régression linéaire Avec Excel: Outil, Utilitaire d’analyse Régression linéaire Coefficients de régression Analyse de variance (test de F1) Calcul, significativité et intervalles de confiances des coefficients Analyse des résidus

Résolution matricielle
Coefficients du modèle B = (X'X)-1 X'Y Matrice de variance-covariance des coefficients C'est une matrice où les variances sont disposées sur la diagonale et les covariances de part et d'autre de cette diagonale (matrice carrée symétrique) :

yi - y yi - y Variance-covariance Variance de x Variance de y
x,y yi - y Covariance xy

Matrice de variance-covariance des coefficients
var (b0) cov (b1,b0) var (b1) var (B) = Var(B) = s2 (X'X)-1 Variance expérimentale Conséquence: le choix des points expérimentaux conditionne la qualité de l’estimation la meilleure estimation consiste à annuler la covariance et minimiser les variances sur les coefficients  Plan d’expériences

Définitions LOD/LOQ LOD = 1) Plus petite quantité d’analyte dont on puisse dire avec un niveau de confiance donné qu’il est présent dans l’échantillon 2) Plus petite quantité de l’élément à analyser pouvant être détectée, mais non quantifiée par une valeur précise (ICH). 3) …, mais non quantifiée par une valeur exacte (SFSTP 1997). LOQ = 1) Plus petite quantité d’analyte qui peut être quantifiée avec un niveau de confiance donné. 2) Plus faible concentration de l’analyte dans l’échantillon qui puisse être déterminée quantitativement avec une justesse et une précision convenables (ICH). 3) Plus petite quantité à examiner dans un échantillon pouvant être dosé dans des conditions expérimentales décrites avec une fidélité et une exactitude définies (SFSTP 1997)

Etalonnage et modélisation

Présentations similaires

Présentation au sujet: "Etalonnage et modélisation"— Transcription de la présentation:

Présentations similaires

Notre projet

Feed-back

Entrer

S'autoriser via un réseau social:

Etalonnage et modélisation

Présentations similaires

Présentation au sujet: "Etalonnage et modélisation"— Transcription de la présentation:

Présentations similaires

Notre projet

Feed-back