METHODOLOGIE DE LA RECHERCHE EXPERIMENTALE Roger Phan-Tan-Luu Université Paul Cézanne - France Méthodologie de la Recherche Expérimentale
Une mesure nous donne un résultat * L’information ainsi obtenue doit être de bonne qualité, pour que nous puissions, à partir de celle-ci, prendre une décision avec un risque minimum * Ce résultat doit nous apporter une information qui correspond bien à l’information demandée Hay dos clases de criterios : Criterios que permiten, para un valor de N, elegir la matriz de experiencias óptima (según el criterio elegido) Se llaman : Criterios de tipo I Criterios que permiten elegir en un conjunto de matrices de experiencias óptimas (según el criterio de tipo I elegido) para diferentes valores de N, la matriz de experiencias de calidad aceptable Se llaman Criterios de tipo II Utilisable Utile
Le résultat de la mesure nous donne Cas ideal : il n’y a pas d’erreur expérimentale Le résultat de la mesure nous donne Cas normal : l’erreur expérimentale existe Le résultat de la mesure ne nous donne que y yi = I + ei yi est une estimation de i précision, justesse, exactitude, ..
mesure associée à un modèle mesure individuelle * Pour améliorer la qualité de l’information obtenue à partir du modèle, en plus de la qualité apportée par la mesure,il faudra aussi compter avec les conditions d’expérimentations * Pour améliorer la qualité de l’information obtenue, il suffit d’augmenter le nombre d’essais Hay dos clases de criterios : Criterios que permiten, para un valor de N, elegir la matriz de experiencias óptima (según el criterio elegido) Se llaman : Criterios de tipo I Criterios que permiten elegir en un conjunto de matrices de experiencias óptimas (según el criterio de tipo I elegido) para diferentes valores de N, la matriz de experiencias de calidad aceptable Se llaman Criterios de tipo II
mesure individuelle Soit N essais répétés (honnêtement) y1, y2, …, yN * Pour améliorer la qualité de l’information obtenue, il suffit d’augmenter le nombre d’essais Soit N essais répétés (honnêtement) y1, y2, …, yN Ymoyen = yi/N Var (ymoyen) = s2 / N Hay dos clases de criterios : Criterios que permiten, para un valor de N, elegir la matriz de experiencias óptima (según el criterio elegido) Se llaman : Criterios de tipo I Criterios que permiten elegir en un conjunto de matrices de experiencias óptimas (según el criterio de tipo I elegido) para diferentes valores de N, la matriz de experiencias de calidad aceptable Se llaman Criterios de tipo II
mesure associée à un modèle * Pour améliorer la qualité de l’information obtenue à partir du modèle, en plus de la qualité apportée par la mesure,il faudra aussi compter avec les conditions d’expérimentations Hay dos clases de criterios : Criterios que permiten, para un valor de N, elegir la matriz de experiencias óptima (según el criterio elegido) Se llaman : Criterios de tipo I Criterios que permiten elegir en un conjunto de matrices de experiencias óptimas (según el criterio de tipo I elegido) para diferentes valores de N, la matriz de experiencias de calidad aceptable Se llaman Criterios de tipo II
Cas normal : l’erreur expérimentale existe yi = i+ ei= 0 + 1 xi+ ei y2 = 0 + 1 x2 + e2 y1 = 0 + 1 x1+ e1 (y2 - y1) / (x2 – x1) = (2+ e2 - 1 – e1) / (x2 – x1) = (2 - 1 + e2 – e1) / (x2 – x1) = (2 -1) / (x2 – x1) + (e2 – e1) / (x2 – x1) b1= 1 + (e2 – e1) / (x2 – x1)
b1= 1 + (e2 – e1) / (x2 – x1) Pour obtenir une bonne estimation de 1 : b1 1 Il faut et il suffit que : (e2 – e1) / (x2 – x1) 0 (x2 – x1) doit être le plus grand possible La qualité de l’information obtenue dépend de la position des points expérimentaux.
Y S. C. E = (yexp, i - ycalc, i )2 X x6 y6 x7 y7 y5 x5 x4 y4 yexp, 3
L = (yi – b0 – b1xi )2 Nb0 + b1 xi = yi b0 xi + b1 xi 2 = yi xi
b1 = Sxy / Sxx b0 = y moyen – b1 x moyen Sxy = yi (xi - x moyen )2 Sxx = (xi - x moyen )2 b1 = Sxy / Sxx b0 = y moyen – b1 x moyen Var(b1) = Var (Sxy / Sxx) = Var (Sxy) / S2xx Var(b1) = Var ( yi (xi - x moyen )2 ) / S2xx Var ( yi (xi - x moyen )2 ) = s2 (xi - x moyen )2 Var (b1 ) = s2 / Sxx Var (b0 ) = s2 [ 1/N + x moyen 2 / Sxx ]
REPRESENTATION VECTORIELLE Définitions : Y : vecteur colonne de la réponse expérimentales yi Y' : { y1, y2,…… yN } h : vecteur colonne de la réponse théoriques h i h ' : { h1, h2, ….. hN }
REPRESENTATION VECTORIELLE (suite) b : vecteur colonne des coefficients du modèle à estimer bi b ' : { b0 , b1 , b2 , …. bp} B : vecteur colonne des estimateurs bi B' : {b0 , b1 , b2 , …. bp} e : vecteur colonne des erreurs expérimentales ei e ' : {e1 , e2 , ..... eN} Notation matricielle classique h = Xb y = Xb + e
METHODE DES MOINDRES CARRES La méthode des moindres carrés ne nécessite aucune hypothèse sur la distribution des erreurs expérimentales L = (Y – Xb ) ‘(Y – Xb ) X'X B = X'Y B = (X'X)-1 X'Y si det (X'X) 0
METHODE DES MOINDRES CARRES Si la matrice (X’X) n’est pas singulière, nous obtenons le vecteur des estimations : B = (X'X)-1 X'Y X’X : matrice d’information (X’X)-1 : matrice de dispersion Si le modèle y = Xb + e est correct, B est une estimation non biaisée de b,
MATRICE DE VARIANCE – COVARIANCE DE B Var [B ] = (X’X)-1 s2 Var [B ] : matrice de variance-covariance de B (X’X)-1 : matrice de dispersion : { c ij } cjj : coefficient de variance La variance de l’estimateur bj est obtenue en multipliant la variance de l’erreur expérimentale s2 par le terme diagonal correspondant cjj de la matrice de dispersion var [bj ] = cjj s2 covar [bj , bi] = cji s2
plan d’expérimentation G S I O N M U L T I L I N E A I matrice d’expériences x N modèle matrice du modèle X matrice d’ information X'X plan d’expérimentation matrice de dispersion (X'X)-1 expérimentation Y - B = (X'X)-1X'Y tests statístiques s2 Var (B) = (X'X)-1 facteurs d’inflation fonctions de variance - 1
La variance et la covariance d’un estimateur dépendent seulement de: - la variance de l’ erreur expérimentale s2 - des éléments de la matrice de dispersion (X’X)-1, * donc des éléments de la matrice d’information (X’X), * donc de la structure de la matrice d’expériences et de la forme analytique du modèle, La qualité des estimateurs est indépendante de la valeur des résultats expérimentaux (éléments du vecteur Y),
Un modèle ! Pourquoi faire ? * Le modèle doit nous permettre de faire, dans tout le domaine expérimental défini, une prévision de bonne qualité * Le modèle doit représenter au mieux l’ensemble des résultats expérimentaux Hay dos clases de criterios : Criterios que permiten, para un valor de N, elegir la matriz de experiencias óptima (según el criterio elegido) Se llaman : Criterios de tipo I Criterios que permiten elegir en un conjunto de matrices de experiencias óptimas (según el criterio de tipo I elegido) para diferentes valores de N, la matriz de experiencias de calidad aceptable Se llaman Criterios de tipo II critères a priori critères a posteriori
R2 = 1 – (yi – ycalc,i)2 / (yi – ymoyen)2 critères a posteriori Quelques critères a posteriori R2 : coefficient de détermination multiple R2 = 1 – (yi – ycalc,i)2 / (yi – ymoyen)2 R2A : coefficient de détermination multiple adjusté R2A = 1 – [ (yi – ycalc,i)2 / (N – p)] / [ (yi – ymoyen)2 / (N – 1)]
Analyse des résidus Résidus ei = yi - y calc, i analyse graphique
ri = ei / s Résidus normés s : écart-type de la réponse ei : résidu au point i Les résidus normés ont une moyenne nulle et une variance approximativement égale à 1. Si ri > 3 la valeur de la réponse au point i doit être examinée avec soin (erreur de transcription, artéfact, validité du modèle en ce point,…)
Student-R ri = ei / s(1 - di) Au point i y calc, i = XB y calc, i = X(X’X)-1X’Y H = X(X’X)-1X’ (hat matrice) y calc, i = HY E : {ei, ei, ..., eN} E = Y - Ycalc E = Y – XB = Y – HY = (I - H)Y ei = (1 – di) yi Var (E) = Var [(I - H)Y] = (I – H) Var(Y) (I – H)’ Var (E) = s2 (I – H) Var (ei) = s2 (1 – di) = (1 – di) s2 ri = ei / s(1 - di)
s2(i) = [(N – p) s2 - ei2 / (1 - di) ] / (N - p -1) R-student s2(i) = [(N – p) s2 - ei2 / (1 - di) ] / (N - p -1) ti = ei / s2(i) (1 - di) si ti est très différent de ri, alors le point i a une grande influence sur le calcul des coefficients du modèle
PRESS (Prediction Error Sum of Square) On fait la régression en enlevant le point i et en chacun des (N – 1) points on calcule Y calc, (i) au point i e (i) = yi - y calc, i La procédure est répétée pour chaque point (i : 1,., N) e(1), …e(i), … e(N) PRESS = e(i)2 = [ei /(1 - di)]2 ri = ei / s(1 - di)
R2Prédiction R2 prédiction = 1 – PRESS / yi2
critères a priori Ces critères permettent de choisir, de construire, un ensemble d’expériences qui nous apporteront les informations désirées avec une qualité acceptable. OBJECTIFS
Elaborer une stratégie expérimentale choisir une stratégie expérimentale adéquate OBJECTIFS On sait que l’on peut classer les différents types de problèmes en différents groupes, comme la recherche exploratoire, ou le screening de facteurs, ou les études d’optimisation, sachant que pour chacun de ces objectifs, des stratégies expérimentales adaptées existent ! Et de nouveaux types de M.E sont proposés depuis ces dernières années !! Nous allons tout d’abord parler de ce que l’on appelle la recherche exploratoire.
Une expérience apporte toujours une information Mais, cette information est-elle utile ? C’est une droite Est-ce une droite ?
C’est une droite Dominio de validación
Est-ce une droite ? N = 2 N = 2 Et si nous faisions 50 points ? N = 50 Dominio de validación Et si nous faisions 50 points ? N = 50 25 25
Est-ce une droite ? N = 2 N = 2 N = 3 Dominio de validación N = 3 Toute l’information se trouve dans la distribution des points expérimentaux
C’est une droite Dominio de validación
var (b1) = s2 / S (xi – xmoyen)2 1 j n var (b1) = s2 / S (xi – xmoyen)2 S (xi–xmoyen)2 = (x1–xmoyen)2 + 5 (xj–xmoyen)2 + (xn–xmoyen)2
Fonction de variance maximale Critères de type II Modéles linéaires, … * Nous voulons connaître les estimations des coefficients du modèle avec une qualité acceptable * Nous voulons connaître en n’importe quel point du domaine expérimental d’intérêt, la valeur de la réponse étudiée avec une qualité acceptable Criterios que permiten, para un valor de N, elegir la matriz de experiencias óptima (según el criterio de tipo I elegido). Tomamos, por ejemplo, un modelo lineal de primer grado con dos variables. = b0 + b1X1 + b2X2 después de la experimentación, calculamos las estimaciones de los coeficientes del modelo : b1 y b2. Facteurs d'inflation Fonction de variance maximale
Fonction de variance maximale Critères de type II Modéles linéaires, … * Nous voulons connaître les estimations des coefficients du modèle avec une qualité acceptable * Nous voulons connaître en n’importe quel point du domaine expérimental d’intérêt, la valeur de la réponse étudiée avec une qualité acceptable Criterios que permiten, para un valor de N, elegir la matriz de experiencias óptima (según el criterio de tipo I elegido). Tomamos, por ejemplo, un modelo lineal de primer grado con dos variables. = b0 + b1X1 + b2X2 después de la experimentación, calculamos las estimaciones de los coeficientes del modelo : b1 y b2. facteurs d'inflation Fonction de variance maximale
Objectif Le criblage des facteurs ð rechercher rapidement, parmi un ensemble de facteurs potentiellement influents, ceux qui le sont effectivement dans un domaine expérimental fixé. Les études quantitatives des facteurs ð étudier les effets principaux et les effets d’interaction des facteurs. En el caso en que queramos conocer : las estimaciones de los pesos o de los efectos de los factores, es evidente que sólo los factores de inflación nos van a permitir saber, a priori, si las informaciones que buscamos serán de buena calidad o no. Es el caso de los estudios de cribado y de los estudios de factores.
Objectif Facteurs d’inflation Le criblage des facteurs Les études quantitatives des facteurs Nous voulons connaître les estimations des coefficients du modèle : poids des facteurs, effets principaux et effets d’intéraction,.. avec une qualité acceptable. En el caso en que queramos conocer : las estimaciones de los pesos o de los efectos de los factores, es evidente que sólo los factores de inflación nos van a permitir saber, a priori, si las informaciones que buscamos serán de buena calidad o no. Es el caso de los estudios de cribado y de los estudios de factores. Facteurs d’inflation
Fonction de variance maximale Critères de type II Modéles linéaires, … * Nous voulons connaître les estimations des coefficients du modèle avec une qualité acceptable * Nous voulons connaître en n’importe quel point du domaine expérimental d’intérêt, la valeur de la réponse étudiée avec une qualité acceptable Criterios que permiten, para un valor de N, elegir la matriz de experiencias óptima (según el criterio de tipo I elegido). Tomamos, por ejemplo, un modelo lineal de primer grado con dos variables. = b0 + b1X1 + b2X2 después de la experimentación, calculamos las estimaciones de los coeficientes del modelo : b1 y b2. Facteurs d'inflation Fonction de variance maximale
Objectif Les études quantitatives des réponses Les mélanges Connaître en n'importe quel point du domaine expérimental d'intérêt la valeur d'une ou plusieurs réponses expérimentales . Les mélanges Connaissance d'une ou plusieurs propriétés, dépendant de la proportion de chaque constituant dans le mélange étudié. Pero en el caso en que queramos conocer : en cualquier punto del dominio experimental de interés el valor de una o más respuestas estudiadas con una calidad aceptable, sólo el valor de la función de varianza nos permitirá, a priori, saber si la estrategia experimental propuesta nos permite respetar nuestro objetivo (desde luego, después de tener validado el modelo postulado).
zone de compromis acceptable Que voulons-nous ? Connaître en n'importe quel point du domaine expérimental d'intérêt la valeur d'une ou plusieurs réponses expérimentales Trouver, s’il existe, le domaine dans lequel toutes les réponses expérimentales respectent les contraintes imposées par le cahier des charges zone de compromis acceptable
Quelles doivent être les qualités du modèle ? Le modèle doit bien représenter le phénomène étudié dans le domaine expérimental d’intérêt Si cela est vérifié, il doit permettre de prévoir, en n’importe quel point de ce domaine expérimental d’intérêt, la valeur de la réponse expérimentale étudiée avec une bonne qualité prévisionnelle
Que voulons nous ? Si le modèle est vérifié, il doit permettre de prévoir, en n’importe quel point de ce domaine expérimental d’intérêt, la valeur de la réponse expérimentale étudiée avec la même qualité que celle que nous aurions eue si nous avions fait l’expérience en ce même point.
A Var (y calc ,A) = dAs2 Var (y exp ,A) = s2 2750 g 2500 g 3000 g 360 sec 270 sec A 180 sec Var (y calc ,A) = dAs2 Var (y exp ,A) = s2
Que voulons nous ? Si le modèle est vérifié, il doit permettre de prévoir, en n’importe quel point de ce domaine expérimental d’intérêt, la valeur de la réponse expérimentale étudiée avec la même qualité que celle que nous aurions eue si nous avions fait l’expérience en ce même point. d Max 1
Objectif Fonction de variance maximale dans tout le domaine d’intérêt Les études quantitatives des réponses Les mélanges Connaître, en n’importe quel point du domaine expérimental d’intérêt, la valeur de la réponse expérimentale étudiée avec une qualité acceptable. Fonction de variance maximale dans tout le domaine d’intérêt dMax Pero en el caso en que queramos conocer : en cualquier punto del dominio experimental de interés el valor de una o más respuestas estudiadas con una calidad aceptable, sólo el valor de la función de varianza nos permitirá, a priori, saber si la estrategia experimental propuesta nos permite respetar nuestro objetivo (desde luego, después de tener validado el modelo postulado).
et en plus, ne sont pas importantes Les expériences coûtent cher, prennent du temps, consomment des produits, de l’énergie .... et en plus, ne sont pas importantes
Il n’y a aucune information dans le résultat d’une expérience ! Toute l’information se trouve dans la distribution des points expérimentaux
Comment savoir si l’objectif est atteint ? mesure réponse expérimentale
Etablir la liste des réponses Description du problème Les objectifs Etablir la liste des réponses In the second step, we can record the existing information (bibliography, technical reports,...) and, from it, we make the list of the responses we will study.
Réponse expérimentale Qualités: pertinente, reproductible connue avec une précision acceptable. La réponse est un résultat et il n’est pas possible d’agir directement sur sa valeur SORTIE
REPONSES EXPERIMENTALES Etude d’un procédé CVD tungstène vitesse de dépôt, résistivité, réflectance, adhésion, recouvrement, tension. Optimisation de la géométrie d’une boîte de boisson résistance au choc, quantité d’aluminium, volume utile. Fabrication d’un comprimé dureté, friabilité, indice de cohésion, granulométrie, rapport de transmission Catalyse par transfert de phase rendement de la réaction
Il faut agir indirectement Comment modifier la réponse expérimentale ? Il faut agir indirectement Facteurs L’expérimentateur peut agir directement sur la valeur que peut prendre un facteur contrôlé. ENTREE
So, now, what would we like to have ?? Phénomène ENTREE SORTIE Facteurs Réponses Granulométrie - Liquide de mouillage Friabilité - Temps de malaxage Dureté For example, we can study a process for a tablet granulation. The output variables (that means the experimental responses) can be : … The input variables (that means the factors) can be for example : the amount of liquid, the mixing time and for each factor, we define the domain of interest. So, now, what would we like to have ?? We would like to establish a quantitative relation between the factors and the responses Rapport de transmission Indice de cohésion
Etablir la liste des réponses Description du problème Les objectifs Etablir la liste des facteurs étudiés non étudiés Etablir la liste des réponses So, in the 3rd step, we have to do the list of the factors we want to study and those we won’t study. It’s important, because if a factor is not studied, it should be constant during the experimentation (You must be able to keep it constant.) We want to set up a relation between the responses and the factors : we want to link the variation of the responses to the variation of the factors. For that, we have to make the factors changed, that means to give different values to the factors.
Domaine de variation des facteurs L'ensemble des niveaux (ou états) que peut prendre un facteur, peut être défini : en extension tous les niveaux (ou états) sont énumérés en compréhension énoncé de propriétés caractéristiques
Facteurs qualitatifs Type de fruits secs : 40 % E T U C D H O noisettes du Piémont noisettes turques amandes de Valence amandes de Sfax E T U D ‘U N C H O L A T Type de matières grasses : 15 % beurre de cacao beurre concentré biscuitine toffita Type de produits de chocolat : 15 % chocolat noir chocolat au lait masse de cacao Type de produits / matière sèche : 30 % sucre glace lactosérum dextrose farine de soja
Les différents états que peut prendre un facteur The various levels that a factor can have is called the experimental domain of the factors. Usually, we reduce it to the experimental domain of interest that means the domain where we look for the missing information.
DOMAINE EXPERIMENTAL D’INTERET Le domaine expérimental possible (ou domaine d'opérabilité) est le sous-ensemble du domaine des facteurs contenant les expériences réalisables. Dans la pratique, ce domaine est souvent lui-même réduit au domaine expérimental d'intérêt dans lequel nous recherchons les informations désirées. Nous devons, avant toute expérimentation bien définir sa taille, sa forme, les possibilités d'extension, les discontinuités soupçonnées du phénomène...
Etablir la liste des réponses Domaine expérimental d’intérêt Description du problème Les objectifs Etablir la liste des facteurs étudiés non étudiés Etablir la liste des réponses Domaine expérimental d’intérêt Therefore, in the next step, we must define the experimental domain of interest where we’ll look for the missing information.
Nous devons faire des expériences Lesquelles ? Celles qui nous amènent les informations désirées Stratégie expérimentale
Elaborer une stratégie Description du problème Les objectifs Etablir la liste des facteurs étudiés non étudiés Etablir la liste des réponses Domaine expérimental d’intérêt So, the last step of this methodological approach is the elaboration of the experimental strategy or experimentation design, that means to choose the experiments that will have to be made according to the targets, the means you have and the desired information. And after experimentation, from the results, you will deduce (conclude) the responses to the questions. Elaborer une stratégie Méthodologie de la Recherche Expérimentale
Stratégie expérimentale Ensemble d’expériences dont la réalisation apporte des informations bien définies Plan d’expériences
Construire un plan d’expériences Description du problème Les objectifs Etablir la liste des facteurs étudiés non étudiés Etablir la liste des réponses Domaine expérimental d’intérêt So, the last step of this methodological approach is the elaboration of the experimental strategy or experimentation design, that means to choose the experiments that will have to be made according to the targets, the means you have and the desired information. And after experimentation, from the results, you will deduce (conclude) the responses to the questions. Construire un plan d’expériences Méthodologie de la Recherche Expérimentale
Elaborer une stratégie expérimentale choisir une stratégie expérimentale adéquate LES OBJECTIFS Optimisation Recherche exploratoire On sait que l’on peut classer les différents types de problèmes en différents groupes, comme la recherche exploratoire, ou le screening de facteurs, ou les études d’optimisation, sachant que pour chacun de ces objectifs, des stratégies expérimentales adaptées existent ! Et de nouveaux types de M.E sont proposés depuis ces dernières années !! Nous allons tout d’abord parler de ce que l’on appelle la recherche exploratoire. Etude quantitative de facteurs Criblage de facteurs
l La recherche exploratoire : ð cerner le domaine expérimental, s'assurer de la maîtrise du phénomène, choisir les grandeurs qui serviront de réponses et contrôler la répétabilité. l Le criblage des facteurs : ð rechercher rapidement, parmi un ensemble de facteurs potentiellement influents, ceux qui le sont effectivement dans un domaine expérimental fixé. l Les études quantitatives des facteurs : ð étudier les facteurs retenus d'une façon plus fine : interactions possibles entre les différents facteurs.
ð Rechercher l'optimum d'une ou plusieurs réponses expérimentales l Les études quantitatives des réponses ð Rechercher l'optimum d'une ou plusieurs réponses expérimentales Connaître en n'importe quel point du domaine expérimental d'intérêt la valeur d'une ou plusieurs réponses expérimentales . l Les mélanges : ð formulation = étude de l'influence des proportions de plusieurs constituants sur les manifestations d'un phénomène physico-chimique. Connaissance d'une ou plusieurs propriétés, dépendant de la proportion de chaque constituant dans le mélange étudié.