Fusion de données SENSO - Bordeaux / Jeudi 15 Mars 2007 - Fusion de données SENSO M.A. PLOIX, V. GARNIER, J. MOYSAN LCND, Laboratoire de Caractérisation Non Destructive Université de la Méditerranée, IUT, Av Gaston Berger, 13625 Aix-en-Provence
Plan Définitions Modélisation de connaissances Contexte Etapes du processus de fusion Modélisation de connaissances Gaussiennes, trapèzes Principe d’extension Combinaison des distributions Formulation des opérateurs testés Résultats Application aux données réelles Conclusions et perspectives
1. Définitions
Contexte de la fusion But avec les données actuelles : déterminer le taux de porosité (avec confiance associée) à partir des diverses mesures d’observables Traitement statistique (D. Breysse) Utilisation pour la fusion de : V3 moyen : moyenne des variances V3 V3 = variance sur valeurs moyennes des 8 éprouvettes d’1 gâchée Corrélation observable / paramètre : Sur les moyennes par gâchées ou sur tous les points. 1. Définitions / Contexte
Processus de fusion : 3 étapes 1. Modélisation des connaissances Construction des distributions de possibilité (x) à combiner : x(u) : degré de possibilité que x=u x(u) = 0 : impossible que x=u x(u) = 1 : rien n’empêche x de valoir u NB : x(u) = 1 u ignorance totale (x) 1 2 3 1 x 2. Combinaison des distributions Choix de l’opérateur de combinaison F : [0,1]n [0,1] (n:nb de distributions à fusionner) Comportement de l’opérateur F( i) min( i) (t-normes) sévère ("conjonctif") ="et" F( i) max( i) (t-conormes) indulgent ("disjonctif") ="ou" min( i) F( i) max( i) prudent ("compromis") Opérateur adaptatif : dépendant du contexte, i.e. degré de conflit... 3. Critère de décision Critère le plus couramment utilisé : maximum de la distribution fusionnée 1. Définitions / Etapes de la fusion
2. Modélisation des connaissances
Modélisation : forme des distributions Distributions les plus courantes : Gaussiennes Valeur moyenne valeur mesurée de l’observable, et à discuter... Trapèzes Exemples : = 0.2 = 0.8 2. Modélisation des connaissances / Gaussiennes, trapèzes
Distribution du paramètre recherché Distribution de l’observable Principe d’extension Distribution du taux de porosité + confiance : R2 pour l’instant 2. Modélisation des connaissances / Principe d'extension
3. Combinaison des distributions
Opérateurs adaptatifs testés (1/2) Bloch : comportement conjonctif, privilégié quand h ~ 1 (accord) comportement disjonctif, privilégié quand h ~ 0 (conflit) où Possibilité 1 2 3 : intersection des distributions quantité de conflit Taux de porosité gestion difficile du conflit aucune gestion du conflit total (pas défini pour h = 0) 3. Combinaison des distributions / Formulation
Opérateurs adaptatifs testés (2/2) Delmotte : disjonctif, privilégié quand ~ 0 (peu de sources fiables) conjonctif, privilégié quand ~ 1 (majorité de sources fiables) où fiabilité globale de la source i , (on prendra ) fiabilité moyenne et deux entiers avec >1 , (on prendra ) NB: la fiabilité globale peut contenir la fiabilité propre + de concordance... (superviseur) prise en compte explicite des fiabilités et de leur répartition (i.e. si sur 100 sources, 99 très fiables et 1 non, alors le résultat tend vers l’intersection des 99) possibilité de considérer le degré de possibilité final comme une confiance 3. Combinaison des distributions / Formulation
Influence de la forme des distributions confiance = 0.99 3. Combinaison des distributions / Résultats
Comportement dans différentes situations confiance = 0.80 confiance = 0.31 Augm. conflit confiance = 0.49 confiance = 0.32 3. Combinaison des distributions / Résultats
4. Application à des données réelles
Test avec des données connues (1/2) G1 – Epr. 2 V US 4088 A Radar 0.64 Résistivité 8.28 Porosité (%) 6.16 taux de porosité : 6.9 % confiance : 0.23 G1 – Epr. 6 V US 4000 A Radar 0.63 Résistivité 15.09 Porosité (%) 6 taux de porosité : 6.2 % confiance : 0.31 4. Application aux données réelles
Test avec des données connues (2/2) G1 – Epr. 8 V US 4521 A Radar 0.64 Résistivité 16.91 Porosité (%) 6.3 taux de porosité : 5.45 % confiance : 0.57 Moyennes G1 V US 4343 A Radar 0.63 Résistivité 14.75 Porosité (%) 6.55 taux de porosité : 6.55 % confiance : 0.81 4. Application aux données réelles
Conclusions et perspectives Choix à discuter : Distribution gaussienne plutôt que trapèze Opérateur de Delmotte le plus adapté (parmi tous les opérateurs testés) Distributions construites en considérant la valeur mesurée comme valeur moyenne Question de représentativité d’une mesure ? Ecart type des distributions calculé à partir de la moyenne des V3 ? Perspective : Taux de porosité + teneur en eau... fusion à n dimensions à partir de corrélations à n dimensions Autre amélioration envisageable : Ajout avis d’expert, fiabilité de concordance... besoin d’un superviseur