Fusion de données SENSO

Slides:



Advertisements
Présentations similaires
Mais vous comprenez qu’il s’agit d’une « tromperie ».
Advertisements

Délégation à l’Emploi et aux Formations
Introduction à l’analyse
Soutenance du stage de DEA.
Distance inter-locuteur
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Présenté à Par. 2 3Termes et définitions 3.7 compétence aptitude à mettre en pratique des connaissances et un savoir-faire pour obtenir les résultats.
ETUDE DU NEWS BOY PROBLEM
A. Cornuéjols IAA (basé sur Rob Schapires IJCAI99 talk) Combiner des apprenants: le boosting.
Caractériser les précipitations intenses du MRCC
RECONNAISSANCE DE FORMES
Test statistique : principe
Les TESTS STATISTIQUES
Analyse de Résultats de Simulation
Mise en œuvre d’une démarche et d’un outil de gestion de « connaissances métier » basés sur la collaboration. Cyril BEYLIER
Vers un outil d’aide à la conception des cannelures à flancs en développante de cercle La recherche effectuée lors de ma thèse a consisté à décrire le.
Les TESTS STATISTIQUES
Les tests d’hypothèses
LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.
SENSO – Bordeaux 15 et 16 mars 2007
Bouyekhf Rachid-Lyuboumir Gruitch Laboratoire SeT UTBM
Construction de Box-Plot ou diagrammes en boîtes ou boîtes à moustaches Construire une boîte à moustaches …
1 Analyse de la variance multivariée Michel Tenenhaus.
variable aléatoire Discrète
Distributivité: Mode demploi Le développement La factorisation Exercices développement Exercices factorisation.
Les requêtes La Requête est une méthode pour afficher les enregistrements qui répondent à des conditions spécifiques. La requête est donc un filtre.
PROMOTION 2012 Les résultats. Baccalauréat général et technologique Filière STG CFE STG COM RH STG MERC LES 1ES 2S1S2S3TOTAL Nb de candidats
Un neurone élémentaire
Application des algorithmes génétiques
Dynamique dopinions sur réseaux Amblard F.*, Deffuant G.* *C emagref-LISC.
Vuibert Systèmes dinformation et management des organisations 6 e édition R. Reix – B. Fallery – M. Kalika – F. Rowe Chapitre 1 : La notion de système.
Le soccer & les turbans Sondage mené par lAssociation détudes canadiennes 14 juin 2013.
Les Systèmes Multi-Agents pour la Gestion de Production
Présentation générale
Fusion de données : Vision probabiliste de la fusion
Capital économique analyse et reporting pour Fortis Assurances
Etude longitudinale d’essais multilocaux: apports du modèle mixte
Cours Corporate finance Eléments de théorie du portefeuille Le Medaf
Méthode des k plus proches voisins
Zouhair Chaib, Antoine Ghosn, Alain Daidié
SCIENCES DE L ’INGENIEUR
1.Un rang de données multicolores 2. Deux permutations des n premiers entiers 3. b permutations des k premiers entiers 4. Choix de n points dans [0,1]
Interaction entre les possibles facteurs de risque
Commentaires sur les biais écologiques et les échelles non emboîtées
RACINES CARREES Définition Développer avec la distributivité Produit 1
Courbes de Bézier.
La statistique descriptive
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Les modèles linéaires (Generalized Linear Models, GLM)
Corrélation Principe fondamental d’une analyse de corrélation
Fourmis artistiques ou l'art artificiel pictural et musical
Aire d’une figure par encadrement
Écart moyen et écart type
Les mesures de dispersion Camp de jour Âges Groupe 1: 7,8,9,10,11,12,13 Âges Groupe 2: 10,10,10,10,10,10,10 Caractériser ces groupes par 1 seule mesure.
Régression linéaire (STT-2400)
Délégation à l’Emploi et aux Formations
ASI 3 Méthodes numériques pour l’ingénieur
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
1 - Programme de Seconde (juin 2009) Statistique et probabilités
APPROCHE PSYCHOLOGIQUE DE L’EXPERIENCE REEDUCATIVE
1. Présentation générale du système
1 Introduction à la théorie des tests. 2 Plan I- choix entre 2 paramètres de tendance centrale Choix entre 2 proportions pour un caractère qualitatif.
Joseph CHONG, Mauduit Pergent
Monitoring Détection de séquences vidéo en temps réel dans une grande base de données Julien Law-to 23/07/2004.
ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage
Rappels de statistiques descriptives
1 Alain Casali Christian Ernst Extraction de Règles de Corrélation Décisionnelles 29 Janvier 2009.
1 / 23 GDR-ISIS Avancées en fusion de données Paris 11 février 2010 Fusion de données appliquée à l'END du béton V. Garnier M.A. Ploix J. Moysan D. Breysses.
Fusion de paramètres en classification Parole/Musique Julie Mauclair – Equipe Parole Julien Pinquier – Equipe SAMoVA.
Introduction aux statistiques Intervalles de confiance
Transcription de la présentation:

Fusion de données SENSO - Bordeaux / Jeudi 15 Mars 2007 - Fusion de données SENSO M.A. PLOIX, V. GARNIER, J. MOYSAN LCND, Laboratoire de Caractérisation Non Destructive Université de la Méditerranée, IUT, Av Gaston Berger, 13625 Aix-en-Provence

Plan Définitions Modélisation de connaissances Contexte Etapes du processus de fusion Modélisation de connaissances Gaussiennes, trapèzes Principe d’extension Combinaison des distributions Formulation des opérateurs testés Résultats Application aux données réelles Conclusions et perspectives

1. Définitions

Contexte de la fusion But avec les données actuelles : déterminer le taux de porosité (avec confiance associée) à partir des diverses mesures d’observables Traitement statistique (D. Breysse)  Utilisation pour la fusion de : V3 moyen : moyenne des variances V3 V3 = variance sur valeurs moyennes des 8 éprouvettes d’1 gâchée Corrélation observable / paramètre : Sur les moyennes par gâchées ou sur tous les points. 1. Définitions / Contexte

Processus de fusion : 3 étapes 1. Modélisation des connaissances Construction des distributions de possibilité (x) à combiner : x(u) : degré de possibilité que x=u x(u) = 0 : impossible que x=u x(u) = 1 : rien n’empêche x de valoir u NB : x(u) = 1 u  ignorance totale (x) 1 2 3 1 x 2. Combinaison des distributions Choix de l’opérateur de combinaison F : [0,1]n  [0,1] (n:nb de distributions à fusionner) Comportement de l’opérateur F( i)  min( i) (t-normes)  sévère ("conjonctif") ="et" F( i)  max( i) (t-conormes)  indulgent ("disjonctif") ="ou" min( i)  F( i)  max( i)  prudent ("compromis") Opérateur adaptatif : dépendant du contexte, i.e. degré de conflit... 3. Critère de décision Critère le plus couramment utilisé : maximum de la distribution fusionnée 1. Définitions / Etapes de la fusion

2. Modélisation des connaissances

Modélisation : forme des distributions Distributions les plus courantes : Gaussiennes Valeur moyenne  valeur mesurée de l’observable, et à discuter... Trapèzes Exemples :  = 0.2  = 0.8 2. Modélisation des connaissances / Gaussiennes, trapèzes

Distribution du paramètre recherché Distribution de l’observable Principe d’extension Distribution du taux de porosité + confiance : R2 pour l’instant 2. Modélisation des connaissances / Principe d'extension

3. Combinaison des distributions

Opérateurs adaptatifs testés (1/2) Bloch : comportement conjonctif, privilégié quand h ~ 1 (accord) comportement disjonctif, privilégié quand h ~ 0 (conflit) où Possibilité 1 2 3 : intersection des distributions   quantité de conflit Taux de porosité gestion difficile du conflit aucune gestion du conflit total (pas défini pour h = 0) 3. Combinaison des distributions / Formulation

Opérateurs adaptatifs testés (2/2) Delmotte : disjonctif, privilégié quand  ~ 0 (peu de sources fiables) conjonctif, privilégié quand  ~ 1 (majorité de sources fiables) où  fiabilité globale de la source i , (on prendra )  fiabilité moyenne et deux entiers avec >1 , (on prendra ) NB: la fiabilité globale peut contenir la fiabilité propre + de concordance... (superviseur) prise en compte explicite des fiabilités et de leur répartition (i.e. si sur 100 sources, 99 très fiables et 1 non, alors le résultat tend vers l’intersection des 99) possibilité de considérer le degré de possibilité final comme une confiance 3. Combinaison des distributions / Formulation

Influence de la forme des distributions confiance = 0.99 3. Combinaison des distributions / Résultats

Comportement dans différentes situations confiance = 0.80 confiance = 0.31 Augm. conflit confiance = 0.49 confiance = 0.32 3. Combinaison des distributions / Résultats

4. Application à des données réelles

Test avec des données connues (1/2) G1 – Epr. 2 V US 4088 A Radar 0.64 Résistivité 8.28 Porosité (%) 6.16  taux de porosité : 6.9 % confiance : 0.23 G1 – Epr. 6 V US 4000 A Radar 0.63 Résistivité 15.09 Porosité (%) 6  taux de porosité : 6.2 % confiance : 0.31 4. Application aux données réelles

Test avec des données connues (2/2) G1 – Epr. 8 V US 4521 A Radar 0.64 Résistivité 16.91 Porosité (%) 6.3  taux de porosité : 5.45 % confiance : 0.57 Moyennes G1 V US 4343 A Radar 0.63 Résistivité 14.75 Porosité (%) 6.55  taux de porosité : 6.55 % confiance : 0.81 4. Application aux données réelles

Conclusions et perspectives Choix à discuter : Distribution gaussienne plutôt que trapèze Opérateur de Delmotte le plus adapté (parmi tous les opérateurs testés) Distributions construites en considérant la valeur mesurée comme valeur moyenne  Question de représentativité d’une mesure ? Ecart type des distributions calculé à partir de la moyenne des V3 ? Perspective : Taux de porosité + teneur en eau...  fusion à n dimensions à partir de corrélations à n dimensions Autre amélioration envisageable : Ajout avis d’expert, fiabilité de concordance...  besoin d’un superviseur