La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 EDA2005 3 INRA / UMR IATE Bat. 31, 2 place Viala 34060 Montpellier Cedex 01 1 Unité INRA - 16, rue Claude Bernard 75231 PARIS Cedex 05 2 UMR.

Présentations similaires


Présentation au sujet: "1 EDA2005 3 INRA / UMR IATE Bat. 31, 2 place Viala 34060 Montpellier Cedex 01 1 Unité INRA - 16, rue Claude Bernard 75231 PARIS Cedex 05 2 UMR."— Transcription de la présentation:

1 1 EDA INRA / UMR IATE Bat. 31, 2 place Viala Montpellier Cedex 01 1 Unité INRA - 16, rue Claude Bernard PARIS Cedex 05 2 UMR INA P-G / INRA MIA UER dinformatique 16, rue Claude Bernard PARIS Cedex 05 A Data Warehouse that Gathers Several Formalisms to Capture Data Heterogeneity, Imprecision and Incompleteness in the Field of Food Safety Patrice Buche 1 Juliette Dibie-Barthélemy 2 Ollivier Haemmerlé 2 Rallou Thomopoulos 3

2 2 Plan de lexposé Contexte Présentation du système MIEL++ Le sous-système XML Conclusion et perspectives

3 3 Contexte Application Analyse du risque chimique et microbiologique dans les aliments. Données Données scientifiques provenant de la bibliographie internationale, de sources industrielles, institutionnelles, … Notre travail : Créer un outil pour: stocker les données; interroger les données. SymPrevius,

4 4 Spécificités des données Incomplètes Imprécises Hétérogènes Évolutives Contexte Contenu des données Comportement de germes pathogènes (e.g.: Listeria) et prévalence de contaminants chimiques (e.g.: Mercure) dans les matières premières et les produits transformés au cours du processus de transformation (chauffage, conservation, …) et de distribution. Requêtes floues sur un entrepôt de données ouvert sur le Web Données représentées par des distributions de possibilité Données faiblement structurées

5 5 Plan de lexposé Contexte Présentation du système MIEL++ Le sous-système graphes conceptuels Le sous-système XML Conclusion et perspectives

6 6 relational database SQL query Tuples MIEL++ graphical user interface queries answers RDB wrapper Global schema OntologyViews MIEL++ : architecture globale Query graph conceptual graph base Answer graphs CG wrapper XML base Xquery query XML fragments XML wrapper

7 7 Un schéma relationnel: ensemble de relations définies dans les bases de données locales de lentrepôt (la relation FoodpH) MIEL++ – Ontologie Une taxonomie de termes Ensemble dattributs interrogeables (aliments, contaminants...), chacun ayant un domaine de définition : Numérique (valeur de pH), symbolique (liste de noms dauteurs), symbolique hiérarchisé. Whole Milk HalfSkim Milk Milk Meat Food Skim Milk Poultry Beef Pork Pasteurized Milk Pasteurized WholeMilk

8 8 MIEL++ – Syntaxe dune requête {a 1, …, a p | Vue(a 1, …, a n ) (a p+1 v p+1 ) … (a m v m )} 1 p m n Vue dans laquelle la requête est posée Attributs de projection Critères de sélection

9 9 Critères de sélection flous (attr val) attribute name fuzzy set (Temperature HumanBodyTemperature) 3536,537,543°C HumanBodyTemperature 37, ,36 1 Expressions de préférences

10 10 MIEL++ – Forme dune réponse Réponse à une requête dans MIEL++ {a 1, …, a p | Vue(a 1, …, a n ) (a p+1 v p+1 ) … (a m v m )} 1 p m n tuple { [a 1, …, a p ], }

11 11 Degrés dadéquation dune donnée floue à un critère flou Les sous-ensembles flous à comparer doivent être définis sur le même domaine Q D D Q mesure dinclusionmesure dintersectionSignification Exemple N(Q;D) = 1 - (Q;D) = inf (max (µ Q ;1- D )) (Q;D) = sup (min (µ Q ; D )) Formule Degré de nécessité [Dubois&Prade 88] Degré de possibilité [Zadeh 78] Degrés dadéquation

12 12 Fermeture dun sous-ensemble flou sur domaine hiérarchisé D satisfait Q avec le degré de possibilité (Q,D) = sup (min (µ Q ; π D )) = 0,6 0 1 Milk Pasteurized WholeMilk 0,6 0 1 Skim Milk Pasteurized Milk 0,4 0,2 Whole Milk requête Q données D Whole Milk HalfSkim Milk Milk Meat Substrate Skim Milk Poultry Beef Pork Pasteurized Milk Pasteurized WholeMilk 0,6 1 µQ 0, , Whole Milk HalfSkim Milk Milk Meat Substrate Skim Milk Poultry Beef Pork Pasteurized Milk Pasteurized WholeMilk 0,2 1 0,4 πD

13 13 Plan de lexposé Contexte Présentation du système MIEL++ Le sous-système XML Conclusion et perspectives

14 14 Base XML floue: alimentation avec AQWEB ArticleValeur pH Fromage de chèvre6.6 Oignon rouge5.2 (Article, Aliment)(Valeur pH, pH) Fromage de chèvre Aliment = {(fromage,0.66) (lait de chèvre,0.5)} 6.6 pH = 6.6 Oignon rouge Aliment = {(oignon dEgypte, 0.5), (chou rouge, 0.5)} 5.2 pH = 5.2 Extraction de tableaux FSML XML base sml ontologie Base de graphes conceptuels Base de données relationnelles MIEL++ AlimentpH(Aliment, pH)

15 15 Base XML Q1 : {a,b | V1(a,b,c) (c HumanBodyTemperature)} Sélection des arbres vues Génération de requêtes XML A1 = {w1, …, wn, 1} A2 = {x1, …, xn, 2} A3 = {y1, …, yn, 3} A4 = {z1, …, zn, 4} Valuation de la requête Exécution dune requête XML

16 16 Requête Exécution dune requête XML : un exemple Tableau Contenu Aliment ValF Item fromage MD 0.66 ValF Item lait de chèvre MD 0.5 pH 6.6 Source ligneRel AlimentPH originalVal fromage de chèvre finalVal DFS Tableau Contenu Aliment ValF Item fromage MD 1 ValF Item fromage frais MD 0.5 pH ql+pl Source ligneRel AlimentPH originalVal ql+pl finalVal ql+pl+sl DFS La réponse : { =0.66, fromage de chèvre, 0.66/fromage+0.5/lait de chèvre, pH=6.6} Tableau Contenu Aliment ValF ItemMD pH ql Source ligneRel AlimentPH originalVal ql finalVal ql DFS Vue Données

17 17 Conclusion MIEL++ : architecture médiateur BD relationnelle étendue au flou (environ données), en production GC étendus au flou (environ 150 graphes conceptuels), prototype avancé validé XML flou (156 tableaux issus de documents scientifiques), étude de pertinence effectuée, prototype avancé en cours de finalisation

18 18 Perspectives Extension du langage MIEL++: jointure entre sources de données Application au calcul de lexposition des individus au risque chimique 2 sources de données: Base de contamination des aliments Base de consommation des aliments par des individus AQWEB: Prise en compte de lincertitude dans la méthodologie dannotation sémantique et conséquence sur linterrogation MIEL++


Télécharger ppt "1 EDA2005 3 INRA / UMR IATE Bat. 31, 2 place Viala 34060 Montpellier Cedex 01 1 Unité INRA - 16, rue Claude Bernard 75231 PARIS Cedex 05 2 UMR."

Présentations similaires


Annonces Google