La sécurité alimentaire L’existant Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire L’existant Objectifs du sous-projet et réalisations Conclusion
L’analyse des risques Création de l’OMC en 1994 Accords de Marrakech SPS agreement (mesures sanitaires et phytosanitaires) commerce international de la nourriture, protection de la santé des humains analyse des risques L ’analyse des risques nécessite des données de qualité systèmes efficaces de collecte d’informations (n’existent pas) données nécessaires : contaminations initiales de matières premières, contaminations de produits finis, informations sur l’effet de facteurs, informations sur l’exposition du consommateur Le but est de pouvoir réagir rapidement à une crise prévenir une crise au lieu de simplement réagir
Les risques alimentaires Risques physico-chimiques présence de métaux lourds (ou de dioxyne...) dans les matières premières Risques microbiologiques présence de bactéries pathogènes (ex. Listeria monocytogenes) dans les matières premières, les usines, le réfrigérateur du consommateur facteurs qui influencent le comportement des bactéries température, pH, aW (activité de l’eau)
Les bases de données existantes En France bases sur les contaminations chimiques (DGCCRF) et les consommations (INSEE) bases microbiologiques spécialisées (charcuterie/CTSCCV) privées (viande/Bigard) Dynacard (Danone, integré dans Sym’Previus) Dans le monde bases européennes sur les contaminations (projets) Grande-Bretagne (Combase) et Etats-Unis (PMP) : données de croissance sur des milieux de culture Nouvelle-Zélande, Australie et Danemark : dédiées à un type de produit (poisson...) ou une bactérie
Le projet Sym’Previus Début en novembre 99 / version 1 en 2004 Outil d’aide à l’expertise en hygiène et sécurité alimentaire pour les industriels de l’agro-alimentaire, les instituts techniques, de recherche et les pouvoirs publics (DGAL) originalité : résultats sur aliments Objectif : combiner Base de données expérimentales sur aliment Logiciel de simulation du développement des micro-organismes
Consortium GIS
Les objectifs de Sym ’Previus Constituer une base de connaissances qui contient des données bibliographiques validées et saisies par des experts des données expérimentales acquises dans le cadre du projet des données industrielles (contamination initiales…) Créer des requêtes « consolidées », synthèses du comportement d’un micro-organisme Caler les modèles de simulation et confronter les résultats des simulations avec des données expérimentales Quel utilisateur : utilisation sous « contrôle » d’expert
Exemple de données de la base Sym’Previus
Caractéristiques de la base Sym’Previus 2 types d’information niveaux de contamination d’aliments par des germes pathogènes impact de différents facteurs (température, process...) sur le comportement des germes (stabilité, croissance, décroissance) Sources plus de 550 articles de la bibliographie internationale, sélectionnés par des experts en microbiologie données industrielles anonymées Structure schéma relationnel (environ 80 tables) complexité due à l’hétérogénéité des données sources d ’information variées nombreuses requêtes des membres du groupe de travail qui a validé le schéma
Quelques caractéristiques des données 1) Données incomplètes 2) Données imprécises [Zwietering 92] : On products with a low water activity, spore-forming microorganisms can be present (no growth) [Augustin 96] : Decimal reduction time of Listeria monocytogenes in skimmed milk at 63.3°C is between [25.8, 28.2] (in sec) [Rangasamy,1993] : Le niveau de contamination du lait cru par Bacillus cereus est inférieur à 10 CFU/ml 3) De nature très différentes ne « matchent » pas toujours avec la structure de la BDR
Système d’interrogation unifiée : MIEL Stockage structuré en tables : Base de données relationnelle Stockage faiblement structuré : Graphes conceptuels Information correspondant à la structure de la BD Information en marge de la structure de la BD
Langage d’interrogation du MIEL Requête Q = {V, a1, …, an, <an+1, vn+1>, …, <am, vm>} Réponse A = {<a1, v1>, …, <an, vn>}
Données incomplètes et imprécises sous-ensembles flous MIEL Données imprécises Requête floue 1) Interrogation élargie par l’utilisateur : représentation de préférences pour les critères de sélection par le moteur d ’interrogation : relation de similarité entre valeurs Res(Whole egg, Egg + salt/sugar) = 0.33 2) Représentation de données imprécises The fuzzy set framework is a sound scientific choice : 1) to manage enlargement in order to avoid an empty set of answer : the enlargement is controlled by the user : fuzzy sets represent gradual preferences by the engine : fuzzy similarity relations which permit to retrieve information which do not correspond to the user ’s preferences but considered semantically close 2) The fuzzy set framework restated in the theory of possibility permits to represent imprecise information. The same mathematical object, a fuzzy set, may represent an imprecise value.
Exemple de GC de la base
Interrogation de la base de GC Base GC Q = {V, a1, …, an, <an+1, vn+1>, …, <am, vm>} Génération de GC requêtes A1 = {w1, …, wn} A2 = {x1, …, xn} A3 = {y1, …, yn} A4 = {z1, …, zn} Projection
Objectifs du sous-projet 1 Quelques questions auxquelles le sous-projet 1 doit répondre quels types de données utiles pour l’entrepôt trouve-t-on sur le Web ? comment faire cohabiter données trouvées sur le Web et données déjà stockées ? quels traitement veut-on faire sur les données provenant du Web (monitorage) ? Intégration explicite des données aux tables préexistantes ? Interrogation via un schéma global ? quelles connaissances relatives à la fiabilité des données ?
Objectifs du sous-projet 1 Détail des réalisations analyse des besoins détermination avec experts des manques prioritaires dans la base Sym’Previus analyse du contenu d’autres bases identification des éléments que l’on peut trouver sur le Web production liste de spécifications listes de mots-clés permettant de guider la recherche sur le Web
Réunion du 27 janvier 2003 Présentation de l’existant BD relationnelle BK graphes conceptuels Ce que l’on peut trouver sur le Web présentation de quelques sites intéressants Discussion sur la suite caractériser les infos intéressantes, caractériser les sites ou pages intéressants, réfléchir à l’extraction des informations intéressantes CR disponible sur le site e.dot
Réunion du 11 février 2003 Point sur l’avancement du sous-projet 2 présence de Benoît Leporq, IR INRA Point sur l’avancement du sous-projet 2 Informations que l’on aimerait ajouter dans l’entrepôt informations concernant le pH, l’aw et la teneur en acides gras des aliments informations extraites de sites bibliographiques Critères de choix ou de rejet d’une page titre de revues, description du protocole expérimental, noms des auteurs, noms des bactéries, mots-clés Critères de validité des infos réputation de certains sites, présence de références bibliographiques, redondance, confrontation
Documents produits Hiérarchie de germes pathogènes Liste d’auteurs (158 germes + 104 liens) Lactobacillus>Lactobacillus plantarum Listeria>Listeria innocua Listeria>Listeria monocytogenes Liste d’auteurs (1107 noms) Amaro-Lopez;M. Ammar;M.S. Ammendolia;M.G. Andersen;J.K. Anderson;J.G. Hiérarchie de produits génériques (420 noms + traduction + 414 liens) Fromage à pâte molle>Camembert Poisson fumé>Carpe fumée Fruits et légumes frais>Betterave Liste de « synonymes » (604 synonymes) Poulet: blanc et aile;blanc et aile de poulet Fromage frais;Cottage cheese Fromage frais;Mozarella
Documents produits Combinaisons recherchées Liste des germes {cinétique, croissance, décroissance, survie, kinetic, growth, decrease, survival, inactivation} Liste des germes {"pH", "aw", "acide gras", "acides gras", "fatty acid"} Liste des produits Liste des auteurs
Conclusion Des documents permettant le crawling du Web ont été produits L’avis d’un expert français financé par l’INRA a pu être recueilli afin de déterminer le type d’informations utiles pour l’entrepôt MAIS la troisième réunion prévue le 2 avril a été annulée (impossibilité de financer le déplacement et les honoraires d’un expert Hollandais) => RETARD