Mise en service d’une interface Web UMR 1112 Réponse des Organismes aux Stress Environnementaux Equipe de Biologie des Populations en Interaction Equipe Informatique de Centre DESS BioInformatique Montpellier II Sciences et Techniques du Languedoc Echantillonnage en cultures de Melon Mise en service d’une interface Web pour la saisie, le stockage et l’interrogation de données expérimentales Tuteurs de stage : Laurent Lapchin, Roger Boll Informaticien encadrant : Xavier Bernardet année 2003-2004 Aurore Veyrat
Durabilité de la résistance du melon au puceron Aphis gossypii CONTEXTE DU PROJET Durabilité de la résistance du melon au puceron Aphis gossypii Chez le melon, le gène Vat permet de résister à la colonisation par le puceron Des cas d’installation du puceron sur melon Vat ont été signalés => Mesurer l’ampleur de ce phénomène et récupérer les souches résistantes à Vat Echantillonnage 2004: - 2 types de culture: serre et plein champ 3 à 4 sites d’observation distants Sur chaque site 2 parcelles étudiées : melon Vat, résistant melon –Vat, sensible
Objectif du stage BioInformatique Conception et mise en service d’une interface WEB de saisie des données melon Mise en place d’une base sous MySQL pour le stockage des données 3. Débuggage de l’utilitaire de saisie rosier développé en 2003
Cahier des charges de l’interface de saisie Contrôle d’accès à l’interface (serveur) et à la base de données Fiabilité, rapidité et confort de la saisie - Contrôle d’intégrité référentielle des données - Contrôle de vraisemblance - Absence de données orphelines ou de doublons Développement de modules - d’interrogation et de correction - de mise en forme des données Audit de la saisie des données 2004
Le protocole expérimental Suivi de colonies Suivi parcellaire Suivi spatio-temporel d’une colonie à l’échelle d’un foyer Surface 1/16ème de m², centrée sur la colonie Suivi spatio-temporel de l’infestation (?) d’une parcelle Transect de 8 placettes (1 m²) centré dans la parcelle La mesure du couvert végétal (1 m²) et le sous-échantillonnage du nombre d’organes (1/16ème m²) servent à calculer les densités au m² Les positions des organes observés dans les foyers et les placettes sont repérées par des coordonnées (x,y)
Les données expérimentales Les données expérimentales sont des observations en classes visuelles d’abondance sur des organes végétaux (feuilles, apex), ainsi que des comptages d’organes par unité de surface. Deux types de suivi : de colonie et/ou parcellaire L’enregistrement des données élémentaires (organe) permet les regroupements aux différentes échelles : organe, foyer, placette, parcelle, zone culturale… On a donc : N nombre de pucerons/organe pucerons/type d’organe pucerons/placette (m²) pucerons/parcelle (m²) pucerons/foyer Répété pour chaque date * expérimentation (313 relevés)
L’utilitaire de saisie Construction du formulaire L’administrateur de données délivre un password à l’utilisateur et lui autorise la saisie sur des références d’expérimentation melon uniquement.
L’utilitaire de saisie Construction du formulaire L’utilisateur construit la grille d’échantillonnage correspondant à l’expérimentation. La connexion à la base de données nécessite un password
L’utilitaire de saisie Saisie à partir du formulaire Le formulaire de saisie correspond à la feuille de terrain et représente tous les organes observés, dans chaque placette. Sélection par bouton radio, les classes visuelles d’abondances sont initialisées à 0.
L’utilitaire de saisie Saisie à partir du formulaire
L’utilitaire de saisie Envoi des données Les données définitivement saisies sont insérées dans les tables MySQL (java, JavaScript), les fichiers .txt correspondant sont envoyés à l’administrateur de données Fichiers de données Inra Sophia temporel.txt organe.txt spatial.txt Utilisateur MySQL Pièce jointe Administrateur de données Oracle
L’utilitaire de saisie Affichage des résultats Histogrammes de fréquence des classes visuelles d’abondance par type d’organes On peut obtenir l’affichage de 3 dates successives
L’utilitaire de saisie Corrections Un module « corrections » permet l’interrogation et la ressaisie des données erronées (date entière)
AUDIT DE L’INTERFACE DE SAISIE 3 critères : Compréhension / Ergonomie Construction de la feuille de saisie Validité des données saisies
AUDIT DE L’INTERFACE DE SAISIE Compréhension / Ergonomie Cinq techniciens et stagiaires ont saisis 132 relevés parcellaires Soit 1056 placettes et 22110 observations en classe + Peu de questions sur le fonctionnement de l’interface (les utilisateurs ont tous participé aux observations) - 2 déclarations de saisie de mot de passe par relevé (appels contrôlés en entrée et en sortie à la base de données) = Confort oculaire mais monotonie inévitable (cause d’erreur)
AUDIT DE L’INTERFACE DE SAISIE Construction de la feuille de saisie 13% de feuilles de saisie inexploitables. Explications : - Inversion des coordonnées lignes-colonnes : 3 cas ; - Erreur dans les pourcentages de couvert végétal, 1 au lieu de 100% : 2 cas ; - Saisie avec date erronée : 2 cas ; - Confusion dans les coordonnées des placettes : 2 cas ; - Nombre d’organes observés incorrect : 1 cas ; Erreurs imparables de lecture de la feuille de terrain : saisie trop rapide et/ou monotonie de l’opération. Initialisation automatique des coordonnées des placettes d’une même expérimentation Affichage graphique de la grille avant validation Contrôle des valeurs aberrantes du nombre d’organes observés
AUDIT DE L’INTERFACE DE SAISIE Validité des données saisies Échantillon de 19 relevés non nuls, 152 placettes, 3213 observations en classes Le remplissage direct des feuilles de saisie nécessitait 396 sélections radio bouton (les valeurs initialisées à 0) 0,6% d’erreur globale mais 5% d’erreur de sélection 14/22 erreurs = oublis de saisie (sur 2 relevés chargés) 8/22 confusions entre classe d’abondance ou ligne de saisie Attention particulière aux relevés complexes Utilisation de boutons radio plus espacés Saisie par lecture optique, en cours avec URIH (rosier)
AUDIT Application Tableur Discussion 15 minutes par relevé Masques de saisie modifiables Taux global d’erreur 5% (D. citrus) Superpositions de données ou création de dates ou de placettes dues aux copier / coller multiples pour adapter le masque Gestion des fichiers locale avant insertion dans la base de données Programmation de macros pour les graphes Interrogation / correction des données nécessite une interface (Access) 7 minutes par relevé Création du formulaire à chaque relevé Taux global d’erreur 0,6% Impossible avec l’application Contrôle des doublons à la saisie Envoi automatique des données à l’administrateur Affichage des résultats par l’application Fonction disponible dans l’application laborieux et source d’erreurs
CONCLUSIONS La diversité des travaux réalisés durant ce stage ainsi que la rencontre entre chercheurs et informaticiens s’est révélée très bénéfique pour la mise en place du projet. Les chercheurs sont très attachés à la feuille de terrain (mémoire physique du relevé). L’application est actuellement exploitable pour le projet melon, résultats satisfaisant En accord avec la démarche qualité pour l’acquisition des données expérimentales Améliorable : écriture d’un module de représentation spatiale Démonstration d’adaptation générique de l’informatique à une problématique scientifique
Préparation de la migration base Oracle vers ProgreSQL PERSPECTIVES Préparation de la migration base Oracle vers ProgreSQL Intégration des procédures de modélisations quantitatives aux interfaces de saisie Conception d’un système de création d’interfaces : données de terrain ou de laboratoire Accessible à partir du site Web de l’équipe BPI http://bpi.antibes.inra.fr
REMERCIEMENTS Merci à Laurent LAPCHIN, Eric LOMBAERT, Xavier BERNARDET, Stephen AMBROGIO Merci à toute l’équipe BPI et particulièrement Michèle SALLES et Roger BOLL Enfin merci à vous pour votre attention
Des données complexes… Exemple : calcul du nombre de pucerons d’une placette (1 m²) On a observé 5 feuilles âgées : l’étalonnage nous indique = 28 pucerons/FA On a observé 5 feuilles jeunes : l’étalonnage nous indique = 7 pucerons/FJ On a observé tous les apex (15): l’étalonnage nous indique = 2 pucerons/AP D’autre part, le couvert végétal de cette placette est de 70% et les nombres de feuilles âgées et jeunes dans le sous-ensemble de 1/16ème de m² sont respectivement 5 et 10. Le calcul du nombre de pucerons par placette est le suivant: (28*5*16 *0.70)+(7*10*16*0.7)+(15*2)= 2382 pucerons dans la placette