Interprétation de données d’analyses protéomiques sur une grille de calcul : Utilisation d’algorithmes libres pour l’identification MS/MS. Christine CARAPITO.

Slides:



Advertisements
Présentations similaires
Couplage BASE/Outils de Data Mining Pierre LAURENCE
Advertisements

La Gestion de la Configuration
Atelier régional pour la planification du PNUAD. Introduction Le chef déquipe/de délégation présente les membres de son équipe. Inventer une devise ou.
Mesures dans le domaine fréquentiel
Le Grid Computing Par Frédéric ARLHAC & Jérôme MATTERA.
LE CONTRAT CADRE DE SERVICE
Présentation de GeneProt
Intégration du système de production LHCb sur la DataGRID V. Garonne, CPPM, Marseille Réunion DataGRID France, 13 fv fév
1 Nicole Tourigny - Le raisonnement à partir de cas : une aide à la formation en analyse de sécurité routière Le raisonnement à partir de cas : une aide.
Mathilde Bouchet Master 2 SIG et gestion de lEspace Septembre 2007 LES DONNEES LIEES AUX ESPACES NATURELS: ETUDE ET PROPOSITION POUR UNE MEILLEURE GESTION.
Les forums de discussion
Développement d’applications Intranet
Plateforme de gestion de données de capteurs
SIMULATION WATERFALL & INSPECTION
d’un article scientifique
Systèmes de requêtes par billets
Logiciel dévaluation et de maîtrise des risques de la création ou du rachat dentreprise CréaSûr est issue de la technologie AutoScore qui a été développé
Frédéric Amblard, Guillaume Deffuant – Cemagref LISC 22 Octobre 2002 – Table ronde Simulation AFH Nantes SimExplorer: un outil logiciel daide à lexploration.
Recherche d’un thème de projet Identification d’un besoin
DPC et APP en 2014 : les nouveaux fondamentaux pratiques
BERNARDIN Benoît Lycée Louis Pergaud
Enseignement Spécifique (Coefficient 7) Enseignements de spécialité (Coefficient 9)
Introduction à la Gestion de lInformation (IM) Picture: Janet Ousley.
IFT – Ingénierie des connaissances Exposé darticle « Applying a library of problem-solving methods on a real-life task » Piet-Hein Speel et Manfred.
Structures de données IFT-2000 Abder Alikacem Standard Template library Édition Septembre 2009 Département dinformatique et de génie logiciel.
Projet Génie Logiciel & UML, Bases de Données & Interfaces
Lun des outils de travail de lenseignant coordonnateur TICE au département de français : le portfolio Beira, janvier 08.
Simulation du pliage d’une pièce de sécurité automobile
Réalité virtuelle et Représentation de Données Complexes
En calcul mental Trois types dobjectifs peuvent être distingués :
Etienne Danchin & Amandine Campan Présentation interne, pôle Santé des Plantes, Sophia - Antipolis Mercredi 21 avril 2010 Grille PACA ProActive : retour.
Soutenance de stage 16 Mai au 5 Août 2011
Soutenance de stage 16 Mai au 5 Août 2011
Centre de Calcul de l'IN2P3 - Lyon Toulouse - Lyon, 21 décembre 2004 Les projets de grille au Centre de Calcul de l’IN2P3.
 L’informatique ne cesse de se développer. Elle est devenue une science à part entière, fondamentale et appliquée.  En effet, elle intervient de plus.
Amélioration de la performance des SISR et de l’utilisation de l’information pour la gestion des systèmes de santé CESAG, Dakar, du 03 au 21 Mai 2010 Solutions.
Interface Homme-machine (interaction humain-machine)
Vers une exploitation orientée performance Alain Le Saout Responsable Outils.
L’archive ouverte HAL-SHS Christine Berthaud, Agnès Magron Service d’Ingénierie Documentaire Institut des Sciences.
Approche Cross layer Dr Mekkakia Maaza Zoulikha Cours M2 SIR
L’évaluation économique des scénarios sylvicoles (activité 6.2) Application Le 3 novembre 2010 Formation PAFI.
Présentation février 2002 Relations Visiblement Meilleures.
Objectifs - Leçon T6-F5 Comprendre le rôle des TI dans les domaines financier et comptable Comprendre l’analyse du risque en évaluation de projet d’investissement.
Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC – Equipe ISLanD Apport d’outils d’informatique documentaire à l’analyse de forums de.
Cours 1: Définition de l’équipe de projet
Création d’une base de données pour l’intégration de données génétiques et l’aide à la sélection de gènes candidats Franck De-graeve Master ASE.
( ) Collège de Maisonneuve
Période 2 Séance 61 Les icones dans les environnements informatiques standardis é s Daniel Peraya M. Viera, M. Acosta TECFA Universit é.
La sécurité des transactions et Signatures Electroniques
Logiciel pour la résolution des programmes linéaires : « LINDO »
UNIVERSITÉ KASDI MERBAH OUARGLA DÉPARTEMENT DE GÉNIE DES PROCÉDÉS
Programme d’apprentissage avancé EFSA Session 1.3. Types d’EFSA dans la Région.
Centre Hospitalier Universitaire de Liège Semaine de la Sécurité des Patients Méthode d’évaluation des faiblesses et des étapes critiques du processus.
MICROSCOPIE : Contrôle de Qualité Externe (CEQ)
ECOLE DES HAUTES ETUDES COMMERCIALES RECHERCHE MARKETING Dr. KHERRI Abdenacer Mai
ECOLE DES HAUTES ETUDES COMMERCIALES RECHERCHE MARKETING Dr. KHERRI Abdenacer Mai
Gestion des documents internes avec SQL Server 2005 Date de publication : janvier 2006.
IAEA International Atomic Energy Agency Réglementation 1ère partie Rôle et Structure de la réglementation Jour – présentation 5 (1)
INTRODUCTION AUX BASES DE DONNEES
Développement du jeu Ricochet Robots pour Android
LYCEE E. BRANLY – 04 février 2016Académie d’Amiens – Stéphane VERCLEVEN Thème : Evaluation avec SACOCHE Formation d’Initiative Locale (FIL) Durée 2 heures.
Atelier de démarrage de l’étude d’analyse des besoins et opportunités en matière de renforcement des capacités CESAR Termes de Référence de.
Journées France Grilles et LCG France Bilan Visio opérations – décembre 2013.
PROJET DE SESSION PRÉSENTÉ PAR : Rosemarie McHugh DANS LE CADRE DU COURS : SCG Réalisation d’applications en SIG 16 avril 2007.
Mardi 31 mai 2016 JJS (Java Job Submission) Soumission de jobs sur grille Pascal Calvat Centre de calcul.
LYON G.Lamanna Introduction Giovanni Lamanna IN2P3 Informatique Lyon 12 février 2014.
Soumis par: DRPU équipe Software Site:
CNRS Images / Photothèque 2008 La Photothèque du CNRS.
La méthode des fiches d’évaluation par les communautés Ulrik Birk Petersen Département du développement social Banque mondiale.
1 4th International Conference on Arabic Language Processing, May 2–3, 2012, Rabat, Morocco Titre Mohamed El Amine ABDERRAHIM Mohamed Alaedine ABDERRAHIM.
Transcription de la présentation:

Interprétation de données d’analyses protéomiques sur une grille de calcul : Utilisation d’algorithmes libres pour l’identification MS/MS. Christine CARAPITO 1, Jérôme PANSANEL 2, Patrick GUTERL 1, Alexandre BUREL 1, Fabrice BERTILE 1, Stéphane GENAUD 3, Alain VAN DORSSELAER 1, Christelle ROY 2 1 Laboratoire de Spectrométrie de Masse BioOrganique, DSA, IPHC, UMR7178, CNRS, Université de Strasbourg, 25 rue Becquerel Strasbourg, France 2 Département Recherches Subatomiques, DRS, IPHC, UMR7178, CNRS, Université de Strasbourg, 23 rue du Loess Strasbourg, France 3 Laboratoire de Sciences de l’Image, de l’Informatique et de la Télédétection, équipe ICPS (LSIIT/ICPS), Université de Strasbourg, CNRS UMR7005, Strasbourg, France Introduction Ces 20 dernières années, la spectrométrie de masse (MS) a joué un rôle majeur pour l’analyse protéomique et est aujourd’hui considérée comme l’une des méthodologies les plus prometteuses permettant des progrès dans la compréhension de nombreux processus biologiques. Les importants progrès techniques en MS ont conduit au développement d’instruments générant des données MS/MS de plus en plus volumineuses (du fait d’une grande rapidité d’acquisition des spectres de fragmentation). Par ailleurs, la soumission des résultats d’identification de protéines à partir de ces données MS/MS est de plus en plus réglementée par les journaux du domaine qui recommandent l’utilisation d’algorithmes transparents (open-source) et multiples si possible. Dans ce contexte, afin de répondre au besoin croissant de puissance de calcul nécessaire pour l’analyse protéomique, une interface permettant d’effectuer l’interprétation des données MS/MS avec un logiciel libre (OMSSA : Open Mass Spectrometry Search Algorithm 1 ) sur la grille de calcul a été développée. Conclusion Le développement de l’interface pour OMSSA sur la grille de calcul permet de répondre aux importants besoins de puissance de calcul non accessibles à ce jour dans les laboratoires de protéomique. Non seulement les performances sur une expérience sont nettement améliorées mais la puissance disponible nous a permis d’ouvrir le site à une large communauté de protéomistes tout en s’affranchissant de la notion de file d’attente. Méthode Les différentes étapes à suivre pour le lancement d’une identification de données MS/MS sur la grille sont les suivantes : 1. Préparation de la banque de séquences protéiques 2. Préparation de fichiers de sous-ensembles de spectres MS/MS à partir des fichiers de données MS/MS d’origine 3. Soumission des calculs sur la grille avec l’outil JJS 2 (via la VO Biomed ou la VO régionale) 4. Récupération des résultats et post-traitement Lors de l’exécution des calculs sur la grille, les éventuelles erreurs sont gérées par JJS permettant ainsi d’assurer l’intégrité des données (tous les fichiers sont récupérés et correctement traités). Résultats Afin d’illustrer l’amélioration des performances obtenue en calculant sur la grille de calcul, quatre sets de données caractéristiques d’expériences protéomiques courantes ont été utilisés. Les gains de temps optimisés sont décrits dans la figure 1. Les paramètres clés ayant permis d’accélérer les recherches d’un facteur 80 sont les suivants : - Nombre de soumissions par minute - Nombre de spectres MS/MS par fichier - Temps de calcul minimal autorisé sur un site - Nombre minimal de CPU sur un site Figure 1 : Facteurs de gains de temps optimisés pour chaque type d’expérience Figure 2 : File d’attente des utilisateurs sans la grille T1T2Tn Serveur local Grille de calcul T1 Figure 3 : Avec la grille, les utilisateurs accèdent directement au serveur Un second bénéfice de la grille réside dans le fait que l’ensemble des recherches peut être lancé en simultané. Comme illustré ci-dessous, les multiples utilisateurs peuvent donc bénéficier des améliorations de performances optimisées sans passer par une file d’attente (figures 2 et 3). Références : 1 Geer LY, Markey SP, Kowalak JA, Wagner L, Xu M, Maynard DM, Yang X, Shi W, Bryant SH. J Proteome Res. 2004, 3(5): Pascal CALVAT, CC-IN2P3, Villeurbanne France Facteur de gain de temps : 11,8 Local : 5:47:47 Grille: 0:29:33 0:00:00 1:00:00 2:00:00 3:00:00 6:00:00 MS haute résolution et semi-spécificité enzymatique Temps (h) 4:00:00 5:00:00 Facteur de gain de temps : 1,2 Local : 0:17:24 Grille : 0:14:12 0:00:00 0:05:00 0:10:00 0:15:00 0:20:00 MS haute résolution et spécificité enzymatique complète Temps (h) Facteur de gain de temps : 5,2 Local : 3:34:29 Grille: 0:41:34 0:00:00 4:00:00 MS basse résolution et spécificité enzymatique complète Temps (h) 3:00:00 2:00:00 1:00:00 Facteur de gain de temps : 78,6 Local : 74:38:38 Grille: 0:57:00 0:00:00 80:00:00 MS basse résolution et semi-spécificité enzymatique Temps (h) 70:00:00 60:00:00 50:00:00 40:00:00 30:00:00 20:00:00 10:00:00