La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Laboratoire de Spectrométrie de Masse Bio-Organique ECPM - Université Louis Pasteur - UMR CNRS 7509 25 rue Becquerel 67087 Strasbourg Cedex 2 Etudes protéomiques.

Présentations similaires


Présentation au sujet: "Laboratoire de Spectrométrie de Masse Bio-Organique ECPM - Université Louis Pasteur - UMR CNRS 7509 25 rue Becquerel 67087 Strasbourg Cedex 2 Etudes protéomiques."— Transcription de la présentation:

1 Laboratoire de Spectrométrie de Masse Bio-Organique ECPM - Université Louis Pasteur - UMR CNRS rue Becquerel Strasbourg Cedex 2 Etudes protéomiques sur Cenibacter arsenoxidans Christine Carapito Réunion du GDR2909-Métabolisme de l'arsenic chez les procaryotes 30 mars 2005, Paris

2 Deux études : 1_ Etude protéomique différentielle : Identification des protéines impliquées dans le mécanisme de résistance à larsenic 2_ Réalisation dune carte protéomique complète de Cenibacter arsenoxidans Etudes protéomiques sur Cenibacter arsenoxidans

3 1_Etude différentielle avec/sans arsenic par gel 2D puis analyse par nanoLC-MS/MS Comparaison des gels 2D des extraits cytoplasmiques de cultures réalisées en présence/absence darsenic : Sélection de 22 spots différentiellement exprimés

4 Séparation isoélectrique 3 Séparation par masse Electrophorèse bi-dimensionnelle Stratégie protéomique Excision des spots dintérêts Identification par homologie de masses MS nanoLC-MS-MS Traitement: - Lavage - Réduction/Alkylation des ponts disulfures - Digestion trypsique - Extraction des peptides Pas didentification ou ambiguïté MALDI-TOF-MS (empreinte peptidique massique PMF) Recherche dans les banques de données Séquençage de novo, identification par homologie de séquences Identification par homologie de masses MS et MS/MS

5 Séparation isoélectrique 3 Séparation par masse Electrophorèse bi-dimensionnelle Stratégie protéomique Excision des spots dintérêts Identification par homologie de masses MS nanoLC-MS-MS Traitement: - Lavage - Réduction/Alkylation des ponts disulfures - Digestion trypsique - Extraction des peptides Pas didentification ou ambiguïté MALDI-TOF-MS (empreinte peptidique massique PMF) Recherche dans les banques de données Séquençage de novo, identification par homologie de séquences Identification par homologie de masses MS et MS/MS Stratégie utilisée lorsque le génome nest pas séquencé

6 Le couplage avec la chromatographie liquide La nanoLC-MS/MS Nano HPLC (colonne C18 de 75 µm) Spectre de masse Spectre MS Mesure des masses des peptides au fur et à mesure de leur élution de la colonne Sélection des peptides les plus intenses isolation fragmentation Fragmentation dans la cellule de collision Spectre MS/MS

7 Spectres MS/MS Liste de masses expérimentale MSMS/MS 546,45 576,32 678,09 897, ,56 789,67 876,43 987,49 999, , , , , , ,22 712,43 750,09 812,34 933,66 978, , , , , , , ,55 516,90 634,79 612,75 752,93 879,89 999, , , , , ,44 809,89 878,78 956,56 994, , , , , , , , ,38 712,43 750,09 812,34 933,66 978, , , , , , , ,55 Digestion trypsique et fragmentation in silico Banque protéique Comparaison des listes de masses MS et MS/MS Stratégie didentification des protéines par listes de masses

8 Identification de la protéine B Stratégie didentification des protéines par listes de masses

9 Identification de la protéine impossible avec les recherches classiques par comparaison de listes de masses dans les banques de protéines 90% d'homologie MSASETTSASASRGLSYRDFDVDIEAGDALVDVIKPFAKRTLRENHKM GIGGFGALFEISKKYQEPVLVSMTDGVGTKLKPAFALNRHDTVGQDLV ATSVNDILVQGAEPLFFEDYFACGKLDVETAATVIKGIAQGCEAAGCAL IGGETAEMPSSYPAGEYDQDFFAVGAVEKRKIIDGTTIACGDVVLGCVS SGAHSNGYSLVRKIIEVSRPDLNADFHGQRLQDAIMAPTRIYVKPLLALI WKLPVKGMAHITGGGLVENVPRVDRAYVTAVLHQDAWTLPPLFQWLQ KAGNVADDEYHRVFNCGIGMFDIVSAADAPAAIAHLKDAGETVYCVGEI Protéine présente dans les banques protéiques Elongation factor de Cenibacter arsenoxidans Protéine étudiée absente des banques de données MSASETPSASASRGLSYRDAGVDIEAGDALVDRIKPFAKRTLREGVLG GIGGFGALFEISKKYQEPVLVSGTDGVGTKLKLAFALNRHDTVGQDLV AMSVNDILVQGAEPLFFLDYFACGKLDVDTAATVIKGIAQGCELAGCAL IGGETAEMPSMYPAGEYDLAGFAVGAVEKRKIIDGTTIACGDVVLGLAS SGAHSNGYSLVRKIIEVSRPDLNADFHGQRLQDAIMAPTRIYVKPLLALI DKLPVKGMAHITGGGLVENVPRVLPEGVTAVLHQDAWTLPPLFQWLQ KAGNVADDEMHRVFNCGIGMIVIVSAADAPAAIAHLKDAGETVYQIGEIRI Elongation factor de Ralstonia solanacearum Particularité de cette étude : Le génome de Cenibacter arsenoxidans nétait pas séquencé les protéines absentes des banques de données

10 Da Da MALDI-MS Modification de la masse du peptide trypsique Da 933,66 978, , , , , , , ,55 Ne participe plus à lidentification Nano-LC-MS-MS Modification de la masse du parent et de la masse des fragments Ne participe plus à lidentification 678,09 897, ,90 634,79 612,75 752,93 879,89 999, , , , , ,44 809,89 878,78 956,56 994, , , , , , , , ,38 712,43 750,09 812,34 933,66 978, , , , , , , ,55 Ralstonia solanacearum ELMVIYDSER Modification du peptide ELPVIYDSER Cenibacter arsenoxidans

11 Les protéines étudiées doivent être présentes dans les banques de données ou au moins présenter de très fortes homologies avec celles présentes Modification de la masse du peptide trypsique Da Identification impossible Ne participe plus à lidentification Modification de la masse du parent et de la masse des fragments ELMVIYDSER Modification du peptide ELPVIYDSER Ne participe plus à lidentification MALDI-MS 933,66 978, , , , , , , ,55 Nano-LC-MS-MS 678,09 897, ,90 634,79 612,75 752,93 879,89 999, , , , , ,44 809,89 878,78 956,56 994, , , , , , , , ,38 712,43 750,09 812,34 933,66 978, , , , , , , , Da Da Cenibacter arsenoxidans Ralstonia solanacearum

12 Recours à une stratégie de séquençage de novo des spectres MS/MS Déduction dun tag de séquence en acides aminés : QGMEAWDGPALLLFSDGR

13 Séquençage de novo Détermination de plusieurs tags de séquence: TYNVLFLCTGNSAR-FVAYSAGSHPGGTVNPFAIEQIK- STGYALENLR-AVFSKIAK-VNLLNSLPLAMLEKTALK-EMDAIGSSK + MS/MS spectrum of the parent ion m/z = (retention time=28.1min) Détermination dun tag de séquence : SIMAEAMINTMGK Résultat Soumission au MS-BLAST Identification par homologie de séquence : tolérance aux variations dans les séquences

14 Résultats obtenus grâce à lutilisation de cette stratégie par séquençage de novo

15 2_ Réalisation dune carte protéomique complète de Cenibacter arsenoxidans Gel coloré à largent (Evelyne Turlin) Carrotage systématique Analyse de 437 spots en nanoLC- MS/MS Possible grâce au séquençage du génome!

16 Utilisation du génome brut paires de bases pages - 1 seule séquence Traduction dans les 6 cadres de lecture

17 Fragmentation de ce génome et création dune banque au format Fasta Fichier dentrée : genome.txt Banque au format fasta comprenant des segments de 7500 bases avec des recouvrements de séquence de 2500 bases.

18 Analyse nanoLC-MS/MS Protéine identifiée sur le segment 113 Spécificité suffisante pour lidentification de la région codante

19 Identification de la fonction Extraction des peptides identifiés et soumission au MS-BLAST Souvent par homologie chez Ralstonia solanacearum Identification de la fonction de la protéine

20 Analyse MALDI-TOF-MS et recherche par « empreinte peptidique massique » Pas didentification possible car beaucoup de faux positifs !

21 Stratégie par séquençage de novo = identification des protéines dintérêt avec 3, 4 ou 5 peptides par protéine Environ 60 minutes de traitement par analyse + Traitement par PEAKSBLAST

22 Recherche dans le génome completSéquençage de novo Comparaison des résultats des 2 stratégies Lors de la recherche dans le génome complet, on a le maximum dinformations

23 Comparaison des méthodes de recherche Méthode classique Recherche dans les banques protéiques (SwissProt+TrEMBL+ TrEMBLnew) Pas de résultats dans la plupart des cas ou des résultats sans grande confiance Recherche dans le génome 1/ Recherche dans le génome Identification avec 5 à 15 peptides par protéine 2 / BLAST Durée : 5 minutes Identification avec 3, 4 ou 5 peptides par protéine Stratégie de novo 1/ Traitement avec PEAKS 2 / BLAST Durée : 60 minutes 3/ Vérification des séquences 4/ BLAST de vérification

24 Résultats obtenus 384 sur les 437 spots ont été analysés en nanoLC-MS/MS sur deux systèmes : - un systéme CapLC/Q-TOF II de Waters - un système nanoLC Agilent (1100 series)/trappe ionique HCTPlus (Bruker Daltonics) 250 analyses sont déjà interprétées Projet DESS de Michael Heymann Automatisation de ces travaux dinterprétation, lancement des BLASTs en batch, … Annotation du génome, confrontation des résultats de lannotation automatique/résultats protéomiques : PROTEOGENOMIQUE

25 Remerciements : Emmanuelle LEIZE Alain VAN DORSSELAER Philippe BERTIN Daniel MULLER Marie-Claire LETT Michael HEYMANN Evelyne TURLIN

26

27 Suite des résultats du différentiel

28

29

30 Stratégie d'identification des protéines par « empreinte peptidique massique » (PMF) Banque protéique CCFDSDFRGTHTTYIPLMRKMD EASCVNFJRPQSDGHLKITYPM NVCDSDFRAQSDFERTGGHPL MNVFFRDSQACVSDEFRHKITP LFMDLMFPRTEQASSCVFHDNR TIPLYMTIFKGSREFDYAGSRHE YD DFHEGRILPMKYITRFNCHDSFA QRSFEDGEHDIRLFPMTGFKNV DFCGERSFDGCVAQDHFIRLPF MFYRHGTTDGNVHCFSQDAEQ DSFEGDTHFFKGFLFMGPITLFG KITRYFHGNVDFSQREAS DFFSDFFIRLFPFMLDKFNVCGD FSREFDGEDGGDFGFHEHSDGD TSGQFARSFERDFCVVNFKFLDI KDLFLFMPRLGFHHTFLFIKDK GHRDGFTEGDHSGDFHCDPMD LCNCDSREFDDSGGGQFASRAQ FSRSDQDIPMDLIRKFMPLCCFD FDSFIRLFPFMLDKFNVCGDFSR EFDGEDGGDFGFHEHSDGDTSG QFARSFERDFCVVNFKFLDIKD LFLFMPRLGFHHTFLFIKDKGH RDGFTEGDHSGDFHCDPMDLC NCDSREFDDSGGGQFASRAQFS RSDQDIPMDLIRKFMPLCCFD IRLFPFMLDKFNVCGDFSREFD GEDGGDFGFHEHSDGDTSGQF ARSFERDFCVVNFKFLDIKDLFL FMPRLGFHHTFLFIKDKGHRDG FTEGDHSGDFHCDPMDLCNCD SREFDDSGGGQFASRAQFSRSD QDIPMDLIRKFMPLCCFD IRMLKLFPFMLDKFNVCGDFSR EFDGEDGGDFGFHEHSDGDTSG QFARSFERDFCVVNFKFLDIKD LFLFMPRLGFHHTFLFIKDKGH RDGFTEGDHSGDFHCDPMDLC NCDSREFDDSGGGQFASRAQFS RSDQDIPMDLIRKFMPLCCFD VFGNDFHEGRILPMKYITRFNC HDSFAQRSFEDGEHDIRLFPMT GFKNVDFCGERSFDGCVAQDH FIRLPFMFYRHGTTDGNVHCFS QDAEQDSFEGDTHFFKGFLFMG PITLFGKITRYFHGNVDFSQREA S RFEDDFHEGRILPMKYITRFNCH DSFAQRSFEDGEHDIRLFPMTGF KNVDFCGERSFDGCVAQDHFIR LPFMFYRHGTTDGNVHCFSQD AEQDSFEGDTHFFKGFLFMGPIT LFGKITRYFHGNVDFSQREAS FGEGRILPMKYITRFNCHDSFAQ RSFEDGEHDIRLFPMTGFKNVD FCGERSFDGCVAQDHFIRLPFM FYRHGTTDGNVHCFSQDAEQD SFEGDTHFFKGFLFMGPITLFGK ITRYFHGNVDFSQREAS Spectre MALDI-TOF Listes de masses théoriques Digestion trypsique in silico 789,67 876,43 987,49 999, , , , , , ,22 AC 516,90 634,79 612,75 752,93 879,89 999, , , , , ,44 B 712,43 750,09 812,34 933,66 978, , , , , , , ,55 F 543,89 691,86 699,88 746,92 777,49 855,38 867,32 900,99 933, , , , ,73 E 809,89 878,78 956,56 994, , , , , , , , ,38 G ,45 676,32 678,09 897, , , , , , ,76 Liste de masses expérimentale 546,45 576,32 678,09 897, , , , , , ,76 Comparaison par un moteur de recherche type Mascot

31 Stratégie d'identification des protéines par « empreinte peptidique massique » (PMF) Banque protéique CCFDSDFRGTHTTYIPLMRKMD EASCVNFJRPQSDGHLKITYPM NVCDSDFRAQSDFERTGGHPL MNVFFRDSQACVSDEFRHKITP LFMDLMFPRTEQASSCVFHDNR TIPLYMTIFKGSREFDYAGSRHE YD DFHEGRILPMKYITRFNCHDSFA QRSFEDGEHDIRLFPMTGFKNV DFCGERSFDGCVAQDHFIRLPF MFYRHGTTDGNVHCFSQDAEQ DSFEGDTHFFKGFLFMGPITLFG KITRYFHGNVDFSQREAS DFFSDFFIRLFPFMLDKFNVCGD FSREFDGEDGGDFGFHEHSDGD TSGQFARSFERDFCVVNFKFLDI KDLFLFMPRLGFHHTFLFIKDK GHRDGFTEGDHSGDFHCDPMD LCNCDSREFDDSGGGQFASRAQ FSRSDQDIPMDLIRKFMPLCCFD FDSFIRLFPFMLDKFNVCGDFSR EFDGEDGGDFGFHEHSDGDTSG QFARSFERDFCVVNFKFLDIKD LFLFMPRLGFHHTFLFIKDKGH RDGFTEGDHSGDFHCDPMDLC NCDSREFDDSGGGQFASRAQFS RSDQDIPMDLIRKFMPLCCFD IRLFPFMLDKFNVCGDFSREFD GEDGGDFGFHEHSDGDTSGQF ARSFERDFCVVNFKFLDIKDLFL FMPRLGFHHTFLFIKDKGHRDG FTEGDHSGDFHCDPMDLCNCD SREFDDSGGGQFASRAQFSRSD QDIPMDLIRKFMPLCCFD IRMLKLFPFMLDKFNVCGDFSR EFDGEDGGDFGFHEHSDGDTSG QFARSFERDFCVVNFKFLDIKD LFLFMPRLGFHHTFLFIKDKGH RDGFTEGDHSGDFHCDPMDLC NCDSREFDDSGGGQFASRAQFS RSDQDIPMDLIRKFMPLCCFD VFGNDFHEGRILPMKYITRFNC HDSFAQRSFEDGEHDIRLFPMT GFKNVDFCGERSFDGCVAQDH FIRLPFMFYRHGTTDGNVHCFS QDAEQDSFEGDTHFFKGFLFMG PITLFGKITRYFHGNVDFSQREA S RFEDDFHEGRILPMKYITRFNCH DSFAQRSFEDGEHDIRLFPMTGF KNVDFCGERSFDGCVAQDHFIR LPFMFYRHGTTDGNVHCFSQD AEQDSFEGDTHFFKGFLFMGPIT LFGKITRYFHGNVDFSQREAS FGEGRILPMKYITRFNCHDSFAQ RSFEDGEHDIRLFPMTGFKNVD FCGERSFDGCVAQDHFIRLPFM FYRHGTTDGNVHCFSQDAEQD SFEGDTHFFKGFLFMGPITLFGK ITRYFHGNVDFSQREAS Spectre MALDI-TOF Liste de masses expérimentales Digestion trypsique in silico 789,67 876,43 987,49 999, , , , , , ,22 AC 516,90 634,79 612,75 752,93 879,89 999, , , , , ,44 B 712,43 750,09 812,34 933,66 978, , , , , , , ,55 F 543,89 691,86 699,88 746,92 777,49 855,38 867,32 900,99 933, , , , ,73 E 809,89 878,78 956,56 994, , , , , , , , ,38 G Listes de masses théoriques 546,45 676,32 678,09 897, , , , , , ,76 546,45 576,32 678,09 897, , , , , , ,76 Identification de la protéine F Comparaison par un moteur de recherche type Mascot

32 Le peptide trypsique NH 3 + C C R1 O NH C C R2 O C C R3 O NH C C O OH CH 2 (CH 2 ) 3 NH 3 + Se termine par une Lysine ou une Arginine donc 2 sites basiques protonables par peptide : le NH 2 terminal et le NH 2 de la chaîne latérale de la Lys ou de lArg Lysine

33 CH R 1 R 2 CO NH a b c x y z 2 CH CO NH CH COOH R 3 CH 2 v w d Règles de fragmentation des peptides Biemann, 1990 Ions de série a, b et c : charge positive portée par la partie N-terminal Ions de série x, y et z : charge positive portée par la partie C-terminal Ions de série d, v et w : fragmentation des chaînes latérales Fragmentations basse énergie Fragmentations haute énergie Biemann K., Appendix 5, Nomenclature for peptide fragment ions (positive ions), Methods Enzymol, 1990, 193, 886-7

34 + ALLLFSDGR + Fragmentation des peptides : La loi du proton mobile + ALLLFSDGR + Fragmentation dans la cellule de collision Les peptides ne cassent qu'une seule fois pour générer préférentiellement les fragments y et b + ALLLFSDGR + Dongré et al., Journal of Mass Spectrometry, Vol. 31, (1996) +A+A + AL + ALL + ALLL + ALLLF + ALLLFS + ALLLFSD + ALLLFSDG Fragments b LLLFSDGR + LLFSDGR + LFSDGR + FSDGR + SDGR + DGR + GR + R+R+ Fragments y


Télécharger ppt "Laboratoire de Spectrométrie de Masse Bio-Organique ECPM - Université Louis Pasteur - UMR CNRS 7509 25 rue Becquerel 67087 Strasbourg Cedex 2 Etudes protéomiques."

Présentations similaires


Annonces Google