La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Réunion du GDR2909-Métabolisme de l'arsenic chez les procaryotes

Présentations similaires


Présentation au sujet: "Réunion du GDR2909-Métabolisme de l'arsenic chez les procaryotes"— Transcription de la présentation:

1 Réunion du GDR2909-Métabolisme de l'arsenic chez les procaryotes
30 mars 2005, Paris Etudes protéomiques sur Cenibacter arsenoxidans Christine Carapito Laboratoire de Spectrométrie de Masse Bio-Organique ECPM - Université Louis Pasteur - UMR CNRS rue Becquerel Strasbourg Cedex 2

2 Deux études : Etudes protéomiques sur Cenibacter arsenoxidans
1_ Etude protéomique différentielle : Identification des protéines impliquées dans le mécanisme de résistance à l’arsenic 2_ Réalisation d’une carte protéomique complète de Cenibacter arsenoxidans

3 Sélection de 22 spots différentiellement exprimés
1_Etude différentielle avec/sans arsenic par gel 2D puis analyse par nanoLC-MS/MS Comparaison des gels 2D des extraits cytoplasmiques de cultures réalisées en présence/absence d’arsenic : Sélection de 22 spots différentiellement exprimés

4 Stratégie protéomique
150 15 7 Séparation isoélectrique 3 Séparation par masse Electrophorèse bi-dimensionnelle Excision des spots d’intérêts Traitement: Lavage Réduction/Alkylation des ponts disulfures Digestion trypsique Extraction des peptides MALDI-TOF-MS (empreinte peptidique massique PMF) Identification par homologie de masses MS et MS/MS Recherche dans les banques de données Identification par homologie de masses MS Pas d’identification ou ambiguïté nanoLC-MS-MS Séquençage de novo, identification par homologie de séquences

5 Stratégie protéomique
150 15 7 Séparation isoélectrique 3 Séparation par masse Electrophorèse bi-dimensionnelle Stratégie protéomique Excision des spots d’intérêts Identification par homologie de masses MS nanoLC-MS-MS Traitement: Lavage Réduction/Alkylation des ponts disulfures Digestion trypsique Extraction des peptides Pas d’identification ou ambiguïté MALDI-TOF-MS (empreinte peptidique massique PMF) Recherche dans les banques de données Séquençage de novo, identification par homologie de séquences Identification par homologie de masses MS et MS/MS Stratégie utilisée lorsque le génome n’est pas séquencé

6 Nano HPLC (colonne C18 de 75 µm)
La nanoLC-MS/MS Le couplage avec la chromatographie liquide Sélection des peptides les plus intenses isolation fragmentation Fragmentation dans la cellule de collision Nano HPLC (colonne C18 de 75 µm) Spectre de masse Spectre MS Mesure des masses des peptides au fur et à mesure de leur élution de la colonne Spectre MS/MS

7 Stratégie d’identification des protéines par listes de masses
Spectres MS/MS Banque protéique Digestion trypsique et fragmentation in silico Liste de masses expérimentale MS MS/MS 546,45 576,32 678,09 897,98 1002,56 789,67 876,43 987,49 999,12 1018,98 1342,34 1597,09 1678,97 1987,65 2202,22 712,43 750,09 812,34 933,66 978,55 1207,45 1327,87 1387,23 1505,72 1678,06 1835,79 1944,55 516,90 634,79 612,75 752,93 879,89 999,78 1134,48 1368,84 1596,28 1675,89 1888,44 809,89 878,78 956,56 994,83 1059,01 1166,99 1234,56 1345,78 1423,67 1624,97 1777,22 1878,38 Listes de masses théoriques Protéine B Protéine C Protéine A 756.24 854.25 956.36 998.65 785.69 859.65 899.29 958.63 989.65 895.36 958.29 999.36 759.26 895.32 985.36 999.25 859.35 958.36 989.36 589,36 785,69 898,58 651,48 1001,56 569,36 955,69 996,58 1561,56 546,45 576,32 678,09 897,98 1002,56 789,67 876,43 987,49 999,12 1018,98 1342,34 1597,09 1678,97 1987,65 2202,22 712,43 750,09 812,34 933,66 978,55 1207,45 1327,87 1387,23 1505,72 1678,06 1835,79 1944,55 516,90 634,79 612,75 752,93 879,89 999,78 1134,48 1368,84 1596,28 1675,89 1888,44 809,89 878,78 956,56 994,83 1059,01 1166,99 1234,56 1345,78 1423,67 1624,97 1777,22 1878,38 Comparaison des listes de masses MS et MS/MS

8 Stratégie d’identification des protéines par listes de masses
Liste de masses expérimentale Spectres MS/MS MS MS/MS 546,45 576,32 678,09 897,98 1002,56 789,67 876,43 987,49 999,12 1018,98 1342,34 1597,09 1678,97 1987,65 2202,22 712,43 750,09 812,34 933,66 978,55 1207,45 1327,87 1387,23 1505,72 1678,06 1835,79 1944,55 516,90 634,79 612,75 752,93 879,89 999,78 1134,48 1368,84 1596,28 1675,89 1888,44 809,89 878,78 956,56 994,83 1059,01 1166,99 1234,56 1345,78 1423,67 1624,97 1777,22 1878,38 Digestion trypsique et fragmentation in silico Banque protéique Comparaison des listes de masses MS et MS/MS Listes de masses théoriques Protéine B Protéine C Protéine A 756.24 854.25 956.36 998.65 785.69 859.65 899.29 958.63 989.65 895.36 958.29 999.36 759.26 895.32 985.36 999.25 859.35 958.36 989.36 589,36 785,69 898,58 651,48 1001,56 569,36 955,69 996,58 1561,56 Identification de la protéine B

9 Particularité de cette étude :
Le génome de Cenibacter arsenoxidans n’était pas séquencé les protéines absentes des banques de données Protéine étudiée absente des banques de données MSASETPSASASRGLSYRDAGVDIEAGDALVDRIKPFAKRTLREGVLG GIGGFGALFEISKKYQEPVLVSGTDGVGTKLKLAFALNRHDTVGQDLV AMSVNDILVQGAEPLFFLDYFACGKLDVDTAATVIKGIAQGCELAGCAL IGGETAEMPSMYPAGEYDLAGFAVGAVEKRKIIDGTTIACGDVVLGLAS SGAHSNGYSLVRKIIEVSRPDLNADFHGQRLQDAIMAPTRIYVKPLLALI DKLPVKGMAHITGGGLVENVPRVLPEGVTAVLHQDAWTLPPLFQWLQ KAGNVADDEMHRVFNCGIGMIVIVSAADAPAAIAHLKDAGETVYQIGEIRI Elongation factor de Ralstonia solanacearum 90% d'homologie  MSASETTSASASRGLSYRDFDVDIEAGDALVDVIKPFAKRTLRENHKM GIGGFGALFEISKKYQEPVLVSMTDGVGTKLKPAFALNRHDTVGQDLV ATSVNDILVQGAEPLFFEDYFACGKLDVETAATVIKGIAQGCEAAGCAL IGGETAEMPSSYPAGEYDQDFFAVGAVEKRKIIDGTTIACGDVVLGCVS SGAHSNGYSLVRKIIEVSRPDLNADFHGQRLQDAIMAPTRIYVKPLLALI WKLPVKGMAHITGGGLVENVPRVDRAYVTAVLHQDAWTLPPLFQWLQ KAGNVADDEYHRVFNCGIGMFDIVSAADAPAAIAHLKDAGETVYCVGEI Protéine présente dans les banques protéiques Elongation factor de Cenibacter arsenoxidans Identification de la protéine impossible avec les recherches classiques par comparaison de listes de masses dans les banques de protéines

10 ELMVIYDSER ELPVIYDSER 1254.6034 Da Modification du peptide
Ralstonia solanacearum ELMVIYDSER Modification du peptide ELPVIYDSER Cenibacter arsenoxidans Da Da MALDI-MS Modification de la masse du peptide trypsique Da 933,66 978,55 1254,60 1327,87 1387,23 1505,72 1678,06 1835,79 1944,55 Ne participe plus à l’identification Nano-LC-MS-MS Modification de la masse du parent et de la masse des fragments Ne participe plus à l’identification 678,09 897,98 516,90 634,79 612,75 752,93 879,89 999,78 1134,48 1368,84 1596,28 1675,89 1888,44 809,89 878,78 956,56 994,83 1059,01 1166,99 1234,56 1345,78 1423,67 1624,97 1777,22 1878,38 712,43 750,09 812,34 933,66 978,55 1207,45 1327,87 1387,23 1505,72 1678,06 1835,79 1944,55

11 ELMVIYDSER ELPVIYDSER Identification impossible 1254.6034 Da
Ne participe plus à l’identification Modification de la masse du parent et de la masse des fragments ELMVIYDSER Modification du peptide ELPVIYDSER MALDI-MS 933,66 978,55 1254,60 1327,87 1387,23 1505,72 1678,06 1835,79 1944,55 Nano-LC-MS-MS 678,09 897,98 516,90 634,79 612,75 752,93 879,89 999,78 1134,48 1368,84 1596,28 1675,89 1888,44 809,89 878,78 956,56 994,83 1059,01 1166,99 1234,56 1345,78 1423,67 1624,97 1777,22 1878,38 712,43 750,09 812,34 1207,45 Da Da Cenibacter arsenoxidans Ralstonia solanacearum Modification de la masse du peptide trypsique Da Les protéines étudiées doivent être présentes dans les banques de données ou au moins présenter de très fortes homologies avec celles présentes

12 Recours à une stratégie de séquençage de novo des spectres MS/MS
Déduction d’un tag de séquence en acides aminés : QGMEAWDGPALLLFSDGR

13 Détermination de plusieurs tags de séquence:
Séquençage de novo MS/MS spectrum of the parent ion m/z = (retention time=28.1min) Détermination d’un tag de séquence : SIMAEAMINTMGK Détermination de plusieurs tags de séquence: TYNVLFLCTGNSAR-FVAYSAGSHPGGTVNPFAIEQIK-STGYALENLR-AVFSKIAK-VNLLNSLPLAMLEKTALK-EMDAIGSSK + Soumission au MS-BLAST Résultat Identification par homologie de séquence : tolérance aux variations dans les séquences

14 Résultats obtenus grâce à l’utilisation de cette stratégie par séquençage de novo

15 Possible grâce au séquençage du génome!
2_ Réalisation d’une carte protéomique complète de Cenibacter arsenoxidans Gel coloré à l’argent (Evelyne Turlin) Carrotage systématique Analyse de 437 spots en nanoLC-MS/MS Possible grâce au séquençage du génome!

16 Traduction dans les 6 cadres de lecture
Utilisation du génome brut paires de bases 1370 pages 1 seule séquence Traduction dans les 6 cadres de lecture

17 Fragmentation de ce génome et création d’une banque au format Fasta
Fichier d’entrée : genome.txt Banque au format fasta comprenant des segments de 7500 bases avec des recouvrements de séquence de 2500 bases.

18 Analyse nanoLC-MS/MS Protéine identifiée sur le segment 113 Spécificité suffisante pour l’identification de la région codante

19 Identification de la fonction
Extraction des peptides identifiés et soumission au MS-BLAST Identification de la fonction de la protéine Souvent par homologie chez Ralstonia solanacearum

20 Pas d’identification possible car beaucoup de faux positifs !
Analyse MALDI-TOF-MS et recherche par « empreinte peptidique massique » Pas d’identification possible car beaucoup de faux positifs !

21 Environ 60 minutes de traitement par analyse
Stratégie par séquençage de novo + Traitement par PEAKS BLAST = identification des protéines d’intérêt avec 3, 4 ou 5 peptides par protéine Environ 60 minutes de traitement par analyse

22 Comparaison des résultats des 2 stratégies
Recherche dans le génome complet Séquençage de novo Lors de la recherche dans le génome complet, on a le maximum d’informations

23 Comparaison des méthodes de recherche
Méthode classique Recherche dans les banques protéiques (SwissProt+TrEMBL+TrEMBLnew) Pas de résultats dans la plupart des cas ou des résultats sans grande confiance Identification avec 3, 4 ou 5 peptides par protéine Stratégie de novo 1/ Traitement avec PEAKS 2 / BLAST Durée : 60 minutes 3/ Vérification des séquences 4/ BLAST de vérification Recherche dans le génome 1/ Recherche dans le génome Identification avec 5 à 15 peptides par protéine 2 / BLAST Durée : 5 minutes

24 Résultats obtenus 384 sur les 437 spots ont été analysés en nanoLC-MS/MS sur deux systèmes : un systéme CapLC/Q-TOF II de Waters un système nanoLC Agilent (1100 series)/trappe ionique HCTPlus (Bruker Daltonics) 250 analyses sont déjà interprétées Projet DESS de Michael Heymann Automatisation de ces travaux d’interprétation, lancement des BLASTs en batch, … Annotation du génome, confrontation des résultats de l’annotation automatique/résultats protéomiques : PROTEOGENOMIQUE

25 Remerciements : Emmanuelle LEIZE Alain VAN DORSSELAER Philippe BERTIN
Daniel MULLER Marie-Claire LETT Michael HEYMANN Evelyne TURLIN

26

27 Suite des résultats du différentiel

28

29

30 Stratégie d'identification des protéines par « empreinte peptidique massique » (PMF)
Spectre MALDI-TOF Banque protéique CCFDSDFRGTHTTYIPLMRKMDEASCVNFJRPQSDGHLKITYPMNVCDSDFRAQSDFERTGGHPLMNVFFRDSQACVSDEFRHKITPLFMDLMFPRTEQASSCVFHDNRTIPLYMTIFKGSREFDYAGSRHEYD DFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS DFFSDFFIRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD FDSFIRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD IRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD IRMLKLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD VFGNDFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS RFEDDFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS FGEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS Liste de masses expérimentale 546,45 576,32 678,09 897,98 1002,56 1234,78 1564,90 1678,09 1876,86 2009,76 Listes de masses théoriques Digestion trypsique in silico 789,67 876,43 987,49 999,12 1018,98 1342,34 1597,09 1678,97 1987,65 2202,22 A C 516,90 634,79 612,75 752,93 879,89 999,78 1134,48 1368,84 1596,28 1675,89 1888,44 B 712,43 750,09 812,34 933,66 978,55 1207,45 1327,87 1387,23 1505,72 1678,06 1835,79 1944,55 F 543,89 691,86 699,88 746,92 777,49 855,38 867,32 900,99 933,73 1116,94 1269,57 1424,54 1532,73 E 809,89 878,78 956,56 994,83 1059,01 1166,99 1234,56 1345,78 1423,67 1624,97 1777,22 1878,38 G --- -- 546,45 676,32 678,09 897,98 1002,56 1230,78 1564,90 1678,09 1876,86 2009,76 Comparaison par un moteur de recherche type Mascot

31 Stratégie d'identification des protéines par « empreinte peptidique massique » (PMF)
Spectre MALDI-TOF Banque protéique CCFDSDFRGTHTTYIPLMRKMDEASCVNFJRPQSDGHLKITYPMNVCDSDFRAQSDFERTGGHPLMNVFFRDSQACVSDEFRHKITPLFMDLMFPRTEQASSCVFHDNRTIPLYMTIFKGSREFDYAGSRHEYD DFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS DFFSDFFIRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD FDSFIRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD IRLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD IRMLKLFPFMLDKFNVCGDFSREFDGEDGGDFGFHEHSDGDTSGQFARSFERDFCVVNFKFLDIKDLFLFMPRLGFHHTFLFIKDKGHRDGFTEGDHSGDFHCDPMDLCNCDSREFDDSGGGQFASRAQFSRSDQDIPMDLIRKFMPLCCFD VFGNDFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS RFEDDFHEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS FGEGRILPMKYITRFNCHDSFAQRSFEDGEHDIRLFPMTGFKNVDFCGERSFDGCVAQDHFIRLPFMFYRHGTTDGNVHCFSQDAEQDSFEGDTHFFKGFLFMGPITLFGKITRYFHGNVDFSQREAS Digestion trypsique in silico Liste de masses expérimentales 546,45 576,32 678,09 897,98 1002,56 1234,78 1564,90 1678,09 1876,86 2009,76 A B C E F G -- 789,67 876,43 987,49 999,12 1018,98 1342,34 1597,09 1678,97 1987,65 2202,22 712,43 750,09 812,34 933,66 978,55 1207,45 1327,87 1387,23 1505,72 1678,06 1835,79 1944,55 516,90 634,79 612,75 752,93 879,89 999,78 1134,48 1368,84 1596,28 1675,89 1888,44 543,89 691,86 699,88 746,92 777,49 855,38 867,32 900,99 933,73 1116,94 1269,57 1424,54 1532,73 546,45 676,32 678,09 897,98 1002,56 1230,78 1564,90 1678,09 1876,86 2009,76 809,89 878,78 956,56 994,83 1059,01 1166,99 1234,56 1345,78 1423,67 1624,97 1777,22 1878,38 --- Comparaison par un moteur de recherche type Mascot Identification de la protéine F Listes de masses théoriques

32 le NH2 terminal et le NH2 de la chaîne latérale de la Lys ou de l’Arg
Le peptide trypsique Se termine par une Lysine ou une Arginine donc 2 sites basiques protonables par peptide : le NH2 terminal et le NH2 de la chaîne latérale de la Lys ou de l’Arg R1 R3 O O C NH C C NH C NH3+ C C OH C NH C O R2 O CH2 (CH2)3 NH3+ Lysine

33 Règles de fragmentation des peptides Biemann, 1990
2 a b c d R 1 R 3 CH 2 NH CH CO NH CH CO NH CH COOH 2 v w x y z Ions de série a, b et c : charge positive portée par la partie N-terminal Ions de série x, y et z : charge positive portée par la partie C-terminal Ions de série d, v et w : fragmentation des chaînes latérales Fragmentations basse énergie Fragmentations haute énergie Biemann K., Appendix 5, Nomenclature for peptide fragment ions (positive ions), Methods Enzymol, 1990, 193, 886-7

34 Fragmentation des peptides : La loi du proton mobile
Dongré et al., Journal of Mass Spectrometry, Vol. 31, (1996) Les peptides ne cassent qu'une seule fois pour générer préférentiellement les fragments y et b Fragments b Fragments y +ALLLFSDGR+ +A LLLFSDGR+ +ALLLFSDGR+ Fragmentation dans la cellule de collision +AL LLFSDGR+ +ALLLFSDGR+ +ALL LFSDGR+ +ALLLFSDGR+ +ALLL FSDGR+ +ALLLF SDGR+ +ALLLFSDGR+ +ALLLFS DGR+ +ALLLFSDGR+ +ALLLFSD GR+ +ALLLFSDGR+ +ALLLFSDG R+


Télécharger ppt "Réunion du GDR2909-Métabolisme de l'arsenic chez les procaryotes"

Présentations similaires


Annonces Google