q6 `/ C. ~. J, e7 D" R
8 Z& g/ m4 \% \# m- x8 f* }1 o 引言7 a4 }# ~5 G& q
绝大多数海洋微生物及其功能还有待探索,它们所包含的相当大的多样性是知识和财富的无尽来源,可以在工业规模上进行评估强调需要开发快速有效的识别和表征技术。
# u0 o6 g& R1 v% e. x0 ]; p5 a2 x 本文将使用前沿的串联质谱原型技术 phylopeptidomics,从地中海西北部沿海水域中鉴定出 26 种微生物分离物,对所有分离株成功地进行了物种水平的分类学探讨。
) g0 e* u+ q2 ~+ c; R9 R! ^- l 8 G5 ^* ]& v" |& s
一、质谱法
0 ^+ X/ d! D2 a1 Z 原型分析是从各种样品中鉴定微生物的强大工具,质谱法在诊断领域的出现,特别是通过 MALDI-TOF,彻底改变了细菌学,以前由基于 DNA 扩增的分子技术主导。 ! K) U' {7 f5 M' J7 O) d5 x* V
由于基于 MALDI-TOF 的鉴定需要全面的光谱数据库才能鉴定被测样品中存在的微生物,因此该技术不适用于环境样品和微生物混合物。
b, w! @6 V8 B* d# f5 w5 R* ] 而串联质谱法提供的信息比 MALDI-TOF 多,因此基于鉴别肽或肽组相似性的鉴定开发了替代的蛋白质分型方法,这种技术不需要先验知识,并且可以满足从培养组学中表征大量分离物所需的高通量水平。
% X1 q) f5 @/ t 8 a& D* h3 F. Y$ G6 I
Phylopeptidomics,Pible 等人首次描述的一种新的蛋白质组学概念,允许样本中微生物的分类鉴定和相对生物量量化,基于通过鸟枪蛋白质组学获得的常见和类群特异性肽的组合。
5 `+ q" Q2 Y9 F$ J6 O 这种技术具有许多优点因为它依赖于带注释的测序基因组的公共数据库,并且不需要实验光谱数据库,如果数据库中存在密切相关的基因组,它允许在一次运行中识别任何原核和真核物种,这与 16S 靶向测序方法不同。 7 P/ k' {7 p) N- ?) e
2 ?* _) A& b2 ~, k
利用最先进的质谱 UPLC-MS/MS 对 26 对海洋细菌进行了基于植物肽组学的蛋白质分型,使用的是经过验证的实验工作流程,该工作流程已被证明对细菌鉴定具有稳健性和可靠性。
# N) M! O7 z% F4 m6 i 对两种与环境相关的细菌进行了进一步的蛋白质组功能分析,以举例说明单次分析运行提供的丰富信息,这是首次应用串联质谱原型法来鉴定海洋微生物分离物,并使用适合 48 小时窗口的工作流程来表征它们各自的蛋白质组。
2 x r0 V% V4 }0 x; u ! g! ]5 U$ W( e+ }
对海水进行采样并在室温下在黑暗中不搅拌 12 个月,以选择能够在这种条件下存活并且比更丰富的海洋微生物更难以识别的代表性不足的海洋分类群。
8 k; ~1 n* F( ^! B2 u# Y 在海洋培养基琼脂平板上分离得到 26 个分离物,通过串联质谱法获得的细菌鉴定结果 提供了 MS/MS 谱图编号,以及分配给肽序列的这些谱图的百分比,即肽谱匹配 (PSM)和在物种水平上分配给分类单元的 PSM 数。
0 c- O' T- {' A 在 30 分钟内记录了 19,527 ± 1310 个 MS/MS 谱图,其中 56.9 ± 3.8% 归因于肽序列,这种恒定且高的分配率表明为所有样品记录的 MS/MS 谱图质量良好,归因于分类单元的 PSM 数量,称为先前定义的分类单元与光谱匹配 (TSM) ,范围从 6610 到 11,871。
* E* M# ^! ]0 f+ }1 k! `! g4 q5 m 6 D$ h" o0 N, H( P U" j' ]
这个数字可能受到每个分类单元可用的基因组序列密度以及该分类单元及其密切相关的邻居中基因组序列多样性的覆盖范围的影响,对于环境样本尤其是海洋分离物,这种覆盖率相当低,每个物种只有几个代表。 % @4 V9 @7 Z, R
于此我们引入了一个新的比率,它对应于分配给已识别物种的 TSM 的 PSM 的百分比,在当前数据集的物种水平上,该比率介于 78.5% 和 99.5% 之间,平均为 96.4 ± 5.3%。
$ K( m. q: z! I. h* t0 B+ @ 该比率取决于分离株和数据库中存在的参考基因组之间的关系,较低的值可能表明样本包含大量不存在于参考基因组中但存在于其他代表中的肽序列,这些肽序列可能未被测序,所以不存在于数据库中。
. r' s4 m+ V! G 9 ~$ ^( i- H" [0 S/ y7 s/ O" w
分离株 4A (78.5%) 和 8 (82.9%) 获得了最低的 TSM/PSM 比率值,均指定为深海海螺菌,值得注意的是,最后一轮数据库包含八个基因组,揭示了海藻属中的八个不同物种:Thalassospira profundimaris、Thalassospira lucentensis、Thalassospira lohafexi、Thalassospira australica、Thalassospira xiamenensis、Thalassospira alkalitolerans、Thalassopira marina 和 Thalassospira me苏菲拉。 ' N; ~) T2 g/ ~& |3 U5 e
两个样本的 TSM/PSM 比率分别为 91.0% 和 95.9%,结果表明这些分离物很可能属于未测序的海螺菌属物种,这些物种在几个物种之间共享大量蛋白质序列。 3 n6 o5 b, z( G$ X1 t4 i
* Z1 k! ?4 r4 \
在鉴定出的26种细菌中,15种属于Gammaproteobacteria,9种属于Alphaproteobacteria,2种属于Balneolaeota。在目水平上,Vibrionales 占主导地位,有 8 个分离株,依次是 Rhodospirallales、Alteromonadales、Rhizobiales、Xanthomonadales、Balneolales 和 Sphingomonadales,尽管厚壁菌门、放线菌门和普朗克霉菌门由于样本数量少而未出现在该列表中,但考虑到变形菌门在海水中占主导地位,这些观察结果与环境相关 。
% ~: ?5 e) K1 z a2 A
e9 _) `/ v4 z4 q. y8 C& _: O 二、植物肽组学特征的例子
: N* n C# Q# z5 ^/ S; [ V. alginolyticus(样品 25B)和Balneola vulgaris (样品 5)的 Phylopeptidomic 特征显示在图 2A,B。这些签名代表数学拟合,解释了 TSM 的数量作为与已识别分类单元的系统发育距离的函数。
) E' H" f( G5 U8 q- e 尽管有助于特征的 TSM (d < 0.5) 可以分配给 5180 个在系统发育上远离溶藻弧菌的测序生物体在数据库中只发现了六种生物B. vulgaris,相比完全测序的 Vibrionales 数量很多,这种差异提醒我们proteotyping 依赖于公共数据库。 0 C' f# U& Z) B( G
1 d8 U: d8 O& X7 {" a4 E
我们注意到分配给B. vulgaris的 TSM 水平非常高,表明分离株 5 与测序的B. vulgaris菌株之间的系统发育接近性存在于查询的数据库,将来加大对其他 Balneolaeota 代表测序的努力可能会改善在。
( W |4 N/ ^! V0 }2 Z9 ~0 f 以两种细菌为例,说明我们的工作流程能够为每种细菌提供全面的蛋白质组学分析,经鸟枪泛蛋白质组学工作流程对采集的 MS/MS 谱图数据集进行了利用。 , C" \$ H, G, I" L/ q$ A% M
V. alginolyticus和B. vulgaris的完整蛋白质组包含总共 1173 和 1138 个已鉴定的蛋白质,分别揭示了 25.8% 和 46.8% 的理论蛋白质组,可以通过增加培养条件和细菌生理状态来优化蛋白质组覆盖率,蛋白质列表在错误发现率设置为 1% 的情况下进行了验证,每种蛋白质的丰度通过它们各自的光谱计数进行评估。
_% N; f) g: j% Q + B# q1 V- X% u) G/ w
蛋白质注释是使用 KO 术语进行的,尽管基于本体的注释被描述为可以完善,对于原核物种报告了两个分离物的每个主要功能类别的蛋白质百分比和每个类别的蛋白质生物量。
% X2 q8 b7 t. D7 r& m( O& H 对于后一种估计,蛋白质丰度使用定义的归一化光谱丰度因子 (NSAF) 进行加权。虽然“碳水化合物代谢”是主要功能,占V. alginolyticus的 17.7% ,但它位居第三,占B. vulgaris的 14.6%,其中功能最大的是“氨基酸代谢”,占17.0%。 " Z, R* M) d% W. Y% t0 R
' J" Y4 q: t2 U" m
使用 NSAF 的功能加权提供了按功能划分的蛋白质丰度的更具代表性的图片,对于这两个物种,“遗传信息处理”成为最丰富的 KO 术语,其次是“碳水化合物代谢”。
9 y& c, }' t: b/ t2 I$ L 两个物种中专门用于“氨基酸代谢”的分子的百分比差异很大:12.7% 的已鉴定蛋白质参与了B. vulgaris中的这一过程,而只有 8.4% 参与了V. alginolyticus,参与“环境信息处理”的蛋白质也观察到主要差异,V. alginolyticus的蛋白质生物量占 8.2%。 ( ^$ T7 x* e! t& [
而B. vulgaris的蛋白质生物量仅为 3.9%. 这些差异可能与它们适应自然环境的根本差异有关。
: U7 }* l% y W- [9 K% k 7 I' r0 f( U+ k$ v8 M: b
V. alginolyticus(分离株 25B)和B. vulgaris (分离株 5)之间属于特定功能的已鉴定蛋白质数量的比较揭示了这两个物种之间的主要差异,对于初步功能性分子表征特别有趣,选择了 β-内酰胺抗性和生物膜形成功能,因为它们在临床微生物学中可能有价值,而鞭毛组装、细菌趋化性和群体感应是最近环境微生物学研究的核心。
0 K, f# ?: F, J$ B, _ 前者的蛋白质组包含 40 种与生物膜形成有关的蛋白质,23 种与群体感应有关,16 种与趋化性有关,7 种与鞭毛组装有关,10 种与β-内酰胺抗性有关。
! j! I, W( o0 P. Y! F2 Y0 w9 w
/ E: J0 \1 H% ~2 M2 u 另一方面B. vulgaris仅含有 6 种参与生物膜形成的蛋白质,15 种与群体感应有关,没有一种与趋化性有关,这表明这种细菌在我们的培养条件下是非运动和非生物膜形成的。 6 l" V% f, q, d+ ?& j5 W
具有成本效益、快速且可靠的微生物鉴定是一项具有挑战性的任务,尤其是对于环境菌株,其中大多数未测序且研究不足。
' A) E0 S; D. e 本研究中使用的 phylopeptidomics 方法允许在物种水平上进行鉴定,而无需任何分离物的先验数据,无论其真核或原核性质如何,我们成功鉴定了 26 种环境海洋分离株,其中大部分属于 Gammaproteobacteria,其次是 Alphaproteobacteria。我们还鉴定了两个属于 Balneolaeota 的分离株。 ; t$ `! @" M4 H- F4 e E
/ F6 ]* W% n4 `; e 我们确定了Balneola vulgaris,这是一种首次从地中海西北部 Banyuls-sur-Mer 海湾分离出来的物种,并于2006年进行了描述,目前的新分离株来自 200 公里外的海边采样,并在相同的培养条件下获得。 % E1 g3 `9 V# K1 B5 I+ b) e
关于该物种的信息很少且仅限于形态学和表型特征,我们在分子水平上提供了它的第一个描述,它的基因组序列自 2013 年以来通过 DOE 联合基因组研究所执行的项目提供,但直到现在还没有探索。
0 K. ?3 |9 k, z! m! g* E X
; \6 e- y Y! P: z4 r% z5 \/ r6 V 蛋白质组学表征表明,溶藻弧菌能够进行群体感应、生物膜形成和运动,文献支持了这一点。 * v! C6 R- J6 k" y e0 ~
数据表明B. vulgaris是非运动的并且没有鞭毛,当考虑到 NSAF 时,我们观察到每个功能的百分比发生了显着变化,提供了在当前培养条件下我们的分离物的蛋白质组的更好图片。 ) ^' f4 }% o! H- \% _; E2 k+ P
这两种菌株在遗传信息、碳水化合物代谢和能量代谢中所涉及的蛋白质的归因百分比增加,考虑到这两种细菌都是在丰富的培养基中培养的,共有 10 种和 7 种蛋白质分别归因于溶藻弧菌和普通芽孢杆菌的 β-内酰胺抗性。 5 ]$ j% m2 \# m/ L
3 Y5 v7 [1 ~: o9 a4 N 以上蛋白质中,B. vulgaris含有外排 RND 转运体周质衔接子亚基 、青霉素结合蛋白 1A和外膜蛋白 TolC,据记载涉及抗生素输出和对抗菌肽的抗性。
( D' ]/ @% b$ g- @: U" x 总结. S/ c3 z" t+ ?6 X: b3 }0 Q
我们证明了 MS/MS 原型分析方法(如植物肽组学)允许在单次运行中进行物种水平的鉴定和环境分离物的蛋白质组学表征,证实了与传统技术(如 MALDI-TOF 或 PCR)相比具有相当大的优势。 & m7 o4 k9 T- k$ T
phylopeptidomics 适用于可培养的分离物,因为这些微生物目前有更多机会进行基因组测序,宏基因组组装的基因组也可用于定义新物种,并将迅速填充基因组和分类数据库, phylopeptidomics 理论上可以应用于更直接的海水分析而不需要培养。
2 y, c$ S2 ^3 J: O4 b- C
' l" ` \7 \: ~6 ]: t, c 该技术检测与抗生素耐药性有关的蛋白质的能力,这是临床和环境科学的一项资产,phylopeptidomics 可能是培养程序的宝贵资产。 5 p( @8 l# a8 I+ @( V5 I
因为该方法能够快速分类最非典型的分离株,提供了属于 Balnoleata 门的细菌物种的第一个蛋白质组学特征,并强调了可能激发未来测序工作的文献中的空白。 % Y5 r0 o+ s+ }* D0 l' |/ n
存在属于新描述的 Balneolaeota 门的菌株,但未在蛋白质组学规模上进行表征。对 Balneolaeota 门代表的首次基于蛋白质组学的研究里Balneola vulgaris被提出。
# @2 q* b& T+ \( v- A& e8 O ( }; }1 u, g) e, {" o6 g4 q
原型工作流程在单次 MS/MS 分析运行中用于快速鉴定和深入分子表征的用途,串联质谱原型法是文化程序的宝贵资产,因为该方法能够快速对最非典型的分离株进行分类。
; g z7 K8 \( D , O+ P' W$ u0 K$ `* T9 K7 G5 y, [/ D
参考文献 岳振峰;林秀云;唐少冰;陈小霞;吉彩霓,《高效液相色谱-串联质谱法测定动物组织中的16种喹诺酮类药物残留》王桂友; 臧斌; 顾昭,《质谱仪技术发展与应用》陈晓水; 侯宏卫; 边照阳; 唐纲岭; 胡清源,《气相色谱-串联质谱(GC-MS/MS)的应用研究进展》3 Y* a2 P, `6 O0 a9 f
. G$ H& d u! i. F
7 y* R9 @7 K' u
/ s5 A/ X' X6 G9 p& V$ D4 r
4 l5 q( t f3 W) o |