4月22日,西湖大学医学院郭天南团队与德国马克斯·普朗克生物化学研究所Matthias Mann团队在Nature Biotechnology发表了一篇评论文章,指出在血浆蛋白质组学中追求更深的蛋白质覆盖度时,需警惕血细胞污染带来的“虚假深度”,这种污染会虚增鉴定数量并干扰定量准确性。
文章强调,可靠的生物学发现必须建立在严格的样本质量控制、匹配的统计功效与平台适配的污染评估基础之上。
在血浆蛋白质组学研究中,提高蛋白质鉴定数量被广泛视为技术进步的重要方向。然而,来自西湖大学与德国马克斯·普朗克生物化学研究所的研究团队在一篇评论文章中指出,蛋白质组“深度”的提升需要结合样本质量、定量可靠性以及统计设计综合评估,其生物学意义并非总是随鉴定数量增加而同步提升。
人的循环血浆中包含数千种蛋白质,但其中不到20种高丰度蛋白占据了超过99%的总蛋白质量,使得大量低丰度蛋白难以检测。鉴定和定量这些低丰度循环蛋白是血浆蛋白质组学的重要目标,其价值依赖于两个方面:一是测量是否真实反映无细胞污染的血浆(避免细胞成分污染),二是结果在重复实验和不同队列中的可重复性。
目前,质谱是开展血浆非靶向蛋白质组分析的主要方法。在未进行去除高丰度蛋白或分馏处理的情况下,通常可鉴定约300–500种蛋白;随着数据非依赖性采集等技术的发展,这一数字已提升至约1000种。为进一步提高覆盖度,研究人员采用了多种样本前处理策略,如高丰度蛋白去除、高氯酸辅助沉淀中和法以及基于纳米颗粒的富集方法。在部分研究中,基于纳米颗粒的方法可实现3000至8000种蛋白的鉴定。
图1 基于质谱的血浆蛋白质组学工作流程中检测深度与血细胞污染的关系
然而,这类高鉴定数量对前处理过程较为敏感。残留的血细胞,尤其是血小板,同时还包括红细胞和外周血单个核细胞,可能引入额外蛋白,从而增加鉴定数量并影响定量精度。在比较不同工作流程时,未处理血浆对污染的敏感性最低,高氯酸辅助沉淀中和法居中,而基于磁珠或纳米颗粒的策略对污染最为敏感。
研究进一步表明,血细胞污染可以系统性地影响蛋白质组数据。已有工作基于血细胞参考蛋白质组建立了红细胞、血小板及凝血相关蛋白的污染标志物集合,每类包含约30种蛋白。当这些标志物应用于已发表的数据集中时,超过一半的数据集将至少一种污染相关蛋白报告为潜在疾病标志物。受控添加实验也显示,血小板或红细胞污染可使蛋白鉴定数量从约3000增加至7000以上,同时降低干净的血浆样本与受污染的血浆样本之间的定量一致性。
图2 前处理变量导致的血浆污染及其补救策略
针对不同工作流程,污染标志物的适用性存在差异。例如,在纳米颗粒富集体系中,部分既有标志物表现出不同甚至相反的变化趋势。基于添加梯度实验中呈线性响应的蛋白,研究者建立了针对该类流程优化的标志物组合,并开发了相应的软件工具用于质量控制。这些结果表明,污染评估需要针对具体方法进行验证。
除质谱外,高通量亲和力平台(如Olink和SomaScan)也已实现大规模蛋白定量。这些平台的检测范围由试剂组合决定,通常可在大队列中定量数千至上万种蛋白。尽管其“深度”不随样本质量变化,但血细胞污染仍可通过改变样本中蛋白的实际浓度而影响测量结果。例如,在英国生物银行数据分析中,血小板压积被识别为血浆蛋白变异的重要来源之一,对数百个蛋白的测量产生显著影响。
此外,亲和力平台还可能受到蛋白质形态选择性和溶血等因素的影响。不同探针对同一蛋白的识别差异可导致测量结果不一致,而溶血则会对部分蛋白信号产生系统性干扰。因此,这类平台同样需要在分析中纳入污染相关指标和标志物。
这些影响主要来源于采血、处理和储存等前处理环节,包括离心条件、血浆样本分离、冻融以及不同抗凝剂采血管选择等因素。研究显示,即使在相同操作流程下,不同采血管也可能导致蛋白质组结果差异。因此,标准化样本处理流程、记录关键参数并控制变量,对于提高数据一致性具有重要作用。
在方法层面,研究建议在实验流程中引入污染评估工具,对样本进行标记或筛选,并在必要时进行部分校正。同时,应明确记录样本处理条件,如离心时间、温度、抗凝剂类型及冻融次数等,以支持结果解释和跨研究比较。
除样本质量外,统计功效也是影响研究可靠性的关键因素。在蛋白质组维度不断扩大的背景下,多重检验带来的统计负担显著增加。如果队列规模不足以匹配所测量蛋白数量,则更容易产生不可重复的关联结果。相关研究表明,即使在随机数据上应用标准分析流程,也可能得到表面上具有较高性能的分类模型。
因此,在设计蛋白质组学研究时,需要综合考虑鉴定深度、预期效应大小和可接受的假发现率,并据此评估统计功效。只有在样本规模与蛋白质组维度相匹配的情况下,相关分析结果才更具稳定性。
总体来看,血浆蛋白质组覆盖度的提升需要在低污染水平和充分统计功效的前提下进行。对于基于质谱的研究,合理的样本处理策略有助于扩展检测范围,同时降低细胞成分引入的风险。进一步的标准化流程、质量控制方法以及跨机构协作,将有助于提高结果的可重复性,并推动相关研究向临床应用转化。