Cell发文!复旦华山科学家绘制人类健康与疾病蛋白质组图谱

图片


大规模蛋白质组学研究

能够深化对健康和疾病的理解

但蛋白质与健康和疾病之间的关系

仍然存在许多未解之谜

 

蛋白质能否作为疾病预测和诊断的

生物标志物及潜在治疗靶点?

复旦大学附属华山医院郁金泰、毛颖团队

联合复旦大学类脑智能科学与技术研究院

程炜、冯建峰团队联合攻关

全面绘制了人类健康与疾病蛋白质组图谱

结合人工智能大数据分析方法

构建疾病诊断预测模型

发现了26个药物治疗新靶点

为精准医疗和新药开发提供了重要科学依据

 

相关成果

《健康与疾病血浆蛋白质组图谱》

(Atlas of the plasma proteome in health and disease in 53,026 adults)为题

于北京时间11月22日,在《细胞》(Cell)杂志发表


图片




多学科融合创新

为精准医学实施提供支撑




随着全球人口的快速增长和老龄化,健康需求和疾病负担日益增加。疾病预防和治疗面临的主要挑战包括缺乏可靠的个体化风险预测模型以及现有治疗方法的疗效和不良反应仍有待改善,这突显了精准医学的重要性。


基于基因组学的精准医学研究已取得初步成效,但基因转录和翻译过程的复杂性阻碍了因果基因的识别,进而限制了精准医学的发展。蛋白质能够直接反映人体的生物过程和病理变化,是理解疾病机制和开发新疗法的关键。


郁金泰教授和程炜教授多学科融合交叉团队敏锐觉察到蛋白质组学研究对阿尔茨海默病(AD)预防、诊断和治疗的意义,先后通过血浆及脑脊液蛋白质组学研究发现了AD新的诊断生物标志物,联合诊断精度高达98.7%。系列成果早期发表在Nature Human BehaviourNature Aging等期刊,并受到Nature主刊的高度评价。


在前期蛋白质组学研究的基础上,团队发现,尚缺乏全面的健康与疾病蛋白质组图谱,而这引出了许多尚未解决的问题。例如,前期所发现的AD相关蛋白质是否特异性地与AD相关,抑或同时与其他疾病有关联?这些蛋白在疾病的病理生理机制中有何贡献,是否能够促进对人类疾病的生物学分类?血浆蛋白对人类疾病的预测诊断效能如何,是否能作为疾病的潜在治疗靶点?回答这些问题是极大的挑战。人类健康状态与蛋白间存在复杂作用关系,此外,高维度蛋白测序数据内部也存在错综复杂的交互作用,这使得数据的处理与分析过程变的异常繁琐且充满挑战。




全面绘制健康与疾病蛋白质组图谱

深度解析疾病发病机制




该研究通过深入分析53,026名个体的血浆蛋白质组数据,跨越了14.8年的中位随访期,建立了全面的蛋白质组图谱。该图谱涵盖了2,920种血浆蛋白质与406种既往患病、660种随访新发疾病以及986种健康相关表型,揭示了168,100个蛋白质-疾病关联和554,488个蛋白质-表型关联。研究中发现超过650种蛋白质与至少50种疾病存在联系,而超过1000种蛋白质表现出性别和年龄的异质性,这些发现加深了我们对疾病间共享和特异分子机制的理解,揭示了不同人群在疾病易感性上的差异,为精准诊疗提供了科学依据。


图片

人类健康与疾病血浆蛋白质组图谱


研究还发现免疫系统相关通路在绝大部分疾病中富集,强调了炎症在人类健康中的重要作用。此外,不同疾病间生物学通路的比较分析,完善了对疾病病理生理学相似性和异质性的理解。例如, AD和血管性痴呆(VaD)相关的蛋白质在与神经系统相关的共同通路中富集,而AD特异性通路大多与脂质代谢有关,VaD特异性通路与心肌有关。


传统的疾病分类策略通常基于相似的临床症状和表型特征,而忽略了共同的分子基础。利用蛋白质组学特征对660种疾病进行聚类,能够根据其共享的生物学特性将这些疾病联系起来,从而重新审视疾病的类别和亚型。例如,各种痴呆亚型被划分到同一疾病亚群,该亚群还包含精神、内分泌、心血管等系统疾病,基于此,研究团队进一步揭示了该亚群的特征性生物学通路,将生物学上相关的疾病联系在一起,有助于解释为何患者身上会同时出现看似不相关的症状,并进一步加深对疾病机制的理解和提高治疗的有效性




人工智能助力全疾病谱预测/诊断

挖掘疾病诊疗新靶点




为了精准评估血浆蛋白质组学在疾病预测和诊断中的临床价值,我们需要结合人工智能和大数据分析技术。血浆高通量测序蛋白质数据存在复杂交互作用,往往难以单独处理,而人工智能算法,能够高效提取关键特征,构建精确预测/诊断模型。


研究利用人工智能与大数据分析技术,识别出了具有潜在诊断和预测价值的生物标志物,发现基于蛋白质的模型在183种疾病中的AUC值超过0.80,明显优于基于人口统计学的模型,将有助于提高疾病的早期诊断精度。值得一提的是,GDF15被发现是预测和诊断多种疾病的关键蛋白,其在对200种疾病的预测中的重要度均排名第一,这表明GDF15在疾病的早期识别和风险评估中具有重要作用,可能成为一个重要的生物标志物。此外,EDA2R、NTproBNP、COL9A1和NEFL等蛋白也在多个疾病中表现出良好的预测和诊断性能,表明它们在多种生物过程中发挥着核心作用,具有广泛的临床应用潜力。


图片

蛋白质在疾病预测和诊断中的性能(A-B.血浆蛋白、人口统计学及综合模型预测[A]和诊断[B]疾病的AUC值;C-D.蛋白质在疾病预测[C]和诊断[D]中的重要度排序)


同时,通过整合蛋白质数量性状位点(pQTL)和疾病全基因组关联研究(GWAS)数据,本研究使用孟德尔随机化分析(MR)确定了474个具有潜在因果关联的蛋白质-疾病对,其中与神经精神疾病相关的蛋白质有18个。通过检索DrugBank和Therapeutic Target Database两个数据库中的药物靶点信息,本研究提供了对25个已知靶点的37种潜在药物重新利用机会,如将BSG重定位作为治疗抑郁症的潜在靶点。最后,通过对MR发现的潜在靶点进行安全性评估,本研究确立了26个具有治疗潜力且安全性良好的新靶点,为新药开发提供了重要线索。


血浆蛋白在疾病的发病机制中发挥关键作用,是治疗靶点主要来源。对历史药物开发项目数据的评估显示,有遗传证据支持的靶点-适应症对在药物开发中更有可能获得成功。本研究发现的蛋白质-疾病因果关系将为疾病的药物重新利用和新药开发提供极大的助力。




资源开放共享

助力精准医学研究




为了进一步推动科学研究和精准医疗的发展,本研究建立了一个可开放访问的蛋白质组-表型组资源数据库Proteome-Phenome Atlas(https://proteome-phenome-atlas.com/)。这个数据库不仅有助于科学家们更好地理解疾病的生物学机制,还将加速疾病生物标志物的识别、预测诊断模型和治疗靶点的开发,为精准医学的实施提供强有力的支持。


图片

Proteome-Phenome Atlas数据库首页


这项研究绘制的人类健康与疾病蛋白质组图谱揭示了血浆蛋白在疾病诊断、预测和治疗中的潜在应用价值。同时,该研究也为临床实践提供了科学依据,有助于疾病的早期检测、精准分层和个性化治疗。未来,基于这一开放获取的蛋白质组学图谱,研究人员将能够更深入地探索疾病发病机制,推动生物标志物和预测/诊断模型开发,并探寻全新治疗靶点,为精准医学发展奠定了基础。


图片

由神经临床医生、人工智能、数学、脑科学等专家组成的多学科交叉融合创新团队


复旦大学附属华山医院博士生邓悦婷、复旦大学类脑智能科学与技术研究院青年研究员尤佳等为共同第一作者。复旦大学附属华山医院郁金泰、毛颖教授,复旦大学类脑智能科学与技术研究院程炜、冯建峰教授为论文共同通讯作者。该研究得到了科技创新2030“脑科学与类脑研究”重大项目、国家重点研发计划、国家自然科学基金等经费支持。


论文链接:


图片
图片

来       源


华山医院、类脑智能科学与技术研究院


责       编


殷梦昊


编       辑


曾译萱 徐沁芃