STCM | 清华大学李梢团队探究网络药理学结合大语言模型在中药研究中的应用

图片

摘要


的成分复杂,其多靶点、多途径的作用机制挑战了传统的单一药物-单一靶点模式。网络药理学通过构建多层次的药物-靶点-疾病网络,为系统解析中药的作用机制提供了有力框架。近年来,人工智能特别是大语言模型的突破性进展,显著提升了数据整合、靶点识别和临床辅助决策的能力。本文综述了网络药理学与大语言模型在中医药研究中的应用进展,重点探讨了它们在深入阐明中药作用机制和优化药物研发方面的潜力。通过融合传统医学智慧与现代计算工具,这种综合研究策略有望推动中医药的科学化验证进程,并助力创新医疗解决方案的开发。


关键词:中药;网络药理学;大语言模型;机制解释;药物开发


1. 引言


中医药(TCM)历史悠久,其核心理念基于整体观,强调人体系统间的平衡与相互联系。作为全球应用最广泛的医学体系之一,中医药在疾病的预防、诊断和治疗方面提供了独特的视角。然而,中药多成分、多靶点的复杂特性使得中医药的科学验证与作用机制阐明面临挑战。这种复杂性也制约了中医药融入现代生物医学研究及临床实践的进程。


网络药理学,作为一种基于系统生物学的研究方法,已成为应对上述挑战的有力工具。该方法通过构建“药物-靶点-疾病”多层次生物网络,能够系统、全面地解析药物的作用与治疗机制,尤其契合中药多靶点、多途径作用的特点。通过识别关键的生物靶点和信号通路,网络药理学有力推动了中药多靶点效应的研究,揭示了中药活性成分与生物系统之间复杂的相互作用关系。


近年来,人工智能技术(AI),特别是大语言模型(LLM)的迅猛发展,进一步拓展了网络药理学的研究边界。AI驱动的算法显著提升了药物-靶点相互作用的预测精度,优化了药物-疾病关联分析,并改进了药物组合策略。将AI与网络药理学相融合,有望在传统医学智慧与现代生物医学之间架起桥梁,为阐明中医药作用机制和开发创新治疗策略开辟崭新路径。


网络药理学与LLM的整合具有显著的互补性,在推进药物发现和机制阐释(特别是在中医药领域)方面展现出应用潜力。传统的网络药理学主要侧重于构建基于现有知识的“中药-靶点-疾病”相互作用静态网络。尽管这种方法提供了对相关关系的基础认知,但其在处理大规模、多源异构数据的动态分析能力上存在局限。相比之下,LLM 擅长处理和分析海量多模态数据,能够挖掘潜在特征、识别复杂模式,并持续优化其推理过程。


因此,网络药理学为识别和描绘静态关系奠定了基础,而LLM 则能通过动态分析这些关系来生成更深入的洞见。这种协同效应显著增强了药物靶点识别能力,深化了对治疗机制的阐释,加速了药物发现进程,并支持了更广泛的应用。


本文旨在简要介绍网络药理学与大语言模型的基本原理及研究方法,并重点探讨二者如何在阐明中药复杂、多层次的作用机制方面实现优势互补。通过整合这两个前沿领域的见解,本综述强调其联合应用不仅有助于揭示中药复方的分子作用基础,更能加速新型治疗干预措施的发现与优化(图1)。


图片


络药理学与大语言模型集成的全面概述


2. 引言网络药理学和LLM概述


2.1. 网络药理学


2.1.1. 网络药理学的概念与发展


网络药理学是一门新兴的交叉学科,它融合了系统生物学、生物信息学和网络科学等领域的理论方法,突破了疾病与药物研究中传统的“单基因、单靶点”模式。与聚焦单一靶点的传统研究不同,网络药理学通过构建多层次的生物网络,将药物、靶点及疾病节点相互连接,着重解析药物的多靶点效应。该方法使研究人员能够揭示药物与生物系统之间复杂的相互作用关系,并阐明其作用机制。


1999年,李梢教授首次提出了与中医药分子网络机制相关的假说,这成为国际上最早的网络药理学概念雏形之一。进入21世纪,高通量组学技术与生物信息学的飞速发展推动了该领域的快速成长。


2007年,英国学者霍普金斯(Hopkins)正式提出“网络药理学(network pharmacology)”这一术语,将药物作用定义为多靶点调控网络,并将其确立为“下一代”药物发现的范式。随着基因组学、蛋白质组学、代谢组学等大规模组学数据的海量积累,以及人工智能技术的突飞猛进,网络药理学在复杂疾病生物标志物筛选、多靶点药物作用机制解析、药物研发优化等关键研究领域得到了日益广泛的应用。


2.1.2. 网络药理学方法


研究人员基于“多基因、多靶点、网络调控”的核心原理,持续开发出药物-靶点预测、疾病-靶点预测、药物-疾病关联分析、药物协同作用预测等新方法。


在药物靶点预测方面,核心目标是识别潜在的药物作用靶点,这依赖于对药物与靶标分子间相互作用的深入分析。该过程通常整合多种计算方法,包括网络拓扑分析、共表达分析以及基于机器学习的预测模型,这些方法能够系统性地协同识别新的治疗靶点。例如,drugCIPHER 作为一种线性回归框架,通过整合异构药物相似性数据与蛋白质相互作用网络信息,实现了药物-靶标相互作用的精准预测。通过在多层生物网络中整合图学习框架(融合随机游走算法与图神经网络(GNN)),药物靶点预测领域取得了进展。例如,Deep-DTA 应用异构图注意力(HGAT) 模型,捕获化合物分子的拓扑结构信息及其与靶蛋白之间的双向互作关系。此外,GNN 技术已被应用于预测药物对靶点的激活与抑制效应。例如,DrugAl 整合了 GNN、卷积神经网络(CNN)及网络嵌入等多个模块,专门预测药物-靶点间的激活与抑制机制。


在疾病靶点预测方面,研究者利用网络拓扑分析与图算法来挖掘与特定疾病相关的潜在靶点。例如,DIAMOnD 算法采用随机游走策略,从人类蛋白质-蛋白质相互作用(PPI)网络中识别疾病相关功能模块。Barabási团队研究了大规模人类PPI网络的结构可控性,证明了可控性分析在高效识别疾病基因与药物靶点方面的价值。此外,疾病相关基因的预测方法已不再局限于疾病本体,进一步拓展至更具体、微观的层面,如表型、组织及细胞水平。


整合疾病、药物与生物分子网络信息,增强了药物-靶点-疾病关联关系的预测能力,推动了药物重定位及新药发现进程。例如,TxGNN 作为一种基于图学习的药物再利用基础模型,为治疗方案有限的疾病识别潜在候选疗法。类似地,RepCOOL 方法通过整合异构生物网络,为特定疾病推荐新的候选药物。此外,用于模拟协同药物效应及构建药物组合网络的深度学习方法的发展,优化了药物相互作用的预测精度,并提升了联合用药策略的有效性。例如,一种基于网络的迁移学习方法被成功应用于高效的药物-疾病相互作用预测,对单一药物及药物组合均展现出较强预测能力。其他模型如 NLLSS 和 MLRDA,则利用半监督学习技术增强对协同药物组合的预测性能。


2.2. 大语言模型


2.2.1. LLM的概念和发展


大语言模型是基于深度学习技术训练的人工智能模型,其核心特征在于拥有海量参数。这些模型不仅在自然语言处理(NLP) 领域应用广泛,还深刻影响着生物信息学、医学、编程语言及多模态学习等多个学科。


相较于支持向量机(SVM)、决策树和随机森林等传统机器学习模型,LLM 通常包含数亿至数千亿参数,赋予其处理更复杂、更庞大数据集的能力。例如,SVM 常用于文本分类任务,决策树应用于医疗诊断系统,而随机森林则用于预测股票市场趋势。尽管这些传统模型对诸多任务有效,但它们通常依赖人工特征工程,过程耗时且在处理大规模复杂数据集时可扩展性受限。此外,在数据有限或噪声较多的情况下,传统模型更易过拟合;面对需要捕捉长程依赖关系或复杂模式的任务时,其性能也往往显著下降。


相比之下,凭借其庞大的参数量和复杂架构,LLM 在解决现实世界问题时展现出卓越的表达能力与泛化能力,在执行各类复杂任务时通常超越传统模型。更重要的是,LLM 能够自动从原始数据中学习并提取关键特征,彻底摒弃了人工特征工程的繁琐过程,从而显著提升了其在广泛应用中的准确性与适应性。这些模型不仅擅长理解人类语言,还能有效解析蛋白质序列、编程代码,甚至处理融合文本、图像与音频的多模态数据。


LLM 的兴起可追溯至深度学习技术取得突破性进展的时期。2012年,AlexNet 在计算机视觉领域的成功标志着深度神经网络开始受到广泛关注,开启了大规模神经网络时代。随着深度学习技术的持续演进,结构日益复杂的模型被开发出来,在包括自然语言处理在内的多个领域取得了成就。


2018年,Google 推出了基于Transformer架构的BERTBidirectional Encoder Representations from Transformers) 模型。其双向编码机制能更有效地捕捉上下文信息,为大规模预训练语言模型奠定了基础。


2020年,OpenAI 发布了拥有1750亿参数的语言模型 GPT-3,进一步加速了 LLM 的发展,充分展示了大规模预训练模型在多任务处理与微调适应方面的潜力。继 GPT-3 之后,Google 的 PaLMDeepMind 的 Chinchilla 等超大规模模型相继问世,凸显了LLM技术不仅在NLP中举足轻重,更在代码生成、蛋白质结构预测(如AlphaFold)等专项任务中展现出强大能力


2.2.2. LLM在医学中的应用


LLM 在多个领域取得了显著进展,尤其在医学领域的疾病诊断、个性化治疗、医学影像分析和药物研发方面展现出强大的能力。例如,在结构生物学领域(而非狭义医学影像),DeepMind 的 AlphaFold 革新了蛋白质结构预测,为药物研发提供了关键洞见。组学技术的进步也使得 Geneformer 等生物信息学模型能够分析基因组数据并识别潜在生物标志物。专为生物医学设计的 BiomedGPT,实现了在医学影像分类、问答等任务的应用。在药物研发领域,ChemBERTa 等模型可预测分子特性,助力新候选药物的发现。随着这些模型的持续演进,它们有望在医疗实践现代化进程中扮演日益重要的角色。


LLM 不仅在现代医学领域成就斐然,其在中医药领域同样展现出潜力。中医药的理论框架与现代医学差异显著,尤其在疾病分类体系、治疗理念方法及药物运用原则等方面。当前,LLM 技术已在阐释中医理论精髓及结合网络药理学开发创新中药方面显现前景,为该领域带来新的研究视角和实用工具。


LLM 技术选型上,通用领域 LLM(如 GPT-3)通常在包含数十亿参数的庞大开放域数据集上预训练,具备强大的泛化能力,但也存在领域特异性知识有限的不足。相比之下,中医药专用 LLM 则在专业语料库(常融合中医药知识图谱或经典古籍文本)上进行精调,以增强其在中医临床场景中的相关性与准确性。虽然这类领域专用模型在部署时通常效率更高,且其逻辑推理更契合中医药语言体系,但其知识覆盖范围可能相对受限。因此,在针对中医药机制阐释或处方生成等任务选择合适的 LLM 工具时,深入理解这些差异至关重要。随着技术不断发展,LLM 有望在驱动中医药现代化方面发挥越来越关键的作用。


2.3. 网络药理学与LLM的方法学区别与互补性


尽管传统的网络药理学方法与LLM方法均被应用于中医药研究,但两者在方法论与功能定位上存在显著差异。


传统网络药理学的核心在于,依据预构建的生物学关联(如蛋白质互作、通路)及拓扑学规则,将中药/化合物、生物靶点以及证候/疾病节点连接起来,构建结构化的生物网络图。这类方法侧重于识别关键功能模块,并基于静态或半结构化的知识库数据(如已知相互作用数据库)来解析多组分间的相互作用机制。


相比之下,LLM(如 GPT-3 或特定领域模型)则是建立在海量非结构化文本数据上训练的深度学习模型。它们擅长语言理解、文本摘要与内容生成,具备能力阐释中医药理论、解答临床诊疗问题,甚至能基于学习到的模式生成符合临床指征的中药处方。


虽然基于网络算法的方法在生物学可解释性和机制相关性方面具有强大优势,LLM 却能提供更高的灵活性、深层的语义理解以及强大的生成能力。


网络药理学与LLM的深度整合,有望弥合基于生物机制的定量建模与智能语言驱动决策之间的鸿沟。这种融合方法的具体应用与潜力,将在后续章节中详细探讨。


▋3. 基于网络药理学驱动的人工智能算法解析中医药原理


中医药作为中国传统文化的重要瑰宝,其整体观诊疗理念与网络药理学的核心原则高度契合,均强调中药复方的“多成分、多靶点”作用特征。随着人工智能方法与大数据分析技术的迅猛发展,网络药理学已成为解析中医药复杂作用机制的关键工具。该方法在阐明中药药效物质基础与作用机制、鉴定生物活性成分以及解析中医证候与现代疾病关联等方面展现出应用潜力。


3.1. 网络药理学在中医药机制解析中的应用


网络靶标理论是网络药理学应用于中医药研究的基石。该理论认为,药物的治疗效应源于其对疾病相关分子网络模块的调控能力。这一观点深刻揭示:理解中药方剂的核心在于识别并构建方剂(或单味药)、分子与细胞靶点、器官/组织层面的表型、中医证候以及现代疾病之间的多层次网络关联。正是这些网络关联构成了中医疗效的结构基础,因此,推断和验证这些网络关系的能力,对于阐明中药的作用原理至关重要。


3.1.1. 中药作用机理分析


网络药理学通过引入多层次网络分析视角,系统地将中药、生物靶点及疾病关联起来,革新了中药作用机制的研究范式。例如,对经典方剂六味地黄丸的网络分析,揭示其核心分子靶点群与关键药理通路,阐明了其治疗作用的基础。该方法整合了中药的化学性质、治疗应用与网络分析技术,为阐明中药复方的作用机制提供了系统性、整体性策略。同样,针对滋补类中药在癌症治疗中的研究显示,其生物活性成分能协同靶向免疫调节通路与抗肿瘤通路,体现了中医“扶正祛邪”治则在分子层面的作用机制。此外,对中药“寒”、“热”药性(四气)的分类研究表明,寒/凉性中药普遍具有较强的抗菌、抗病毒及抗炎活性,而温/热性中药则表现出更强的免疫调节作用。大数据与人工智能算法的融合,使得中药药性的表征日趋精准,推进了中医药的现代化进程。


中药作用机理分析的核心挑战在于确定其发挥疗效的关键生物活性成分,并深入理解中药复方配伍的科学规律。网络药理学为应对这些挑战提供了强有力的方法学支撑。例如,基于距离的互信息模型(Distance-based mutual information model)的建立,揭示了中医方剂配伍的核心组合原则。基于网络靶标的多组分协同识别方法(Target-based identification of multicomponent synergy, TIMCS)应用网络靶标策略筛选具有协同效应的中药组合。此外,针对华氏黑汤(Huashi Baidu Decoction, HSBD)治疗COVID-19(新型冠状病毒肺炎)的药理学研究,成功鉴定出343种化合物,并利用超高效液相色谱(UPLC)技术在患者血浆中追踪到60种原型生物活性化合物。


人工智能驱动的网络药理学模型显著提升了中药-靶点相互作用的预测精度,为深入解析中医药的分子机制提供了新视角。例如,HTINet2 模型融合知识图谱嵌入技术与图神经网络,实现了中药-靶标相互作用的预测。类似地,Herb-CMap 构建了一个多模态融合框架,将蛋白质-蛋白质相互作用数据与中药诱导的基因表达谱特征进行整合。该模型通过基于网络的热扩散算法,筛选活性成分并构建了中药-靶点互作图谱。


3.1.2. 疾病-证候关联与生物标志物发现的解析


网络药理学最具前景的应用方向之一,在于其破译中医证候与现代疾病关联以及识别用于诊断与疗效评价的生物标志物的能力。寒证与热证是中医最基本的辨证分型之一,诸多现代疾病可依据其临床表现被纳入相应的中医证候范畴。深入理解中医症候与现代医学疾病类型(西医证型)的关联及其内在分子机制,对于阐明中医辨证论治的科学内涵及优化临床治疗策略至关重要。


Chen等学者通过探索寒热证背后的免疫-代谢稳态网络,揭示了二者具有显著差异的生物网络特征。针对脾虚证等证候的研究也取得进展:Wang等学者在慢性胃炎及肠易激综合征患者中,识别出先天免疫功能失调与氧化应激相关功能模块,验证了“疾病-证候-中药”网络模型的有效性。此外,人工智能驱动的微生物组学研究已发掘出超越经典中医理论框架的新型生物标志物。例如,一项基于舌苔微生物组的分析揭示了与寒热证显著相关的差异性微生物群落结构,并据此构建了符合中医诊断学原理的“舌苔菌群失衡网络”。


中医证候与现代临床表型常植根于不同的认知框架。网络药理学则在传统中医理论体系与现代医学范式之间架设了至关重要的桥梁。例如,基于AI的多组学整合分析研究了胃部慢性炎症促进肿瘤发生的机制,其发现与中医对“脾胃湿热”等证候导致胃肠疾病的核心观点高度契合,提供了分子层面的机制印证。名为 aittongue 的深度学习模型被成功开发,通过识别舌象特征与疾病状态(如胃癌前病变)的关联,实现了对相关疾病的无创筛查。


近年来,研究者日益广泛地应用数据挖掘与网络表征学习技术构建中医证候-现代表型-分子特征关联数据库,便利了对中医证候生物学基础的解析。例如,SymMap 系统整合了中医证候与现代医学的表型、分子特征,将中医概念映射至当代生物医学知识体系。


3.2. 网络药理学与LLM融合在中医药机制解析中的潜力


网络药理学与大语言模型的深度整合,为推进中医药作用机制的深度解析展现出潜力。网络药理学的核心优势在于系统阐明药物、靶点与疾病之间复杂的相互作用网络,这与中医药“多组分、多靶点、多通路”的整体调节特征高度契合。当结合 LLM 强大的海量异构数据处理能力与深层语义理解能力时,这种融合能够深入挖掘中医药复杂机制背后的生物学基础,提供更系统、更动态的见解。


然而,当前研究现状显示,尽管LLM在中医药相关任务(如文献挖掘、处方分析、辅助诊断)中的应用日益广泛,但其与网络药理学的有效协同仍处于探索初期。大多数现有研究倾向于孤立地应用LLM,未能充分发掘两种方法间的互补优势与协同效应。目前,LLM在中医药机制解析中的应用,主要集中在以下几个方向:临床知识智能检索与推理、中药复方配伍原理的阐释与生成、基于证候的疾病智能诊断支持。


3.2.1. 临床知识检索


在临床知识检索领域,大语言模型正日益广泛地应用于解读和回答与中医药理论及实践相关的问题,从而加深对中药及疗法临床应用的理解。其中一项进展是构建中医药知识图谱。该图谱将中医的症状、方剂、药材等数据以结构化形式组织起来,实现了临床见解的查询与检索。类似地,TCMM(中医药与现代医学)数据库整合了传统中医与现代医学的信息,实现了方剂生成与知识发现,为临床决策提供支持。


除了静态数据库,MedChatZH是一个专为中医问诊设计的微调生成式大语言模型,可辅助临床医师依据中医原理提供诊疗建议。基于案例的问答系统则结合LLMs和知识图谱技术,对临床案例数据进行提取和组织,从而能够从历史案例中提供与当前情境高度相关的答案


此外,灵丹(Lingdan)系统融合了专用数据集和“思维链”(chain-of-thought)提示策略,在症状分析和中药方剂推荐方面实现应用。总体而言,这些技术进展通过提升临床知识在医疗环境中的可及性和应用水平,共同推动了中医药的现代化进程。



3.2.2. 方剂解析


在方剂解析领域,大语言模型为理解多成分中药复方及其复杂相互作用提供了强大工具。其典型应用之一是中医方剂分类:研究人员利用LLM对中药方剂数据集进行微调,根据方剂功效实现自动分类。该方法提升了方剂分类的自动化程度与准确性,为海量数据处理提供可扩展解决方案,助力中医药知识体系的现代化进程。


此外,基于LLM的中药处方自动化数据挖掘技术,可辅助识别用药规律与组方原则,从而揭示中药复方背后的核心逻辑并优化分析流程。另一创新应用体现于证候重分类:LLM通过重释《伤寒论》等中医经典著作,为现代中医辨证论治(即辨证施治)及相关疗法提供创新性见解。


这些方法共同推动中医药方剂解读向精准化、系统化方向发展,既为临床决策提供支持,亦促进中医药与现代医学体系的深度融合。


3.2.3. 疾病诊断


在中医疾病诊断领域,大语言模型正日益成为重要的辅助工具。它们通过解析症状模式并推荐适宜疗法,为传统诊断方法与现代医学认知搭建桥梁。典型案例如TCM-GPT:该模型基于中医专业语料库对通用LLM进行微调,实现了中医四诊(望闻问切)及疾病诊断等核心功能


EpidemicCHAT则融合中医典籍知识图谱,专注于疫病防治支持在生成中药处方与自动问答方面实现了应用降低了中医语境下的幻觉生成等错误率。另一生成式模型TCMChat通过模拟真实医患对话,依据中医理法方药原则指导症状解读与治疗方案制定。


针对特定疾病开发的Hengqin-RA-v1模型基于结构化电子病历与临床数据,专注于类风湿关节炎(痹证)的诊疗辅助


这些创新工具彰显了LLMs与中医深度融合的潜力,为疾病诊断与治疗提供了更精准有效的解决方案。


3.2.4. 未来展望


既往研究主要探讨了大语言模型在中医药机制解析中的应用,聚焦于临床知识检索、方剂解析及疾病诊断三大领域。然而,当前多数研究仍集中于文献挖掘、知识图谱构建和数据驱动模式识别,网络药理学的整合应用尚显不足。


最新研究表明,网络药理学与LLM的深度融合将为复杂生物系统的机制阐释开辟全新路径。以TREE模型为例:该模型基于Transformer架构整合多组学数据与生物网络拓扑结构,通过解析多元分子互作与网络特征,识别癌症相关基因。这种方法启示了网络药理学与LLMs在更广泛网络研究中结合的潜力这种技术融合有望增强中医药机制的解析深度。


其核心价值主要体现在三方面


第一,精准阐释方剂多成分-多靶点作用机制通过构建药物-靶点-疾病网络,并依托LLMs的高维数据处理能力,研究者可系统解析中药复方的作用机理,建立全景式认知框架。


第二,实现药物靶点与信号通路的智能识别LLM能自动化处理海量中医药与药理数据,在网络药理学框架内精准定位关键靶点及通路,显著提升机制解析的精确度与药理效应认知深度。


第三,推动中西医知识的跨学科融合通过整合中医经典文献与现代药理学、基因组学等生物医学数据,LLM可构建跨领域知识桥梁,促进中医药机制阐释与现代医学体系接轨。


综上所述,网络药理学与LLM的协同创新将为中医药机制研究带来革命性突破。该融合模式既能精准解析中药复方多靶点作用机制,又可实现关键药理要素的智能识别,同时促进跨学科知识整合。这些突破性进展将共同推动中医药的科学验证与现代化转型。


▋4. 基于网络药理学与人工智能的中药新药开发 


中药新药研发已逐步演进为融合中医理论精髓、临床实践经验与现代临床试验方法的综合性转化研究体系。然而,该领域仍面临诸多关键挑战。中医药遵循“辨证论治”原则,强调依据患者的整体状态及具体证候制定个体化治疗方案。此外,中药复方固有的多组分特性及其复杂的作用网络,使得明确药效物质基础、系统阐明整体作用机制以及构建完整科学证据链变得困难。


因此,网络药理学与人工智能大语言模型的深度整合,为突破上述瓶颈、驱动中药新药研发范式的转型,提供了一条具有前景的创新路径。


4.1. 网络药理学在中药新药开发中的应用


网络药理学结合人工智能算法,为中药新药开发提供了系统性策略框架,涵盖临床相关信息智能提取、疾病-药物多维网络构建、处方推荐优化、药物重定位以及精准处方设计等关键环节。这些数据驱动的方法,有效桥接了真实世界临床实践与分子层面的机制洞见,为开发创新中药奠定了坚实基础。


在网络药理学研究中,为确保预测结果的可靠性,通常需设定若干关键验证参数:


  • 潜在靶点筛选: 常采用预定义的 Top-N 潜在靶点筛选策略(如选取预测得分最高的前N个靶点)进行深入验证。


  • 通路富集分析: 利用显著性阈值(通常 p < 0.05)识别具有统计学意义的生物学通路及相关过程。


  • 成药性评价: 评估关键药代动力学(ADME)特性,例如设定口服生物利用度(OB≥ 30% 及类药性(Drug-likeness, DL≥ 0.18 等标准,以保障候选化合物具备良好的治疗潜力与成药性。


这些标准化参数体系,不仅支持对药物-靶点相互作用的全面评估,更是高效识别具有显著临床应用前景的候选药物的重要保障。


4.1.1. 药物开发案例研究


案例一:基于传统智慧的新分子实体设计血管生成受复杂生物网络精密调控。受传统用于心绞痛治疗的中药复方(如含丹参、冰片方剂)的启发,研究者成功开发了新型小分子化合物——丹参素冰片酯。该研究展示了如何从传统中药的药效机制洞见出发,指导设计具有明确靶向性与清晰药理特性的创新治疗分子。


案例二:整合现代临床试验验证中药新药该研究采用多中心、前瞻性随机对照试验(RCT)设计,旨在比较金振口服液(JZOL 与西医常规治疗药物盐酸氨溴索口服溶液(含氨溴索、克仑特罗) 在治疗儿童急性支气管炎中的疗效。研究共纳入480例患儿,随机分配接受为期7天的JZOL或西药治疗。


  • 主要疗效终点(至咳嗽缓解时间): 两组中位缓解时间均为5天(风险比 [HR] 0.98, 95% 置信区间 [CI] 0.80-1.20; P=0.85)。


  • 起效时间: 止咳效应最早可在治疗启动后24小时观察到。


该研究阐释了如何通过严谨的现代临床试验方法,对源自中医临床经验的方剂进行科学化评估与验证,从而强化中药复方的科学基础。


4.1.2. 精准处方优化


网络药理学结合人工智能算法,推进了中药精准处方优化的研究进程,支持研究者依据患者的个体化临床特征(如证候、基因型、代谢谱等)动态调整中药复方配伍。


其核心机制在于:通过构建疾病-靶点多维互作网络,AI模型能够精准识别并推荐最优中药组合。这些推荐方案遵循中医君臣佐使”“辨证论治等核心原则,同时深度融合现代生物医学(如基因组学、蛋白组学)的最新发现,确保其科学性与有效性。


案例佐证:例如,一项针对亨廷顿病(Huntington's Disease, HD)的研究,应用SVM模型系统分析了该疾病的关键致病通路,并成功锁定潜在治疗靶点群。该研究不仅构建了一套基于计算的理性复方设计框架,更为阐释中药干预神经退行性疾病的药效机制提供了新视角。


4.1.3. 智能处方推荐


此外,基于人工智能的数据驱动处方推荐系统已成功研发,旨在显著提升中医药诊疗方案的精准度与临床决策效率。


此类系统深度融合了真实世界临床大数据、中医辨证论治(Syndrome Differentiation and Treatment, SDT)核心原则以及先进的AI预测模型,能够为个体患者动态生成高度个性化且疗效最优化的中药复方。


例如:


  • PresRecST 提出了一种面向真实世界患者的中药复方智能推荐算法,

    将辨证论治原则与治疗决策算法进行整合。


  • FordNet 突破传统推荐模式,通过融合临床表征数据与分子水平信息(如靶点、通路),构建疾病-证候-药物-靶点多层生物网络关系模型。


4.2. 网络药理学与LLM在中药新药开发中的协同潜力


基于网络药理学与大语言模型在中医药机制深度解析中展现的互补优势,两者的协同融合在驱动中药新药研发创新方面同样蕴含着重大战略前景。


该融合的核心价值在于:


  • 靶点与通路识别精准化: 能够更精准地锁定中药的作用靶点及其调控通路。


  • 复方作用机制深度阐释: 系统深化对中药复方多组分-多靶点协同治疗机制的理解。


当前,该领域的研究主要呈现两大聚焦方向:


  • 应用导向研究 (宏观层面) 主要集中于开发智能处方推荐系统,旨在优化临床决策流程与提升治疗方案的精准性。


  • 机制驱动研究 (微观层面) 重点聚焦于在分子水平上解析中药活性成分的作用机制、识别潜在靶点群以及阐明生物网络调控规律。


4.2.1. 智能处方推荐


在宏观应用层面,研究核心聚焦于中药复方的智能推荐。大语言模型通过分析海量中药处方数据集,依据已知药效与组分相互作用规律,为特定临床场景推荐最优中药组合方案。尽管该方法主要基于既有理论与实践经验,其核心价值在于高效挖掘与重组已有知识,为潜在新方创制提供数据驱动支持,而非直接提供新机制洞见。


代表性方法与模型:


  • 融合图神经网络的方法: Qi等学者整合LLMGNN技术,提升处方推荐的精准度。


  • 领域微调LLM模型:


  • TCMLLM-PR 专注于中医药处方任务的LLM微调,利用广泛的中医药数据源及疾病关联信息对模型进行训练,填补专业处方知识空白。其指令微调数据集包含68,654样本,语料规模达1000Token


  • TCM-FTP 同样通过微调LLM实现中药处方预测,其特色在于依赖专业临床数据集并采用LoRALow-Rank Adaptation)技术实现参数微调。该模型训练集包含16,896个处方样本,平均每方含23.92味中药。


  • 融合外部知识的方法:


  • TCM-KDIF 融合中医药理论及分子生物学知识于临床数据中,提升对罕见临床病例的处方推荐性能,降低模型对大规模训练数据的依赖。


  • 生成对抗网络(GAN)与Transformer结合模型: 提出一种基于Transformer架构并集成生成对抗网络的模型,用于预测住院患者电子健康记录(EHR 相关的中药处方。该模型利用自然语言处理技术对原始EHR数据进行结构化处理,并通过GAN生成合成数据增强训练集,缓解模型过拟合问题。


综上,这些前沿方法通过:


  • 整合多源异构数据集


  • 融入外部专业知识(中医药理论、分子生物学)


  • 应用先进数据增强技术(如GAN


提升了中药智能处方推荐的准确性、鲁棒性与临床适用性,为循证中医决策提供了工具。


4.2.2. 分子研究


在微观层面,研究聚焦于分子层面的探索,其中大语言模型与网络药理学被用于识别中药方剂中的特定化合物,并探究其与生物靶点的相互作用。这种更精细的研究方法为揭示中药疗效的分子机制提供了有价值的见解,有望加速新药物靶点和治疗途径的发现。


有研究采用基于Transformer的图神经网络模型,通过整合分子结构来预测中药化合物的生物利用度。该方法可识别具有药理相关性的分子片段,有助于筛选出有潜力的候选药物。类似地,HGNA - HTI模型通过引入注意力增强的GNN优化了中药 靶点相互作用预测,能够捕捉复杂关联,为阐释中药的治疗机制提供思路。此外,DeepTCM模型将深度学习与系统生物学相结合,用于预测中药方剂的疗效。该模型聚焦于中药 靶点相互作用,并借助生物知识图谱模拟复杂疾病关联(如冠心病与抑郁症的共病情况)。这些先进方法正逐步弥合传统中药知识与现代药物研发之间的鸿沟,为基于中药的药物发现开辟了新路径。


4.2.3. 未来展望


网络药理学与大语言模型的整合为中药新药研发提供了极具前景的策略。如前述讨论,这两种模型通过将计算能力与中医药固有的丰富复杂知识相结合,在多靶点药物研发挑战中形成互补优势。网络药理学致力于绘制中药、靶点与疾病间的复杂相互作用网络,而LLM凭借其处理海量数据集的能力,深化了对这些相互作用的理解。二者共同构建起一个提升药物靶点识别、阐明治疗机制并加速新药发现的综合框架。


以图变换-卷积网络方法为例:该技术虽最初针对癌症研究开发,但其整合网络药理学绘制药物-靶点-疾病互作网络,并利用大模型处理多源数据集的技术路径,增强了药物发现效率。尽管此案例不聚焦中医药领域,却为中药新药开发提供了可迁移的方法论参考。


第一,在靶点识别与药物筛选中,网络药理学通过解析中药化合物的多靶点效应发挥核心作用,但其对静态数据的依赖限制了预测效能。大模型(特别是深度学习技术)通过分析海量分子与临床数据,精准定位候选药物,从而提升靶点预测精度并优化筛选流程,最终获得更可靠的结果。


第二,在精准药物研发领域,网络药理学与LLM的协同效应构建了强大的个体化医疗框架。网络药理学虽能阐释中药复方与疾病的系统级互作,LLM则通过整合患者特异性多组学数据及临床特征,进一步深化机制认知。这种融合可实现双重目标:(1)基于个体基因构成与疾病特征的精准靶向治疗;(2)通过计算模型预测药效与安全性,建立替代性临床试验评估体系。


第三,该整合策略可加速临床转化进程。传统临床试验常受限于成本与周期,而LLM能模拟临床结局并优化试验设计。例如TrialDura方法利用LLM整合多模态临床试验数据,预测试验周期(误差率低于15%),在优化资源配置的同时提升试验管理决策效能。当结合网络药理学的机制洞察,该策略不仅能减少50%的重复性临床验证,更提高了个体化中药疗法的上市效率与安全性。


TCM研究方法汇总


图片


5. 总结


本文综述了网络药理学在中医药领域的发展、研究方法及应用(表1)。研究强调了网络药理学在阐释中药复方多靶点、多成分特性中的关键作用,及其在推动药物发现与治疗策略创新方面的潜力。


尽管传统网络药理学已做出重要贡献,但其局限性也十分显著。传统研究方法主要通过静态生物网络识别药物-靶点相互作用,却往往难以捕捉中药的复杂性——众多生物活性成分在动态多维系统中相互作用。此外,传统方法无法处理中医药中固有的海量异质数据,这进一步阻碍了对其全面的认知。 


将人工智能算法与网络药理学结合,是克服上述局限的重要突破。AI驱动的技术不仅提升了药物-靶点相互作用的预测能力、助力疾病相关靶点的识别,还优化了药物组合策略。通过推动更全面的数据驱动分析,这些技术进一步提高了网络药理学的整体效率与准确性。 


展望未来,网络药理学与大语言模型的结合蕴藏更大潜力。LLM具备处理海量复杂数据的能力,可自动化知识检索、辅助临床决策,并深化对中药方剂的解析。通过将LLM与网络药理学整合,研究人员能更深入理解中药多靶点、多成分的作用机制,为开发更具靶向性的疗法和个性化治疗策略铺平道路。这种协同效应有望加速中医药的科学验证,并为药物发现开辟新路径。为推动临床转化,未来研究可聚焦开发智能诊疗系统——整合真实世界临床数据、辨证论治原则与分子证据,以生成个性化处方。此外,这些集成模型还可应用于药物再利用流程和数字化方剂设计,通过系统性证据生成支持中药现代化。 


尽管LLM与网络药理学的整合为推进中医药研究带来广阔前景,但仍面临若干关键挑战。其中之一是中医药文献常包含专业术语和模糊表述(如“湿热”与“湿温”的区分),通用LLM难以准确解读。解决这一问题可将预定义的中医药词典(包含经典文献与现代临床笔记)与领域适配语言模型结合,以增强语义理解。此外,高质量中医药临床数据的稀缺性可通过迁移学习缓解——先在西医数据上预训练模型,再用中医药特定数据集进行微调。 


综上,网络药理学、人工智能与大语言模型的融合代表着中医药现代化的前沿方向。这些进展不仅架起传统医学与现代医学的桥梁,还推动形成更整体、精准的医疗模式,有望重塑全球医疗实践。


该文章来自于清华大学李梢教授课题组,课题组自主研发了基于网络靶标的中西医药智能和定量分析技术与系统(UNIQ系统),通过分子网络定位与导航技术,突破传统研究模式,中医药原理解析、精准诊疗、中药创新研发等方面取得重大应用STCM邀请撰写此综述


清华大学自动化系博士生刘清源、张丁帆、汪博洋为该文的共同第一作者,欧洲科学与艺术院院士、清华大学北京市中医药交叉研究所所长李梢为该文的通讯作者,研究得到国家中医药管理局“中医药原理解读计划”专项项目资助GZY-KJS-2024-03)。


该文章在线发表于《中医药科学(英文)》Science of Traditional Chinese Medicine


引文格式

Liu Qingyuan, Zhang Dingfan, Wang Boyang, Zhao Weibo, Zhang Tingyu, Sutcharitchan Chayanis, Li Shao. Network pharmacology: Advancing the application of large language models in traditional Chinese medicine research. Science of Traditional Chinese Medicine 2025;3(2):113-123. doi: 10.1097/st9.0000000000000073 

https://journals.lww.com/stcm/fulltext/9900/network_pharmacology__advancing_the_application_of.55.aspx


期刊简介



STCM文章汇总








1卷1期

1卷2期

2卷1期

2卷2期

2卷3期

2卷4期

3卷1期



投稿方式


杂志官网


https://journals.lww.com/stcm

投稿网址


https://www.editorialmanager.com/stcm


图片

机器学习

图片