Genomics, Proteomics & Bioinformatics(GPB)在线发表了由河北医科大学丛斌院士和南方医科大学朱波峰教授团队合作完成的题为“Forensic Transcriptomics: Research Progress of the Past Two Decades”的综述文章。我们的“要文译荐”栏目很高兴邀请到文章的作者团队为大家解读法医转录组学在过去二十年的技术演进、应用拓展及未来挑战。
要点介绍
在过去的二十年间,测序技术和数据科学的进步显著深化了转录组学—尤其是非编码转录组学的研究,有力推动了法医学应用的实质性发展。本世纪最初的十年间,法医转录组学分析技术经历了从靶向信使RNA(messenger RNA, mRNA)分型到大规模平行测序及微阵列芯片的演进,使研究人员能够通过分析mRNA表达图谱,追溯法医案发现场生物检材的来源、研究降解动力学,探索与尸体、损伤和毒理学相关的转录组变化规律,为案件侦破提供了重要线索。近十年里,高通量测序技术的突破进一步拓展了法医转录组学的研究前沿,从mRNA延伸至各类非编码RNA。其中,微小RNA(micro RNA, miRNA)、与Piwi蛋白相互作用的RNA(PIWI-interacting RNA, piRNA)、环状RNA(circular RNA, circRNA)及长链非编码RNA(long non-coding RNA, lncRNA)等分子在表达调控和表观遗传修饰中具有独特功能,使其在组织与体液溯源、死因与损伤分析、死亡时间推断、年龄推断以及同卵双胞胎鉴别等法医学实践中展现出一定潜力。现代转录组学结合深度学习及多模态分析,通过多学科融合,正逐步实现对法医生物检材动态时空特征的全面刻画。然而,这些技术仍面临流程标准化、样本采集与处理、伦理规范以及证据解释力等方面的挑战,突破这些瓶颈将是未来十年法医转录组学发展的关键任务。
本文处理编委:
国家生物信息中心陈非研究员
主要内容
本综述系统总结了近二十年来法医转录组学共704篇相关文献的研究进展,内容涵盖从生物证据分析到死亡与损伤推断等多个关键应用领域,展示了从靶向mRNA分型到高通量测序及多组学整合的技术演进路径。关于法医转录组学应用领域的总结中,重点从多个维度进行了分析,包括不同RNA分子(mRNA、miRNA、circRNA、lncRNA、piRNA)的分子特性、检测平台、生物信息学分析策略及其在具体法医学问题中的应用价值,为读者提供了该领域发展的全景式框架。
法医转录组学的研究主要围绕四大方向展开:现场生物证据分析、损伤转录组学、死亡转录组学以及毒物相关转录组学。不同RNA分子因其独特的稳定性、组织特异性和调控功能,适用于不同的分析场景(图1)。例如,mRNA因其明确的生物学功能和丰富的注释数据,在体液组织溯源中应用广泛。miRNA和circRNA则凭借较高的结构稳定性,在腐败、降解样本的离体时间推断中表现出优势。而ncRNA(如lncRNA、piRNA)位于非编码区,且具备表观遗传调控能力,因而在同卵双胞胎鉴定和年龄推断等领域显示出潜力。此外,针对损伤鉴定,多种mRNA和ncRNA的表达呈现与损伤恢复相关的时序依赖性变化,为损伤时间推断提供了客观的分子证据;在法医病理学和毒物分析领域,转录组学有助于阐明机体不同死因下的病理过程、尸体降解腐败时序变化以及毒物与成瘾性物质的作用机制,从而发现可用于法医学实践的相关生物标志物。
图1 不同RNA分子的功能、特点及其在法医转录组学中的应用
早期研究主要集中于利用特定转录本和逆转录终点PCR进行组织或体液鉴定。自2011年以来,RNA在法医科学中得到了广泛研究,其中mRNA因其组织特异性强、功能注释较完善,且拥有较多验证研究与数据库证据支撑,成为极具潜力的生物标志物。欧洲DNA分型组(European DNA Profiling Group,EDNAP)和法医RNA分型组(Forensic RNA Profiling,FoRNAP)的协作项目,以及近年来法医转录组学领域不断增长的文献数量,反映了该研究领域的蓬勃发展。随着分子生物学和生物信息学的进步,法医转录组学的边界不断扩展。曾被视为遗传分子中“暗物质”的ncRNA已成为研究热点,其在基因表达调控中的关键作用,为法医鉴定提供了新的见解和策略。
目前,法医转录组学的常用检测方法包括定量逆转录聚合酶链反应(quantitative reverse transcription polymerase chain reaction, RT-qPCR)、毛细管电泳(capillary electrophoresi, CE)、逆转录重组酶聚合酶扩增结合侧流层析试纸条(reverse transcription-recombinase polymerase amplification with lateral flow dipstick, RT-RPA-LFD)、微阵列(microarray)和RNA测序(RNA sequencing, RNA-seq)。近年来,单细胞转录组测序(scRNA-seq)的出现,为混合样本的解析提供了更高分辨率的革命性策略。当前的研究范式系统性地涵盖了数据探索、生物标志物筛选、效能评估、体系构建和法医应用五个关键方面,旨在通过生物信息学分析和特征工程流程,筛选出适用于构建法医检测系统的RNA生物标志物,并最终开发成基于不同分型和测序检测方法的人工智能预测模型(图2)。
图2 法医转录组学研究基本范式
本文对近二十年法医转录组学进行了文献计量分析。通过Web of Science(WOS)和中国知网(CNKI)数据库检索数千篇相关文献最终依据PRISMA指南筛选出704篇进行分析。分析显示,当前法医转录组学的主流研究方向包括:(1)现场生物物证分析:组织/体液溯源、个体识别、混合样本解析、年龄推断等;(2)死亡转录组学:死亡时间推断与死因鉴定;(3)损伤转录组学:损伤形成时间与类型判断;(4)中毒与毒品相关转录组学。我们根据摘要和关键词信息,按照上述类别的比例生成了一个旭日图(图3),描绘了当前研究领域的基本分布情况。
图3 基于所选文献集的摘要和关键词信息分布旭日图
基于WOS数据库的文献计量分析显示(图4),法医RNA研究的热点集中于体液识别、死因分析和法医分子病理学,其中mRNA与miRNA是最常用的分子标记。近年来,机器学习赋能应用、死亡时间与离体时间推断成为新兴焦点,circRNA的潜力也受到更多关注。关键词共现网络进一步将研究方向归纳为法医分子病理学、体液识别和死亡时间估计三大主题。在技术方法上,RT-qPCR凭借其定性与定量分析优势仍占据主导地位。从地域贡献看,欧洲、美国和中国是该领域发展的主要推动者。
图4 基于Web of Science数据库法医转录组学文献的文献计量分析可视化
针对CNKI数据库的分析揭示了中国法医转录组学的研究格局(图5)。关键词分析表明,国内研究以死亡时间、体液识别和损伤时间推断为核心,主要依赖miRNA与mRNA标记及RT-qPCR技术。研究主题可聚类为法医病理学、法医遗传学与法医毒理学三大方向,分别聚焦死亡与损伤时间推断、体液斑迹识别、以及甲基苯丙胺毒理学。跨领域关联显示,法医病理学与遗传学的研究均侧重于miRNA、mRNA和circRNA标记的应用。
图5 基于CNKI数据库法医转录组学文献的文献计量分析可视化
总结与展望
本文对法医转录组学文献进行了计量分析和系统性论述,揭示了该领域近二十年的研究进展与趋势。分析显示,法医转录组学的研究主要聚焦于现场生物物证鉴定、死亡转录组学、损伤鉴定以及中毒与药物滥用等方向。其中,现场生物物证鉴定,尤其是体液与组织来源识别,是研究最为集中的领域,主要依赖于mRNA、miRNA等标记物,并借助RT-qPCR、高通量测序等技术实现精准鉴别。死亡转录组学的研究重点在于死因分析和死亡时间推断,通过转录组变化揭示分子水平的病理过程,其中miRNA和circRNA因其较高的稳定性,在晚期死亡时间推断中展现出独特价值。损伤鉴定方面,转录组学通过分析损伤后时间依赖性的RNA表达变化,为损伤形成时间与类型的判断提供了分子依据。在中毒与药物滥用相关领域,转录组学有助于揭示毒物作用机制及成瘾相关的分子变化。
随着高通量测序和生物信息学的发展,法医转录组学正逐步从单一标记物分析转向多组学整合与深度学习辅助的“第五研究范式”。尽管技术不断进步,法医转录组学在走向实际应用的过程中仍面临诸多挑战。例如,数据标准化方法和算法评估体系尚不完善,限制了不同研究之间的比较与模型的泛化能力;案事件现场样本往往稀缺、不稳定,且现场环境复杂多变,对数据分析提出了更高要求;多组学数据整合与深度学习模型的“黑箱”特性,也为司法证据的解释与采信带来了新的挑战。未来,该领域的发展需着力于建立统一的实验流程与数据分析标准,加强真实案例样本库的建设,并推动跨学科合作,以构建更透明、可解释且符合司法实践要求的分析框架。随着单细胞测序、空间转录组学、多组学整合以及深度学习等前沿技术的应用,研究人员有望更精细地刻画生物样本的时空动态特征,从而为案件侦破提供更有效的线索。计算生物学与法庭科学的进一步融合,预计将催生更多创新的研究范式。例如,借助大语言模型进行知识挖掘、构建生物证据的数字孪生系统、建立跨学科的司法证据评估框架等,均表明该领域具有广阔的发展前景。在这些方法与技术的推动下,法医转录组学正朝着更高分辨率、更动态全面的方向稳步迈进。
审校人:
GPB青年编委何光林
文章编译来源:
Lei F, Yuan X, Lan Q, Shen R, Wu Y, Shi X, et al. Forensic Transcriptomics: Research Progress of the Past Two Decades. Genomics Proteomics Bioinformatics 2026;24:qzag007.
英文全文详见:
https://academic.oup.com/gpb/advance-article/doi/10.1093/gpbjnl/qzag007/8460766
作者及资助信息:
河北医科大学丛斌院士和南方医科大学朱波峰教授为本文的通讯作者,南方医科大学雷梵章和袁曦为论文共同第一作者。该研究得到了国家自然科学基金重大项目(No. 82293650 和 No. 82293652)的资助。
GPB论文:
Genomics, Proteomics & Bioinformatics [基因组蛋白质组与生物信息学报(英文),简称GPB] 于2003年创刊,是由中国科学院主管、中国科学院北京基因组研究所(国家生物信息中心)与中国遗传学会共同主办的英文学术期刊,由牛津大学出版社金色开放获取(Gold Open Access)出版。刊载来自世界范围内组学、生物信息学及相关领域的优质稿件。现为中国科学引文数据库(CSCD)和中国科技论文与引文数据库(CSTPCD)核心期刊,被SCIE、PubMed/MEDLINE、Scopus等数据库收录。2025年公布的官方数据显示,CiteScore为17.8;2年和5年Impact Factor分别为7.9和9.1,排名WoS遗传学领域Q1区和前10%;JCI为2.64,排名WoS遗传学领域5/191。期刊由科技部等七部门联合实施的“中国科技期刊卓越行动计划”(2019–2028)和“中国科学院精品期刊建设试点项目”(2024–2025)资助。