明明物种丰富,eDNA却测不出?热带红树林正面临基因数据“系统性失踪”

问AI · eDNA与传统调查结合能否加速红树林物种基因档案建设?
图片

红树林生态系统。©摄影:王敏幹(John MK Wong) | 海潮天下(Marine Biodiversity)

海潮天下·导读

红树林空有丰富的物种,却连最先进的环境DNA技术都“查无此人”?这篇由多国学者历时48年文献梳理完成的干货研究,首次揭示了热带红树林eDNA监测面临的基因参考库断层现状:在999种已知红树林动物中,近三成物种基因数据完全空白,无脊椎动物及部分核心鱼类面临“系统性失踪”。这个研究详细拆解了经典标记物的覆盖率漏洞,并务实探讨了如何通过“eDNA+传统调查”破局,是一篇值得一读的生态监测技术实战痛点解析。(编者按:Linda)

本文约3900字,阅读约8分钟

文 | 王海诗

出品 | 海潮天下


过去十多年里,环境DNA#eDNA被视为生态监测领域最具变革性的技术之一。科学家不必捕捉动物,只需从水体、沉积物甚至空气中提取遗留的DNA片段,便有机会重建一个区域的生物多样性图谱。对于地形复杂、生物隐蔽、调查成本高昂的红树林而言,这项技术尤其令人期待。


但是,近日一项由菲律宾学者发表于《环境DNA》Environmental DNA)期刊上的最新研究揭示了一个鲜少被关注的情况。在全球热带红树林生态系统中,许多动物即便已经被科学界记录和命名,却依然无法被eDNA技术准确识别。原因呢,并不在于它们不存在,而是因为,它们的“身份证信息”从未被录入基因数据库。


48年999种动物大摸底


这项由菲律宾、澳大利亚等多国研究人员合作完成的研究,系统梳理了近半个世纪以来关于热带红树林动物群落的资料。该研究团队从1976年~2024年的文献中整理出999种已知生活于热带红树林中的动物,并逐一核查这些物种在主流遗传数据库中的基因参考序列覆盖情况。结果显示,约29%的物种完全缺乏任何可用于eDNA鉴定的参考基因数据


换句话说,即使这些物种真实存在于采样区域,即使它们释放出的DNA已经被检测到,研究人员仍然可能无法知道它们是谁。


环境DNA监测的核心逻辑其实并不复杂。采样获得的DNA序列本身并不能直接告诉研究人员对应的是哪种生物,得跟已有的参考数据库进行比对,才能完成物种鉴定。


就像指纹,这枚指纹本身(采样获得的DNA序列)只是一堆纹理线条,它不会直接告诉你“这是张三的指纹”,得把它跟指纹库里比对了之后(对应参考数据库比对),才能找出它匹配的是张三、李四,还是库里没有的人。又比如人脸识别系统需要先录入照片,可如果数据库中没有某个人的面部信息,再先进的算法也无法给出正确身份。因此,参考库的完整程度,往往决定了eDNA调查的最终识别能力


该研究发现,红树林生态系统恰恰存在这样的“数据库短板”


在调查涉及的999个物种中,仅有约71%能够在现有数据库中找到至少一种常用DNA标记序列。剩余近三成物种则处于完全缺失状态。特别值得关注的是,这种缺失并非随机分布,而是集中出现在一些生态功能重要、但长期被研究忽视的类群。


图片


(图文无关)珠海淇澳岛红树林湿地保护区的招潮蟹。该保护区位于伶仃洋畔,有大片茂密的红树林。这片湿地生态系统,为众多鸟类、鱼类和其他海洋生物提供了栖息和繁衍的场所,也发挥着防风固浪、净化水质等重要的生态功能。©张效唯 摄影 | 海潮天下(Marine Biodiversity)



无脊椎动物,“黑户”


无脊椎动物成为最明显的“失踪人口”(种群)


螃蟹、虾类、多毛类环节动物以及软体动物等底栖生物是红树林食物网的重要组成部分,它们参与有机质分解、沉积物翻动以及营养循环过程,也是众多鱼类和鸟类的重要食物来源。然而在基因数据库中,这些类群的覆盖率远低于脊椎动物。


研究团队发现,一些红树林优势蟹类甚至完全缺乏标准条形码序列。对于依赖eDNA开展群落分析的研究人员来讲,这意味着即使采样成功,也可能低估这些关键类群的存在。


令人意外的是,即便在研究相对充分的鱼类中,也好不了多少,同样存在这个问题。


红树林被认为是许多经济鱼类的重要育幼场,但,部分红树林特有鱼类和区域性鱼种依然缺乏足够的基因参考数据。研究显示,在不同DNA标记体系下,鱼类的可识别比例差异显著,一些物种只能被部分标记识别,而另一些则完全游离于数据库之外。


▼ 海潮天下·往期相关报道:

孟加拉虎,进化成红树林“潜水艇”?它的适应力超乎想象!海潮天下·图说

生态修复效果难评估?Nature警示:全球自然保护陷入证据危机

警报!热带雨林正以肉眼可见速度消亡,60%或将变成荒漠,人类只剩最后十年?

图片

(图文无关)横跨印度与孟加拉国的孙德尔本斯(Sundarbans)地区,是全球最大的连续红树林生态系统,其内潮汐涨落频繁、水道纵横交错,构成了极具挑战性的生存环境。栖息于此的孟加拉虎(Panthera tigris tigris)种群,通过一系列生理与行为上的特化,成功地适应了这种咸淡水交汇的迷宫。这些老虎成为了出色的泳者,能够长时间在宽阔的潮汐河道中泅渡,跨越水道,搜寻在各个岛屿间隔离分布的猎物,有效地利用了这片破碎化的领地。它们还鱼类、螃蟹甚至大型爬行动物。▲上图:孟加拉虎的适应。©艺术家:Arijit Dos | Linda Wong 摄于阿联酋 


技术问题在哪儿?


这也暴露出另一个长期被忽视的问题:并非所有DNA标记都同样有效。


当前eDNA监测最常使用的几个基因片段包括COI、12S、16S和18S等,它们各自针对不同生物类群具有不同识别能力。研究团队对这些经典标记进行了系统评估后发现,没有任何单一标记能够覆盖全部红树林动物。


其中,COI作为全球动物DNA条形码计划的核心标记,整体覆盖率最高,但在部分鱼类检测中表现并不理想。12S和16S在脊椎动物中效果较好,却无法充分反映无脊椎动物多样性。18S虽然适用范围广,但在物种分辨率方面存在局限。


因此,即便数据库不断扩充,仅依赖单一标记开展监测仍可能遗漏大量物种信息。


对于正在快速推广的eDNA技术而言,这项研究提供了一个重要提醒:检测能力与识别能力并不是同一个概念。


▼ 海潮天下·往期相关报道:

《世界红树林状况》(2024版)报告:知识共享、加强合作,共同拯救红树林!

超强台风对红树林群落结构与恢复模式的影响:一项物种特异性评估 | 高雪芹、梁沛健、王文卿最新研究

图片

红树林是天然的“海岸卫士”。其发达的支柱根、呼吸根和板状根构成密集的立体网络,能有效消浪、促淤、固滩。在台风或风暴潮来袭时,可显著降低波浪能量,减少海水对岸线的侵蚀,保护后方农田、村庄和基础设施免受破坏。©摄影:王敏幹(John MK Wong)|海潮天下(Marine Biodiversity)


先得给红树林中的物种“上户口”,积累数据


近年来,随着高通量测序成本持续下降,环境DNA检测变得越来越容易。许多项目能够在一次测序中获得数百万条DNA序列,但如果缺乏对应的参考数据,这些序列最终只能被归类为“未知物种”或停留在属、科等较高分类层级。


图片

(图文无关)第二十届国际基因组学大会武汉专场(ICG-20 Wuhan)探讨了“组学与人工智能在生物多样性中的应用”,会上,来自澳大利亚科学院院士、堪培拉大学杰出教授Arthur Georges做了一个《A glimpse into the future》主题报告里面讲到利用组学技术解决生物多样性监测与演化机制问题,里面也提到参考基因组或条形码数据库对于识别或追溯物种演化路径的重要性。©Linda Wong 摄影 | 海潮天下(Marine Biodiversity)




从技术角度看,问题已不是测序仪器的问题了,现在更多的是基础生物学数据积累


研究作者因此提出,未来红树林生态监测不能简单地把eDNA视为传统调查的替代品。相反,在基因参考库尚未完善的阶段,两者需要形成互补关系


传统调查能用标本采集、形态鉴定来确认物种存在,并进一步补充其基因序列信息;环境DNA则能够在更大空间尺度和更低干扰条件下开展长期监测。当两种方法结合使用时,既能提升物种发现能力,也可以持续的完善参考数据库本身。


事实上,这种“边监测、边建库”的思路正在成为全球生物多样性研究的新趋势。越来越多研究人员开始意识到,环境DNA革命的真正瓶颈,可能不在实验室,而在那些尚未被测序、尚未被数字化记录的野外物种的身上。


对于红树林这样的热点生态系统而言,这一点颇重要。红树林面积仅占全球热带森林的一小部分,却支撑着高度复杂的生态网络,并承担着海岸防护、碳储存和渔业资源培育等多重生态功能。如果监测体系无法准确识别其中的重要成员,对生态变化的判断也可能出现偏差。


从某种意义上说,环境DNA正在让科学家获得前所未有的“看见能力”。但这项研究提醒,看见并不等于认出。当越来越多DNA信号从红树林水体中被读取出来时,仍有相当数量的生物停留在数据库之外,成为无法命名的存在。


该研究指出,未来红树林生物多样性监测的发展,很大程度上将取决于一个看似基础却至关重要的工作,那就是,先“上户口”、给这些物种建立属于自己的基因档案




思考题·举一而反三


图片

【海潮天下·写在文末】


其实,这篇研究作为一家之言,若是从传统生态学论文的标准来看,这篇论文未必属于“方法学突破”或“重大发现”类型;但如果从eDNA领域的发展阶段来看,多多少少算是某种“基础设施诊断报告”,还是有启发的。当前eDNA技术转化为实际生产力时最核心的“七寸”在哪儿?


eDNA领域过去十几年经历了一种典型的发展轨迹。前期重点解决“能不能测出来”,中期关注“测得准不准”,而现在越来越进入“测出来之后究竟代表什么”的阶段。


毕竟eDNA不单单只是一个测序技术问题,它是由多个环节串联起来的一种体系。从采样→DNA提取→PCR扩增→测序→生物信息学分析→参考数据库匹配→生态学解释……


回头看,过去十年,其实行业投入最大的其实主要还停留在前半部分。随着测序平台越来越便宜,引物不断优化,生信流程越来越标准化,检测灵敏度不断提高,但参考数据库建设一直是最慢的一环。也就是说,实验室端已经进入“工业化时代”,数据库端却仍停留在“手工作坊时代”。事实上,很多eDNA研究都存在类似问题。很多研究报告中的“未识别OTU”,本质上未必就代表真的有发现新物种,而可能只是数据库没收录罢了。换句话讲,检测不到≠不存在。如果决策者不了解数据库局限性,很容易出现误判。


数据库建设虽然不那么“酷”、那么好玩,却决定整个体系的上限。数据库本身正在成为核心资产。就跟遥感、现在热门的ai一样,今天真正有价值的往往不是算法本身,而是长期积累的高质量训练数据。预计,未来几年最有效率的路线可能不是eDNA替代传统调查,而是传统调查+eDNA→共建参考库→再实现规模化eDNA监测。这实际上是国际生物多样性监测体系正在发生的转变。


对于中国科研人员来说,我们国家近年投入巨大,有全球面积最大的温带人工红树林恢复工程之一,也得天独厚的本来就有大量滨海湿地、河口、珊瑚礁和海草床生态系统。但客观地说,相较于欧美一些区域数据库项目,我们在海洋无脊椎动物、底栖生物、热带海岸带生物的条形码建设上,可能还是存在一些明显缺口的。当测序技术高速前进时,分类学和参考数据库建设是否跟得上。往往,最前沿的技术,最终仍然依赖最基础的自然史工作。没有可靠的物种学基础,再先进的分子工具也难以充分发挥价值。以后科研/生态修复的直径的投入重点,除了测序能力,可考虑更多的转向标本采集、分类学鉴定、区域参考库建设、标准化序列验证。


本文参考资料




感兴趣的海潮天下(Marine Biodiversity)读者可以参看该研究的全文:

Cooper, E. K. T., J. P.Trillo, E. J. A.Tucong, et al. 2026. “Genetic Reference Gaps Limit eDNA Metabarcoding and Biodiversity Monitoring of Tropical Mangrove Ecosystems.” Environmental DNA8, no. 3: e70280. https://doi.org/10.1002/edn3.70280.

https://onlinelibrary.wiley.com/doi/full/10.1002/edn3.70280


图片

声明:1)本文仅代表资讯;仅供读者参考,不代表平台观点。详情请参看文末链接。2)本文已经开启“快捷转载”,欢迎微信公众平台转发(直接转即可);3)“海潮天下”拒绝使用AI生成图片;4)欢迎专家、读者不吝指正、留言、赐稿!欢迎有理有据的不同意见,激发思考、百家争鸣。


资讯源 | Cooper, E. K. T., J. P.Trillo, E. J. A.Tucong, et al. 2026

文 | 王海诗

排版 | 卢晓雨