革命性的人工智能模型首次破译植物语言

Plant RNA-FM是一种人工智能模型,利用来自1100多种植物的RNA数据进行训练,解码遗传模式,以推进植物科学,改善作物,并应对全球农业挑战。

图片

一项研究合作推出了一种开创性的人工智能(AI)模型,旨在解码构成植物遗传“语言”的序列和结构模式。

这种名为“Plant RNA-FM”的创新模式是同类中第一个,由约翰英纳斯中心的植物研究人员和埃克塞特大学的计算机科学家合作开发。

该模型的创造者说,这是一个聪明的技术突破,可以推动植物科学的发现和创新,并可能在无脊椎动物和细菌的研究中发挥作用。

RNA,就像它更为人所知的化学亲戚DNA一样,是贯穿所有生物体的重要分子,负责以其序列和结构携带遗传信息。在基因组中,RNA的结构是由称为核苷酸的构建块组合而成的,核苷酸的排列方式与语言中单词和短语的字母组合方式相同。

解码RNA的复杂结构

丁义良(音译)教授在约翰英纳斯中心的团队研究RNA结构,这是RNA分子的关键语言之一,RNA可以折叠成复杂的结构,调节复杂的生物功能,如植物生长和应激反应。

为了更好地理解RNA的复杂语言及其功能,丁教授的团队与埃克塞特大学李科(音译)博士的团队合作。

他们一起开发了PlantRNA-FM,这是一个在由540亿个RNA信息组成的庞大数据集上训练的模型,这些信息构成了1124种植物的遗传字母表。

图片

在创建PlantRNA-FM时,研究人员采用了ChatGPT等人工智能模型被训练以理解人类语言的方法。人工智能模型通过研究世界各地植物物种的RNA信息来学习基于植物的语言,从而全面了解RNA如何在植物界发挥作用。

就像ChatGPT能够理解和响应人类语言一样,PlantRNA-FM已经学会了理解RNA序列和结构的语法和逻辑。

研究人员已经使用该模型对RNA功能做出了精确的预测,并在转录组中确定了特定的功能性RNA结构模式。他们的预测已经被实验证实,PlantRNA-FM鉴定的RNA结构影响遗传信息转化为蛋白质的效率。

约翰英纳斯中心丁一亮(音译)教授小组的博士后研究员余浩鹏(音译)博士说:“虽然RNA序列在人眼看来可能是随机的,但我们的人工智能模型已经学会了解码其中隐藏的模式。”

具有未来潜力的合作努力

这次成功的合作也得到了东北师范大学中国科学院的科学家们的支持,为这项工作做出了贡献。

丁教授说:“我们的PlantRNA-FM只是一个开始。我们正在与李博士的团队密切合作,开发更先进的人工智能方法,以了解自然界中隐藏的DNA和RNA语言。这一突破为理解和编程植物开辟了新的可能性,这可能对作物改良和下一代基于人工智能的基因设计产生深远的影响。人工智能在帮助植物科学家应对挑战方面发挥着越来越重要的作用,从养活全球人口到开发能够在不断变化的气候中茁壮成长的作物。”


如果朋友们喜欢,敬请关注“知新了了”!