北京大学的研究人员公布了一种突破性的DNA数据存储方法,该方法利用酶甲基化来密集有效地存储数据。
这种名为“epi-bits”的新方法可以实现可扩展且经济高效的高容量数据存储,证明了使用DNA作为通用存储介质的实用性。
DNA存储的优势与创新
最近,北京大学计算机科学系院长张程和定量生物学中心的钱龙领导的研究人员在《自然》杂志上发表了一项开创性的研究,题为“通过在DNA上打印表观遗传位实现并行分子数据存储”。
该研究介绍了一种开创性的基于DNA的数据存储方法。通过使用酶甲基化,研究人员开发了一种将数据编码为表观遗传修饰的方法,称为“epi-bits”,可以精确地添加到通用DNA模板中。这项创新为分子数据存储提供了一种可扩展和可编程的方法。
随着世界在管理不断增长的数字信息流方面面临越来越多的挑战,DNA提供了一个有吸引力的解决方案。由于其惊人的存储密度 —— 仅仅一克DNA就可以存储215000太字节,相当于1000万小时的高清视频(Imburgia & Nivala, 2024)—— 以及它的长期稳定性,DNA是一种理想的数据存储介质。然而,传统的方法依赖于从头合成,核苷酸是顺序添加的,这使得这个过程缓慢而昂贵。科研团队开发的方法克服了这些限制,实现了并行、可编程的DNA组装,使数据写入更快、更高效。
此外,epi-bit方法可供个人使用,以个性化他们的DNA存储,来自不同学术背景的60名志愿者实施了该方法。这清楚地表明了科研人员的epi-bit方法作为一种可访问、通用、快速和低成本的DNA存储方法的潜力。
表观遗传DNA存储方法
信息通过DNA中胞嘧啶碱基的选择性甲基化进行编码。
预合成的DNA片段,称为DNA砖,被组装在可重复使用的DNA链上。每个DNA块都与链上的一个独特位置结合。
砖的精确结合引导酶将模板上的特定位置甲基化,从而有效地将数据“打印”到模板上。
遵循与计算机硬件相同的二进制系统,每个DNA块携带一个甲基化或未甲基化的位点,分别编码1或0。
使用纳米孔测序设备读取Epi位。
主要发现和实际应用
使用epi-bit方法,研究人员能够在自动化平台上的五个模板上写入275000个信息位,而不需要合成DNA,包括两张白虎和大熊猫的高清照片。
在科研人员创建的iDNAdrive平台上,允许用户自己对数据进行编码,志愿者使用epi-bit编写工具包对大约5000位数据进行了编码。读取数据时的错误率低至1.42%。
如果朋友们喜欢,敬请关注“知新了了”!