尽管电子数据存储系统的效率很高,但它们与大自然的DNA完全不同。一项将数据写入DNA的新技术就像印刷机一样工作,并且使它变得非常简单,任何人都可以做到。
向DNA写入数据通常需要一次合成一个字母,就像把珠子穿在绳子上一样。这显然是一个非常缓慢的过程,尤其是当一个给定的DNA序列中可能有数十亿个这样的字母或碱基时。
但是,新的DNA印刷机大大加快了这一过程。该团队创造了一组700个DNA砖块,每个砖块包含24个碱基,就像活字块一样工作。这些基因可以按照需要的顺序排列,然后用来将它们的数据“打印”到DNA模板链上。
这种印刷机不是一次写一个比特,而是每次反应同时写350比特。
为了简化这个过程,数据没有被编码成DNA中常见的GCAT字母,而是被编码成我们熟悉的二进制代码中的1和0。在这种情况下,化学标记附在一些DNA块上,而不是附在其他DNA块上 —— 有标记的代表1,没有标记的代表0。
该团队通过存储图像来测试这项技术,其中包括中国古代老虎的16833位拓印图像,以及由252500多位组成的熊猫照片。经过一些调整,可以使用标准的DNA读取方法恢复100%的数据。
为了展示它使用起来有多简单,该团队对60人进行了一项实验。参与者使用一个名为“iDNAdrive”的软件平台对他们选择的文本片段进行编码,总计约5000位。数据成功回读,准确率为98.58%。
DNA数据存储的吸引力是显而易见的。首先,它的密度令人难以置信 —— 据估计,你可以在1立方厘米的DNA中存储超过100亿千兆字节的数据。更好的是,在适当的条件下,这些数据可以保存数千年甚至数百万年,使其成为一个伟大的档案系统。
从DNA中读取数据相对较快,但写入是瓶颈。古代的文字也是如此,所以这项新研究的研究人员采用了类似的解决方案。
活字印刷术的发明使第一批大规模生产的文本成为可能。独立小块上的单个字符可以排列成大块,快速打印出许多副本。分子活字印刷的灵感来自于我们自己的细胞存储和处理数据的方式。
你身体里的每个细胞都含有你的完整基因组。将不同组织中的细胞区分开来的是一层额外的信息,称为表观基因组。附加的化学标记表明哪些基因需要开启或关闭,以让细胞发挥不同的作用。
换句话说,如果你的身体是一家公司,每个员工都有同样的手册,但不同的部门 —— 大脑、肝脏、皮肤等 —— 有不同的章节,所以细胞知道它们完成工作所需的具体信息。
对于新的DNA印刷机,这些标记,或甲基,保存着被写入和读取的信息。DNA砖是可移动的类型块,空白DNA模板链是纸。
当需要一定的顺序时,选择相应的砖块,并与模板一起放置在溶液中。一旦到达那里,砖块就会沿着DNA模板与特定区域结合。
最后是墨水。一种酶将砖块上的所有甲基复制到DNA模板的每个部分。随后,纳米孔测序设备可以读出1和0的模式,以重建存储的数字文件。
因为砖块在模板DNA链上自我组装,所以大量的书写同时发生,而不是一点一点地发生。加快这一过程,并使其对非科学家开放,可能有助于DNA成为一种可行的数据存储介质。
这篇论文发表在《自然》杂志上。
如果朋友们喜欢,敬请关注“知新了了”!