DNA作为大自然生物遗传信息的存储媒介,一直以来就受到科学家的广泛关注。既然DNA能存储遗传信息,那么日常的数字信息是否也能存储到里面呢?近日,东南大学研究团队成功将校训写入DNA中,实现了DNA合成与测序环节的一体化,仪器设备也实现了小型化。下面,就让我们走进DNA分子的世界来探究面向未来的新技术——DNA存储。
什么是DNA存储?
当前主流的DNA存储技术是以人工合成的脱氧核糖核酸(DNA)分子为存储介质,将数字信息存储于DNA分子上。
DNA由腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)、胞嘧啶(C)4个碱基构成双螺旋结构,可以保存生物体的遗传信息。而在数字世界,数据信息都会转换为二进制数据即“0”和“1”的状态来进行存储。
因此,可以将数据文件通过编码转到碱基中,将AGCT转化为二进制数据来实现信息的存储,再配合各种算法便可以实现数据的存储与读取。
DNA存储有何优劣势?
相比于目前我们常用的存储介质,如U盘、光盘、硬盘等,DNA存储具有一系列优势。
一是存储密度高。由于DNA独特的双螺旋立体结构,单位空间可存储的数据密度相当高。据估算,每立方厘米的DNA分子可以存储大约1EB的信息,这一密度是当前存储密度最高的介质(闪存)的1000倍,是硬盘数据存储密度的百万倍。
二是保存寿命长。通常情况下,传统的数据存储在10年左右就会开始失去完整性,但DNA对于外部环境,如高温、震荡等具有较强的抗干扰能力。目前人类从化石中可以提取出百万年前动物的DNA。因此,从理论上来说,DNA数据在没有特别人工干预的情况下至少能保存千年之久。
三是维护成本低。目前数据中心的维护需要耗费大量的能源,而存储在DNA的数据,理论上来说通过低温冷冻或者固态封存的手段,可以长时间存储且几乎不需要维护,这尤其适用于存储大规模不需要经常访问的“冷数据”。
此外,DNA存储所需要的占地也远小于传统存储介质,并且还具备数据易复制、易携带、能在生物体内存储等特点。
电脑供图/视觉中国
虽然DNA存储拥有一系列优势,但在目前的发展过程中仍然存在很多问题。
一是数据读写速度慢。当前主流的数据写入技术需要进行DNA合成,读取技术需要进行DNA测序,这两种技术的处理效率还不能达到日常数据读写的要求。
二是读写成本高昂。目前DNA数据读写需要专用的设备来完成,设备造价费用高,导致数据读写成本高昂。
三是数据安全问题凸显。一旦DNA数据存储技术成熟,存储材料的隐蔽性也会对数据安全带来新的挑战。
四是DNA介质不能覆盖和重写。不像我们目前使用的可擦除存储,DNA存储技术把信息存进去以后,一般来说不能修改,想读取存储的信息,只能通过把全部信息完全测序出来再转码。
五是定点读取困难。目前,数据读取需要将整个DNA序列测一遍,难以直接从中间某处开始读取,而且操作过程需要液体试剂,操作极不方便。
各国发展情况如何?
随着人们对DNA认识的不断深入以及DNA相关技术的不断发展,各国对DNA存储技术越来越重视,不断出台相关政策支持其发展。
1
美国
美国是全球范围内率先对DNA存储技术领域进行研发布局的国家,早在2013年美国半导体研究联盟就启动了“半导体合成生物学”计划,促进半导体与合成生物学交叉和融合。
美国也陆续电脑出台了各项政策支持DNA存储发展,例如,2020年,美国高级情报研究计划局发布了“分子信息存储”项目,旨在开发可部署的存储技术,利用DNA存储取代传统存储方式;美国国家科学基金发布项目招标指南,继续研发新兴合成生物学以实现下一代信息存储。2021年美国半导体产业协会发布《半导体十年计划》,将DNA数据存储列为未来海量数据存储的重要选项。
目前,美国的高校、研究机构在DNA存储技术领域均走在世界前列。哈佛大学在实验成果、论文刊发方面一直处于世界领先地位,2012年哈佛便将书的HTML版本存入到了DNA中,2017年哈佛研究人员将短片电影存储到了DNA中,还将编写的图书编码到细菌DNA中并复制了900亿份。2019年,哈佛团队将一本有大约5.34万个单词的书、11张图片和一段Java程序,编码进不到亿万分之一克的DNA微芯片,并成功利用DNA测序来阅读这本书。
除哈佛外,2020年德克萨斯大学将整本《绿野仙踪》存入到DNA中;2021年麻省理工大学研发出了能快速、准确识别DNA数据文件的技术。
美国在DNA存储商业化方面也走在世界前列。2016年微软公司将200MB数据存储到DNA中,此后研发了用于DNA存储数据的全自动系统。2019年,Catalog将全部维基百科英文版数据存储到了DNA中。为了进一步促进DNA存储商业化,2020年微软、西部数据等传统信息技术企业与Twist Bioscience、Illumina等新兴生物技术公司一道,共同宣布成立了第一个DNA数据存储联盟,旨在牵头为DNA数据存储领域制定标准和行业路线图,并为商业档案数据存储生态系统奠定基础。
电脑供图/视觉中国
2
欧盟
欧盟也非常支持DNA存储技术领域的研发,通过未来和新兴技术计划(FET)下的开放项目资助优瑞卡姆(Eurecom)、法国国家科学研究中心(CNRS)以及海力克斯沃克斯(Helix-works)等企业开展相关研究。
2019年,瑞士苏黎世联邦理工学院与以色列Erlich Lab合作,将存储了如何打印兔子的数据DNA分子注入到3D打印的塑料兔子中,这样切下兔子的任何部位都可以重新打印出一模一样的兔子。
2018年,爱尔兰沃特福德理工学院(WIT)研究人员开发出一种新型DNA存储方法,可在1克大肠杆菌DNA中存储1ZB的数据。
3
中国
我国也高度重视DNA存储技术的发展,“十四五”规划明确指出要“加快布局量子计算、量子通信、神经芯片、DNA存储等前沿技术,加强信息科学与生命科学、材料等基础学科的交叉创新”。
东南大学师生团队研发的DNA存储电极。供图/东南大学
虽然我国在DNA存储技术领域刚刚起步,但相关企业、高校等已取得了一定的研究进展。例如,2021年12月,东南大学研究团队将该校校训“止于至善”存入一段DNA序列。2019年,天津大学与华大基因等联合研究,将开国大典视频的数据保存在了DNA中。
4
其他国家
其他国家在DNA存储和合成生物学领域也有一定的行动和布局。
日本将合成生物学视为其未来科学政策的重要组成部分,并力争在该领域跻身国际前列。2019年,由16所合成生物设施机构联合发起的国际合成生物设施联盟(GBA)在日本神户成立,旨在促进全球合成生物学相关发展。
澳大利亚联邦科学与工业研究组织(CSIRO)投资创建的合成生物学未来科学平台旨在支持多领域的创新等来提高澳大利亚的竞争力。2020年澳大利亚国家电影和声音档案馆在国际上首次使用DNA保存运动员的比赛录像。
未来展望
目前,人类已经进入了信息时代,随着互联网的普及和信息技术的发展,人类生活与网络不断交融,将产生海量的数据,而数据作为生产要素将发挥更多作用。如何存储未来庞大的数据量将是人类面临的重要问题。
DNA存储技术凭借其独特的优势,在特定的存储领域将得到广泛应用。随着人们对DNA的不断深入探索以及生命信息技术的加速发展,未来DNA存储技术将更加便捷、快速,配套设备将更加小型化、智能化。
一想到如今占地巨大、能耗高昂的数据中心,在未来可能会被一小瓶DNA所取代,就不禁让人感慨生命的伟大与神奇,并再次感受到信息技术对整个社会发展进步的巨大推动作用。
电脑