未来一定是一个数据爆炸的时代!
5G、物联网和人工智能等信息技术的快速发展,使得信息量呈指数级增长。根据国际机构IDC预测,全球数据产生量将从2018年的33ZB快速增长至2025年的175ZB,1ZB约相当于10亿TB(太字节)的数据量存储。
这有多恐怖呢?举个很简单的例子:数据单位从小到大分别为KB、MB、GB、TB、PB、EB再到ZB,如果将1ZB文件加载到1TB硬盘中,则需要转换大约10亿个1TB硬盘。如果它是连接的,那么绕地球旋转两次都足够了!
然而目前的存储技术却完全满足不了未来的需求。
正是在新一轮数字洪流喷薄而出的背景下,DNA存储数据这一思路被提出来。DNA存储技术作为未来潜在的无限存储方式,或将打开数据存储的新纪元。
DNA是如何实现数据存储的?
DNA存储是一种相对于传统存储设备的生物存储技术。它是一种用人工合成的脱氧核糖核酸(DNA)存储文本文档、图片和声音文件等数据,随后完整读取的技术。
其原理本身并不复杂!
我们知道,电脑上存储的数据是依据电压的高和低代表0和1来表示的,每一个数字、字符和标点符号都由唯一的一串01组合来构成。比如小写字母“e”的代码是:01100101,因此,任何数字化的内容(视频,图片,文字)本质上都只是一串串的0和1而已。
那么,DNA的存储原理实际上就是把原本这些用0和1来表示的内容,换成用碱基:A,C,G,T来表示,这是一个从数字信号到化学信号的过程。而且由于碱基有四个,相比起原本的0和1,我们可以用来多表示两个状态,比如,我们可以假设用A代表00,C代表01,G代表10,T代表11。一个本来要用8bit代表的字符用DNA编码的话,只需要用4个化学碱基,比如上面的小写字符「e」编码成为DNA序列就是:CGCC。
DNA可以以远超过电子设备的密度精确存储大量数据。根据《新科学家》杂志报道,1克DNA理论上携带有455EB的数据。在这样的密度下,1kg DNA就能储存全球数据。
在应用场景上,DNA存储大概可以分为以下几类:
1. 归档场景,其中美国国家图书馆、维基百科、Google有意愿将资料备份在DNA存储上;
2. 在军事用途应用中,可以通过人体携带DNA数据,有了DNA存储技术,我们人体就是“云硬盘”;
3. 在个人应用中,未来个人可以随身携带超大容量的DNA USB数据盘。
而且相较于传统的硬盘、存储器等存储介质,DNA存储还具有以下优势:
(图为目前常见存储产品形式)
DNA存储优势初现,引领企业争相角逐
DNA存储虽然作为一个比较新的概念,但却早已不是“PPT产品”。
早在2012年,哈佛大学研究人员就用DNA储存了一本五万字的图书。2016年,哈佛大学医学院也第一次利用这样的技术把这一张“奔跑的骏马”的Gif放进了活大肠杆菌的DNA里,而且还能重新测序并解码出来。
同样是2016年,华盛顿大学和微软研究院的团队,他们更进了一步,把莎士比亚的十四行诗、马丁路德金的演讲原声、医学论文等资料共计739KB的数据编码成了DNA序列,并存储起来,这个技术以此为标记取得了巨大的进步。
2019年年初,微软宣布在概念验证测试中,微软已经演示了第一个全自动DNA数据存储系统。这将是 DNA 存储技术从实验室走向商业数据中心的关键步骤。
正如微软所说,“假如合成 DNA作为存储手段能够实现的话,那么合成DNA的成本和提取信息的测序过程成本都需要降下来。”这些过程自动化,对降低合成 DNA 存储信息的成本极为重要。
在研究的同时,一些企业也围绕DNA存储技术加紧推出商业服务。
其中美国初创企业Catalog在2019年宣布,他们已经把维基百科英文版的所有文本,一共16GB,塞进了和我们人类身体相同的DNA分子里。据悉,Catalog拥有自己的设备,可以每秒4MB的速度将数据写入DNA中。技术优化应该将这个速度提高两倍,让人们在一天内记录125GB内存的数据,这大约相当于一部高端手机的存储容量。
此外,全球还有这些企业在DNA存储领域“逐鹿中原”:
虽然中国在DNA存储技术领域刚刚起步,企业或高校的研究水平目前都不突出,但也有某些企业开始将目光转向DNA存储技术。 苏州泓迅生物科技有限公司是一家专注于合成生物学的DNA技术公司,该公司在DNA存储技术领域申请了2件相关专利,有自主知识产权的编码转制软件,精确、快速的大规模和高通量的合成DNA序列,应用于下一代的信息存储。
另外,上海吐露港生物科技有限公司与上海生命科学院于2018年在《ACS合成生物学》上共同发表了一篇关于辅助的DNA隐写术对DNA编码信息的储存和转移的安全处理的文章。 该研究结果可以巧妙地利用Cas12a的trans切割特性,对DNA数据进行加密。
大数据蓝海将催生DNA存储新纪元
DNA存储是在解决海量数据存储的背景下应运而生的。而大数据的蓬勃发展必将为DNA存储带来广阔空间。
根据IDC发布的白皮书显示:每年被创建、采集或是复制的数据集合就是全球数据圈,2018 至 2025 年全球数据圈将增长5倍以上。IDC预测,全球数据圈将从2018年的33ZB增至 2025年的175ZB。届时不仅将会对全球数据中心的建设产生影响,同时也会对数据的存储发起挑战。
此外,从数据量和存储空间来看,在2018年,全球已安装的存储容量为 5.0ZB,到2025年预计届时全球容量大约为16.5ZB。这与全球2025年将产生175ZB的数据量相比,远远不够。
而中国存储市场将率先享受到海量数据带来的红利。
IDC发布的白皮书显示:中国数据圈增速最为迅速,平均每年的增长速度比全球快 3%。2018 年,中国数据圈占全球数据圈的23.4%,即7.6ZB。预计到2025年将增至 48.6ZB,占全球数据圈的 27.8%,中国将成为全球最大的数据圈。
从不同存储类型的存储容量增长情况来看,即使电影和音乐从DVD 和CD 迁移到流媒体,在中国市场,磁盘和光碟仍将继续发挥重要作用。但随着数据的爆炸式增长,可以预见的是这部分市场将被率先被取代。
从研发到商业落地,DNA存储的技术瓶颈亟待打破
DNA存储要想完成从研发到商业化的华丽转身,就必须打破现有的技术瓶颈。
其中数据的输入和读取效率一直是阻碍DNA 储存技术商业化的最大瓶颈之一,今年年初微软首次实现了全自动 DNA 信息存储,仅仅是编码“hello”五个字母,从转换到读取就要花费 21 小时。但在现有技术下,这已经算是非常快的速度了。
其次,与现在几百块的硬盘相比,成本高企也是目前DNA存储的“阿克琉斯之踵”。据早前《Wired》杂志报道,存储一分钟立体声音所需150 万对碱基对,成本约为10万美元。如果成本不能大幅降低,那么将无法进入实用环节。
现阶段下,如果DNA存储能够解决这些瓶颈,那么距它迎来高光时刻也就不远了。
从结绳记事到竹简纸张,从计算机存储到光盘刻录,人类从未停止追求更加高效便捷的信息存储方式,信息存储方式的变革很大程度上也塑造着我们获取信息和认知世界的方式。
本文来自: 前瞻网
举报/反馈

中国科学技术馆

76万获赞 65.1万粉丝
中国科学技术馆官方账号
中国科学技术馆官方账号
关注
0
0
收藏
分享