DNA存储是你没听说过的最重要的创新

admin 3730 0
DNA存储是你没听说过的最重要的创新

百度网盘课程

通用入口链接!10000G.课程都有!一起学习吧!

立即点击↓ 获取课程!

随着互联网活动、数字设备和物联网传感器产生的数据继续以惊人的速度增长,企业没有时间解决一个关键问题:将所有数据放在哪里。根据最近的IDC报告,未来五年创建的数据量将是自数字存储开始使用以来生成的数据量的两倍多。

其余的要么被覆盖,要么被临时缓存),但是全局数据存储需求仍然超过总容量的扩展。

硬盘(HDD)和固态硬盘(SSD)虽然在保存和提供我们日常设备运行所需的大量数据方面表现出色,但并不适合长时间存储大量信息。

线性磁带开放(LTO)磁带在归档存储中占主导地位,其单位容量成本是所有技术中最低的。当前一代的磁带LTO-8具有12TB的本机容量,只需75美元(或6.25美元/TB)即可购买。

但是,尽管性价比高,磁带也有其弱点。数据只能串行访问,很难定位特定文件。企业还需要半定期迁移到新磁带,以避免数据丢失。

为了试图解决迫在眉睫的数据危机,研究人员正在寻找新的超高密度和超耐用的存储技术。有一些不同的候选物,但有一个概念似乎特别有希望:脱氧核糖核酸,更好地被称为DNA。

什么是DNA存储,它是如何工作的?

DNA是生物体的基本物质,由腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)四种分子成分组成。这些化合物成对连接(AT和GC)形成著名的双螺旋步骤。

通过将二进制的1和0转换成4个字母的遗传字母表,这种结构可以作为一种极其密集和持久的数据存储形式。已经发现一克DNA可以存储215 PB (22万TB)的数据。

“DNA数据存储是对合成DNA链上的二进制数据进行编码和解码的过程,”去年由微软、西部数码、Twist Bioscience和Ilumina成立的DNA数据存储联盟(DDSA)的发言人解释说。

“要将数据存储在DNA中,先对原始数字数据进行编码,然后写入(通过化学/生物过程合成)并存储。当再次需要存储的数据时,DNA分子将被测序以依次显示每个个体A、C、G或T,并从DNA碱基重新映射回1和0。”

脱氧核糖核酸数据存储联盟

DNA几乎在所有类别上都优于目前的档案存储技术。最近的一篇论文估计,9TB的编码DNA可以被压缩到一个只有1毫米3的空间中,这意味着一个LTO盒子的体积可以容纳200万TB的数据,而一个LTO-8带的容量大约是16.7万倍。

在现实世界中,DNA可以用来将整个YouTube(据信每年托管约40万TB的新视频)存储在一个小冰箱中,而不是几英亩的数据中心。

与需要根据使用情况每十年或两年更换一次的磁带不同,DNA在适当的条件下可以保存数千年。这意味着总拥有成本非常低。

DNA是可生物降解的,容易复制,除了必要的气候,消耗的能量非常少,所以非常环保。

但是DNA没有让磁带存储过时的原因还是有很多的。这项技术还处于起步阶段,从编码到合成到测序,几乎整个过程的每一个阶段都需要解决问题。

存储公司Quantum的LTO开发高级主管图尔盖戈克(Turguy Goker)表示,“对这匹马下任何赌注都为时过早”。

“DNA储存现在正在一些汹涌的水域中游动,要安全航行到商业海岸需要几年时间,”他解释道。

密集而耐用,但缓慢而昂贵

虽然早期迹象可能很有希望,但在DNA开始解决世界存储容量问题之前,仍有许多障碍需要克服。主要问题与成本和速度有关。

为了防止降解,DNA需要一个非常特殊的气候,维护起来既困难又昂贵。具体来说,DNA需要保持在非常低的温度下,或者暴露在严格控制的气流中。

与现有技术相比,使用当前技术将数据写入DNA的过程也非常耗时。在此得到改善之前,DNA存储不会被大规模使用。

“DNA书写是一个化学过程,本质上比我们目前习惯的数字电子设备慢得多,”Goker解释说。“如果这个障碍没有克服,写基于DNA的存储就类似于用吸管清空游泳池。”

脱氧核糖核酸

读取储存在DNA中的数据也带来了挑战,测序过程中很可能会引入错误。出于这个原因,DDSA希望最早采用该技术的人将其用于一次写入、从不读取(磨损)或一次写入、很少读取(更糟)的用例(例如,存储某些数据类型以满足法规要求)。

除了技术问题,还需要解决问题

乏通用标准的问题,以确保 DNA 存储技术能够与其他技术和传统技术互操作。

然而,随着 DNA 存储吸引了政府、存储老牌企业和科技巨头的关注和投资,正在努力寻找这些问题的解决方案。

Advertisement

例如,欧洲国家情报总监办公室去年启动了分子信息存储(MIST)计划,其既定目标是开发能够在 24 小时内写入 1TB 和读取 10TB 的 DNA 技术,成本低于 1000 美元.

另外,Twist Bioscience 开发了一种方法,通过使用使所需化学物质小型化的硅平台,将DNA 合成产量提高 1,000 倍。

根据 DDSA 的说法,能够纠正序列问题的脚本将减轻对数据准确性的担忧,该组织还认为,仍有时间建立规范,以防止整个行业出现碎片化。

“与必须完美的医疗保健合成不同,由于当今存储中通常使用的校正算法,DNA 存储可以容忍错误。DNA 存储先驱们已经在致力于改进编码和纠错算法,以降低这种风险并准确地恢复数据,”一位发言人解释说。

“随着商业上可行的 DNA 数据存储的方法和工具得到更好的理解和更广泛的应用,联盟将考虑创建特定的规范和标准(例如编码、物理接口、保留、文件系统),以促进可互操作的 DNA 的出现基于数据存储的解决方案可以补充现有的存储层次结构。”

尽管 DNA 存储的到来会对磁带的持久用途提出质疑,但仍有一些人认为,这本书还没有写在墙上。

例如,当被问及 DNA 是否会让其磁带存储产品受到威胁时,IBM 表示要提高磁带的密度,这在商业环境中也是经过验证的。

IBM 闪存部门首席技术官兼首席架构师 Andy Walls 表示:“随着全球数据量持续飙升,磁带技术仍然是本地和混合云环境中企业数据保留、保护和弹性的首选解决方案。

“这也是最环保的存储技术,零功耗,可持续使用数十年。而且由于我们不断提高磁带的密度,今天 IBM 的单个磁带(比 VHS 磁带还小)可以容纳令人难以置信的 60TB 压缩数据。这些特性使磁带成为最大的超大规模企业的首选解决方案,这些企业依靠它来获得廉价、可靠的档案存储。”

版权声明:内容来源于互联网和用户投稿 如有侵权请联系删除

本文地址:http://0561fc.cn/42739.html