政府的这些努力能够破解 DNA 存储的密码吗?

政府的这些努力能够破解 DNA 存储的密码吗?

在《实力悬殊》中,我们仔细研究了国防工业的核心科学和技术——士兵和间谍的世界。

犹他州布拉夫代尔的城镇口号是“生命相连”。这既平淡无奇又十分普遍——这两个词是如此平淡无奇和普遍,以至于这两个词也是科罗拉多州一位治疗师的口号和 BBC 科技专栏的标题。然而,在瓦萨奇山脉阴影下的布拉夫代尔,这两个词的含义略有不同。因为这个地方是代号为“Bumblehive”的设施所在地。

一个设施有别名这一事实无疑透露了一些关于其性质的信息。Bumblehive 的正式名称是犹他州数据中心。它隶属于国家情报总监办公室(美国官方间谍机构的中央组织),并为臭名昭著的国家安全局存储数据。“如果你没有什么可隐瞒的,”Bumblehive 前面的一块标语不祥地写道,“你就没有什么可怕的。”

围栏外的人并不知道 数据存储在这座占地 100 万平方英尺的设施内,但据估计其规模已达到 EB 级。1EB 相当于约 3300 亿首泰勒·斯威夫特的歌曲。

显然,也存在争议的是,间谍组织并不是唯一对保存大量信息有重大兴趣的群体。想想看,谷歌、微软、亚马逊和 Facebook(以及他们的伙伴)为了运行互联网以及为了知道向你推销哪些奇怪的 T 恤而必须存储的所有信息。例如,Facebook 正在扩建位于德克萨斯州的一座工厂,该工厂今年完工后将占地 260 万平方英尺,占地面积 150 英亩,耗资约 15 亿美元。

没人希望把所有空间浪费在嗡嗡作响的服务器、冷却系统和耗费大量电力和金钱的无聊建筑上。尤其如此,因为这些存储方法最终可能会过时。

如果不用构建任何类型的蜂巢,而是将所有信息放在你的手中,并且以一种不会降解、不会过时、也不会让你破产的形式,那会怎样?

情报界希望弄清楚如何将这个几乎可笑的愿景变成现实。他们希望与私营部门的数据大亨分享他们的解决方案。为了实现这一目标,对于间谍和企业来说,情报高级研究计划署 (IARPA [IC 的 DARPA,如果你想要更多缩写]) 目前正在开展一项为期四年的项目,名为分子信息存储 (MIST)。2019 年授予两个团队的合同总额约为 4800 万美元。

MIST 的目标是利用一种生物存储形式:DNA。基因序列可以在一个肉眼无法看见的封装中对整个人类进行编码,这比芯片或 CD 的效果好得多。就像计算机使用 0 和 1 来表示图片、图像和文档一样,构成 DNA 的核苷酸碱基——腺嘌呤 (A)、胞嘧啶 (C)、鸟嘌呤 (G) 和胸腺嘧啶 (T)——也可以代表相同的信息。每个 A、C、G 或 T 都具有新的编码含义。

DNA 存储也非常高效:人类的所有知识(比如它本身,以及是否可以测量的知识)都可以存储在 DNA 的小房间里,而将这些信息存储在磁带上则需要数百万英亩的土地。此外,正如侏罗纪公园所证明的那样:DNA 的保存时间比磁带、CD(RIP)或闪存驱动器长得多。而所有这些都是 IARPA 感兴趣的。

像 IARPA 这样的研发机构承担着高风险高回报的挑战,而这些挑战的结果对其他组织来说可能太不确定了。他们恰当而自鸣得意地称,将整个犹他州数据中心安装在桌面上这样的问题为“IARPA 难题”。

尽管如此,你不会轻易浏览包含整个维基百科的双螺旋桌面(是吗?)。这是因为它仍然不够实用,也不够便宜——这是 MIST 想要改变的两个方面。

如果 MIST 成功,那么如今的一些大数据仓库有朝一日可能就只是一堆双螺旋结构。该项目理想情况下将生产出一个原型系统,该系统可以将 1TB 的数据编码到 DNA 中,并在 24 小时内从 DNA 中提取 10TB 的数据,成本不到 1,000 美元,耗电量不到 1 千瓦。

IARPA 的计划旨在为学术研究和商业行业注入一剂强心针——推动他们朝着符合情报界利益的目标前进,同时满足他们的求知欲和未来的收入。如果 MIST 取得成功,它既可以向私营部门展示潜在的大客户(间谍)的兴趣,也可以展示其他公司可以借鉴的成功经验。

两个团队(一个由布罗德研究所领导,另一个由佐治亚理工学院研究所领导)赢得了合同,试图让这种 DNA 数据存储不只是一个巧妙的技巧,而是让每个人都能过上互联的生活。

数据的增长速度超过了人们创建经济高效存储的能力,这意味着一些信息最终会被扔进垃圾桶。“任何拥有大量数据存储负担的人都会遇到这个问题,”MIST 项目经理 David Markowitz 表示。虽然没有人确切知道,但他估计全球每年产生约 30 ZB 的数据。“1 ZB 有 1,000 EB,”他说,“这意味着我们生产的新磁带只能存档每年产生的数据的 0.3%,即使我们想保留,超过 99% 的新数据也无法保留。”

佐治亚理工学院研究所开发了一种用于培养 DNA 链的微芯片,可以以极低的成本提供高密度 3D 档案数据存储。DNA 生长的微孔深度只有几百纳米,可以反射照片中特定颜色的光。GTRI 的 Sean McNeil

情报机构自然对捕获和保存这些信息有着极大的兴趣。“你并不总是能提前知道哪些数据对解决谜团最有用,”马科维茨说。“谁应该为未来发生的一些事件负责?”解开这种时间扭曲需要大海捞针,而且马科维茨说,通常需要“挖掘大量历史数据”。

利用 DNA 来保存DNA的想法可以追溯到几十年前,当时只是一个假设。1988 年,一位名叫乔·戴维斯 (Joe Davis) 的艺术家(在哈佛大学的助手的帮助下)创作了一件名为“微静脉”的作品。他在大肠杆菌的核苷酸中嵌入了一个 35 位图像,显示了一个古老的日耳曼字符,意思是“女性地球”。

戴维斯现在是哈佛大学科学家乔治·丘奇实验室的一名研究员(乔治·丘奇是基因编辑领域的先驱,目前正在尝试复活猛犸象)。2011 年,丘奇将一本书(谦虚地说,是他合著的一本书)的 700 千字节内容嵌入 DNA 中,第二年,他又开展了一个类似的项目,添加了图像和 JavaScript 代码。2013 年,欧洲生物信息学研究所的研究人员证明,他们可以将超过 625 千字节的内容编码到 DNA 中,而且几乎没有错误。

作为 MIST 的一部分,致力于解决该问题的两个团队之一由佐治亚理工学院领导,其他团队还包括 Twist Bioscience、Roswell Biotechnologies 和与微软合作的华盛顿大学。该团队将其解决方案称为 SMASH:可扩展分子档案软件和硬件。

一旦 SMASH 被召唤出来,它将像这样工作:软件将信息翻译成基因序列,输出代表数据的 A、G、C 和 T 字符串。然后,计算机将这些字母串发送到半导体芯片——本质上是指示 DNA 碱基以何种顺序构建的指令。

该芯片上布满了微型孔,每个孔只有几百纳米深。每个孔都是一个小型 DNA 合成器,能够根据指令逐个碱基地生成基因序列。每个孔都并行构建序列,就像母鸡挨着母鸡下蛋一样。一旦一组 DNA 链完成,它就会被冲洗成液滴——就像一个信息密集的 Hershey's kiss。它可以湿着放着,也可以干着放着长期保存。

为了从 DNA提取信息,测序芯片会测量单个 GATTACA 分子的电子指纹。然后科学家只需对 DNA 进行逆向解码,将字符串按正确顺序排列,并纠正错误。

瞧!将来,农民年鉴档案可能会这样被搁置,然后再次被拿走。

另一个 MIST 团队由布罗德研究所牵头,与哈佛大学和 DNA Script 公司合作。项目负责人罗伯特·尼科尔说:“我们希望拥有足够高吞吐量的系统,这样你就可以开始部署它们并存档数据,这些数据可能不是你需要每天访问但你肯定想保留的数据。”他举了一个无关紧要的例子,那就是体育。“每场棒球比赛的吞吐量都非常高,”他说。“整个体育场都有非常高清的摄像机。”捕捉每一个球员、每一个观众。也许,20 年后,人们会想要观看观众对退役巨星的超级热门歌曲的反应的视频。

当然,IARPA 不太可能获得大满贯。

这两个项目都还未完全投入运行,但官员们希望在 MIST 项目结束前(即几年后)它们能够完全投入运行。为了弄清其运行情况,IARPA 聘请了测试和评估合作伙伴:拥有相关专业知识的外部组织,他们制定了一套评判新技术的标准。

对于 MIST 来说,合作伙伴之一是洛斯阿拉莫斯国家实验室。在那里,由 Tracy Erkkila 领导的团队为参赛团队编写测试,然后创建答案。在实验室里,他们自己将文件编码成电子 DNA 档案。然后,参赛团队必须将该档案重新写入 DNA。“他们基本上会为我们提供一堆液态 DNA,”Erkkila 说。评估人员随后将通过测序读取他们的液态 DNA 堆。然后他们对结果进行评分,寻找翻译错误。实验室还尝试将该 DNA 解码回原始编码信息。

尽管埃尔基拉不能透露太多有关该测试的细节(这就像是一名高年级学生将一份十年级的旧测验发给一名刚入学的二年级学生),但他表示,该测试包括视频、音频、哈勃太空望远镜拍摄的图片(因为他表示,“我们非常喜欢其中的一些图像”),以及一个名为“斯坦福兔子”的兔子雕像的 3D 模型。

事实上,动物正是埃尔基拉寻求 DNA 数据存储可能性的原因之一。他说,想象一下你是一名野生动物研究员,你想在偏远的阿拉斯加安装一台摄像机。“我想连续两年记录,”他说。“你要如何存储这些信息?”至于间谍为何想要拥有掌握海量数据的能力,他没有透露。

不过,将 DNA 合成器放在冰川上将是一个很好的妙语。

DNA 数据存储不再是玩笑,即使它曾经是。当 Markowitz 在 2016 年首次开始探索 DNA 是否适合情报界的数据时,这个想法并不受欢迎。“在 DNA 领域工作的少数人会在会议上站起来谈论它,他们会被嘲笑,”他说。“真的。来自传统存储行业的人。”

相比之下,如今 DNA 数据存储联盟(一个行业和学术合作组织)拥有数十家成员,包括 IBM、戴尔和微软。马科维茨说:“现在没人再笑了。”

如果真是这样,那么马尔科蒂兹也许会在 50 年后回顾这一切,因为他保留了那次会议以及其他每一次会议的记录,成绩都是 A、G、C 和 T,然后自己也会得意洋洋地笑。

我们希望您喜欢“Overmatched”,这是一篇探讨政府资助的研究如何改变日常生活的新专栏。请继续关注 PopSci+ 以了解后续文章。

<<:  在爱达荷州的这个湖泊深处,美国海军正在测试其潜艇技术

>>:  苹果将​​俄罗斯最大社交网络 VKontakte 从 App Store 下架

推荐阅读

《Punirunzu》第 1 集的印象和评论:有吸引力的角色和故事的开头

成人和儿童都能享受的轻松动画《Punirunzu》 《Punirunzu》是一部电视动画系列,于20...

俄罗斯战斗机飞行员可能很快就能与装满炸弹的作战无人机一起飞行

如果俄罗斯决定在本世纪末派遣飞机投入战斗,这些飞机上的人类飞行员仍将选择目标,但真正投下炸弹的将是无...

特斯拉不断撞击紧急车辆,现在政府正在调查

2021 年 3 月 17 日凌晨,在密歇根州兰辛市,一辆行驶在 96 号州际公路上的特斯拉汽车撞上...

品尝苏格兰威士忌,真空蒸馏的注意事项

写这篇文章的时候,我正在小酌三杯陈年苏格兰威士忌,它们被分成了九杯。现在是下午三点左右。是的,我又来...

Arcade1Up Infinity 游戏板评测:是时候清理你的游戏柜了

从我小时候起,我的游戏柜就塞得满满的,里面堆满了经典的棋盘游戏,比如《大富翁》和《行动》,还有一盒又...

《血界战线及其他》评论:全新冒险和更深层次的故事

『血界战线&BEYOND』:跨越现实与异世界界限的史诗冒险《血界战线&BEYOND》是改编自奈藤康弘...

这款爱沙尼亚小型坦克是战争机器人的模块化车身

当机器人投入战斗时,它们将又矮又胖,身体也与人类不同。爱沙尼亚公司 Milrem 的新型地面机器人没...

击落一架小型无人机有多难?[视频]

在“捕食者”无人机被冠以“无人机”之名之前,许多军队都曾将无人机作为靶机,以便飞行员和防空炮手练习射...

帅气女孩:全面回顾迷人的角色和故事的深度

我的帅哥女孩 - 电影魅力和详细评论1991年9月29日上映的电影《帅气少女》改编自吉住涉的同名漫画...

兽医、农民和动物园管理员可以帮助预防下一次大流行

林恩·皮普尔斯 (Lynne Peeples) 在西雅图的家庭办公室撰写有关科学、健康和环境的文章。...

奥运泳装的演变:从羊毛“服装”到弹力比赛服

7 月 27 日起,来自世界各地的游泳运动员将跳入巴黎水上运动中心的游泳池,8 月 8 日和 9 日...

对 BLACK LAGOON 的额外漫画进行全面评论!

《黑礁》额外漫画 - 迷人的模仿和人物的新方面《BLACK LAGOON Omake Manga》...

你想去太空。你能忍受超能力细菌吗?

我们都热爱太空,而且我们确信,鉴于有数千人申请单程火星旅行,你们中至少有一些人想在太空飞船中度过很长...

AYAKA的魅力与评价:深度评测

AYAKA的魅力与评价于2023年夏季动画季登场的《AYAKA》作为一部给观众带来新的兴奋和惊喜的作...

这位父亲为他的儿子制作了精彩的 CGI 视频

丹尼尔·桥本 (Daniel Hashimoto) 看起来是个很酷的爸爸。梦工厂工作室的 After...