世界上最快的科学机器

世界上最快的科学机器

距离世界最快超级计算机 TOP500 排名发布仅剩几周时间,本周,美国橡树岭国家实验室 (ORNL) 正式部署了 Titan,这是一台 20 千万亿次浮点运算的机器。Titan 有望击败劳伦斯利弗莫尔国家实验室的另一台能源部机器 Sequoia,让美国重回超级计算机金字塔的顶峰(Sequoia 有望位居第二),而美国过去几年一直在追赶中国和日本。

但除了吹嘘之外,Titan 的意义还不止于此。它将成为世界上速度最快的开放科学机器,为全国各地工业界、学术界和政府实验室的科学家提供时间,他们需要巨大的计算能力来理解六个核心领域的复杂数据集:气候变化、天体物理学、材料科学、生物燃料、燃烧和核能系统。至关重要的是,它结合了图形处理单元 (GPU) 和通常部署在这种超级计算机中的传统中央处理单元 (CPU) 内核。随着科学家们努力开发下一代百亿亿次级科学机器,这种 CPU 和 GPU 的成功结合可能会对超级计算的未来产生深远的影响。

“我们把全部赌注押在了这个混合计算环境上,而且我们成功了。”“Titan 将成为当今最大、速度最快的开放科学计算机,”负责为 Titan 提供 GPU 的 NVIDIA 业务部门 Tesla 的首席技术官史蒂夫·斯科特 (Steve Scott) 表示。“它可能会也可能不会超过 Sequoia。获得这些头衔固然很好,但这并不像在这台机器上进行的科学研究那么重要。”

对于开发 Titan 的合作者来说,其计算机运行速度是否比劳伦斯利弗莫尔的卫冕冠军更快只是次要考虑。Sequoia 是一款 IBM BlueGene/Q 系统,旨在为美国能源部开展机密研究,因此很快就会消失,重新回到国家机密的幕后,普通研究人员将很难接触到它。另一方面,Titan 的设计考虑到了开放研究。它已经准备好以研究科学界从未见过的水平进行计算。

Titan 每秒能够进行 20,000 万亿次计算。为了让您了解这种计算能力的发展范围和速度,请想想 2009 年 ORNL 还拥有世界上速度最快的超级计算机 Jaguar(Titan 实际上是 Jaguar 的升级版,而不是从头开始的系统,尽管 Titan 的架构非常不同)。Jaguar 是世界上速度最快的计算机之一,其系统速度为 2.3 petaflops(“flops” 代表每秒浮点运算次数,是超级计算性能的衡量标准)。短短三年内,Titan 就超越了 Jaguar 十倍。

这一飞跃很大程度上得益于对 ORNL 构建超级计算机方式的重新思考。通过构建一台十倍大、十倍多 CPU 的计算机,可以切实地将计算能力提高十倍,但这样做在很多层面上都不切实际。除了如此大型机器固有的硬件挑战之外,2.3 千万亿次浮点运算的 Jaguar 所需的能源相当于 7,000 个美国家庭的能源需求。20 千万亿次浮点运算的 Jaguar 需要大约 60 兆瓦或 60,000 个家庭的能源才能运行。要让 Titan 达到现在的水平,而又不产生巨大的能源消耗,需要大量的合作、更多地依赖一种新的硬件机制,以及相当大的勇气。

Jeffrey Nichols 表示:“2009 年,我们发明了混合多核,当时我们还没有这个词。从那时起,我们进行了三年的信念飞跃,并获得了巨大的回报,性能提高了 10 倍,效率提高了 5 倍。”

Nichols 指的是将图形芯片 GPU 集成到传统 CPU 架构中。GPU 特别适合某些任务,它们特别擅长每秒处理多个(数十甚至数百个)计算。CPU 并不特别擅长这种计算,但它们仍然非常适合传统的计算任务,例如基本代码行的运行。为了打造 Titan,ORNL 召集了超级计算机制造商 Cray 和 GPU 制造商 NVIDIA,创建了一个混合系统,其中包含 18,688 个 AMD 16 核 CPU 和 18,688 个 NVIDIA Tesla GPU,它们将协同工作,以更快、更高效的完成任务。核心研究已经完成,但挑战在于将所有部件(全部 40,000 个)排列起来并使其发挥作用。

尼科尔斯解释说,参与 Titan 开发的每个人都怀着某种程度的信心,每个人都面临着失败的可能。Cray 必须接触一种新的硬件和接口,这种硬件和接口能够在 CPU 和 GPU 之间进行通信,这是它以前从未做过的事情。NVIDIA 一直声称其 GPU 拥有重要的功能,远远超出了游戏机或 PC 的范围,现在是时候证明这种混合计算真的可以在超级计算规模上进行。而 ORNL 可能处于最危险的位置,其在全球超级计算领域的领导地位岌岌可危。如果 Titan 未能按时上线(或根本无法上线),这将是一个重大挫折,也许是多年的挫折——在快速发展的超级计算领域,这些年将很难弥补。“对于一个必须完成使命、不能承受失败的组织来说,我们把所有的钱都押在了这个混合计算环境中,我们成功了,”斯科特说。

这次冒险现在获得了丰厚的回报。Titan 无需制造一台比 Jaguar 大十倍的计算机,升级到 16 核 CPU 和性能加速 GPU 后,就可以像 Jaguar 一样装入 200 个服务器机柜中。虽然 Titan 确实比其前代产品消耗更多的电量,但只需要大约 9 兆瓦——这只是以相同速度运行的全 CPU 架构所需电量的一小部分。

这仍然是每年 1000 万美元的能源费用,但当你将它与全球当前的机器领域以及我们必须跟上竞争(特别是太平洋彼岸的某个竞争对手)的步伐进行比较时,Titan 是美国超级计算向前迈出的重要一步。美国能源部正试图创造百亿亿次超级计算能力(希望在 2020 年实现),而中国、日本、印度和欧洲及世界各地的其他国家正试图在这一领域击败美国(百亿亿次浮点性能是性能的下一个重要里程碑,相当于 1,000 千万亿次浮点)。与其中一些竞争对手不同,美国能源部正试图在紧张的财务预算和能源预算下实现这一目标。

“我们在美国和其他地方看到的不同之处在于,我们试图在 20 兆瓦的功率内实现百亿亿次级计算,”尼科尔斯说。按今天的价格计算,这大约相当于每年价值 2000 万美元的电力。中国目前没有这种财政或能源限制,因此从研发和国家安全的角度来看,泰坦在性能和效率方面的飞跃意义重大。不过,要在上述预算下达到百亿亿次级性能,需要在相同能量下将性能提高 50 倍左右。这当然令人望而生畏,但尼科尔斯和他在 ORNL、Cray、nVidia 等公司的同事已经在努力寻找解决方案。

“我们在 2009 年拥有最大的机器,并且已经在考虑 2012 年的机器,”尼科尔斯说。“而且我们已经在考虑 2016 年的机器。”

<<:  这个大型室内飓风模拟器可以拯救你的生命

>>:  见见维基百科上为飓风桑迪代言的气候变化否认者

推荐阅读

一家小型初创公司能够建造美国的下一艘宇宙飞船吗?

这一幕让人回想起 NASA 的辉煌岁月,那时人类还在月球上行走。一艘太空舱在三架橙蓝色降落伞的遮篷下...

我的旅行车可以打败你的保时捷!

E55 AMG——比你先到达杂货店的旅行车作者:Scott Mowbray我的一些编辑同事特别鄙视...

这个机器人厨师可以用手臂尝盐

机器人可以看到人眼以外的波长,可以听到人耳以外的波长,甚至可以感受到接近人类皮肤的触觉。但说到品尝,...

斯科特·普鲁特希望撤销美国环保署对清洁汽车的要求。这将是一场斗争。

美国环保署署长斯科特·普鲁特最近宣布,他打算废除奥巴马时代的汽车排放标准。虽然我们没有关于新要求的具...

电影《精灵宝可梦钻石珍珠》的魅力与评价:帝牙卢卡VS瓦尔基雅VS达克莱伊

精灵宝可梦钻石&珍珠剧场版:帝牙卢卡 vs. 瓦尔基雅 vs. 达克莱伊评论概述2007 年 7 月...

俄罗斯拟建新核电站——以及新风险

开始将 FPU‘罗蒙诺索夫学院’拖往佩韦克。rosatom.ru世界上第一座商用浮动核电站——一艘重...

班格梦想! Roselia 第1集:约定 - 透彻解析动人故事与音乐的融合

班格梦想! Roselia Ⅰ:承诺 - 电影评论和详情《BanG Dream!Roselia第Ⅰ集...

比圣诞老人找到饼干更快地找到你的钱包——这款追踪器仅售 27 美元

我们都知道,有些人总是回头找钱包——也许你就是那个人。MagTag 超薄追踪卡可以帮你解决这个问题(...

《飞翼少年​​:黑色的翅膀与沉睡的森林-破空-》评论:惊心动魄又深刻的破空故事

Air Gear:黑色羽毛与沉睡森林 -Break on the Sky- 综合评论与推荐概述《飞轮...

视频:一家公司的算法揭示了所有数据之间的隐藏联系

在互联网上流淌的庞大而无差别的数据洪流中,隐藏着错综复杂的信息拓扑结构。拥有数百万美元资金的决策者需...

《魔法少女泰!》的魅力与评价:不容错过的动漫体验

巫師泰! - 回顾与推荐■ 公共媒体电视动画系列■ 原创媒体动漫原创■ 播出时间1999 年 7 月...

“这就是为什么我不能做爱。”《五行物语》的魅力与评价:故事深刻,人物有魅力

“这就是我不能做爱的原因。”——一个令人着迷的色情幻想《这就是我不能做爱的原因》是一部改编自立花伴郎...

我们的长童年可能与食物采集技能有关

有些动物出生后不久就能站立、行走甚至奔跑。而人类婴儿则只能哭闹、吐奶和排便,直到出生几个月后才开始做...

您需要了解的有关打击盗版的版权警报系统的一切

本周有很多关于版权警报系统的讨论。这是一件令人困惑的事情!但如果你喜欢在互联网上偷东西,或者即使你不...

从独特到实用,送给男士的最佳生日礼物创意一定会让您惊叹不已

每年这个时候,你是否需要找到一份完美的生日礼物来向你生命中的男人表达你对他的爱和/或感激?有时,为你...