Root Nation文章技术关于前沿超级计算机

关于前沿超级计算机

-

© ROOT-NATION.com - 本文由人工智能自动翻译。如有不准确之处,敬请谅解。若要阅读原文,请选择 English 在上面的语言切换器中。

什么是 边疆,世界上最强大、最快的超级计算机,在橡树岭国家实验室运行,用于?从模拟反应堆到预测气候。

这个问题有更广泛的背景。经常有人问我,当我们每个人都可以拥有一台计算机时,为什么还要制造如此强大的机器。当然,超级计算机是非常昂贵的机器,消耗大量能源,但我们从它们身上得到的东西更有价值。今天,我将尝试用 Frontier 超级计算机的例子来解释这一点。

另请阅读: Midjourney V6:关于下一代人工智能的一切

为什么我们需要超级计算机?

简而言之,超级计算机可以处理大量信息。我们的世界正在迅速变化,人类创建了一个巨大的数据库,最终需要对其进行处理、分析、分类和存储。例如,这有助于我们开发新的、更便宜、更有效的药物、更耐用的材料,预测数十年的气候变化等等。超级计算机可以对我们计划建造的物体(例如热核反应堆)的行为进行建模。这些只是最快超级计算机应用的几个例子。是的,它们的生产和维护成本非常昂贵,但这是值得的。

前沿超级计算机

但让我们从基础开始。超级计算机到底是什么?目前还没有准确的定义。然而,当前运行的每台超级计算机的一个特征是其极高的计算能力。在互联网上,你可以找到一个简化的定义,根据该定义,超级计算机是能够实现至少 1 teraflop 计算性能的机器,即每秒 10^12(万亿)次浮点运算。与普通家用计算机相比,这是一个很大的数量。

如果以前计算机的速度是用IPS(每秒指令数)来衡量的,那么对于超级计算机来说,就必须发明一个新的单位——FLOPS,它代表每秒浮点运算次数。这个数字越高,计算机的功能就越强大。

当然,随着作为这些机器的核心的处理器的性能不断发展和增长,基于特定计算阈值的方法很快就会过时。随着新处理器的每次发布,现代计算机的性能也会随之提高。然而,建造它们非常具有挑战性并且需要大量资金。

阅读: OpenAI的项目问:突破还是迫在眉睫的威胁?

哪些超级计算机速度最快?

我们有关于此事的最新数据。 2023年500月,多年来定期发布地球上最强大计算机性能排名的网站Top62.org发布了最新的第500版Top500榜单。本期展示了目前存在的 台最高效的超级计算机。

前沿超级计算机

Frontier 系统仍然是迄今为止地球上最高效的超级计算机。这台超级计算机是世界上第一个百亿亿次计算系统,这意味着它的处理速度已经超过了1亿亿次浮点运算。 Frontier 位于美国田纳西州橡树岭国家实验室,目前处于领先地位,其 HPL(高性能 LINPACK — 一种评估超级计算机初始性能的特定测试)分数为 1193 EFlops(10 exaflop 是 18 万亿次,即 ^,每秒浮点运算数)。

相比之下,最强大的 Apple M1 Ultra 芯片的速度约为 21 teraflops(2002 万亿 FLOPS)。这个数字确实很可观。有趣的是,早在 36 年,就有一台计算机的速度甚至更快——日本科技巨头 NEC 公司生产的 Earth Simulator 超级计算机。它的速度约为 teraflops!

前沿超级计算机

Frontier 采用 AMD EPYC 64C 2 GHz 处理器,基于最先进的 HPE Cray EX235a 架构。它配备了 9,408 个 AMD EPYC 处理器和 37,632 个 AMD Instinct MI250x 加速器,总共 8,699,904 个处理器和图形核心。此外,Frontier 拥有 52.59 GFlops/瓦的令人印象深刻的能源效率,并采用 HPE Slingshot 11 网络进行数据传输。在测试过程中,它展示了高达 1.1 exaflops 的能力,峰值性能达到破纪录的 1.686 exaflops。该系统的估计成本约为 600 亿美元。

这是世界上第一台也是目前唯一一台以触发器模式运行的超级计算机。 Frontier 一年前占据榜首,截至 2023 年 2024 月的排名,它一直保持着自己的位置,抵御了任何挑战者。截至 年初,美国超级计算机仍然是世界上生产力最高的。

然而,科学家们已经猜测,也许在某个时候,它可能不得不将领先地位让给另一台美国机器:极光超级计算机。

极光超级计算机

根据最新排名,在美国伊利诺伊州阿贡领导力计算中心运行的搭载英特尔 Sapphire Rapids 芯片的全新 Aurora 超级计算机以 585.34 PFlops 的 HPL 性能位居第二。尽管这仅为排名第一的 Frontier 超级计算机生产力的一半,但 Aurora 系统仍未完工,目前只有一半的计划最终系统投入运行。完成后,Aurora 的预计性能可能会超过 2 EFlops。英特尔打造的 Aurora 超级计算机基于 HPE Cray EX 架构 - 英特尔百亿亿次计算刀片,采用英特尔至强 CPU Max 系列处理器和英特尔数据中心 GPU Max 系列加速器。与 Frontier 类似,它依靠 HPE Slingshot-11 网络进行数据传输。

Microsoft Azure Eagle 超级计算机

第三高效的超级计算机是名为 Eagle 的新系统,安装在 Microsoft Azure cloud 在美国。这是一项技术奇迹,因为 Eagle 是 cloud的超级计算机,其在 Top500 排名中位居第三,这是有史以来 cloud基于系统。 Microsoft Eagle 拥有 561.2 PFlops 的 HPL 性能,配备 Intel Xeon Platinum 8480C 处理器和 NVIDIA H100加速器作为计算核心。

值得一提的是日本超级计算机Fugaku,其性能比Frontier低三倍以上,以及过去生产力最高的超级计算机之一LUMI。尽管中国人目前正在研究一些强大的东西,但这一切仍然处于前景之中。

阅读: 什么是 Gemini:关于谷歌新 AI 模型的一切

为什么我们需要如此巨大的计算能力?

您可以欣赏地球上最快机器的效率,但它们所达到的基准并不是要打破记录;而是要打破记录。它们是为了在尽可能短的时间内获得所需的计算结果。没有超级计算机用户使用这些机器来编写电子邮件或创建演示文稿。使用此类机器来执行我们可以在家用设备上执行的任务将是一种可怕的浪费。毕竟,超级计算机的计算潜力可以实现普通计算机无法完成的操作。

我们谈论的任务主要是为了带来切实的利益,而不一定是那些可以立即转化为金钱收益的任务。值得提醒的是,仅Frontier超级计算机的建造就耗资约600亿美元。当然,它的使用和持续维护费用也很大。该超级计算机占地680平方米,耗电量21兆瓦。

前沿超级计算机

Frontier 与其他超级计算机一样,用于气候建模、人类基本药物研发、新材料技术探索等任务。当然,此类设备执行的任务范围要广泛得多,包括分析各种类型的大量数据集:金融、医疗、卫星图像、物理现象建模等等。 Frontier 是第一台百亿亿次超级计算机,这一事实使其能够解决其他超级计算机都面临挑战的任务。

一个例子是热核反应堆整个生命周期的模拟。是的,这不是一个错误。目前世界上还没有正在运行的热核电站,但 Frontier 强大的百亿亿次计算能力可以对假设的热核反应堆的行为进行建模,并预测此类反应堆内等离子体的行为。虽然热核能商业化仍然是一个遥远的前景,但很难想象立即带来的好处。然而,毫无疑问,在全世界范围内,计算能力有助于热核能的创造和进步,最终消除全球能源短缺,这是值得任何投资的。

阅读: Microsoft 副驾驶:游戏规则改变者还是错误道路?

超级计算机和药物

超级计算机的应用之一涉及与​​化学物质和有机化合物的结构相关的复杂且耗能的计算。通过在高度准确的水平上模拟给定化合物的行为,可以对单个物质的行为进行细致的分析,从而成为开发新的、更有效的药物的工具。

前沿超级计算机

时间回到 2020 年,Frontier 超级计算机推出之前,橡树岭国家实验室的科学家们,Summit 超级计算机就在该实验室运行(Summit 是 2018 年效率最高的超级计算机,仍在使用中,效率排名第七,为 7 PFlops) ,用它来开发一种新型的抗癌药物。事实证明,这种新药的治疗效果比以前使用的药物提高了约 148.8%,效果也更好。虽然 10% 看起来可能不是一个显着的改善,但请考虑告诉那些因这一“微小”差异而挽救生命的患者。虽然人的生命是无价的,但任何具有更高功效的药物都可以节省医疗系统的大量资源并降低治疗成本。这就是 Frontier 超越 Summit 超级计算机的能力的价值所在。

阅读:

前沿与新气候模型

气候建模涉及分析和证实地球数千年历史的模型。当然,这是一项需要大量计算资源的任务。我们越准确地模拟气候变化并预测长期前景,我们就需要越快、越强大的超级计算机。

桑迪亚国家实验室的马克·泰勒是世界上第一个使用百亿亿次计算进行长期气候预测的研究人员之一,他曾表示:“Frontier 超级计算机独特的计算架构使我们能够做到以前无法做到的事情。”换句话说,这台机器的计算能力将过去需要数年的计算工作减少到只需几天。同时,这使研究人员能够获得对气候变化和极端天气条件的长期后果的详细评估。 “这是气候建模的新黄金标准,”泰勒补充道。

前沿超级计算机

有哪些优势?它们简直是巨大的。预测灾难性天气变化的能力可以挽救数万甚至数百万人的生命。分析气候变暖对全球和区域水循环的潜在影响使我们能够提前为未来的变化做好准备。虽然有现代空间模型,但它们对计算的要求极高。直到最近,它们还是太苛刻了。是的,它们使人们能够从理论上预测构成我们所说的天气或气候的各种要素之间的复杂相互作用,例如伴随的对流运动 cloud 但处理庞大的信息流和进行极其复杂的计算一直是一个挑战。

Frontier 超级计算机的出现已经改变了这一点。能源百亿亿次地球系统模型 (E3SM) 项目通过将新的软件方法与巨大的百亿亿次性能相结合,克服了这些障碍。 E3SM 项目的研究合著者和协调员 Sarat Sreepathi 以及名为 SCREAM 的 E3SM 大气模型的合著者解释道:“气候建模界长期以来一直梦想以足以促进十年尺度预测的速度运行公里级模型,现在它已经成为现实。”

换句话说,如果没有 Frontier,像 E3SM 这样的项目就会因为缺乏数据处理能力而失败。然而,值得注意的是,不仅基本的计算能力至关重要,模型本身的优化也至关重要。劳伦斯利弗莫尔国家实验室的气候学家 Peter Caldwell 和他的团队在过去五年里创造了一种新的 cloud 模型从头开始。它将高效地在图形处理单元 (GPU) 上运行,而图形处理单元现在是现代超级计算机计算能力的关键组成部分。这还包括一款有趣的同类顶级机器。

想象一下!将代码调整为在图形处理单元 (GPU) 上运行可显著提高生产力。SCREAM 可以在 Frontier 的 8192 个节点上运行,以模拟全球 cloud 通常需要一年多时间(准确地说是 1.25 年)才能完成的形成过程,在一次 24 小时的计算中就能完成。在 Frontier 上,可以在几周内完成涵盖 30-40 年的长期模拟。研究人员指出,在过去进行类似的计算几乎是不可能的。有兴趣进一步了解这些研究的人可以探索 Mark Taylor 及其团队最近的 科学出版物.

另请阅读:

边缘和材料技术

利用 Frontier 超级计算机的百亿亿次潜力的有趣项目之一是材料科学方面的工作。它涉及合金历史上最大的计算模拟之一,由于其计算效率,其精度达到了接近量子水平。这项研究由密歇根大学的 Vikram Gavini 进行,其创新之处在于它使用薛定谔方程来模拟各种材料的行为。 Frontier 强大的计算能力能够模拟由 75,000 个原子组成的镁合金系统。

前沿超级计算机

镁合金是一种非常有趣的材料。它们非常轻巧,同时又非常坚固。然而,镁合金对特定缺陷很敏感,主要是位错(即材料晶体结构中存在大量缺陷),这些缺陷会极大地改变其机械性能。这会将一种有前途的材料变成一块 meta不适合使用,因为它容易开裂、易碎且不稳定。得益于 Frontier 的计算能力,科学家们已经成功解决了镁合金中的一些缺陷。但这只是具有挑战性的工作的开始。

另请阅读: 

未来是超级计算机吗?

普通计算机无法解决一些科学技术问题带来的挑战。超级计算机具有显着更强的计算能力,使它们能够执行普通计算机不可能或花费太多时间的计算。通过创建超级计算机,科学家的目标是突破我们的知识和能力的界限,解决可能对我们的未来产生重大现实影响的问题。

摩尔定律指出,计算机的计算能力以几何级数增长。每两年,计算速度就会翻一番,使工程师和科学家能够找到解决曾经被认为无法完成的任务的方法。

前沿超级计算机

有一天,超级计算机会变得很普遍。就在十年前,虚拟现实、 cloud 游戏,以及 meta过去,超级计算机只存在于少数技术专家和极客的想象中,而如今,它们已经成为现实。未来的一代人甚至不需要接受 IT 教育或在谷歌工作,就能享受超级计算机带来的好处;它们将悄无声息地成为日常生活的一部分,就像智能​​手机、笔记本电脑和其他技术一样。

阅读: 

Yuri Svitlyk
Yuri Svitlyk
喀尔巴阡山脉之子,未被认可的数学天才, Microsoft “律师”,实用的利他主义者,左普拉沃舍克
该作者的更多内容
订阅
通知
客人

0 留言
最新
最老的 最投票
内联反馈
查看所有评论
其他文章
关注我们
现在流行