您的位置:首页 > 运维架构

Exascale 超算系统更多细节曝光 峰值性能1exaflop

2018-11-25 00:00 746 查看

在SC18,中国国家高性能计算研发项目首席科学家钱德沛发表了一个演讲,他透露了2018年安装的三个中国exascale原型系统的一些更强大的细节。提供了一个深入探讨他们的设计和底层硬件元素。

在他进入原型细节之前,钱先生概述了中国的exascale计划,特别是其目标和挑战。关于前者,他重申,确保用于这些机器的技术是“可自我控制的”,暗示大多数(如果不是全部)硬件和软件元素都将在国内开发。这三种原型的性质无疑反映了这种策略。

钱还谈到了这些超级计算机更具体的目标。具体来说,中国的exascale系统计划中的峰值性能 1  exaflop,最小内存容量 10 PB,节点到节点带宽 500Gbps,每节点功耗 30 gigaflops/watt。这比美国,日本和欧盟的exascale计划中设想的20MW到30MW略高 - 而且这些都是Linpack exaflops。

所有三个原型 - 曙光,天河和双威(神威) - 都是在过去10个月内部署的,最后一个原型在一个月前推出。在钱德沛先生对其设计和组件的描述中,我们现在对完整的exascale系统的外观有了相当好的理解,尽管仍然缺少一些关键细节。

曙光原型

曙光Sugon原型配备了AMD授权的Hygon x86处理器。这种针对中国超级计算社区的设计的优势在于它将保持与当前已经生产的HPC软件的兼容性。

这里更有趣的一点是,原型还将使用一种称为“DCU”的东西作为加速器。显然,这些芯片也是由Hygon提供的,根据钱德沛先生在2017年的报告,完整的exascale系统中每片芯片可提供15 teraflops。不过迄今为止的表现似乎只是其中的一小部分。

Sugon的目标是让x86 CPU在exascale系统中提供大约每teraflop的teraflop,这或者意味着Hygon必须提升其第一代Zen CPU的性能,或者计划授权Zen 2或Zen 3来自AMD的IP,其中任何一种都可以轻松提供所需的teraflop。

天河原型

钱先生为天河原型提供了最少量的细节,包括为其供电的处理器。不过很多人认为这个系统将基于中国设计的Arm芯片,这可能是Phytium的小米平台的某个版本。

在钱先生的SC18演示以及2017年的演示中,该芯片只是一个新的多核处理器,可以平衡计算和内存,坦率地说可以是任何东西。但是,由于中国打算将基于Arm的百亿亿次级超级计算机作为其三种选择之一,通过淘汰的过程,必须如此。当然,除非他们改变了主意。

与Sugon原型一样,天河系统由512个节点组成,提供几乎相同的性能:3.14 petaflops。这表明它是一个非常强大的处理器,类似于ShenWei多核芯片(见下文),或者可能是一个适用于每个节点四个插槽设置的更适中的处理器。

该设计还强调容错是一项关键设计功能。这是在互连中实现的,以及新的但未定义的存储介质。

一句话:这台机器仍然很神秘。

双威(神威)原型

这款处理器使用的是神威26010(SW26010)处理器,这是目前为排名第三的TaihuLight超级计算机供电的260核处理器。每个原型节点都有两个这样的处理器,它们共同提供大约6个峰值teraflops。整个512节点机器提供3.13千万亿次浮点运算。

在其当前配置中,每个节点提供每瓦特11千兆浮点数。双威工程师将不得不将其提高近三倍,以达到规定的exascale能源效率目标。毋庸置疑,在预计最终系统部署之前,需要在两到三年的剩余时间内进行大量创新。

与使用Mellanox InfiniBand作为其互连结构基础的Sunway TaihuLight超级计算机不同,exascale原型采用本土网络芯片,可提供200Gbps的点对点带宽。同样,这也是中国将所有exascale技术引入国内战略的一部分。沿着这些线路,这个原型的存储子系统基于一个神威存储盒。

最后的想法

这些原型中的每一个都部署了512个节点,这可能不是偶然的。标准尺寸将使在公平竞争环境中评估这些系统变得更加容易,同时为开发和运行软件提供至少千兆级别的性能。

但正如钱先生所承认的那样,该国正在寻求半导体制造和包装的追赶。这将减缓其exascale机器所需的下一代处理器,网络芯片和存储器件的开发。

也就是说,中国的exascale计划有望改变全球超级计算领域,不仅仅是针对这些极端规模的系统,而是针对日常HPC。在摩尔定律正在放缓,高性能计算正在被数据分析和机器学习中的应用程序重新定义的时候,全球社区将受益于更多样化的设计和方法。

摘自:top500

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息