您的位置:首页 > 其它

EPYC新船能否承载AMD旧望?

2017-06-21 05:17 274 查看
特别鸣谢线哥(李献)的技术支持
AMD重返数据中心市场了,在那不勒斯(Naples)处理器平台发布之后,沉寂多年的AMD“一鸣惊人”,紧接着面向桌面端的ThreadRipper发布,以及面向数据中心市场的EPYC系列曝光,AMD又站在了聚光灯下,合作伙伴与用户市场不停追逐其最新信息,连老对手Intel也坐不住,针对性发布了i9系列。代号为SkyLake的新一代服务器平台也恰巧与EPYC发布日期“追尾”。



网友调笑Intel变身“牙膏厂”,这图的最早出处已无从考证。但明显为应对ThreadRipper而紧急发布的i9系列,让这一称呼更有市场
就在AMD预备发布EPYC服务器处理器平台前几天,恰好是Intel关于SkyLake新一代服务器平台的技术预览,Intel对AMD,SkyLake对Neples,服务器厂商和用户市场都有“兴奋”的理由。不管怎样,被Intel长期“垄断”的x86处理器市场有了新的选择。
在十几年前,当AMD从Alhpha那里学来了一些独门绝技后,推出的Opteron仅一段时间内就在服务器市场反噬了英特尔,那时的至强5000系列处理器还要挂在芯片组北桥上,FSB低带宽被AMD用HT总线互联的Opteron超了过去,当2009年的SNB平台上市的时候,AMD已经占据了相当份额的服务器市场了。那时任何一家较大的服务器品牌商都有AMD处理器的产品线,不过2010年后,就形势逆转,虽然AMD几经努力,难奈风向已变。



北京时间6月21日凌晨4点,AMD总裁兼CEO苏姿丰女士揭开了AMD重返数据中心的序幕

服务器市场又进入到一个平淡乏味的周期,十年一个周期,AMD在Zen架构的驱动下,带着EPYC又回来了。服务器市场相比台式机市场而言,没有那么多嘴仗可打,是骡子是马,拉出来遛遛。特别是那些拥有几十万台服务器的互联网客户不希望被一家所绑架,有多家的处理器可选必然是极好的,特别是在很大程度上,AMD具有ARM和OpenPower所不具备的对位优势。



在正式发布EPYC前一天,AMD全球市场执行副总裁John Taylor在技术预览开场就透露了三个信息,苹果最新的iMac和MacBook、戴尔的Alienware Area 51以及微软的Xbox One X都将基于AMD新一代处理器推出新的产品。在介绍Area 51时甚至还引用了迈克尔·戴尔(Michael Dell)的推文,这或许也能代表业界的一种态度



AMD与HPE展示了最新的一款基于EPYC处理器的HPE Gen10服务器平台,这是一台双路服务器,在配置256GB内存,16个1.6TB Samsung NVMe SSD的情况下,获得了910万IOPS(随机读),其中随机写最高达到710万,带宽超过53GB/s

不止HPE,微软(Azure)也展示了其与AMD合作设计的Olympus服务器平台,以及Dell、VMware、赛灵思、三星、红帽与迈络思等更多合作伙伴相继登台为AMD背书,包括超微、泰安、曙光、技嘉、英业达等在内的ODM们也相继展出了各自基于EPYC的服务器设计。不管怎样,下游厂商以及最终用户都希望多一个选择,而在没有AMD的日子,ARM以及OpenPower都担任过此角色,但同属x86阵营的EPYC出现,显然更容易被用户接受。



同时,还有来自中国互联网公司百度的经验分享,如何利用EPYC为百度构建用于机器学习的服务器

EPYC:关注性能 更关注效率
发布处理器产品,总是少不了两个环节——讲架构,飚性能,既能照顾高冷技术爱好者的Bigger,又能兼顾热衷“一把梭”的跑分党,厂商也能在这两者上做出不少文章来,而我等业内看客还可凑个热闹,简直是皆大欢喜,必不可少。

AMD新处理器EPYC的架构相对还是比较好理解的,网上有太多的解读,而且老对手Intel在这方面普及也很“积极”。其实对于技术之争,有时真的很难说。比如x86市场的64位处理器、多核处理器以及异构计算(如CPU与GPU一体的APU),都是AMD率先提出并实践的,在提出之时都有较大争论,且过几年再看?
关于微架构的技术之争并无严格意义的对错。在AMD看来,其EPYC架构是面向未来,且领先于对手的:



EPYC系列处理器,不管是单路还是双路,均提供128条PCIe 3.0通道,能够支持更多的NVMe SSD或者GPU;而且一个神奇的设计就是2S时,64条PCIe可以形成高速IF(Infinity Fabric)通道,连接两颗处理器,整套服务器还是128条PCIe通道



简单用一个表来总结一下EPYC处理器的特点吧,核多(最高32物理核心)、内存多(8通道内存支持,单颗处理器最大2TB容量)、PCIe通道多(128条PCIe 3.0通道)。与SkyLake相同核心数量的处理器相比,EPYC虽然主频不占优势,但功耗却低10~20%
在一对一的处理器性能对比中,据AMD提供的测试数据来看,其性能基本都能高出E5 v4处理器50%左右,期待SkyLake发布后双方的正面对决。



EPYC与E5 v4处理器高中低市场皆针锋相对,在主流双路服务器区间,EPYC甚至能有高出60%~70%的性能表现,在整个双路服务器市场,EPYC平均能高出40%~50%。比较有意思的是,AMD是按价格区间来划分的,换而言之,EPYC在500美元以上服务器平台时,其优势才凸显出来
这还不是最劲爆的,AMD对于EPYC处理器的期待,一对一显然不能满足了,还要在1颗EPYC对2颗 E5 v4上下功夫,推出了一种特别的处理器系列:



从Datasheet上来看,跟普通的EPYC(双路设计)处理器并没有明显的不同,以7551P为例,32核心64线程,主频2.0GHz可睿频到3.0GHz,8通道内存支持最大2TB内存,128条PCIe 3.0通道,功耗180W,与EPYC 7551相比,参数上基本没有区别。其实是针对单路服务器而优化的,简单来说,就是要以单路服务器抗衡双路服务器



注意红框,这是单路EPYC服务器与双路服务器的性能对比,不但不弱,还要超过20%。两颗E5-2650 v4共24核心48线程,相比EPYC 7551P的32核心64线程,核心数量上少了四分之一,但却处于同一个价格区间(或曰成本)。这一市场策略是否有种似曾相识的感觉?
性能对比要受限于参照物,很显然EPYC在测试中是将E5 v4处理器作为对手,而Skylake即将发布,这才是其真正的对手。
显然,AMD也考虑到这种情况,将重点放在了服务器整体效率之上,提出“可选择的能耗限制”口号,即Selectable Power Limits,即在性能与功耗之间可以动态调整,以提供更好的灵活性。



以EPYC 7601为例,其额定功率为180W,但实际上可在165W和200W之间浮动,不同功耗意味着不同的性能,在较低功耗时能获得更好的能效,较高功耗时,又能获得更好的性能
EPYC隐藏属性:更多PCIe支持引发SDS破局
AMD的Naples平台刚流出相关的Datasheet时,就被震惊了一下,毕竟单颗处理器支持128条PCIe 3.0通道还是很有震撼力的。尤其是NVMe SSD的应用市场日趋增大的时候,受限于服务器的PCIe通道数,支持NVMe SSD的服务器设计显得不那么完美,难以满配24个NVMe SSD(典型双路服务器80条PCIe通道,只能支持20个NVMe SSD,还要考虑其他HBA卡需要的PCIe通道),即使装上了也性能受限。
显然,不管是单路EPYC服务器还是双路EPYC服务器,其均能提供128条PCIe通道,这实在是个独特的优势,给NVMe SSD和其他HBA卡带来了更灵活的配置选择。

AMD展示的双路EPYC服务器实物图,注意红框中的组件,这实际上是两排用于连接(NVMe/SATA)前面板驱动器的接插件,4个并排的接插件支持PCIe3.0 x4通道,即连接NVMe SSD;这4个当中的最右两个接口时同时提供对NVMe SSD和SATA SSD的支持;两个接口并排的则只支持SATA SSD
再来看一下现场的实物图



双路EPYC服务器的实物展示图,首先映入眼帘的就是密集的内存插槽,共32条内存插槽。图中的两个红框,左边的即上一张图中展示的U.2 NVMe SSD和SATA SSD接口;实际上右边的红框也是同样的4个支持NVMe的接口,同样,右边两个(未接线)只支持PCIe(在服务器实际设计中,可灵活安排),左边两个(已接线)同时支持U.2和SATA。本来还想把硬盘抽出来确认一下接口的,无奈这台服务器为了方便展示,采用前端朝下倾斜摆放的姿势,难以抽出硬盘
双路EPYC服务器可配置两颗7601处理器,共64核心128线程,同时32条内存插槽能够最大支持4TB内存容量,提供更好的计算性能,而128条PCIe 3.0通道则连接更多的NVMe SSD(包括U.2),这个提示还不明显吗?全闪存配置的Server SAN已经具备物理条件了。
怪不得在讲解EPYC处理器的目标市场时,有一个“转瞬即逝”的“软件定义存储”市场:



EPYC处理器所面向的市场领域:高性能计算,云、Hyperscale和虚拟化市场,以及大数据分析,这都比较好理解。软件定义存储市场则是刚刚讲到的NVMe SSD支持,那么机器学习领域有什么新鲜?
不一样的架构 不一样的人工智能
今年人工智能大火,显然AMD是有提前布局的,毕竟“A卡”也占据了GPU市场的半壁江山。不过说起这个,就不得不提一下异构计算,关于这个可以回忆一下APU,类似的技术理念。但经过几年时间的实践,显然AMD更加信心满满。



异构计算的架构实现,简单来说,就是AMD通过Infinity Fabric将CPU与CPU,或者CPU与GPU连接起来,实现Scale out或者异构计算。而这之中的关键就是基于PCIe的Infinity Fabric,不得不说,设计很巧妙,也富有成效



封装内的4个Die间的IF带宽42GB/s,总计170GB/s;两颗处理器间的Infinity Fabric带宽38GB/s,总计152GB/s,带宽足够高,且AMD强调这不仅用于CPU互联,还可用于其他IO。这让我想起了AMD当年利用HT总线的性能一举反攻Intel的历史
同样有服务器实物展示:



首先映入眼帘的就是Radeon Instinct GPU(内存插槽之间,GPU之下是CPU),以及一大把黄绿相间的6 Pin电源线,这为GPU提供额外的电源。图中红色的框是一个M.2接口设计,在M.2右边,黑色导流板下,有并排的SATA接口连接器,上图中白色的线即为SATA连接线,连接前面板上的24个2.5英寸的SATA接口驱动器
这之中的GPU,AMD有介绍三种硬件,基于三种不同架构,提供不同的性能,满足不同市场需求:



Radeon Instinct系列GPU具体分为MI25、MI6和MI8三个型号,分别采用不同架构,针对不同的应用环境
EPYC+Radeon Instinct只是AMD在人工智能领域的三驾马车之一,也是必备前提。ROCm和MIOpen则是其另外两驾马车,三者相辅相成,必不可少:



AMD就如何加速GPU之间的数据流动而进行了一系列改进,其中ROCm这一优化的软件平台居功至伟,但受限于NDA,我能说的就这么多



关于MIOpen,AMD就只提供了这么一张图……
AMD最新的EPYC系列处理器是值得期待的,至少从技术上来看,其设计理念的前瞻性和具体产品的性能是有助于当前的新兴应用的,比如软件定义存储,机器学习或者说人工智能。剩下的可能更多的是商业问题,比如在企业级市场如何重获最终用户的信任,这需要AMD及其合作伙伴付出更多努力。
而且,EPYC的特点,也使得其可以在互联网行业寻找突破口。首先,Google、Facebook以及微软等公司青睐新的技术尝试,比如AMD就已经与微软有一款合作的服务器设计,而EPYC的特点也契合互联网公司的某些应用需求。从商业上看,“扶持”AMD也有利于他们的采购策略,AMD能否涅槃重生,天时地利皆有,就看AMD人和了……

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: