数据中心

数据中心芯片开源正在拉开序幕


发布时间: 2019-03-24
微软和合作伙伴宣布了开源RTL,用于一种新的数据紧缩机制,而英特尔颁布了另一个实现平安块的类似项目。这些举措注解,介入开放盘算项目(Open Compute Project,OCP)的数据中间巨子们,正执政着芯片开源迈出第一步。
 
以上提到的这些项目,是推动环球最大数据中间向前成长的深度和广度的一个指标。当下,摩尔定律正在放缓,深度进修等工作负载赓续增长,这迫使工程师们竭尽全力寻求机能提升。
 
例如,有厂商展示了冷却高速芯片的六种替代办法,包含浸泡浴。一位厂商高管表示,因为今朝有十几款热点处置器和加快器正在研发中,是以他希望OCP委员会可以或许在来岁之前起草干系的尺度。
 
今年有跨越3500名工程师注册参加了OCP大年夜会,个中有约178受访者称,他们每年在数据中心装备上的花费为25.6亿美元,估计到2022年将增长至近110亿美元。
 
自2011年Facebook成立OCP以来,该组织已经宣布了数十款干事器、交换机以及其他体系和主板的开源设计。成员企业代表们表示,他们希望这些新项目只是芯片开源的一个开始。
 
微软干事器设计总司理Kushagra Vaid表现:“在云干事供给商中,我们开创了供献RTL的先例,我希望其他人也紧随厥后…对于一项新的紧缩尺度来说,你须要为全部行业做出供献,你须要大年夜量的芯片。”
 
“拉手风琴的须眉”:英特尔Jason Waxman与浪潮公司合营设计了一款四路干事器,并表示英特尔将在今年推出Nervana演习推理处置器。(图片来源:EE Times)
 
Project Zipline是对所谓“数据大水”的一种响应办法,依据比来的一项研究显示,估量到2025年每年产生的数据量将到达175ZB。Project Zipline界说了优化数据中心的霍夫曼编码的一种变体,在模式匹配的IP块中实现的。Project Zipline将微软测试文件大年夜小削减了了92%-96%,同时可以在微秒级处置吞吐量达每秒数十GB。
 
Vaid坦言,推出新的紧缩技巧须要必定的时光。到今朝为止,Project Zipline获得了AMD、Arm,Broadcom、Cadence、Intel、Marvell、Mellanox和Synopsys等厂商的支撑。
 
在另一个项目Project Cerberus中,OCP的目的是将运用Project Cerberus创建的处置器信赖根扩展到办事器的所有组件中,这就须要Facebook、Intel和微软等厂约界说一个新的协议和IP块。
 
这种办法让今朝Cerberus主板上运用的NXP控制器成为主控制器,与每个外围芯片中的从属块进行通信。英特尔谈话人表现,这几家厂商将开放这些外围块的源代码。
 
从新思虑办事器主板
一位微软工程师刻画了他的项目:将干事器主板分化为多个模块,以下降成本并缩短设计时光。该项目负责人Siamak Tavallaei(下图)已经颁布了这一概念的高级描绘内容,并且已经有十几家企业有兴趣在今年夏天设计出原型。
 
这种办法让处置器和内存酿成了一个模块,可以在界说好芯片后立刻开端设计。各类CPU模块都可以采取一种安然控制器模块,这种模块运行固件、监控温度、控制电扇和其他基本琐务。
 
采取基于PCIe Gen 4的I/O线缆,可以有助于削减电路板空间并缩短处置器与I/O之间的距离。距离缩短可以节俭高达60%的PCB资料,并在机箱中腾出更多空间,用于容纳更多端口、PCIe插槽、乃至是GPU等加快器。
 
微软Siamak Tavallaei描写了一种针对模块化主板的新概念。
 
为过热的处置器准备一个“冷却浴”
跟着处置器和加快器变得体积更大年夜,散热更多,各种替代性的冷却体系也开端风靡。
 
微软的Vaid表现:“今年展会上有很多很时髦的设法主张。到来岁,如果OCP说‘这个功率下我们须要X,谁人功率下我们更偏向于其他冷却体系’,那会是个不错的工作。”
 
OCP的冷却委员开展这方面的工作刚刚几个月的时光,所以来岁OPC大会要看到响应的尺度问世照样很有野心的。在今年的大会上,参会者看到了各类各样的热管、泵和更奇特的冷却技能。
 
台湾的WiWynn公司展示了一种两相(液体到蒸汽)浸没体系,可以冷却48-V Facebook Diablo Pass办事器的100个节点。
 
有一家厂商估量,除了一些收集巨子正在自立研发的解决计划之外,市场中现有多达十几种液冷产物,甚至是浸入式体系,如今也有多达八个竞争公司展示了他们的单相或者双相体系。
 
侵入式体系厂商Submer表示,他们今朝在测试4兆瓦的体系,估量将在几天内颁布10兆瓦的首个安排案例。
 
在LinkedIn的展位上,Zutacore展示了多个解决计划,从用于1U干事器(上图)的管道,到用于机架和热交换装配(看起来就像是有着金属外壳的汽车散热器)的液冷体系。
 
例如,Facebook正在与Broadcom和Verisilicon互助开拓一款用于视频转码器的ASIC,它可以处置各类责任,包含处置来自手机的不稳固上传,到Facebook Watch的下一个系列。它兼容H.264、VP9和AV1等多种编码器。
 
芯片方面须要在10 W的60帧/秒的速度下处置两个4K流,并且并行编码多个流,此外还须要支撑ffmpeg和VAPI尺度,Facebook技能计策总监Vijay Rao这样表现。
 
对于AI推理责任来说,Facebook欲望芯片可以或许到达至少5 TOPS/W的机能。今朝Facebook正在与Esperanto、Habana、Intel、Marvell和Qualcomm围绕用于推理责任的开源Glow编译器睁开合作。
 
OCP大年夜会:数据中间芯片开源正在拉开序幕
 
Facebook的Emerald Pool是一种机械和电气设计,针对可容纳8个加快器的干事器,今朝采取的是PCIe Gen 3总线。
 
Arm仍在试图打入数据中间干事器
微软正在将AMD Naples干事器添加到本身的数据中心x86声威中,但到今朝为止,微软还无法将Arm干事器投入临蓐。最后一个难题,是怎么让复杂云软件客栈中的很多依存关系变得腻滑,Vaid欲望可以在一年时光内解决这个问题。
 
Marvell的ThunderX2是高通撤消Centriq之后独一的候选芯片。然则,微软有望在新的Ampere芯片上市之后对其进行测试。
 
华为展示了本身的1月份推出的双路Arm干事器,如今华为供给了每个插槽有64个定制核心的样品。
 
微软致力于简化SSD控制器
在存储方面,Facebook和微软正在测试英特尔的Optane,但对今朝的成果保持沉默。微软展示了一款功耗为400 W的256 TB 1U闪存阵列,筹划不才个月投入临盆时采取32个英特尔代号Ruler的16TB 3D NAND卡。
 
微软Vaid展示了一个Project Denali主板,它将大多半固件功课推送到办事器,将SSD控制器缩小到仅治理NAND介质的简单芯片,从而节俭资金并简化治理。
 
Facebook的12.8T交换机采取Broadcom芯片
在收集方面,Mediatek的Nephos部门颁布了本身的6.4 Tbits/s交换芯片所博得的10个设计奖项,个中一些设计已经在位于中国和美国的数据中心运行了。Nephos已经临蓐出了一款12.8 Tbits/s多芯片器件,采取TSMC的7纳米工艺及InFO封装。
 
竞争敌手Innovium公司表现,他们正在临蓐本身的12.8T芯片,今年该芯片设计被思科两款交换机采取。该领域的引诱者Broadcom公司也在发售本身的12.8T Tomhawk-3,但应当还没有采取7纳米芯片。
 
与此同时,诺基亚也在引诱着一个OCP项目,面向用于电信边缘收集的尺度机箱,今朝板子和机械设计已经开源供献给Open Edge,可在各种前提下的安排供给干事。
 
Facebook展示了最新的交换机设计——Minipack,该涉及采取了Broadcom的Tomahawk-3芯片和装备,为大年夜量25G光端供词给干事。此外,Facebook还颁布了一个新的数据中心拓扑构造,将四层折叠改为三层堆叠,以节俭资本并削减跳数。