Marvell DPU的细节首次曝光
今天,我们将对 Marvell Octeon 10 DPU 进行令人兴奋的解读。这也许是我们长期以来一直想看到的产品,现在就在实验室里。它的外形与我们习惯的有点不同,但在我们在 2022 年 OCP 峰会上看到 Marvell Octeon 10 之后,是时候开始工作了。
Marvell Octeon 10 Arm Neoverse N2 DPU
顺便说一句,当我听说 Marvell 正在发送一个 Octeon 10 DPU 时,我以为我们会得到一个 PCIe 卡,就像我们在 2022 年 OCP 峰会上看到的那样。
2022 年 OCP 峰会上的 Marvell Octeon 10
想象一下我打开盒子发现这样一块主板时的震惊吧!
Marvell Octeon 10 CN106XX CRB 24 core Arm Neoverse N2
大型散热器下方是 Marvell Octeon 10 DPU。这是我们期待了一年多的 24 核 Arm Neoverse-N2 芯片。这上面的 CORECLK 是 2500MHz 以平衡性能和功耗。
之前的经验告诉我们不要玩太多 CRB,所以这是一张在 2022 年 OCP 峰会上展示的不同 Octeon 10 DPU CRB 的照片。
Marvell Octeon 10 在 2022 年 OCP 峰会上
快速浏览一下,我们可以看到 CRB 的布局类似于标准主板。
我们有两个 SFP56 cages和一个 QSFP56 端口。到目前为止,我们看到的 Marvell SKU 倾向于使用 50Gbps 作为其基本网络速度,因此我们有 25/50GbE SF56 端口和 100/200GbE QSFP56 端口。Marvell 还有其他带有内置交换机的型号,可以提供比我们这里的更多的 50GbE 通道。
还有一系列 PCIe 连接。理论上,Octeon 10 DPU 是一个 PCIe Gen5 设备,但目前我们缺少 Gen5 端点。取而代之的是,高高地骑在其中一个 PCIe 插槽上方的是 M.2 SSD,即 Crucial 英睿达P5 Plus。至少平台支持NVMe存储。
虽然 NVMe 设备乍一看可能很有趣,但它也非常重要。我们讨论 DPU 的一个关键标准是能够为 PCIe 根联合体提供服务。这正是显示的内容,因为 M.2 NVMe SSD 的 PCIe 根是 DPU。我们经常查看 PCIe 卡上的 DPU,但此 CRB 还旨在向 5G 基础设施提供商和安全设备提供商等设备制造商展示这如何成为网络平台的基础。如果您还记得我们的 BlueField-2 DPU 演示,您可以想象 Octeon 10 为连接了多个存储驱动器的网络存储提供 NVMeoF、加密和压缩服务。这是 DPU 的另一个用例,并且正在推动这种形式因素。
还有一个 ASPEED AST2500 BMC。这正在运行 OpenBMC,它一直是救命稻草。我们一直在广泛使用 serial-over-LAN 功能。
在内存方面,您可能会注意到每个通道一个的三个 DIMM 插槽。高带宽网络、快速 CPU 和加速器意味着我们需要快速内存。安装的 DIMM 是 16GB ECC DDR5 模块。我们没有在此处放置 32GB 或 64GB DIMM。内存带宽很重要。NVIDIA BlueField-1 仍在使用中,尽管 BlueField-2 已淘汰,因为后者的型号具有限制性能的单个内存通道。Marvell 正在使用 DDR5,平台上的官方文档针对 DDR5-5200 速度。那是很大的内存带宽。
这样,就可以设置和运行系统了。
启动系统的步骤是先启动BMC,再手动启动DPU。这感觉就像开始一些更独特的异国情调的汽车。我们在系统启动时发现的第一件事就是型号。Marvell 说“CN106XX”,但 XX 似乎代表核心数。这是 MV-CN10624-A1-AAP。
Marvell Octeon 10 MV CN 10624 A1 AAP SKU
接下来,我们启动了系统并看到了我们新的 Arm Neoverse-N2 内核。这是我们第一次在硅片中看到新的 Arm IP。
Marvell Octeon 10 Lscpu 输出
检查新芯片的另一个有趣部分是查看 Cavium/ThunderX IP。我在 ThunderX2 发布会上发表了演讲,我们测试了原始的 ThunderX 部件,所以看到复古的“THUNDERX”参考很有趣。
Marvell Octeon 10 Cavium 和 ThunderX IP
我们正在其他 DPU 上重新运行数字,但我们认为我们至少会取笑一个基准。实际上,Pensando 卡正在阻止这个过程。不过,这是一个 Coremark 结果:
Marvel Octeon 10 CN10624 Coremark
就某些情况而言,此处的 576K 大致符合 20 核 Intel Xeon Gold 6138。这是一个相当不错的结果。与我们在 Neoverse N1 部件(如 Ampere Altra Max 128 核芯片)上看到的相比,我们的核心性能有了很大的提升。尽管这是一个微基准 Arm 处理器通常表现非常好,但在某些情况下,双 AMD EPYC 9654(192 核/ 384 线程)约为 800 万,而 Ampere Altra Max 128 核相当常见,可以看到很好的分数2.6M。与现代台式机处理器相比,这将更接近 ~8 核 AMD Ryzen 7000 或第 13 代英特尔酷睿。
这应该让人们感到震惊。中端 2017 Xeon 性能即将出现在 DPU 上的 PCIe 卡上。我们有 CRB,但这太棒了。在我们的完整结果之前,我们要说的是,Marvell 拥有我们测试过的最快的 DPU,优势显着。
最后的话
这是一个有趣的过程。它花费的时间比预期的要长得多,但这是新硬件乐趣的一部分。新的 Intel、AMD,甚至 Ampere 服务器平台都比较乏味。这真让人兴奋。也许测试 Marvell Octeon 10 DPU 最奇怪的部分是互联网上的绝大多数网站都可以在专用于 PCIe 卡的芯片上以良好的性能托管。Marvell 在将新内核(Arm Neoverse-N2)、新内存控制器(三通道 DDR5)、新 PCIe 控制器(PCIe Gen5)和高速网络(每链路 50Gbps)组合到一个封装中做得非常出色,同时及其一系列加速器。
同时,我们想指出目前的状况。
Marvell Octeon 体验就像第一次使用ThunderX2 芯片一样。一切正常,但你会觉得自己处在一个特殊的环境中。将其与现代 Ampere Altra (Max) 系统进行对比,在该系统中,Ubuntu 只需从 ISO 安装即可。NVIDIA BlueField-2 DPU 使用起来非常简单,只需将它们插入 PCIe 插槽、连接网络和登录即可。它甚至可以在Windows中运行,并允许您在几分钟内创建Inception风格的演示。AMD Pensando 在易用性和文档方面可能落后 NVIDIA 一两步。Marvell 感觉像是遥远的第三。英特尔仍然需要与Mount Evans一起出现。
Marvell 的 CRB 给人的感觉更像是一台非常快速且非常复杂的机器。我们迄今为止所做的一些基本基准测试证实了 Arm Neoverse N2 内核速度很快,拥有 24 个内核类似于搭载 2017-2018 时代的中端至高端 Xeon。认为 Octeon 10 将整数性能水平与高端网络、更快的 PCIe Gen5 和专为单插槽 PCIe 卡设计的 TDP 相结合,真是令人惊讶。希望这是产品化计划的一部分。Marvell 拥有的产品将在 OEM 市场上运作良好,但在某些时候,NVIDIA 正在疯狂追赶普通开发人员,而其他供应商要么不得不参与竞争,要么被降级到异国情调的市场。
在我们即将推出的 DPU 综述视频之前,我们还有一段路要走,但是看到 Marvell Octeon 10 可能是这一代的高端 DPU 真是太棒了。可以肯定的是,这款芯片速度很快。祝贺 Marvell 团队使这个 DPU 成为现实。
★ 点击文末【阅读原文】,可查看本文原文链接!
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第3244内容,欢迎关注。
推荐阅读
回复 投稿,看《如何成为“半导体行业观察”的一员 》
回复 搜索,还能轻松找到其他你感兴趣的文章!