Arm Neoverse正在成为数据中心的新势力

发布者:EEWorld资讯最新更新时间:2024-02-22 来源: EEWORLD关键字:Arm  Neoverse 手机看文章 扫描二维码
随时随地手机看文章

Arm在拥有手机和物联网设备的通用计算能力后,其下一步行动目前尚不明朗。尽管x86巨头在数据中心占据主导地位,但Arm和RISC-V之间在小型平台上的竞争已初露端倪。然而,Arm一直在积极拓展其业务,向上发展至基础设施领域,包括云计算、有线和无线通信,甚至延伸到网关和边缘设备。起初,他们的步伐是稳健的,但最近他们更积极地寻求取代主流处理器和FPGA,成为以AI为中心的GPU的前端,广泛应用于超大规模扩展、DPU、电信公司的网关和无线基带,以及汽车等边缘应用领域。在我看来,这是对支撑我们所有电子技术的快速增长和高价值基础设施的一次重要而未被充分认识的布局。

image.png

Arm的Neoverse系列在基础设施领域持续占据一席之地。以英伟达的超级芯片为例,这款名为Grace-Hopper的设备实际上是由两个芯片组成:Hopper是处理所有AI内容(如张量运算等)的GPU,而Grace则是一个CPU,与Hopper紧密耦合,通过I/O和内存管理功能实现与常规云世界的连接。Grace基于Neoverse V2构建,拥有72个核心。近期Arm估值的上涨,正是由于其与人工智能相关的广泛应用和市场前景。


Amazon Web Services(AWS)利用Neoverse构建了高效节能的Graviton横向扩展服务器系列,最近的版本是Graviton 4。由于AWS EC2实例几乎全部基于Graviton而非x86处理器,因此对这些平台的需求非常旺盛。AWS还开发了自己的机器学习平台Tranium,虽然Arm在他们的幻灯片中引用了该平台,但我猜测它同样基于Neoverse架构。


与此同时,微软也宣布推出了Cobalt 100服务器芯片和Maia 100 AI芯片。这两款芯片在Arm的Neoverse幻灯片中被提及,并确认将基于Neoverse架构构建。值得注意的是,AWS和Microsoft Azure在云提供商服务(CPS)市场上占据主导地位,且遥遥领先其他竞争对手。其他CPS企业也在追随这一趋势。


此外,Nvidia围绕Neoverse构建了Bluefield DPU平台、AWS的Nitro虚拟机管理系统以及微软的Azure Boost系统。Neoverse在数据中心无处不在,已经成功应用于安培服务器以及诺基亚、爱立信和华为的无线基础设施中。


在推动Neoverse引擎发展方面,Arm每年都会推出新的核心。今年,他们在性能优化的V系列中增加了V3,在性能功耗比的N系列中增加了N3,在数据吞吐量的E系列中增加了E3。令人印象深刻的是,上一代V2在SQL数据库性能、Java和XGBoost(机器学习中的梯度提升优化器)方面的基准测试表现已经超越了x86处理器。V3在一系列以企业为中心的基准测试中比V2取得了两位数的进步,并在AI数据分析方面比V2提升了高达84%的优势。N3在各个方面都比N2表现出显著的性能提升,尤其在AI数据分析方面实现了近200%的进步。


最近的一项战略举措是基于Arm的计算子系统(CSS)内核进行构建,该内核计划于2023年年中发布并用于N系列。上一代CSS是一个可定制的计算子系统,已经过Arm的验证、优化和PPA(性能、功耗、面积)调整。考虑到多核集群的目标需求,用户不仅可以获得类似乐高积木的组件(如CPU核心、一致性互连、内存子系统等),还可以获得一个完整的、可定制的计算子系统配置,包括Neoverse CPU核心、多个DDR/LPDDR通道以及多个PCIe/CXL PHY/控制器等。所有这些组件都通过Arm的总体设计计划针对特定客户工作负载和目标代工厂/流程进行了调整、验证和优化。


在最新的公告中,Arm发布了一款新的CSS N3配置,支持每个芯片包含8至32个内核,其中32个内核的热设计功耗低至40W。此外,他们还发布了首款V系列的CSS-V3,其性能相较于CSS-N2提升了50%。微软的Cobalt芯片正是基于CSS-N2构建的。


鉴于通信服务提供商、移动网络运营商以及汽车原始设备制造商之间的激烈竞争,越来越少的产品团队会认为自己有必要重新发明这个CSS轮子。从CSP的角度来看,能够让计算子系统适应其工作负载需求,同时节省开发成本和上市时间,并保留差异化竞争优势,显然是一种非常合理的选择。


在软件方面,Arm已经成功地融入了软件堆栈的各个层面,形成了一个完善的生态系统。对于云应用程序而言,Arm与开源领导力在语言、工具、Linux发行版和网络等方面的紧密合作尤为重要。随着基于Arm的实例越来越普遍,基于云的软件开发人员开始看到使用Arm进行开发并在Arm平台上优先提供服务的明显优势,从而形成了一个良性循环。


为了强调这一策略的有效性,Oracle现在提供了支持基于Arm硬件的19C数据库平台,无论是在云端还是在本地环境。同样地,SAP也将其SAP HANA云迁移到了AWS Graviton处理器上。这两个都是非常重要的企业应用程序。考虑到成本和软件可用性的优势,我相信未来会有更多的软件和SaaS提供商效仿这一做法。

关键字:Arm  Neoverse 引用地址:Arm Neoverse正在成为数据中心的新势力

上一篇:谷歌发布全球最强开源大模型Gemma:平均性能远超Llama 笔记本可运行
下一篇:芯科科技与Arduino携手推动Matter普及化

推荐阅读最新更新时间:2024-11-12 17:05

科幻大片既视感!ARM开发可植入大脑的芯片
据外媒报道,芯片设计巨头ARM已与美国研究人员合作开发出了一种大脑芯片,这种芯片可以被植入人脑中。下面就随嵌入式小编一起来了解一下相关内容吧。 这种芯片的设计目的是为了帮助脑部或脊椎损伤的病人。它可以被植入人的头骨内。 科幻大片既视感!ARM开发可植入大脑的芯片 科幻大片既视感!ARM开发可植入大脑的芯片 它不仅可以让人们执行各种任务,而且还能够接受感官反馈信息。 但是,我们可能需要等待一些时日才能看到这种芯片的好处。 ARM公司将为华盛顿大学感觉运动神经工程中心(CSNE)设计的移植物开发芯片。 这些研究人员已开发出了早期的原型机。 “他们已开发出了一些原型机。”ARM卫生保健科技负责人彼得-弗格森(Peter Ferg
[嵌入式]
消息称三星将自研移动GPU 减少对ARM Mali GPU依赖
3月27日消息,据外媒报道,消息称,三星将开发自己的移动GPU,以减少对ARM Mali GPU的依赖,并与苹果和高通竞争。 在Exynos 2100发布之前,三星多年来一直依赖ARM的Mali GPU设计,但这一切都可能发生改变。 去年,三星推出了Exynos 2200,Exynos 2200基于4nm EUV工艺制造,采用了基于AMD RDNA 2架构的Xclipse 920 GPU,搭载在Galaxy S22系列智能手机上。 虽然ARM的GPU设计相对稳定,但很明显高通和苹果在这场竞赛中处于领先地位,三星方面的性能差距只能通过为智能手机量身定制的GPU来缩小。 知名数码爆料人Revegnus透露,三星将基于A
[家用电子]
ARM与不同位宽存储器的地址线错位接口 , 外部总线接口深
ARM是32位,地址空间是2的32次幂,4G地址空间。所有的外设(FLASH,RAM,SD卡等等)都映射到这4G的空间上。比如大部分ARM7都把 RAM映射到0x40000000,所以对RAM的操作就在0X40000000开始的地址上。FLASH从0X0开始。使用FLASH还要考虑地址重映 射,就是选择片内FLASH或片外FLASH。 FLASH一般是8位或16位,当它接到32位的ARM上时,地址位就会错位。对于16位FLASH,FLASH的A0要接ARM的A1。对于8位 FLASH,FLASH的A0要接ARM的A0。ARM的A0对应8位,ARM的A1对应16位,ARM的A2对应32位,如果FLASH 是32位,那么FLASH
[单片机]
<font color='red'>ARM</font>与不同位宽存储器的地址线错位接口 , 外部总线接口深
ARM7入门15,看门狗定时器
主程序: /**************************************************************************** * 文 件 名:main.c * 功 能:运行WDT,并控制LED1--LED4显示输出。程序开始先对LED1--LED4闪烁控制, * 并进行喂狗处理;然后只点亮LED1,并进入死循环,等待WDT复位。 * 说 明:将跳线器JP12短接。此程序只可以在Flash中运行,看门狗复位会导致JTAG * 无法调试。 ****************************************************************
[单片机]
<font color='red'>ARM</font>7入门15,看门狗定时器
ARM协处理器主要用途 及其 指令CDP LDC STC MCR MRC介绍
ARM 微处理器可支持多达 16 个协处理器,用于各种协处理操作,在程序执行的过程中,每个协处理器只执行针对自身的协处理指令,忽略 ARM 处理器和其他协处理器的指令,ARM 的协处理器指令主要用于: 1 ARM 处理器初始化 2 ARM 协处理器的数据处理操作 3 在ARM 协处理器的寄存器和处理器的寄存器之间传送数据 4 在ARM 协处理器的寄存器和存储器之间传送数据 ARM 协处理器指令包括以下5条 l CDP 协处理器数操作指令 l LDC 协处理器数据加载指令 l STC 协处理器数据存储指令 l MCR ARM 处理器寄存器到协处理器寄存器的数据传
[单片机]
ARM-linux上实现4G模块PPP拨号上网
在ARM平台上实现4G模块的PPP拨号上网,参考网上的资料和自己的理解,从一无所知到开发完成花了一周多。最后看到ARM板ping通www.baidu.com时甚是高兴,现将此过程整理如下。当然,除此之外要做的工作还有很多。 4G模块使用的SIMTECH 的SIM7100C,SIM7100C带有UART和USB接口,在考虑速度上我们使用USB接口和ARM进行通信。所以向linux内核添加3G模块的驱动(USB转串口驱动)和PPP协议的支持,然后编译内核并下载到开发板。 1. 编译内核 ◇ 大容量存储驱动 Device Drivers USB support make ARCH=arm menuconfig配置USB驱动: *
[单片机]
一种基于ARM的嵌入式系统开发的方案详细讲解
1 背景介绍 在日益信息化的社会中,各种各样的嵌入式系统已经全面渗透到日常生活的每一个角落。嵌入式系统的功能越来越复杂,这就使得一个嵌入式系统产品从市场需求立项到方案选择、样机研制、定型量产所需要的开发费用越来越多,所需开发时间越来越长。因此,高效的嵌入式系统设计方法就显得尤为重要。 1.1 传统的嵌入式系统设计方法 嵌入式系统开发的关键就是对核心部分进行功能验证。传统的验证方法是建模模拟和制作目标板评估。 通过建模来进行功能验证存在不足。首先就是耗时和准确性互相矛盾。建立高层次的模型需要的时间短,但是模拟不够准确。相反,低层次的模型可以达到满意的评估效果,但是建模耗时长。其次,建模模拟是静态的过程,不能很好地反映系统实际
[单片机]
一种基于<font color='red'>ARM</font>的嵌入式系统开发的方案详细讲解
消息称 Arm 计划取消对高通的芯片设计许可,或扰乱智能手机 / PC 市场
10 月 23 日消息,据彭博社今日报道,Arm 拟取消允许长期合作伙伴高通使用 Arm 知识产权设计芯片的许可。 彭博社获得的文件显示,Arm 提前 60 天通知高通要取消架构许可协议。这项许可允许高通基于 Arm 拥有的标准设计自己的芯片。这场纠纷可能扰乱(roil)智能手机和 PC 市场,并对这两家半导体行业巨头的财务和运营造成冲击。 高通每年销售数亿颗处理器,广泛应用于多数 Android 智能手机。如果取消协议生效,高通可能会被迫停止销售为其贡献约 390 亿美元(当前约 2780.5 亿元人民币)收入的大部分产品,或面临巨额损害赔偿。 该行动进一步加剧了双方自 2022 年以来的法律争斗。当时,Arm 起诉高通(其最大
[手机便携]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved