Arm推出新一代指令集架构Armv9，整体性能跃升一级-电子工程世界

Arm推出新一代指令集架构Armv9，以越来越强大的安全性和人工智能能力，应对无处不在的专业处理需求，这是Arm十年来最大的技术革新，上一代的Armv8发布于2011年10月。Arm表示，Armv9架构将在安全性和人工智能方面与英特尔相抗衡。

基于Arm架构的芯片出货量持续增长，过去五年出货超过1000亿颗。按照这个增长速度，全球100%的共享数据将很快在Arm芯片上进行处理，包括端点，数据网络或云中。随着AI，物联网和5G在全球范围内蓬勃发展，Armv9中的新功能将加速在每个应用程序中从通用计算向更专业的计算转变。

Arm首席执行官Simon Segars表示，Armv9在基于通用计算的经济性，设计自由度和可访问性的基础上，对普遍的专业/安全和强大的处理需求的推动下，它将在接下来的3000亿个基于Arm架构的芯片中处于最前沿。

据悉，Armv9可以动态建立Realms(领域)，以保护重要数据和代码不受系统其余部分的影响。Armv9将包括SVE2(类似于英特尔的AVX指令集)，以协助机器学习和数字信号处理任务。

Arm承诺将在Armv9基础上提高整体性能，预计在接下来的两代移动和基础架构CPU中，CPU性能将提高30%以上，而硬、软件改善将进一步提高性能。Arm强调，所有现有软件都可以在基于Armv9的处理器上运行，而不会出现任何问题。但是，随着行业从通用计算向普遍存在的专用处理转变，每年两位数的CPU性能提升还远远不够。除了增强专业处理能力外，Arm的Total Compute设计方法还将通过针对性的系统级硬件和软件优化以及用例（use-case）性能的提高来加快总体计算性能。

Arm还表示，Armv9将为图像和语音识别等任务增加人工智能芯片的功能，在该领域，英伟达公司的芯片表现已经超过了英特尔，并帮助其市值超过了英特尔。

对于与英伟达的合并案，Simon Segars强调，“我们对与英伟达合并未来感到振奋，将我们无处不在的计算平台与他们深厚的人工智能专业知识结合在一起，将带来更强的工程能力。 ”

Arm预计，第一批基于Armv9的处理器将在今年年底之前上市。

与Armv8 区别：延续 AArch64 基准指令集，全面性能提升，还有重要扩展

安全性升级对于 Armv9 来说，其重要性相当于 64 位对于 Armv8。

自 2011 年 10 月 Arm 首次公布 Armv8 架构以来，已经有近 10 年的时间了，这是计算领域相当多变的 10 年，因为指令集架构通过移动领域到服务器领域的应用越来越多，现在开始在笔记本电脑和即将到来的台式机等消费设备市场上普及。这些年来，Arm 对 ISA 进行了各种更新和扩展，有些是重要的，有些也许很容易被忽略。

全新的 Armv9 架构，为 Arm 希望在未来十年成为下一代 3000 亿颗芯片的计算平台奠定基础。

Armv9 与 Armv8 到底有什么区别，才会在 ISA 的命名上有如此大的跳跃？

外媒分析称，说实话，单纯从 ISA 的角度来看，v9 可能并不像 v8 相比 v7 那样有根本性的跳跃，v8 曾用 AArch64 引入了完全不同的执行模式和指令集，而 AArch64 比 AArch32 有更大的微观架构影响，比如扩展寄存器、64 位虚拟地址空间等许多改进。

Armv9 延续了 AArch64 作为基准指令集的使用，然而在功能上增加了一些非常重要的扩展，值得在架构编号上做一个增量，可能让 Arm 也实现了一种软件的重新垒砌，不仅是新的 v9 功能，也包括我们这些年看到的各种 v8 扩展的发布。

IT之家获悉，Armv9 拥有三大新支柱，Arm 认为新架构的主要目标是：安全、AI 以及改进矢量和 DSP 能力。安全性是 v9 的一个非常大的话题，值得更深入地介绍新的扩展和功能细节，但谈到 DSP 和 AI 功能，可以是很直接的。

承诺与 Armv9 兼容的新 CPU 最大的新特性可能是开发者和用户马上就能看到的，那就是 SVE2 作为 NEON 的后续产品的基线。

可伸缩矢量扩展，也就是 SVE，在第一次实现的时候，早在 2016 年就宣布了，并首次在富士通的 A64FX CPU 核心中实现，现在日本的世界第一超级计算机 Fukagu 就采用了 SVE。SVE 的问题在于，这个新的可变向量长度 SIMD 指令集的首次迭代范围相当有限，而且更多的是针对 HPC 工作负载，缺少了许多通用性较强的指令，而这些指令仍然被 NEON 所覆盖。

SVE2 早在 2019 年 4 月就公布了，希望通过补充新的可扩展 SIMD 指令集所需的指令来解决这个问题，以服务于目前仍在使用 NEON（指 128 位 SIMD 单指令多数据扩展结构）的更多样的 DSP 类工作负载。

SVE 和 SVE2 除了增加各种现代 SIMD（单指令多数据）能力之外，好处在于它们的可变向量大小，从 128b 到 2048b 不等，允许可变 128b 粒度的向量，而不管实际硬件运行在什么地方。纯粹从矢量处理和编程的角度来看，这意味着软件开发者只需要编译一次代码，如果未来 CPU 会出现比如原生 512b 的 SIMD 执行流水线，代码就已经可以利用单位的全部宽度了。另外，同样的代码也能在更保守的设计上运行，并具有更低的硬件执行宽度能力，这对 Arm 公司来说非常重要，因为他们设计了从物联网、移动设备到数据中心的 CPU。此外，它还能在 Arm 架构的 32b 编码空间内完成所有这些工作，而在 x86 上的其他实现则必须根据向量大小增加新的扩展和指令。

机器学习也被视为 Armv9 的一个重要部分，因为 Arm 看到未来几年越来越多的 ML 工作负载将变得普遍。在专用加速器上运行 ML 工作负载自然仍然是性能或能效关键的要求，然而，仍然会有大量新的较小范围的 ML 工作负载采用，这些工作负载将在 CPU 上运行。

矩阵乘法指令是这里的关键，并将代表着在整个生态系统中看到更大规模采用的重要一步，作为 v9 CPU 的基线功能。

一般来说，SVE2 可能是保证跳转到 v9 命名法的最重要因素，因为它是一个更明确的 ISA 功能，在日常使用中区别于 v8 CPU，这将保证软件生态系统去实际分化现有的 v8 堆栈。这其实已经成为 Arm 在服务器领域的一个相当大的问题，因为软件生态系统仍然是以 v8.0 为基础的软件包，可惜缺少了最重要的 v8.1 大系统扩展。

让整个软件生态系统向前发展，并且能够假设新的 v9 硬件具有新架构扩展的能力，这将有助于推动事情的发展，可能会解决目前的一些情况。

然而 v9 不仅仅是 SVE2 和新的指令，它还有一个非常大的重点就是安全，在这里我们会看到一些比较彻底的变化。

新的 Arm 保密计算架构 (CCA)试图通过基于硬件的安全环境保护敏感数据。这些所谓的 “领域”可以动态创建，以保护重要数据和代码不受系统其余部分的影响。

除了这些更具体的改进外，Arm 还承诺在 Armv9 基础上进行更全面的性能提升。该公司预计，在未来两次迭代中，CPU 性能将提高 30% 以上，并通过软件和硬件优化进一步提升性能。Arm 表示，所有现有软件都可以在基于 Armv9 的处理器上运行，没有任何问题。

关键字：Arm 引用地址：Arm推出新一代指令集架构Armv9，整体性能跃升一级

上一篇：SensiML联手Silicon Labs开发自动智能传感工具
下一篇：基于RISC-V的DSP芯片会是国产芯片四大件的突破口吗

推荐阅读最新更新时间：2024-11-13 09:40

Kinect移植到嵌入式ARM平台上面

我毕业设计做的libusb移植，而kinect通信是基于libusb，所以，就做了一个kinect+libusb在嵌入式平台上面的移植，经过几个月忙碌，终于将毕业设计给完成了，写下一点心得，也算是我多年在csdn索取资源的回馈。本系统主要由两个部件构成：嵌入式硬件平台和USB设备，通过USB总线建立起它们之间通讯，如图2.16所示，USB设备Kinect中包含一个USB集线器，在Kinect内部通过Hub将红外摄像头、彩色摄像头、电机等设备连接到Kinect内部USB总线上面，最后将Kinect设备连接到ARM9嵌入式硬件平台的Roothub上面。图2.16 系统硬件连接图

[单片机]

Kinect移植到嵌入式<font color='red'>ARM</font>平台上面

Arm将融合物联网、5G通讯和人工智能掀起科技领域第5次运算

芯科技消息（文／雷明正），全球IP 矽智财授权领导厂商Arm 今（1 ）日在台举办年度科技论坛Arm Tech Symposia ，今年主旨为「Drive Innovation with Arm Technology（携手Arm驱动科技创新）」，以数据为核心，并融合物联网、5G 通讯、人工智能三大平台，掀起科技领域第5 波运算革命。 Arm 副总裁暨嵌入式及车用事业部总经理John Ronco表示，过去摩尔定律引领了电脑纪元的发展，现在已经观察到新的科技趋势兴起，Arm 称之为「第5 波运算时代」。Arm 预期人工智能自动化将影响许多现有的工作，同时也会创造将近2 倍的工作机会，但如果正确的掌

[手机便携]

软银收购ARM股价重挫台积电：多赢

集微网消息，据海外媒体报道，软银收购ARM，台积电与ARM在10、7nm合作计划是否生变？台积电发言人孙又文指出，双方合作关系照旧，该交易案让台积电与ARM合作关系更为紧密强大，不仅双赢，更是多赢局面。台积电目前与ARM在10nm及7nm均有合作计划，ARM在Artisan基础实体IP架构与台积电16nm与10纳米FinFET合作，并于今年3月宣布延续该计划，针对7纳米FinFET制程技术进行合作，包括支持未来低功耗、高效能运算系统单芯片的设计解决方案。不过软银宣布以英镑240亿元天价收购ARM震撼业界，外界普遍认为收购价过高，因此，软银于昨天开盘随即重挫，股价一度重跌10.69%。对于外界指出软银趁英镑重贬之际

[手机便携]

嵌入式系统的远程参数测量的设计

嵌入式系统由于性价比高开发周期短等优点目前得到了迅猛发展，各类基于 ARM 处理器的应用开发更是如火如荼。这里介绍基于 ARM9 嵌入式芯片 S3C2410 构建的测量监控系统，该系统设计方案先进，集成度较高，在实践中得到了广泛的应用。 2. 嵌入式 ARM9 S3C2410X 简介 S3C2410X 是三星公司提供的基于 ARM920T 内核的 32 位 RISC 处理器，它的低功耗、低价格、高性能设计特别适合于手持设备和通用嵌入式应用场合，为降低整个系统的成本，它提供了丰富的内部设备，包括分开的 16KB 指令 Cache 和 16KB 数据 Cache，MMU 虚拟存储器管理，24bbp 模式下最大 16M 色 TFT

[单片机]

ARM内核处理器的优异性

一、前言作为Soc（System On Chip )的典型应用，和持电话、机顶盒、数码像机、GPS、个为数字助理以及因特网设备等产品的市场需求越来越大。目前，基于ARM的处理器以其高速度、低功耗等诸多优异的性能而成为上述各类产品中选用较多的处理器。二、ARM内核 ARM内核分为ARM7、ARM9、ARM10以及StrongARM等几类。其中每一类又根据其各自包含的功能模块而分成多种构成在ARM内核中有四个功能模块可供生产厂商根据不同用户的不同要求来配置生产。这四个模块分别用T、D、M和I来表示。 T：表示Thumb，该内核可从16位指令集扩充到32位ARM指令集。 D：表示Debug，该内核中放置

[单片机]

利用ARM的串口传送实现数控系统G代码的高速处理

一、引言现代数控加工都是先采用 CAD/CAM 软件画出零件的加工草图，然后根据草图做适当的属性设置，生成G 代码，生成G 代码之后通过某种方式将G 代码传送给数控系统进行解释转化成实际的轴运动。但是由于实际生成的G 代码数据量相对于ARM 嵌入式数控系统存储资源而言很大，不可能将G代码全部传给ARM数控系统存储起来之后再一条一条来解释、加工，因此在数据传输的过程中应该有一个流量控制的问题。虽然PC 机G 代码到ARM 数控系统代码传送方式很多，但ARM 的串口相对而言，操作方便，因此本设计采用串口来传送数据。虽然串口方便操作，但是在数据传送过程中也存在一些问题，比如说，PC 机向ARM传送9 个数据，却只收到8 个，如果数据

[单片机]

利用<font color='red'>ARM</font>的串口传送实现数控系统G代码的高速处理

基于ARM的电磁流量计设计

0 引言电磁流量计是一种测量导电介质体积流量的计量仪表，具有测量精度高、稳定性好、可靠性高等特点。电磁流量计除可测量一般导电液体的流量外，还可测量液固两相液体、高粘度液体及盐类、强酸、强碱液体的体积流量，可广泛应用于水泥、化工、轻纺、冶金、矿山、造纸、医药、给排水、食品饮料、环保等工业技术部门，其产品的性能、质量和可靠性对上述企业的经济效益有着重要的影响。嵌入式系统( Embedded Sy stem) 是以应用为中心和以计算机技术为基础的，并且软硬件是可以裁减的,能满足应用系统对功能、可靠性、成本、体积、功耗等指标的严格要求的专用计算机系统。它是面向用户、面向产品、面向应用的专用系统，与通用的计算机系统相比具有如下特点

[单片机]

x86手机要来了！大神在Lumia 830上成功运行ARM版Win 10

对很多软粉来说，在手机上运行完整的Windows 10系统一直以来都是个梦想，传闻中能运行.exe程序的x86手机——Surface Phone就是很多流言和爆料的主题。尽管可能至少要到今年年底才能看到微软的Windows 10手机，但已经有黑客大神提前向我们展示了可能性，成功在一款Lumia手机上跑上了桌面Windows 10系统。前不久，最新版本的Windows Phone Internals软件已经可以支持在Lumia上安装任何ROM，于是就有人决定那桌面版的Windows试试看。日前，国外大神Gustave M.在自己的Lumia 830上成功运行了Windows 10的ARM版本，这是我们第一次看到Lu

[手机便携]

热门资源推荐
热门放大器推荐

小广播