2011年11月,Arm发布了Armv8处理器架构的部分技术细节。这是Arm的首款支持64位指令集的处理器架构。由于Arm处理器的授权内核被广泛用于手机等诸多电子产品,故Armv8架构作为处理器的核心技术受到多方应用。十年之后,为了满足全球对功能日益强大的安全、人工智能(AI)和无处不在的专用处理的需求,Arm宣布推出Armv9架构,Armv9立足于Armv8的成功基础,是这十年来最新的Arm架构。
Arm首席执行官Simon Segars表示:“Armv9架构的推出标志着我们公司进入了一个新时代,这是一个推动安全的人工智能驱动计算的全球普适性平台。”
Armv9架构亮点:聚焦安全和AI
1.机密计算架构,构建坚实安全堡垒
随着全球联网设备激增,安全性日益重要,赛门铁克在2020年Q1检测到其物联网有近1900万次攻击。相当于每超过100次攻击速度,比2019年底高出13%,网络犯罪损失的金额将高达六万亿美元。不难看出,在物联网领域,最大的挑战之一在于众多终端设备,数据收集,以及与实体世界交互的安全性。
为了保护全球数据安全,Armv9架构路线图引入了Arm机密计算架构(Confidential Compute Architecture, CCA)。机密计算通过打造基于硬件的安全运行环境来执行计算,保护部分代码和数据,免于被存取或修改,甚至不受特权软件的影响。
Arm CCA将引入动态创建机密领域(Realms)的概念,机密领域面向所有应用,运行在独立于安全或非安全环境之外的环境中,以实现保护数据安全的目的。例如,在商业应用中,机密领域可以保护系统中商用机密数据和代码,无论它们正被使用、闲置或正在传输中。事实上,在最近一项针对企业高管的调查中,超过九成的受访者相信,机密计算可以帮助降低企业在安全方面投入的成本,如此一来,他们可以转而进行大量的工程创新。机密领域是存储数据和执行代码的动态安全区域,与操作系统或管理程序的特权模式分离。
它建立在Arm的TrustZone技术之上,是软件容器的硬件版本,允许应用程序轻松地在不同的系统上运行。然而,这将需要对操作系统(如Linux的Linaro版本)和管理程序进行更改,因此重点放在生态系统上。例如可以将个人银行信息与智能手机的社交媒体应用完全分离。Arm CCA的新安全功能意味着,即使社交媒体应用真的感染了恶意软件,也不会传播设备其他部分。
此外,Arm还与合作伙伴共同开发平台安全架构PSA,作为一套标准的威胁模型、措施及时间,提供给终端设计人员使用。它与分级认证相结合后可以让此设备的采购者对资产的安全性更放心。
内存标签:解决长期存在软件中的顽疾
此外,内存安全一直困扰着我们十几年。如何在这些内存安全漏洞利用之前就能发现问题,是提高全球软件安全最重要一步。为此Arm与Google合作开发“内存标签扩展”技术,可在软件中查找空间和时间内存安全问题,这些扩展技术软件将指向内存的指针和标签建立联系,并在使用指针时检查这个标签是否正确。如果存取超过范围,标签检查就会失败。这样我们就可以找到来自内存安全问题的根源。
2. 可伸缩矢量扩展(SVE2)让AI算力大幅提高
还记得2019年全球排名第一的超级计算机Fukagu吗?可伸缩矢量扩展(SVE)首次应用于此。如今Arm推出新版本SVE2,这是一项用于辅助机器学习和数字信号处理的技术,有助于对5G系统、VR/AR、机器学习等一系列工作负载的处理。
SVE和SVE2的优势还在于其可变的向量大小,范围从128b到2048b,从而允许向量的可变粒度为128b,无论实际运行的硬件是什么。纯粹从向量处理和编程的角度来看,这意味着软件开发人员将只需要编译一次其代码,并且如果将来某个CPU带有本机512b SIMD执行管道,该代码将能够已经充分利用了单元的整个宽度。同样,相同的代码将能够在具有较低硬件执行宽度能力的更保守的设计上运行,这对于Arm设计从物联网,移动到数据中心的CPU而言至关重要。
Armv9 SVE2扩展增加了压缩和解压缩CPU核心内的代码和数据能力,以减少芯片外数据移动,从而降低能耗。
在计算性能方面,Arm预计,随着软硬件优化,基于Armv9架构的下两代CPU产品将实现超30%的性能提升,而且这样30%的算力提升完全得益于本身架构而不是借助制程工艺来实现。
标准化程度如何权衡?
Arm讲到了标准化程度,强调了如何在标准和定置化方面进行权衡。如果过多的标准化,合作伙伴将无法开发合适的专用解决方案。但如果标准化太少,我们就得承担低价值、形同实异的解决方案的风险。这将让软件的生态系统的成本增加,而且毫无益处。因此,Arm继在服务器领域推出“服务器基础系统架构”和其认证计划“服务器就绪”,以推动适量的标准化,正在扩大系统标准化的范围,包括“系统就绪”。
在这十年里,Arm扩充了许多新技术,以及强化了许多安全功能,这是未来十年Arm架构的主要更新,它将应用于我们所有的CPU里面。如今,数据收集往往始于如Arm-M系列的超低功耗物联网设备。对于未来,管理大量数据的需求意味着在整个网络上进行的数据处理将不断增加。随着数据量的增长,必须以更低时延的方式处理数据,因此在网络边缘需要增强的算力和标准化系统。而要执行这些计算任务,需要新的组件。
Arm还希望提供一个称为SystemReady的标准化过程,“SystemReady”的目标是将服务器就绪计划的概念从云端延伸到物联网边缘等更广泛的设备上。这必须考虑到大量不同的CPU, GPU和NPU核以及外围设备。
Segars表示:“预计在不久的将来,基于v9上的Neoverse core将会上市。我们在数据中心看到了许多围绕Arm架构的活动,我们期待其他数据中心供应商也将部署Arm技术,随着时间的推移,将会从v8转向v9。”
未来Arm CPU路线图
Arm谈到了CPU的规划,这与即将到来的v9设计的技术路线图紧密相关,Arm还谈到了有关他们对v9设计的预期性能的一些观点。
SVE2和矩阵乘法(Matrix Multiply) 可以极大地简化软件生态系统,并允许计算工作负载以更统一的方法向前迈进,该方法将来将可以在任何设备上运行。
自1991年以来,Arm的客户的出货量已达到1800亿部,他们预计,在Armv9架构的推动下,未来10年的发货量将超过3000亿部。
上一篇:Google自定义计算愿景:用SoC替代传统CPU主板
下一篇:如何提高边缘机器学习的易用性
推荐阅读最新更新时间:2024-11-08 11:42
- DC1710A-A,使用 LTC5590 的演示板,0.6 至 1.7GHz,IF=190MHz,+/-30MHz 带宽,双路高动态范围下混频器
- BluePill
- CN0364
- DC851A-A,使用 LTC2299IUP DeMUX 双通道、80Msps、14 位 ADC 的演示板
- LT1021DCN8-7 电压基准作为应变计调节器的典型应用
- 使用 Diodes Incorporated 的 AP34063 的参考设计
- 汽车电机控制应用的控制板
- LT3990EMSE-5 5V 降压转换器的典型应用
- 使用 Analog Devices 的 LT1269CQ 的参考设计
- AM2G-2409DH30Z ±9V 2 瓦 DC/DC 转换器的典型应用