ARM虽然是家小公司,但他们是整个ARM处理器阵营的核心,除了苹果、高通等极少数可以自己开发ARM兼容架构的公司之外,联发科、海思等大多数公司都 会直接使用ARM的公版Cortex-A架构授权。64位时代以来,ARM已经发布了Cortex-A57/A53一大一小两种架构,但只有A53遍地开 花,高性能的A57核心在手机市场只有三星、高通在用,面临着难产的尴尬。为此,ARM公司今年2月份推出了A57的继任者——Cortex-A72架 构,号称性能是A15的3.5倍,功耗则降低了75%。
当时我们对ARM的Cortex-A72核心了解并不多,只知道A72核心会使用新一代的FinFET工艺生产,包括三星/Globalfoundries的14nm及TSMC的16nm,得益于先进的工艺,A72核心频率更高,可以达到2.5GHz,更高的频率有助于A72增强服务器市场的存在感,这也是它的目标市场之一。
ARM日前公布了Coretx-A72核心的详细架构,Anandtech网站也做了一番解析,我们来看下A72架构到底有哪些改进,毕竟A72核心很可能成为明年的旗舰手机/平板的标配。
值得一提的是,原先首先解释了A72核心的命名由来,为什么不选择Cortex-A59这样的命名呢?ARM解释说这纯粹是方便市场宣传而已,如果跟A57的命名很相近,那么大家就不容易看出这两种核心之间的区别(大家都只会看数字辩好坏吗?)。
A72核心的性能达到了A15的3.5倍
功耗降低了75%
ARM之前宣传A72核心性能是前代的3.5倍,功耗降低了75%,但大家也得清楚这只是宣传而已,ARM并没有直接对比A57与A72的差别,如果只看这两者,A72核心在同样的14/16nm工艺下只比A57提升了34%(2.6x到3.5x,还得考虑到频率上的差异),而在同样的28nm工艺下,其功耗也不过减少了20%左右。
还要注意到,A72核心可以运行在更高的频率下,这不是简单地最高频率,此前A57由于太强,因此它只能在最高频率下维持很短时间就要降频,而ARM提供的数据表明,A72核心在16nm FinFET工艺下,2.5GHz频率运行时功耗只有750mW。
除了功耗之外,ARM还在A72架构上做了很多优化,如上图所示,整数、浮点、内存等性能皆有不同程度的提升,虽然还缺少一些细节,不过IPC性能上提升16-30%还是有的。
由A57升级而来的A72架构
ARM似乎在性能、功耗及核心面积这三个方面都做了全面的改善,这也是半导体设计的三个重要指标。这个成绩是ARM重新优化了几乎所有A57逻辑区块之后才得来的,其中CPU架构做了相当大的改进,包括新的分支预测单元,改善了解码器管线设计等。
在指令预取这一块,我们可以看到ARM重新设计了分支预测单元,它可以支持更复杂的算法,提高了性能、降低了功耗以、误预测率及投机(speculation),具体来说就是相比A57降低了50%的误预测,25%的投机率。多余的分支预测单元则被禁止了。——实际工作中,如果分支预测单元不能有效工作,那就会被绕过去。
此外,通过更好地耦合不同的IP模块,ARM还优化了RAM组织。
再来看A72的管线设计,解码/重命名性能也提升了。解码器自身是3指令发射的解码器,但ARM在提升性能。降低功耗方面花了很大精力。为了提高要性能,提升了有效的解码带宽,而解码器也获得了一些AArch64指令融合增强。此外,功耗也通过多种方法降低了,包括直接的解码等。
看起来指令分派/收回(Dispatch/retire)单元是提升性能而做的改进中变化最大的。解码器可以融合指令,ARM的指令分派单元可以将ops操作打乱成更小的微操作(micro-ops)输送给执行单元,这样可以在指令派发单元将3发射变成等效5发射。这将提高解码器的吞吐量,同时也提高了每个周期内指令派发单元创建的微操作数。
A72架构,ARM表示平均每个指令有1.08个微操作,这将缓解57架构中实际受限的指令派发单元的性能。
另一方面执行单元也有新的设计,包括新一代的FP浮点/高级SIMD单元,由于FP浮点管线从9降低到了6,因此延迟更低。FMUL(浮点乘法)的延迟也从5周期降低了3周期,FADD(浮点加法)从4降到3,FMAC(浮点累积乘)从9降低到6,CVT单元从4降到2。FP浮点单元的渲染管线长度从19降低到了16。
整数单元也做了改进,Radix-16除法器的带宽加倍,CRC单元延迟降低到了1周期,相比A57架构其带宽达到了3倍。
另一个重大的性能改进是L/S(Load/Store)单元,ARM表示L/S单元的带宽提升了30%,这是因为引入了新的预取器。
A72架构纸面上的改进让人印象深刻,它是A57架构的革新升级,不论是性能还是功耗,或者核心面积,A72都有改进。A57架构是去年Q3季度进入市场的,但现在才有三星、高通的A57架构处理器量产上市,所以A72核心真正进入市场还需要至少1年时间。
关键字:ARM CortexA-72
引用地址:ARM CortexA-72处理器详情:3.5倍性能是怎么来的
当时我们对ARM的Cortex-A72核心了解并不多,只知道A72核心会使用新一代的FinFET工艺生产,包括三星/Globalfoundries的14nm及TSMC的16nm,得益于先进的工艺,A72核心频率更高,可以达到2.5GHz,更高的频率有助于A72增强服务器市场的存在感,这也是它的目标市场之一。
ARM日前公布了Coretx-A72核心的详细架构,Anandtech网站也做了一番解析,我们来看下A72架构到底有哪些改进,毕竟A72核心很可能成为明年的旗舰手机/平板的标配。
值得一提的是,原先首先解释了A72核心的命名由来,为什么不选择Cortex-A59这样的命名呢?ARM解释说这纯粹是方便市场宣传而已,如果跟A57的命名很相近,那么大家就不容易看出这两种核心之间的区别(大家都只会看数字辩好坏吗?)。
A72核心的性能达到了A15的3.5倍
功耗降低了75%
ARM之前宣传A72核心性能是前代的3.5倍,功耗降低了75%,但大家也得清楚这只是宣传而已,ARM并没有直接对比A57与A72的差别,如果只看这两者,A72核心在同样的14/16nm工艺下只比A57提升了34%(2.6x到3.5x,还得考虑到频率上的差异),而在同样的28nm工艺下,其功耗也不过减少了20%左右。
还要注意到,A72核心可以运行在更高的频率下,这不是简单地最高频率,此前A57由于太强,因此它只能在最高频率下维持很短时间就要降频,而ARM提供的数据表明,A72核心在16nm FinFET工艺下,2.5GHz频率运行时功耗只有750mW。
除了功耗之外,ARM还在A72架构上做了很多优化,如上图所示,整数、浮点、内存等性能皆有不同程度的提升,虽然还缺少一些细节,不过IPC性能上提升16-30%还是有的。
由A57升级而来的A72架构
ARM似乎在性能、功耗及核心面积这三个方面都做了全面的改善,这也是半导体设计的三个重要指标。这个成绩是ARM重新优化了几乎所有A57逻辑区块之后才得来的,其中CPU架构做了相当大的改进,包括新的分支预测单元,改善了解码器管线设计等。
在指令预取这一块,我们可以看到ARM重新设计了分支预测单元,它可以支持更复杂的算法,提高了性能、降低了功耗以、误预测率及投机(speculation),具体来说就是相比A57降低了50%的误预测,25%的投机率。多余的分支预测单元则被禁止了。——实际工作中,如果分支预测单元不能有效工作,那就会被绕过去。
此外,通过更好地耦合不同的IP模块,ARM还优化了RAM组织。
再来看A72的管线设计,解码/重命名性能也提升了。解码器自身是3指令发射的解码器,但ARM在提升性能。降低功耗方面花了很大精力。为了提高要性能,提升了有效的解码带宽,而解码器也获得了一些AArch64指令融合增强。此外,功耗也通过多种方法降低了,包括直接的解码等。
看起来指令分派/收回(Dispatch/retire)单元是提升性能而做的改进中变化最大的。解码器可以融合指令,ARM的指令分派单元可以将ops操作打乱成更小的微操作(micro-ops)输送给执行单元,这样可以在指令派发单元将3发射变成等效5发射。这将提高解码器的吞吐量,同时也提高了每个周期内指令派发单元创建的微操作数。
A72架构,ARM表示平均每个指令有1.08个微操作,这将缓解57架构中实际受限的指令派发单元的性能。
另一方面执行单元也有新的设计,包括新一代的FP浮点/高级SIMD单元,由于FP浮点管线从9降低到了6,因此延迟更低。FMUL(浮点乘法)的延迟也从5周期降低了3周期,FADD(浮点加法)从4降到3,FMAC(浮点累积乘)从9降低到6,CVT单元从4降到2。FP浮点单元的渲染管线长度从19降低到了16。
整数单元也做了改进,Radix-16除法器的带宽加倍,CRC单元延迟降低到了1周期,相比A57架构其带宽达到了3倍。
另一个重大的性能改进是L/S(Load/Store)单元,ARM表示L/S单元的带宽提升了30%,这是因为引入了新的预取器。
A72架构纸面上的改进让人印象深刻,它是A57架构的革新升级,不论是性能还是功耗,或者核心面积,A72都有改进。A57架构是去年Q3季度进入市场的,但现在才有三星、高通的A57架构处理器量产上市,所以A72核心真正进入市场还需要至少1年时间。
上一篇:新华社:高通案表明我国反垄断水平居全球前列
下一篇:你真需要64位手机?三项测试揭晓答案
推荐阅读最新更新时间:2024-05-03 14:42
ARM:Intel手机处理器已落后我们一代
泡泡网CPU频道3月2日 ARM CEO沃伦·伊斯特(Warren East)周三表示,Intel近日在移动世界大会(以下简称“MWC”)上展示的智能手机处理器远落后于ARM的产品。 伊斯特称,Intel CEO欧德宁(Paul Otellini)周一在MWC上展示的设备相当于一代或两代前的ARM解决方案。伊斯特称:“从技术的角度讲,Intel的智能手机解决方案好于以往,但与我们相比仍落后一代或两代。”
尽管如此,伊斯特表示,ARM仍认真对待Intel的来袭。他说:“因为我们在经营这项业务,而英特尔是全球最大的半导体公司,拥有大量的资源,先进的制造技术,优质的x86处理器,因此我们需要有所顾虑。”
[手机便携]
ARM9平台下的CMOS图像传感器数据采集系统
引言 随着CMOS(互补金属氧化物半导体)技术的发展及市场需求的增加,CMOS图像传感器得以迅速发展。由于采用了CMOS技术,可以将像素阵列与外围支持电路(如图像传感器核心、单一时钟、所有的时序逻辑、可编程功能和A/D转换器)集成在同一块芯片上。与CCD(电容耦合器件)图像传感器相比,CMOS图像传感器将整个图像系统集成在一块芯片上,具有体积小、重量轻、功耗低、编程方便、易于控制等优点,因此,CMOS图像传感器的应用已经变得越来越广泛。 但是,目前市场上的大部分基于CMOS图像传感器的图像采集系统都是采用DSP与图像传感器相连,由DSP来控制图像传感器,然后由DSP采集到图像后再通过USB接口将图像数据传输到PC机进行后续的处
[单片机]
【嵌入式】arm-linux-gcc/ld/objcopy/objdump参数概述
arm-linux-gcc -o 只激活预处理,编译,和汇编,也就是他只把程序做成obj文件 -Wall 指定产生全部的警告信息 -O2 编译器对程序提供的编译优化选项,在编译的时候使用该选项,可以使生成的执行文件的执行效率提高 -c 表示只要求编译器进行编译,而不要进行链接,生成以源文件的文件名命名但把其后缀由 .c 或 .cc 变成 .o 的目标文件 -S 只激活预处理和编译,就是指把文件编译成为汇编代码 arm-linux-ld 直接指定代码段,数据段,BSS段的起始地址 -Ttest startaddr -Tdata startaddr -Tbss startaddr
[单片机]
嵌入式linux面试题解析(一)——ARM部分一
1、FIQ比IRQ快的原因: A、FIQ模式的R8–R14寄存器是独有的,FIQ处理程序可以不必执行保存和恢复中断现场的指令。 B、FIQ可以将ISR直接放在FIQ后面的地址空间,不需要跳转。 2、中断与异常有何区别 异常在处理的时候必须考虑与处理器的时钟同步,实际上异常也称为同步中断,在处理器执行到因编译错误而导致的错误指令时,或者在执行期间出现特殊错误,必须靠内核处理的时候,处理器就会产生一个异常;所谓中断是指外部硬件产生的一个电信号从CPU的中断引脚进入,打断CPU的运行。所谓异常是指软件运行过程中发生了一些必须作出处理的事件,CPU自动产生一个陷入来打断CPU的运行。 3、在ARM系统中,在函数调用的时候,参数是通
[单片机]
基于ARM与MEMS器件的微惯性测量装置设计
摘要 开发一种生物运动微惯性测量装置,以基于ARM7的LPC2129为核心处理单元,采用MEMS陀螺和MEMS加速度计为测量传感器。该装置实现了对SPC-III机器鱼尾鳍拍动参数的精确测量,为活体鱼尾鳍拍动参数测量实验打下了基础。 关键词 微惯性测量 LPC2129 MEMS器件 尾鳍拍动 在仿生推进机理的研究中,精确测量鱼类尾鳍拍动参数对于鱼类仿生推进机理研究及工程应用具有重要的意义;然而,目前研究者大多采用分析高速摄像机拍摄的图像获得参数的观测方法。这种方法受到环境与设备的限制,结果精确度较差。本设计是一种基于MEMS器件的生物运动微惯性测量装置。利用该装置实现了对SPC-III机器鱼尾鳍拍动参数的精确测量
[工业控制]
ARM CEO否认苹果收购传闻
北京时间4月23日早间消息,据国外媒体报道,周四有传闻称,苹果有可能收购芯片设计公司ARM。然而ARM CEO沃伦·伊斯特(Warren East)暗示,这样的收购不太可能发生。 由于市场猜测苹果已将ARM定为收购目标,ARM股价周四创下8年来新高。不过伊斯特指出,ARM的市值已经超过30亿美元,该公司完全可以通过向苹果和其他公司出售设计授权来获取利润。 伊斯特表示:“传闻引起股价大涨,这令人兴奋。然而常识告诉我们,我们的业务模式是一种出色的方式,能帮助科技公司获得我们的技术。没有人将收购ARM。” 目前全球大部分手机均采用ARM芯片,包括iPhone。随着消费者对智能手机需求的增长,以及手机越来越智
[半导体设计/制造]
ARM联手通用、丰田开发自动驾驶通用计算系统
据国外媒体报道,日本软银集团旗下的英国芯片技术公司ARM,正与汽车制造商通用汽车和丰田汽车合作,开发面向自动驾驶汽车的通用计算系统。这三家公司希望通过加强合作来推动这项技术的发展。 ARM是移动芯片基础技术公司,该公司自己并不制造芯片。该公司与汽车工业的关系可以追溯到20世纪90年代末,当时汽车制造商开始在汽车上添加计算机芯片,以增强汽车发动机控制和检测等功能。 ARM当地时间周二表示,它将与这两家汽车制造商以及行业供应商Bosch Corp、Denso Corp和Continental AG一起,共同创建AVCC(自动车辆计算联合体)。参与这个团体的还有半导体公司英伟达(
[汽车电子]
ARM处理器和其合作伙伴 共同迈进基带连接市场
新闻要点: • 目前ARM处理器被用于全球95%的LTE基带设计中 • 在巴塞罗那举行的2011世界移动通信大会 (Mobile World Congress)上,一系列推出的设备、新闻以及演讲内容反映了ARM Partner Community在2.5G和3G市场的传统优势以及LTE/4G市场所取得的成功 • ARM Partner Community申明将在LTE和LTE-Advanced市场上继续采用ARM技术,其中包括高通、瑞萨移动、三星、东芯通信、Marvell、Cognovo、ST-Ericsson、联发科、博通和Intel Mobile Communications 2011年2月15日,中国
[网络通信]
小广播
热门活动
换一批
更多
最新手机便携文章
- 曝iPhone SE 4首发苹果自研5G基带:明年3月登场
- 曝iPhone 17全系首发3nm A19系列芯片:无缘台积电2nm工艺制程
- 供应链称上游元器件要大降价:国产手机现涨价潮后会主动下调售价吗
- 消息称苹果将拿出近 1 亿美元用于解除印尼 iPhone 16 系列销售禁令
- 消息称塔塔公司收购和硕在印度的唯一一家iPhone工厂,深化与苹果合作
- 苹果遭4000万英国iCloud用户集体诉讼,面临276亿元索赔
- 消息称苹果、三星超薄高密度电池均开发失败,iPhone 17 Air、Galaxy S25 Slim手机“变厚”
- 美光亮相2024年进博会,持续深耕中国市场,引领可持续发展
- Qorvo:创新技术引领下一代移动产业
更多精选电路图
更多热门文章
更多每日新闻
更多往期活动
11月21日历史上的今天
厂商技术中心