ARM的新CPU和GPU核能否冲击英特尔老巢?

发布者:AngelicWhisper最新更新时间:2018-06-23 关键字:ARM 手机看文章 扫描二维码
随时随地手机看文章

集微网消息(文/艾檬)在连续创造惊人的数字之后,ARM的目光更为长远。据最新数据显示,截止2017年底基于Arm的芯片出货量已达1200亿片,约占整体市场四成份额。Arm资深市场营销总监Ian Smythe表示,到目前为止基于Arm的芯片出货量应已突破1300亿,未来将迈向2000亿。2035年预计将有一万亿的互联设备,而5G、AI、安全、全计算等技术将大行其道,以为用户提供更自由更互连的浸入式体验。基于此Arm IP产品线再添生力军,在CPU和GPU层面均实现跃升,除着力渲染可将智能手机实现PC性能之外,染指笔记本电脑市场的野心愈加明晰。

Cortex-A76的野心

去年Arm发布的Cortex-A75针对AI和ML能力进行了特别优化,同时引入了TrustZone技术(芯片级安全技术)和DynamIQ big.LITTLE拓扑特性。而今年Arm宣布最新旗舰CPU——Cortex-A76,相比上一代在性能上实现了35%的提升,同时降低了40%的功耗,并在机器学习能力上提升了4倍。

 

“实现上述进步的原因在于,Cortex-A76虽采用和前一代相同的v8.2指令集,但内建的微处理器架构则是从头开始研发,实现了诸多重大改进,包括解耦合分支预测与指令预取、译码宽度更大、更高的整数与向量与浮点运算单元等。同时,Cortex-A76是针对7nm工艺定制的全新架构,在搭配7nm工艺时主频可达到3.0GHz。”Ian Smythe强调。

这一性能相当于PC端英特尔旗下的酷睿i5-7300,如果SoC厂商缓存设计得更好,其性能甚至可以媲美i7。联想到此前新一代高通骁龙1000版Windows 10ARM笔记本,表明Arm正着力染指PC市场,但能否借Cortex-A76挑战英特尔/AMD在PC领域的权威还待合作伙伴的力道以及生态的配合。同时Cortex-A76还意欲为智能手机带来笔记本级别的性能,过发挥比前一代产品高达4倍的机器学习性能,解决云端持续互动衍生出的延迟以及安全方面的问题。Cortex-A76可谓“身兼重任”。

此外,Arm还提供独特的POP技术。Ian Smythe提及,基于台积电16FFC的Cortex-A76 POP IP,可提供目前最佳性能;而对于那些寻求顶尖制程并锁定高端应用的客户,使用台积电7FF制程的Cortex-A76和Cortex-A55 POP IP将于2018年第四季度上市。Arm POP IP可加速产品的实现,缩短上市时间,并充分利用DynamIQ big.LITTLE的灵活性。

GPU和VPU的跨越

GPU可说是Arm未来要发展AI计算生态的主要角色,从第一代BiFrost架构开始,就已经针对AI计算所需要的各种场景,包含机器学习中的训练以及推理加速等进行优化。时间节点到了2018年中,Mali-G76新晋成为Arm最新旗舰GPU。

“Mali-G76仍采用Bifrost架构,总核配置上限从32核降为20核,每个核心仍然是3个执行单元,但执行单元的线程数增加到8条,也就是每核心24条线程。加上配备texture mapper以及缓存器的优化等,再度提升了30%的性能密度以及30%的能源效率。在7nm工艺的加持下,其性能可提升1.5-2倍。”Ian Smythe介绍说,“而且新GPU通过支持int8 dot实现了强大的机器学习功能,表现足足是Mali-G72的2.7倍。”

除在GPU领域精进之外,面向未来的8K视觉体验,Arm推出了最新的高端视频处理器(VPU)Mali-V76来占领先机。

Ian Smythe介绍,8K60规格串流需要4K60格式的视频4倍的带宽,为此Arm通过加入额外的AXI总线,使处理量增加一倍。此外还将行缓冲区从4096个像素增加到8192个,从而带来额外的效能提升,使得Mali-V76不仅支持8k60解码和8k30编码,性能亦几乎是上一代产品的两倍。

 

即使是当前的高端设备,4K仍未成为标准配备,那么为何市场已开始提前锁定8K?Ian Smythe认为,产业局势瞬息万变,Arm必须针对未来设备的需求提前准备。在未来的高端电视以及更高分辨率的AR/VR头显领域,Mali-V76将发挥更大作用。而对于一个8K视频流的替代方案而言,可选择支持4个60fps的4K视频流。

AI仍“借力使力”

虽然在AI布局上,Arm看似慢了半拍。但事实上,ARM早在2016年就已经把触手伸进多个AI应用领域同时发展,包含号称针对机器学习优化的Bifrost GPU 架构,以及针对高端服务器芯片的SVE延伸指令集。随着相关方案陆续成熟,采用者也逐渐增加,Arm在今年2月推出Project Trillium,结合开发环境、算法与各大主流机器学习框架,布局从终端到云端所有AI应用开发生态。

而此次推出的无论是CPU还是GPU,在AI性能上均实现了大幅提升,表明Arm的AI布局亦在稳妥推进。

至于没有推出单独的AI加速器原因,Ian Smythe特意指出,目前AI还处于初级阶段,虽然某些厂商选择配备单独的AI加速器,但仍有一些合作伙伴配备GPU来对AI方案进行调适,以其灵活性来进行定制化设计,并可获得Arm生态体系的广泛支持。

在近两年的AI热潮中,各家新创产业纷纷推出自有的AI加速器,群雄并起。但Arm仍如此“气定神闲”没有染指AI加速器内核,或许有更深的考量。但是,无论是对算法的承载,对计算的优化,对AI生态的构建,Arm的时间或许没有想象那么从容。


关键字:ARM 引用地址:ARM的新CPU和GPU核能否冲击英特尔老巢?

上一篇:中兴通讯A股连续六日跌停,小米启动香港IPO募资480亿港元
下一篇:GIS屏下指纹识别模组最快Q3量产出货,产能将满载

推荐阅读最新更新时间:2024-05-03 18:35

GNU ARM汇编--(十四)GNU ARM汇编下做任务调度
以前工作中用过arm7,没有MMU,也没有用任何OS.现在回忆当时的代码结构,我觉得可以叫无限循环的有限状态机.arm7不跑OS,就相当于单片机,单片机跑的肯定是无限死循环.有限状态机是因为整个代码要处理很多外部的事情,那就是大的循环里面来套小循环,以轮询的方式来检查外界的变化,然后系统作出变化,系统在有限的状态中切换. OS的一个标识就是支持多任务的并发.比方说linux,我们看起来是多个进程在同时运行,实际上还是cpu运行一下这个进程,再运行一下其他进程.这个就涉及到上下文切换以及进程调度的算法.当然我这里说的是单核的情况,如果是SMP的话,可能有些区别.暂时也没研究linux下的进程调度,但是通过自己写个最简单
[单片机]
ARM系列 STM32F103RCT6 开发
简单介绍STM32F1XX系列可以有RTOS ,实时操作系统,也可以直接当单片机用. 功能有adc,dac,bkp,can,cec,crc,dbgmcu,dma,exti,flash,fsmc,gpio,i2c,iwdg,pwr,rcc,rtc,sdio,spi,tim,usart,wwdg,misc 具体芯片的每个接口是什么功能,不同的板子差别不大,毕竟是要符合芯片规范的。 开发环境基本都是WINDOWS(unix-like gcc) , 开发工具有 MDK-ARM(keil), EWARM(IAR),HiTOP, GCC(RIDE),TrueSTUDIO.. 开发IDE中集成了startup文件,gcc也集成了的启动文件
[单片机]
ARM7-VxWorKs的网络化实时彩色分析虚拟仪器
特种光源、彩色显示等行业的基础是彩色的还原与传递,在光学计量领域属于光源的光度和色度计量范畴,色坐标和亮度因数是主要的参数之一。光度、色度测试系统的性能,在高清晰度数字电视的白场基准测试、高清晰度数字摄像机白平衡校准以及半导体光电二极管LED照明和全彩色显示的白场均匀性测试等领域发挥着基础性关键作用。 人眼的视觉可以感受380nm~780nto范围内的光信号,但对不同波长光的敏感程度不同。l924年国际照明委员会CIE公布了2。视场明视觉光谱光视效率函数V( )。仿真人眼亮度感受的光度探测器通常是由光电二极管PIN构成的,核心是利用滤色玻璃将PIN的光谱光视效率修正得与(V)尽可能地相似。人眼对色彩的感受来源于人眼视网膜上的3种
[测试测量]
<font color='red'>ARM</font>7-VxWorKs的网络化实时彩色分析虚拟仪器
利用ARM处理器LPC1112设计LED电子胸牌
引言 随着LED技术的空前繁荣,LED胸牌备受关注。LED胸牌也叫LED工作牌,是一款新颖的LED贴片点阵“名片”式显示屏,可以显示姓名、性别、工作部门等信息,还可以显示不同速度、不同动作方式的文本及预置图型。它可以吊挂在脖子上或者夹在衣服上,作为公共场所个人及企业身份的证明及宣传之用。LED胸牌既可以显示中文,也可以显示英文。对于那些需要显示的信息量不是很大,分辨率不是很高,制造成本较低的场合,使用小屏幕LED点阵显示器比较适用。电源大多采用锂电池,锂电池具有使用寿命长、能量较高、重量轻和高低温适应能力强的优点。 目前,大多数LED胸牌的点阵显示系统自带字库,显示效果主要靠硬件扫描来驱动,该方法比较简单,但是显示只能按照预先的硬
[单片机]
利用<font color='red'>ARM</font>处理器LPC1112设计LED电子胸牌
高通推出面向基于Arm的Windows 10 PC的全新骁龙开发套件
高通推出面向基于Arm的Windows 10 PC的全新骁龙开发套件, 加大对开发者的支持力度 高通技术公司和微软联合推出具有成本效益的开发套件,进一步加大对软件和应用开发者的支持 2021年5月24日,圣迭戈——高通技术公司今日宣布推出高通骁龙™开发套件,旨在面向骁龙计算平台日益增长的设备生态,加大针对独立软件开发商和应用开发者在应用测试和应用优化方面的支持力度。该开发套件是高通技术公司联合微软利用基于Arm的Windows 10系统打造的套件资源,让开发者可以低成本地对他们的解决方案进行认证和验证,从而确保其在搭载骁龙平台的Windows 10 PC上能够提供出色的用户体验,满足人们工作、学习和协作的需求。 高通
[家用电子]
高通推出面向基于<font color='red'>Arm</font>的Windows 10 PC的全新骁龙开发套件
ARM 中断函数定义
ARM的中断函数是在startup code中定义的,在CODE区分配中断向量表时,及将中断函数定义出了 ; Vector Table Mapped to Address 0 at Reset AREA RESET, DATA, READONLY EXPORT __Vectors __Vectors DCD __initial_sp ; Top of Stack DCD Reset_Handler ; Reset Handler DCD NMI_Handler ; NMI Handler
[单片机]
Android ARM 汇编学习(一)
给自己挖了个坑,一切都得从 Hello World 开始。 hello.S .data msg: .ascii Hello, World!\n len = . - msg .text .globl _start _start: /* syscall write(int fd, const void *buf, size_t count) */ mov %r0, $1 /* fd - stdout */ ldr %r1, =msg /* buf - msg */ ldr %r2, =len /* count - len(msg) */ mov %r7, $4 /* write is syscall #4 */ swi $0
[单片机]
ARM裸机】 - 重定位
1、 重定位的目的 对于2440上电后,分两种情况,从nor启动,直接从nor作为0地址,开始在nor中运行。从nand启动,拷贝前4K到片内SRAM中。当代码大于4K的时候,我们需要重定位代码到更大的SDRAM中去运行。从nor运行时,由于nor只可读而不可以修改nor中的内容,就会导致一些全局变量,在代码中无法修改,此时我们可以将全局变量重定位(指定链接地址)到SDRAM中,这样我就可以nor中运行,然后对全局变量进行修改。 总结来说:重定位就是代码的存储地址和运行地址不一致,我们需要把代码拷贝到运行地址处。可以重定位所有代码,也可以重定位数据段等。由于代码存在flash中,一般可在链接脚本中加入AT()来指
[单片机]
【<font color='red'>ARM</font>裸机】 - 重定位
小广播
最新手机便携文章
换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved