Arm机器学习处理器IP参数公布,将首先用在移动市场中

发布者:火星最新更新时间:2018-06-29 来源: EEWORLD关键字:Arm 手机看文章 扫描二维码
随时随地手机看文章

近日,在Arm Tech Day 2019上,Arm杰出工程师及机器学习事业部技术总监Ian Bratt介绍了Arm在机器学习及人工智能领域目前所做的工作和进展,Arm针对人工智能领域的Project Trillium项目,这是一套包括新的高度可扩展处理器的Arm IP组合,包括全新的ML处理器IP以及OD视觉处理器,以及一系列配套的软件体系。


图片.png

Ian给出第一代机器学习处理器指标,在7nm下效率为3 TOP/W,吞吐量为4.6 TOP/s,有针对激活和权重的硬件压缩,利用Cortex-M技术支持安卓NN和Arm NN,预计2018年中期交付客户。

Ian表示,“机器学习和人工智能是颠覆性的技术,应用场景多种多样,因此对Arm而言,不应该只是出现在某一款处理器上,而是所有处理器都需要有机器学习功能。”

Ian强调:“尽管目前所有机器学习工作负载都可以通过Cortex-A76进行实现,但如果想在机器学习方面更进一步更高密度,可能需要机器学习处理器,这也是为何Arm要推出机器学习专用IP的原因。”

谈到Project Trillium开放平台,Arm强调首先要从软件层进行优化,之后再从处理器端进行有效部署。

图片.png


Arm和合作伙伴在整个人工智能领域布局


未来Arm的机器学习及人工智能生态系统将主要在边缘计算端进行,在整个框架中,Arm提供了最全面的支持,包括CPU、GPU、机器学习IP、目标检测IP以及合作伙伴的IP,而在软件层方面,Arm则提供神经单元网络库,而在最上端的生态系统中,支持Android NN,TensorFlow,Caffe等开放环境。

Ian特别强调机器学习正在向边缘发展,并给出了三大原因,包括物理学、经济学和土地定律。具体而言,机器学习要求越来越低的延迟,但大量数据来不及从边缘传递至云端,而在成本方面,边缘计算在能耗还有带宽、安全隐私等方面都有优势,此外越来越多的云计算则需要大量的数据中心建设土地,因此如何有效的进行边缘计算势在必行。


全新的机器学习处理器IP


Ian认为,机器学习是一种全新的技术,因此Arm也必须从零开始设计全新的处理器架构,从而实现最高效率最高吞吐量且灵活的机器学习负载处理。

Arm的首款机器学习处理IP将率先针对移动市场应用,但“机器学习处理器具有高度可伸缩性,未来可延伸至服务器及IOT各领域。”Ian强调。

“机器学习处理器架构要有三大特征,高效卷积,高效数据移动和可编程性灵活性。”Ian总结道。

图片.png


Arm的机器学习处理器具有16个计算引擎,每个引擎中包括SRAM、MAC引擎、网络控制单元、DMA等多部分组成。

图片.png


在有效卷积方面,Arm借鉴了Cortex-M一些设计经验,当进行卷积计算时MAC引擎在SRAM中读取解压缩激活和压缩权重,当一个计算引擎MAC读取一个激活时候,实际上结果通过广播网络向其他15个计算引擎广播,因此是16个引擎共用一个SRAM值。同时解压缩权重被存在权重解码器中,减少对SRAM的读取操作,从而降低能耗。

在高效数据移动方面,机器学习处理实际能耗和DDR能耗基本接近,所以在这方面,Arm借鉴了Mali-GPU,针对激活和权重,采用硬件压缩方式,减少系统功耗。在编译器方面,Arm充分利用了本机SRAM,降低对ddr访问。

“当运行GoogleNet V3时,动态激活值变化,这时候激活块的值分成两个类型,一个是激活快中有大量0,另外一个没有0有重复的值,我们硬件激活压缩技术很好的利用了动态值的特点,实现了google Ne V3 3.3倍压缩比的无损压缩。”Ian解释道。

在可编程性方面,如果要驾驭不断发展的机器学习领域,一定要让机器学习具有可编程灵活性,PLE(Programmable layer engine)可编程层引擎很好利用了Cortex-M矢量指令和神经网络NN专用指令,可适应未来神经网络变化。


图片.png


PLE引擎中有矢量引擎,可处理神经网络工作负载,而矢量注册表文件,可存储固件和SRAM,和主SRAM连接。卷积处理结果会被直接写进矢量注册表中,通过Cortex-M发出指令,让矢量引擎直接在主SRAM中写结果。

第二代OD处理器

Ian表示,第一代OD处理器已用在海康威视和英国的Hive公司。

第二代OD处理器,可以实时检测60fps 全高清影像,对象尺寸只需大于50*60像素,支持每帧无限数量的目标检测。

Ian强调,通过OD处理器和其他处理器融合,可打造完整的解决方案。前期可用OD进行每一帧的数据流过滤,检测到感兴趣的内容或区域之后传递给其他处理器进行处理,从而提高整体效率。

Project Trillium软件部分

图片.png


Ian表示,在安卓方面,Arm已经和谷歌合作,针对Cortex-A进行Android NN API接口优化,此外,Mali-GPU或机器学习处理器可直接通过Android NN HAL和Arm NN进行部署。

而在Linux方面,对于arm同等重要,Arm提供NNSDK,直接接入包括合作方在内的各种IP。

“由于我们在CPU和GPU领域的多年积累,这对于设计机器学习IP很有帮助。”Ian说道。



关键字:Arm 引用地址:Arm机器学习处理器IP参数公布,将首先用在移动市场中

上一篇:支持8K超高清的Mali-V76了解一下
下一篇:Arm DesignStart项目有多成功?看看2018年进展吧

推荐阅读最新更新时间:2024-05-03 18:36

飞思卡尔推出Kinetis系列基于ARM Cortex-M4的90纳米32位MCU
飞思卡尔半导体日前推出Kinetis系列,这是基于新ARM Cortex-M4处理器的90纳米32位 MCU MCU   MCU Microcontroller(微控制器)又可简称MCU 或μ C,也有人称为单芯片微控制器(Single Chip Microcontroller),将ROM、RAM、 CPU、I/O 集合在同一个芯片中,为不同的应用场合做不同组合控制.微控制器在经过这几年不断地研究,发展,历经4 位,8 位, 到现在的16 位及32 位,甚至64 位.经过20多年的发展,其成本越来越低,而性能越来越强大,这使其应用已经无处不在,遍及各个领域。 ,开创了其 微控制器 微控制器   一
[工业控制]
ubuntu下arm-linux-gcc安装
我下载的地址随便找的,4.4.3版本的,地址: http://www.cr173.com/soft/42654.html#address 1.我放在了/work/tools/ 2.sudo tar xzvf /work/tools/arm-linux-gcc-4.4.3.tar.gz 3.sudo tar xvzf arm-linux-gcc-4.4.3.tar.gz -C / 4./opt/FriendlyARM/toolschain/4.4.3/bin找到了命令; 然后 sudo vim /etc/environment 在PATH= /usr/local/sbin:/usr/local/bin:/usr/sbin:/usr
[单片机]
ADS ARM 汇编和GNU ARM汇编
Linux/Unix内核源代码用的编译器是GCC,而GCC采用的是AT&T的汇编格式,这与ADS下使用的汇编格式是不同的。 两种汇编格式的部分对比如下: GNU ARM汇编 ADS ARM汇编 “@”或“/*…*/” “;” .include GET .equ EQU .global EXPORT .extern IMPORT .long DCD .end END entry: ENTRY .text AREA Init,CODE,READONLY .data AREA Block,DATA,READWRITE .macro MACRO .endm MEND
[单片机]
Speed Pixel获益于ARM DesignStart 计划 得ARM7TDMI授权
香港本土fabless公司获益于ARM DesignStart 计划 中国上海,2007年8月13日 ——ARM公司(伦敦证交所:ARM;纳斯达克:ARMHY)今天宣布,位于香港的新兴fabless公司Speed Pixel Technology Ltd. 通过ARM代工厂计划获得ARM7TDMI处理器授权。Speed Pixel拥有强大的终端产品系统设计背景,通过这项协议,公司将能够开发先进的片上系统解决方案,用于中、短距离数字无线视频应用。Speed Pixel通过ARM DesignStart 计划开始其基于ARM技术的设计。在风险基金的支持下,Speed Pixel正加紧完成其产品设计,预计将于2007年第三季度上市。
[嵌入式]
如何用低成本的ARM Cortex-M微控制器让家电变得更安全
  自2007年起,家电厂商的所有新设计必须遵守IEC60335安全标准。为确保家电设备安全可靠,特别是设备故障不能威胁用户的人身安全,这套新标准涉及十分广泛的内容,从机械系统到嵌入电子元器件均有明确规定。   电子部分参照另一个标准,即适用于各种应用领域的IEC60730自动电子控制标准。对于嵌入式系统开发人员,附件H对于嵌入式系统开发人员尤为重要,因为该附件是关于可编程器件。白色家电通常使用多个微控制器:一个微控制器负责管理控制台,另一个管理阀门和电机控制。   根据设备故障导致的危险程度,该标准将软件分为A、B、C三类。如果家电安全不依靠软件,则该家电属于A类,如室内温控器或照明控制器。相反,如果软件用于防止安全隐患,如电子
[单片机]
如何用低成本的<font color='red'>ARM</font> Cortex-M微控制器让家电变得更安全
arm能给英伟达带来什么?
自从Arm被软银摆上货架之后,苹果和三星就相继成为绯闻主角。在这两家皆表无意之后,新的潜在买家英伟达又浮出了水面。而且,随着报道的深入,这桩半导体行业最大的联姻似乎已接近成形。 如果英伟达并购Arm成功,将会对整个的半导体行业带来难以想象的冲击。 配角变主角 金融时报和彭博社都报道了英伟达与软银进行谈判的消息。双方计划在数周内达成Arm交易。值得玩味的是,报道称英伟达是唯一一家与软银进行具体谈判的企业。 在之前的报道中,英伟达似乎只是配角,苹果和三星才是故事的主角。但是,苹果像2010年那样直接拒绝收购提议。三星也无意接手Arm,按照《Objective Analy
[半导体设计/制造]
<font color='red'>arm</font>能给英伟达带来什么?
ARM不仅只看重移动设备市场 在PC端也有野心
    北京时间1月15日上午消息,上周巴伦周刊的专栏作者Tiernan Ray发布了一篇与ARM首席执行官官沃伦·伊斯特(Warren East)面谈后对该公司的分析文章,主要内容翻译如下: 当地时间9日下午,在美国拉斯维加斯举办的国际消费类电子产品展览会(International Consumer Electronics Show)上,我遇到了ARM的首席执行官沃伦·伊斯特(Warren East)。该公司的展厅位于会场南部展厅内部,地方不大,但颇受与会者的关注。我个人觉得,ARM的小展厅,和该公司在计算机行业中所具有的超强影响力完全不相匹配。 通过批准一些芯片制造商使用ARM旗下技术来打造智能电话、平板电脑甚至是某些个人电脑
[手机便携]
小广播
最新手机便携文章
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved