Arm机器学习处理器IP参数公布，将首先用在移动市场中-电子工程世界

近日，在Arm Tech Day 2019上，Arm杰出工程师及机器学习事业部技术总监Ian Bratt介绍了Arm在机器学习及人工智能领域目前所做的工作和进展，Arm针对人工智能领域的Project Trillium项目,这是一套包括新的高度可扩展处理器的Arm IP组合，包括全新的ML处理器IP以及OD视觉处理器，以及一系列配套的软件体系。

图片.png

Ian给出第一代机器学习处理器指标，在7nm下效率为3 TOP/W，吞吐量为4.6 TOP/s，有针对激活和权重的硬件压缩，利用Cortex-M技术支持安卓NN和Arm NN，预计2018年中期交付客户。

Ian表示，“机器学习和人工智能是颠覆性的技术，应用场景多种多样，因此对Arm而言，不应该只是出现在某一款处理器上，而是所有处理器都需要有机器学习功能。”

Ian强调：“尽管目前所有机器学习工作负载都可以通过Cortex-A76进行实现，但如果想在机器学习方面更进一步更高密度，可能需要机器学习处理器，这也是为何Arm要推出机器学习专用IP的原因。”

谈到Project Trillium开放平台，Arm强调首先要从软件层进行优化，之后再从处理器端进行有效部署。

图片.png

Arm和合作伙伴在整个人工智能领域布局

未来Arm的机器学习及人工智能生态系统将主要在边缘计算端进行，在整个框架中，Arm提供了最全面的支持，包括CPU、GPU、机器学习IP、目标检测IP以及合作伙伴的IP，而在软件层方面，Arm则提供神经单元网络库，而在最上端的生态系统中，支持Android NN,TensorFlow,Caffe等开放环境。

Ian特别强调机器学习正在向边缘发展，并给出了三大原因，包括物理学、经济学和土地定律。具体而言，机器学习要求越来越低的延迟，但大量数据来不及从边缘传递至云端，而在成本方面，边缘计算在能耗还有带宽、安全隐私等方面都有优势，此外越来越多的云计算则需要大量的数据中心建设土地，因此如何有效的进行边缘计算势在必行。

全新的机器学习处理器IP

Ian认为，机器学习是一种全新的技术，因此Arm也必须从零开始设计全新的处理器架构，从而实现最高效率最高吞吐量且灵活的机器学习负载处理。

Arm的首款机器学习处理IP将率先针对移动市场应用，但“机器学习处理器具有高度可伸缩性，未来可延伸至服务器及IOT各领域。”Ian强调。

“机器学习处理器架构要有三大特征，高效卷积，高效数据移动和可编程性灵活性。”Ian总结道。

图片.png

Arm的机器学习处理器具有16个计算引擎，每个引擎中包括SRAM、MAC引擎、网络控制单元、DMA等多部分组成。

图片.png

在有效卷积方面，Arm借鉴了Cortex-M一些设计经验，当进行卷积计算时MAC引擎在SRAM中读取解压缩激活和压缩权重，当一个计算引擎MAC读取一个激活时候，实际上结果通过广播网络向其他15个计算引擎广播，因此是16个引擎共用一个SRAM值。同时解压缩权重被存在权重解码器中，减少对SRAM的读取操作，从而降低能耗。

在高效数据移动方面，机器学习处理实际能耗和DDR能耗基本接近，所以在这方面，Arm借鉴了Mali-GPU，针对激活和权重，采用硬件压缩方式，减少系统功耗。在编译器方面，Arm充分利用了本机SRAM，降低对ddr访问。

“当运行GoogleNet V3时，动态激活值变化，这时候激活块的值分成两个类型，一个是激活快中有大量0，另外一个没有0有重复的值，我们硬件激活压缩技术很好的利用了动态值的特点，实现了google Ne V3 3.3倍压缩比的无损压缩。”Ian解释道。

在可编程性方面，如果要驾驭不断发展的机器学习领域，一定要让机器学习具有可编程灵活性，PLE（Programmable layer engine）可编程层引擎很好利用了Cortex-M矢量指令和神经网络NN专用指令，可适应未来神经网络变化。

图片.png

PLE引擎中有矢量引擎，可处理神经网络工作负载，而矢量注册表文件，可存储固件和SRAM，和主SRAM连接。卷积处理结果会被直接写进矢量注册表中，通过Cortex-M发出指令，让矢量引擎直接在主SRAM中写结果。

第二代OD处理器

Ian表示，第一代OD处理器已用在海康威视和英国的Hive公司。

第二代OD处理器，可以实时检测60fps 全高清影像，对象尺寸只需大于50*60像素，支持每帧无限数量的目标检测。

Ian强调，通过OD处理器和其他处理器融合，可打造完整的解决方案。前期可用OD进行每一帧的数据流过滤，检测到感兴趣的内容或区域之后传递给其他处理器进行处理，从而提高整体效率。

Project Trillium软件部分

图片.png

Ian表示，在安卓方面，Arm已经和谷歌合作，针对Cortex-A进行Android NN API接口优化，此外，Mali-GPU或机器学习处理器可直接通过Android NN HAL和Arm NN进行部署。

而在Linux方面，对于arm同等重要，Arm提供NNSDK，直接接入包括合作方在内的各种IP。

“由于我们在CPU和GPU领域的多年积累，这对于设计机器学习IP很有帮助。”Ian说道。

关键字：Arm 引用地址：Arm机器学习处理器IP参数公布，将首先用在移动市场中

上一篇：支持8K超高清的Mali-V76了解一下
下一篇：Arm DesignStart项目有多成功？看看2018年进展吧

推荐阅读最新更新时间：2024-05-03 18:36

飞思卡尔推出Kinetis系列基于ARM Cortex-M4的90纳米32位MCU

飞思卡尔半导体日前推出Kinetis系列，这是基于新ARM Cortex-M4处理器的90纳米32位 MCU MCU 　　MCU Microcontroller(微控制器)又可简称MCU 或μ C,也有人称为单芯片微控制器(Single Chip Microcontroller),将ROM、RAM、 CPU、I/O 集合在同一个芯片中,为不同的应用场合做不同组合控制.微控制器在经过这几年不断地研究,发展,历经4 位,8 位, 到现在的16 位及32 位,甚至64 位.经过20多年的发展，其成本越来越低，而性能越来越强大，这使其应用已经无处不在，遍及各个领域。，开创了其微控制器微控制器　　一

[工业控制]

ubuntu下arm-linux-gcc安装

我下载的地址随便找的，4.4.3版本的，地址： http://www.cr173.com/soft/42654.html#address 1.我放在了/work/tools/ 2.sudo tar xzvf /work/tools/arm-linux-gcc-4.4.3.tar.gz 3.sudo tar xvzf arm-linux-gcc-4.4.3.tar.gz -C / 4./opt/FriendlyARM/toolschain/4.4.3/bin找到了命令；然后 sudo vim /etc/environment 在PATH= /usr/local/sbin:/usr/local/bin:/usr/sbin:/usr

[单片机]

ADS ARM 汇编和GNU ARM汇编

Linux/Unix内核源代码用的编译器是GCC，而GCC采用的是AT&T的汇编格式，这与ADS下使用的汇编格式是不同的。两种汇编格式的部分对比如下: GNU ARM汇编 ADS ARM汇编 “@”或“/*…*/” “;” .include GET .equ EQU .global EXPORT .extern IMPORT .long DCD .end END entry: ENTRY .text AREA Init,CODE,READONLY .data AREA Block,DATA,READWRITE .macro MACRO .endm MEND

[单片机]

Speed Pixel获益于ARM DesignStart 计划得ARM7TDMI授权

香港本土fabless公司获益于ARM DesignStart 计划中国上海，2007年8月13日 ——ARM公司（伦敦证交所：ARM；纳斯达克：ARMHY）今天宣布，位于香港的新兴fabless公司Speed Pixel Technology Ltd. 通过ARM代工厂计划获得ARM7TDMI处理器授权。Speed Pixel拥有强大的终端产品系统设计背景，通过这项协议，公司将能够开发先进的片上系统解决方案，用于中、短距离数字无线视频应用。Speed Pixel通过ARM DesignStart 计划开始其基于ARM技术的设计。在风险基金的支持下，Speed Pixel正加紧完成其产品设计，预计将于2007年第三季度上市。

[嵌入式]

如何用低成本的ARM Cortex-M微控制器让家电变得更安全

　　自2007年起，家电厂商的所有新设计必须遵守IEC60335安全标准。为确保家电设备安全可靠，特别是设备故障不能威胁用户的人身安全，这套新标准涉及十分广泛的内容，从机械系统到嵌入电子元器件均有明确规定。　　电子部分参照另一个标准，即适用于各种应用领域的IEC60730自动电子控制标准。对于嵌入式系统开发人员，附件H对于嵌入式系统开发人员尤为重要，因为该附件是关于可编程器件。白色家电通常使用多个微控制器：一个微控制器负责管理控制台，另一个管理阀门和电机控制。　　根据设备故障导致的危险程度，该标准将软件分为A、B、C三类。如果家电安全不依靠软件，则该家电属于A类，如室内温控器或照明控制器。相反，如果软件用于防止安全隐患，如电子

[单片机]

如何用低成本的<font color='red'>ARM</font> Cortex-M微控制器让家电变得更安全

arm能给英伟达带来什么？

自从Arm被软银摆上货架之后，苹果和三星就相继成为绯闻主角。在这两家皆表无意之后，新的潜在买家英伟达又浮出了水面。而且，随着报道的深入，这桩半导体行业最大的联姻似乎已接近成形。如果英伟达并购Arm成功，将会对整个的半导体行业带来难以想象的冲击。配角变主角金融时报和彭博社都报道了英伟达与软银进行谈判的消息。双方计划在数周内达成Arm交易。值得玩味的是，报道称英伟达是唯一一家与软银进行具体谈判的企业。在之前的报道中，英伟达似乎只是配角，苹果和三星才是故事的主角。但是，苹果像2010年那样直接拒绝收购提议。三星也无意接手Arm，按照《Objective Analy

[半导体设计/制造]

ARM不仅只看重移动设备市场在PC端也有野心

北京时间1月15日上午消息，上周巴伦周刊的专栏作者Tiernan Ray发布了一篇与ARM首席执行官官沃伦·伊斯特(Warren East)面谈后对该公司的分析文章，主要内容翻译如下：当地时间9日下午，在美国拉斯维加斯举办的国际消费类电子产品展览会(International Consumer Electronics Show)上，我遇到了ARM的首席执行官沃伦·伊斯特(Warren East)。该公司的展厅位于会场南部展厅内部，地方不大，但颇受与会者的关注。我个人觉得，ARM的小展厅，和该公司在计算机行业中所具有的超强影响力完全不相匹配。通过批准一些芯片制造商使用ARM旗下技术来打造智能电话、平板电脑甚至是某些个人电脑

[手机便携]

ARM中断产生和管理

[单片机]