借助周易平台,Arm中国打通AIoT落地的最后一公里

2019-05-20来源: EEWORLD关键字:Arm  AIoT  周易

在2018年第五届世界互联网大会上,Arm中国全新人工智能平台“周易”首次公开亮相,并获得第五届世界互联网大会“世界互联网领先科技成果”。


半年时间过去,客户对周易平台有了进一步了解,无论IP还是软件框架都获得了厂商的认可。在此前提下,近日,Arm中国生态发展副总裁、OPEN AI LAB创始人兼CEO金勇斌及Arm中国产品经理高锦炜解读了周易平台的更多细节。


金勇斌介绍道,周易平台是Arm中国自主开发的平台,包括人工智能处理器AIPU以及AIPU SDK,以及和中国生态合作伙伴共同开发的Tengine人工智能软件框架,适配Arm CPU、Mali GPU和第三方AI处理单元,实现人工智能算力优化。“由于是Arm中国自主开发的产品,可以说更接地气,也更加贴近客户的需求,全力解决AIoT时代最后一公里的问题。”金勇斌说道。


image.png

Tengine和Caffe相比,要快3-5倍


Tengine框架如何解决最后一公里问题


金勇斌表示,随着智能手机普及度越来越高,增长趋于缓慢。软银CEO孙正义所说,2035年,全球联网设备数量将超万亿。对于如此数量庞大的市场来说,仅凭手机是无法做到的。“这么多联网设备,对于人来说不可能随时随地去查看这些设备,因此IoT势必要结合AI决策(AIoT),减少人机互动,才有足够精力支持万亿设备的互联。”金勇斌说道。


周易平台正是在这一大背景下,为了满足IoT市场的AI需求而生。实际上,2018年初,Arm全球就公布了Project Trillium项目,这是Arm全方位的人工智能项目,而周易平台的产品正是在Project Trillium下做出的针对中国市场的有力补充。金勇斌表示:“无论是Trillium还是TensorFlow,并没有解决好最后一公里问题,客户用这些框架很难做到对所有芯片的支持,实际项目落地会带来一些困难。”


image.png

Project Trillium架构


image.png

周易平台架构


和Project Trillium相比,周易平台增加的Tengine框架可有效解决AL算法与Library之间的鸿沟


周易Tengine软件框架内包含不同的library,包括Arm全球library,OPEN AI LAB library等,通过这些library,可以对不同算力做分布和调度,上层则无缝支持不同的主流算法,比如Caffe、PyTorch等。


金勇斌说道,周易平台的Tengine框架具有适用性、兼容性、安全性等特点。具体来说,Tengine支持Arm或其他第三方IP,用户可以直接基于现有的Arm芯片做AI算法的开发,并且可以随着处理器的升级而进行无缝迁移,同时周易也集成或准备集成TrustZone及PSA安全架构,从而形成基于硬件、软件和IP一体化的安全方案。


让AI落地方案更便宜、更便捷、更易用,正是整个Tengine方案的初衷。金勇斌认为,对于AI生态链来说,需要在每个层级上进行交叉合作,甚至有点竞争,这样才能够降低成本,提高普及率和渗透率。


平台化产品赋能全产业链


“周易Tengine赋能的是全产业链。”金勇斌强调道。


具体来说,对于芯片公司来讲,由于Tengine适用于任何Arm IP,因此可以大幅提升目前已售产品的算力,同时还可以延长芯片的生命周期,同时对于那些软件实力不强的芯片公司来说,也不用开发专属自己的一套框架。而对于算法公司来讲,Tengine框架不需要太多考虑底层芯片就可以通过算法显著提升性能,同时一套算法也可以支持多个平台。


通过Tengine平台,让算法开发和迁移变得更加容易,可以更多提取底层芯片的AI性能,这无论对于OEM厂商还是系统集成商来说,都提供了更多的选择,降低了开发门槛,从而显著降低开发及工程实施成本,加速AIoT市场的普及。可迁移对于嵌入式系统来说尤其重要,嵌入式系统为了实现更大规模的成本下降,一直有平台迁移的需求,Tengine可以保证在基于Arm的架构下无缝迁移。


“对于AIoT行业的普及问题,在上游把一个根本的问题解决了之后,下游的普及速度会非常快。目前基于Tengine的应用框架,我们知道的场景应用就已经有好几百个,包括人脸识别、机器人、ADAS等。随着芯片的AI能力越来越强,应用场景的渗透率和范围会变得越来越大。”金勇斌说道。


金勇斌举例道,某家人脸布控系统公司初期的一套开发算上流量、云服务器等成本,单个终端的成本是20000块,而采用周易人工智能平台进行边缘处理后,总体综合成本不足2000元,节省了10倍以上。


金勇斌表示,AIoT市场将是多样化的,相比手机产业链来说,由于和场景密切相关,因此无论芯片公司还是应用,种类都会更多。多样化的局面下,越是底层的东西,考虑到开发成本、维护成本等,就越需要做成平台式的产品。


除了周易平台,Arm在2016年成立的OPEN AI LAB,也是为了推动Arm嵌入式智能机器的产业发展,为智能机器应用场景构建嵌入式SoC基础计算框架,并整合应用场景服务接口。致力于推动芯片、硬件、算法软件整个产业链的深度协作,实现有计算的地方就有人工智能。随着客户的商业化需求增加,OPEN AI LAB也转成了商业公司,从商业交付角度解决最后一公里问题,目前该公司已服务了超过100家客户。


image.png

OPEN AI LAB的业务范围


周易AIPU架构浅析


谈完了Tengine软件框架,高锦炜详细介绍了周易人工智能处理引擎AIPU的特点。目前该款IP已获得了近十家合作伙伴授权。


一:周易AIPU拥有一套完整的人工智能和神经网络优化指令集,同时保证相前兼容,以保护软件和生态系统的投入。高锦炜说道,目前AI界和以前的数据算法大多使用DSP来做NN处理,虽然硬件设计类似,但DSP并没有形成一个良好的生态系统。“DSP主要有两大缺陷,一个是不同的DSP架构是不兼容的,这势必会分散资源和开发的投入,第二则是DSP的开发没有软件生态维护的概念,即使是同一个厂家,第一代DSP的指令集或者软件程序,也无法使用在第二代DSP上,这对软件开发来说是灾难性的。”


二:周易AIPU具有灵活性和高效率的最佳平衡,尤其是在工艺进展缓慢的今天,架构的创新会带来更高的能效比,这就给了周易AIPU最佳的时间点。具体来说,周易AIPU包含粗粒度计算——目前主要的卷积操作,以及支持软件可编程的中、细粒度计算,其中中粒度采用了矢量处理流水线,可处理大位宽数据,细粒度则是一个标量流水线。


三:可支持指令集的扩展,以满足客户的定制化及差异化需求。所以今天你看,这个架构本身它就是一个DSA了,CPU处理通用的操作系统那个东西,这是处理图形的东西,这是处理AI的东西,还有第三方的一些DSP,它可能还有一些处理它专用的处理单元。但由于这些东西碎片化,或者叫它跟应用绑定性比较多,所以每家的DSP可能做得都不太一样。这时候Arm中国希望提供一个更公共的平台,而不是给每家做一个设计服务。这些人我们愿意说每家可能基于这方面发挥它的差异性,能体现它SoC在最终用户体验的一些差异性。


四:在IP对应的软件工具链上,Arm中国也提供了整套工具:从底层的IP开发到上层的软件开发,其中包括了编译器、性能优化库、仿真器和算法示例等全方位支持。


金勇斌表示,AI的演进一定是逐步迭代的过程,这和任何一项技术的演进步骤都一样。比如最终AI实现的是人脸识别,在此基础上诞生了诸如表情识别、发行识别等新的需求,总是会不断提取共性需求,并将其硬件固化升级。算法同样如此,10年前开发APP的要求很高,但随着提取共性的框架越来越高效,开发难度也越来越降低。


正因为迭代是逐步进行的,这就要求所有的开发尽量都向上兼容,同时也需要平台化以支持更多供应商的方案,这样才可以加速整体的迭代过程与效果,充分打通最后一公里。在这一方面,周易平台秉承了Arm一贯以来的做法,也会不断获得市场的认可。

关键字:Arm  AIoT  周易 编辑:冀凯 引用地址:http://news.eeworld.com.cn/qrs/ic462300.html 本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:高云半导体引入成熟的Arm®嵌入式生态系统到其FPGA产品中
下一篇:产教融合共创“中国芯” “高云杯”IC设计大赛开幕

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

赛灵思助力安森美智能功率模块平台更快更高效
本文编译自Xilinx官方博客安森美的智能功率模块(IPM)和集成功率模块是为有效控制电机而制造的。它们适用于高电压和高工作温度,并减少了驱动器的空间。更高的开关频率有助于提高效率,超越了传统电机控制解决方案的能力。这就是为什么在软件中具有算法的MCU无法优化新技术的原因。在专用逻辑中使用高级算法的快速切换可控制电动机的旋转磁场,从而最大程度地提高效率。通过Xilinx(赛灵思) Zynq-7000 SoC中的电机控制功能,该系统可通过设计获得最佳性能。无论Xilinx SoC内部正在运行什么,控制环的速度始终是可预测的。处理系统中的Arm内核使该设备变得智能化,可用于工业物联网(IIoT)。电机的能效起着至关重要的作用。许多电机
发表于 2020-11-22
赛灵思助力安森美智能功率模块平台更快更高效
i.MX 8m Plus如何通过增加ISP和NPU加速边缘计算
本文作者:NXP Ben Eckermann云计算、边缘计算和基于视觉的系统已经应用在越来越多的工业和消费系统中。此外,许多现代系统还采用机器学习和人工智能来增强用户体验,这种方法通常要求嵌入式系统设计者使用各种不同的SoC和专用处理器来完成所有这些任务。然而,NXP决定采取不同的方法,他们将图像信号处理器(ISP)、用于机器学习加速的神经处理单元(NPU)和MPU集成在一个器件中——先进的i.MX 8m Plus应用处理器。图1 i.MX 8M Plus应用处理器。云计算与边缘计算为了理解i.MX 8M Plus应用处理器为什么为边缘计算提供强大的解决方案,需要一些背景知识。云计算是指在用户使用内部网络范围之外的计算资源
发表于 2020-11-20
i.MX 8m Plus如何通过增加ISP和NPU加速边缘计算
三星Exynos 2100解密:ARM X1超大核+A78大核
       三星即将发布Galaxy S21系列,提供骁龙版和Exynos版两种选择。  其中国行、美版为骁龙版,欧洲市场发售的是Exynos版本,处理器将命名为Exynos 2100,骁龙版使用的处理器是骁龙875  作为一款定位高端旗舰的手机芯片,Exynos 2100和骁龙875一样具有强悍的性能。  11月18日消息,据报道,高通骁龙875和三星Exynos 2100都使用了5nm工艺制程,而且两颗芯片都有超大核(ARM Cortex X1)、大核(ARM Cortex A78)和小核,采用“1+3+4”三丛集架构。  报道指出,Exynos 2100和骁龙875的CPU频率
发表于 2020-11-19
三星Exynos 2100解密:<font color='red'>ARM</font> X1超大核+A78大核
苹果自研Arm处理器性能值得期待吗?
11月10日苹果的特别活动快要到了,在此活动上苹果大概率会发布搭载苹果自研Arm处理器的MacBook。而这颗苹果自研Arm处理器——或许会被称为A14X Bionic的性能,已经被曝光了。Expreview超能网引外媒报道,在Geekbench 5上发现了这颗A14X的跑分情况,显示该处理器的基础频率为1.8GHz,并且频率可以最高自己上到3.1GHz,它是一个8核处理器,并且GPU部分包含8GB的显存。从数据来看,A14X的单核基准测试得分为1634,而A12Z的得分为1118,A14的单核测试得分为1583,所以说相较A14,新的MacBook上的Arm处理器单核性能提升不大,毕竟单核性能的提升难度是很大的。多核方面
发表于 2020-11-08
Arm Ethos-U65 microNPU对边缘计算市场意味着什么?
本文作者:NXP边缘处理的技术总监、系统架构师和总工程师Ben Eckermann2020年10月19日,Arm宣布了Ethos-U65 微型NPU。NPU是一个神经处理单元,microNPU顾名思义是一个非常小的NPU,通常针对面积受限的嵌入式和物联网设备。早在2020年2月,NXP就宣布了选择Ethos-U55 microNPU作为Cortex-M系统。Ethos-U55是专为微控制器设计的,与Cortex-M处理器以及MCU中的系统SRAM和flash协同工作,以提供MCU客户所需的性能和效率的结合。但Ethos-U55并不一定适合于在基于Cortex-A的应用处理器上运行的本地复杂ML应用程序。通过我们与Arm的技术合作
发表于 2020-11-06
<font color='red'>Arm</font> Ethos-U65 microNPU对边缘计算市场意味着什么?
解析瑞萨新款MCU RA6M4三大特点
本文作者:瑞萨高级工程师 Stefan Ingenhaag随着最新一代RA系列MCU发布,将帮助您完成最新的创意和理念。基于最新一代Armv8-M体系结构的最先进的Arm Cortex-M33内核、卓越的嵌入式闪存、尖端的安全性、强大的性能和一流的外围IP,所有这些都高度集成在一颗MCU中,并具有最佳易用性,以确保产品快速上市。1更小的BOM和PCB尺寸RA系列以其独特的集成度降低系统成本。集成的安全元素只是众多示例中的一个,内部闪存可以取消对外部EEPROM的需求,高精度片上振荡器无需外围晶振,MCU采用宽输入电压范围的单轨电源工作。利用这些特性可减少许多外部组件和GPIO,从而能够选择更小的封装,减少PCB尺寸和BOM成本
发表于 2020-11-05
解析瑞萨新款MCU RA6M4三大特点
小广播
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2020 EEWORLD.com.cn, Inc. All rights reserved