推动边缘端机器学习,NXP Glow神经网络编译器问市

2020-08-05来源: EEWORLD关键字:NXP  神经网络编译器

恩智浦半导体NXP Semiconductors N.V.发布了eIQ机器学习(ML)软件对Glow神经网络(NN)编译器的支持功能,针对恩智浦的i.MX RT跨界MCU,带来业界首个实现以较低存储器占用提供更高性能的神经网络编译器应用。Glow编译器由Facebook开发,能够集成特定于目标的优化,恩智浦利用这种能力,使用适用于Arm Cortex-M内核和Cadence Tensilica HiFi 4 DSP的神经网络算子库,最大程度地提升i.MX RT685以及i.MX RT1050和RT1060的推理性能。此外,此功能已集成到恩智浦的eIQ机器学习软件开发环境中,在恩智浦的MCUXpresso SDK中免费提供。

 

image.png


使用Glow充分发挥MCU架构特性的优势


2018年5月,率先开发PyTorch的Facebook推出了开源社区项目Glow(Graph Lowering神经网络编译器),其目的是提供优化,提高一系列硬件平台上的神经网络性能。作为一种神经网络编译器,Glow基于未优化的神经网络生成高度优化的代码。这个特点有别于典型的神经网络模型处理,后者采用即时编译,因而需要更高的性能,还会增加存储器开销。像Glow这样直接运行优化代码可以显著降低处理和存储器要求。恩智浦也在Glow开源社区中扮演着积极角色,帮助推广和普及Glow的新功能。

 

Facebook软件工程经理Dwarak Rajagopal表示:“GitHub中提供的标准版Glow可以直接在任何设备上运行,让用户能够灵活地针对感兴趣的基础架构编译神经网络模型,包括Arm Cortex-A和Cortex-M内核以及RISC-V架构。恩智浦使用充分利用MCU计算元件的专用软件库,实现了2-3倍的性能提升,展示了从基于云的高端机器到低成本的嵌入式平台的广泛范围内,将Glow神经网络编译器用于机器学习应用的诸多优势。”

 

优化机器学习框架以增强竞争优势


未来几年内,对机器学习应用的需求预期将会大幅增加。据TIRIAS Research预测,到2025年,98%的边缘设备将使用某种形式的机器学习/人工智能。根据市场预测,到2025年,预计将有180亿至250亿部设备包含机器学习功能,尽管它们可能并没有专用的机器学习加速器。消费型设备制造商和嵌入式物联网开发人员将需要优化机器学习框架,以便实现使用MCU的低功耗边缘嵌入式应用。 

 

恩智浦半导体资深副总裁兼边缘处理业务总经理Ron Martino表示:“借助eIQ机器学习软件框架,利用高度集成的i.MX应用处理器和高性能i.MX RT跨界MCU的强大功能,恩智浦正在推动机器学习功能在边缘设备上的实现。随着i.MX RT系列跨界MCU增加对Glow的支持,我们的客户能够编译深度神经网络模型,为他们的应用带来竞争优势。”

 

恩智浦的面向机器学习的边缘智能环境解决方案是一个全面的工具包,提供开发人员需要的构建模块,帮助他们高效地在边缘设备中实施机器学习。Glow整合到eIQ软件后,机器学习开发人员将拥有全面的高性能框架,可在包括i.MX RT跨界MCU和i.MX 8应用处理器的恩智浦边缘处理解决方案上进行扩展。客户拥有了更强大的工具,能够在i.MX RT MCU和i.MX应用处理器上开发机器学习语音应用、对象识别、人脸识别等应用。

 

利用恩智浦的Glow神经网络实施来提高性能


eIQ现在包含对Glow和TensorFlow Lite的推理支持,对于这些实施,恩智浦通常会执行基准测试以衡量其性能。MCU基准测试包括标准神经网络模型,例如CIFAR-10。以CIFAR-10模型为例,恩智浦采集的基准测试数据表明了如何利用i.MX RT1060器件(采用600MHz Arm Cortex-M7)、i.MX RT1170器件(采用1GHz Arm Cortex-M7)和i.MX RT685器件(采用600 MHz Cadence Tensilica HiFi 4 DSP)的性能优势。

 

恩智浦对Glow的支持离不开Cadence为Tensilica HiFi 4 DSP提供的神经网络库(NNLib),该DSP提供了4.8GMAC性能。同样以CIFAR-10为例,恩智浦的Glow实施使用这一DSP来加快神经网络运算,实现了25倍的性能提升。

 

Cadence Tensilica IP企业副总裁Sanjive Agarwala表示:“Tensilica HiFi 4 DSP最初集成在i.MX RT600跨界MCU中,目的是提高各种不同的音频和语音处理应用的速度。但是,当有越来越多机器学习推理应用瞄准了低成本、低功耗的MCU级应用时,HiFi 4 DSP凭借固有的DSP计算性能,成为加快这些神经网络模型的理想选择。随着恩智浦在eIQ机器学习软件中实施Glow,i.MX RT600 MCU的客户能够利用该DSP来满足多种机器学习应用的需求,包括关键词检索(KWS)、语音识别、降噪和异常检测。”

 

Arm公司机器学习营销副总裁Dennis Laudick表示:“恩智浦将Arm CMSIS-NN软件库包括在elQ中,目的是最大程度地提升性能,减少Arm Cortex-M内核上的神经网络存储器占用。以CIFAR-10神经网络模型为例,恩智浦能够利用CMSIS-NN实现1.8倍的性能提升。其他神经网络模型应该能够产生相似的结果,这清晰地展示了这款高级编译器和我们的优化神经网络算子库的优势。”

 

上市时间


恩智浦的集成Glow神经网络编译器的eIQ软件现已上市,通过i.MX RT600跨界MCU、i.MX RT1050和i.MX RT1060跨界MCU的MCUXpresso SDK提供。未来将会推出适用于恩智浦其他MCU的集成Glow神经网络编译器的eIQ软件。


关键字:NXP  神经网络编译器 编辑:muyan 引用地址:http://news.eeworld.com.cn/qrs/ic505349.html 本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:从实验室到生产线:Xilinx 助力百度 Apollo ACU 量产下线
下一篇:Socionext 全新HDMI模块cecTalker问市,让用户轻松进行设计

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

arm选型指南
  目前国内市场常见的ARM有NXP(Philips)、Samsung、Atmel、TI、ADI等,根据用户要求及应用领域,可从如下几个方面选型:  1、速度(常规应用):ARM7的主时钟为20~133M,ARM9为100~233M,ARM10高达700M,如果速度要求更高,还可使用多核ARM,如MinSpeed公司的ARM系列芯片。  2、内存(常规应用):一般ARM都内带Flash(程序)和SRAM(数据),Atmel公司的ARM自带内存容量最大。如果要扩充外部SDRAM,Atmel、Samsung、NXP均可。  3、MCU升级(常规应用):如果是从原来的单片机系统升级(速度、GPIO等),可选择NXP的ARM,该公司
发表于 2020-09-22
arm选型指南
NXP:微控制器在边缘人工智能中扮演着越来越重要的角色
,从而给物联网带来额外好处。边缘有多远?虽然边缘被广泛认为是物联网网络中最远的点,但它通常被认为是高级网关或边缘服务器。这并不是边缘真正结束的地方,它将在用户侧附近的传感器端结束。把尽可能多的分析能力放在用户端是合乎逻辑的,微控制器最适合这项任务。MobileNet V1模型的变宽乘法器示例显示了对参数数量、计算和精度的巨大影响。仅将宽度乘数从1.0更改为0.75,只会最小程度地影响TOP-1精度,但会显著影响参数和计算的数量(Image:NXP)单板计算机也可以用于边缘处理,因为单板计算机具有卓越的性能,并且在集群中可以与小型超级计算机相媲美。但它们仍然太大,成本太高,无法部署到大规模应用程序所需的成百上千个单元中
发表于 2020-09-15
<font color='red'>NXP</font>:微控制器在边缘人工智能中扮演着越来越重要的角色
NXP大中华区主:协同创新,推动本地化发展
车用半导体是近年来发展最快的半导体板块之一。中国是全球第一大汽车产销国,因此中国市场已经成为了促进车用半导体发展的重要驱动力。恩智浦是全球领先的汽车半导体供应商,在中国市场深耕三十余年,重点布局了汽车电子、工业与物联网、移动设备和通信基础设施这四大“赛道”。 日前在接受《中国电子报》采访时,恩智浦大中华区新任主席李廷伟先生表示,恩智浦将在深度、广度和协同创新方面,与中国半导体产业实现合作共赢。     在新基建中发挥更大作用“  现阶段,70%〜80%参与新基建的公司都是我们的客户……恩智浦的成功主要来源于客户的成功。 Q中国电子报 新冠肺炎疫
发表于 2020-09-11
<font color='red'>NXP</font>大中华区主:协同创新,推动本地化发展
NXP宣布为毫米波雷达收发器选择创新性封装方式
日前,NXP收发器产品经理Carl Henning Cabos在官方博客中表示,NXP正在选择Exposed Die封装方式,以提高毫米波雷达收发器的功率和散热效率。对于汽车雷达应用来说,从24GHz到77GHz频段的切换是很正常的。对于某些应用,如前雷达,这一举措在几年前就已经开始了,而今天的许多新车已经内置了这些雷达,特别是在自适应巡航控制(ACC)或自动紧急制动(AEB)等应用中。工艺创新,特别是向CMOS技术的转移,正加速77GHz角雷达传感器的增长。转换到77GHz时,角雷达精度的差异和固有的设计优势是很难取代的。向77GHz频段的迁移可以实现高达5GHz的扫描带宽,而以前的24GHz窄带雷达系统带宽仅有200MHz
发表于 2020-09-09
二期活动来啦,专家现场分享Cypress、NXP案例
OpenLab Day第二期活动将于9月2日火热来袭!这期活动亮点多多——NI和孤波专家携Cypress、NXP精彩应用案例,还有桌面式ATE级数字Pattern仪器动手实践课程来到NI直播间。在这个炎炎夏日,你除了可以选择足不出户在线上与技术专家们远程交流,更可以选择来到NI上海办公室现场参与OpenLab Day,顺便还可以参观OpenLab!还在犹豫什么?注:现场参与地点为NI上海办公室,坐标张江高科技园区内,由于场地限制,线下参与名额还请以报名确认信为准哦!直播议程剧透1:活动时间9月2日14:00 – 16:152:日程安排14:00– 15:00  SoC和MCU数字接口验证及Cypress、NXP
发表于 2020-08-31
二期活动来啦,专家现场分享Cypress、<font color='red'>NXP</font>案例
NXP多设备车载无线充电解决方案已进入商用阶段
恩智浦半导体宣布,首款以单个MWCT控制器驱动的多设备车载无线充电解决方案现已部署到量产车辆中。作为汽车整合无线充电解决方案的市场领导者,恩智浦扩大了其产品范围,推出了全新15W无线充电标准,从而实现了更快的充电速度。这一全新的解决方案使乘客和驾驶员可以在一个控制台上同时进行无线充电,让汽车制造商能够为其客户提供与众不同的乘车体验。无线充电在车辆上使用单个MWCT设备,不但降低了成本,也可减少物理引脚,使汽车制造商从中获益。这一解决方案基于Qi标准,可以为所有支持Qi标准的手机充电,包括iPhone、三星、华为和小米等手机。 智能手机已经成为数字生活的核心,它们与车辆的互操作(例如通过NFC使用智能汽车门禁)更是在不断巩固
发表于 2020-08-28
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2020 EEWORLD.com.cn, Inc. All rights reserved