AI+FPGA,低功耗智能探测系统将不再是难题

发布者:EEWorld资讯最新更新时间:2020-10-12 来源: EEWORLD关键字:AI  FPGA  莱迪思 手机看文章 扫描二维码
随时随地手机看文章

从家庭控制中智能门铃和安全摄像头的存在检测,到零售应用中用于库存的对象计数,再到工业应用中物体和存在检测,越来越多的网络边缘应用正在不断推动新型AI解决方案面市。根据IHS Markit(现Omida)的预测,2018-2025年物联网设备数量将达到400亿,截至2022年,所有企业产生的数据中近50%会在传统数据中心或云端以外的地方进行处理。

 

但与此同时,市场一方面要求设计人员开发出性能比以往更高的解决方案;另一方面,延迟、带宽、隐私、功耗和成本问题又限制了他们依赖云的计算资源来执行分析。如何解决系统对于日益严格的功耗(毫瓦级)和小尺寸(5mm2到100mm2)要求?如何能够快速获得相应的硬件和软件工具、参考设计、演示示例和设计服务?莱迪思公司为此做出了有益的尝试。

 

Lattice sensAI再获重大更新

 

作为莱迪思推出的业界第一款用于网络边缘设备端AI处理的完整解决方案集合,sensAITM提供了供开发人员评估、开发和部署基于FPGA的机器学习/人工智能解决方案所需的全部资源,包括模块化硬件平台、演示示例、参考设计、神经网络IP核、软件开发工具和定制化设计服务。

 

图1:sensAI架构框图

 

2019年上半年,sensAI通过更新迎来10倍性能提升,这是由多个优化促成的,包括通过更新CNN IP和神经网络编译器、新增8位激活量化、智能层合并以及双DSP引擎等特性。而最令人感到兴奋的是它新增并优化了用于快速实现网络边缘常见AI应用的参考设计,为关键词检测、人脸识别、人员侦测、人员计数等赋予了更强大的特性。

 

 

为了演示关键词检测系统的功能,工程师使用了搭载iCE40 UltraPlus FPGA的HiMax HM01B0 UPduino shield开发板。该开发板有两个直连到FPGA的I2S麦克风、用于FPGA设计的外部闪存、权重激活存储器、以及LED指示灯用以指示是否检测到关键词。用户可以直接对麦克风说话,一旦检测到关键词,LED就会亮起。

 

 

图4左侧是针对低功耗运行进行优化、采用CMOS图像传感器的人员侦测演示,通过VGG8网络提供64 x 64 x 3的分辨率,该系统以每秒5帧的速率运行,使用iCE40 UltraPlus FPGA功耗仅为7mW;右侧是性能经优化的人员计数应用演示,同样也使用CMOS图像传感器,通过VGG8网络提供128 x 128 x 3的分辨率。该演示以每秒30帧的速率运行,使用ECP5-85K FPGA功耗为850mW。

 

Lattice人员识别参考设计方案也应用于售卖机上检测人员的出现,唤醒售卖机的内核。通过减少非人员靠近造成的误触发,或人员路过造成的误触发,达到减小功耗的目的。

 

2020年5月,sensAI又成功升级至3.0版本。

 

在此前支持ECP5/ECP5-5G和iCE40 UltraPlus 模块化硬件平台的基础上,新推出的sensAI 3.0版本支持CrossLink-NX™系列FPGA,运行sensAI软件的CrossLink-NX FPGA比之前版本降低了一半的功耗,同时实现性能翻倍,从而为监控/安防、机器人、汽车和计算领域的智能视觉应用带来功耗和性能上的再次突破。同时,它还拥有定制化卷积神经网络CNN IP并新增支持MobileNet v2、SSD和ResNet模型,这些灵活的加速器IP可简化常见CNN网络的实现,经优化后可更加充分利用FPGA的并行处理能力,开发人员可轻松编译经过训练的神经网络模型并将其下载到CrossLink-NX FPGA中。

 

 

CrossLink-NX FPGA采用28nm FD-SOI工艺制造,与同类FPGA竞品相比,功耗可降低75%。在CrossLink-NX FPGA上运行解决方案时,sensAI可提供多达2.5Mb的分布式内存、RAM块以及额外的DSP资源,MIPI I/O提供瞬时启动的性能可在不到3ms的时间内完成自我配置,而整个器件的配置也只需8ms。在基于CrossLink-NX的对象计数演示中,——基于VGG的对象计数演示拥有10帧/秒的性能,功耗仅为200mW。

 

当AI遇见超低功耗FPGA

 

拥有5K LUT的iCE40 UltraPlus FPGA可实现网络边缘实时在线的智能应用所需的神经网络模式匹配。其拥有5280个4输入LUT、自定义I/O、多达80Kb和1Mb的嵌入式存储器,睡眠电流低至75uA,工作电流仅为1-10mA,功耗低至1mW,硬件平台尺寸小至5.5mm2。为了满足各类应用的需求,还采用了包括从专为电子消费品和IoT设备优化的超小尺寸2.15 mm x 2.50 mm x 0.45 mm WLCSP封装,到低成本应用的0.5mm间距7x7mm QFN封装在内的多种封装选项。

 

功耗优化遥遥领先的原因,得益于其采用的分布式异构处理(Distributed Heterogenous Processing, DHP)架构。由于不使用云端执行算法,而是使用内置的数字信号处理器(DSP)执行重复的数字处理任务,因此大幅减少了功耗极大的应用处理器(AP)的计算负载,从而实现更长时间的睡眠模式以延长电池使用时间。另一方面,内置的神经网络软IP和编译器实现了灵活的机器学习/人工智能应用,消除了云端智能应用带来的延迟,降低了整个系统解决方案的成本。

 

 

图8和图9描述了不同FPGA之间存在的资源差异如何影响到人脸检测和人员检测应用的性能和功耗。图8左侧的32x32输入示例中,橙色部分代表卷积层上运行的周期。在四个示例中,UltraPlus的乘法器数量最少,其他三片ECP5 FPGA的乘法器数量依次递增。随着乘法器数量的增加,卷积层所需的周期数减少;右侧的90x90输入示例中,在每个柱形图的底部有大面积的蓝色区域。这是由于设计更为复杂,需要占用外部DRAM,性能就有所折中。

 

 

人员侦测应用的情况类似,两组分别采用了64x64输入和128x128输入的情况。同样,较多的乘法器会减少卷积层的负担,而依赖DRAM则会影响性能。

 

 

其实,设计AI模型的最常见做法就是使用处理器,可能是GPU或者DSP,也有可能是微控制器(MCU)。不过,低端MCU可能连简单的AI模型也无法处理,高性能处理器又可能会违反设备的功耗和成本要求,但这正是低功耗FPGA发挥作用的地方。与增强处理器来处理算法的方式不同,莱迪思iCE40 UltraPlus FPGA可以作为MCU的协处理器,处理MCU无法解决的复杂任务之余,将功耗保持在要求范围内。

 

另一种思路是将低功耗FPGA作为单独运行的、完整的AI引擎,此时FPGA中的DSP就起到了关键作用。即便网络边缘设备没有其他的计算资源,也可以在不超出功耗、成本或电路板尺寸预算的情况下添加AI功能,更何况它们还拥有支持快速演进算法所需的灵活性和可扩展性。

 

无论采取哪种方法,都意味着设计人员可以采用莱迪思sensAI以及一片低功耗的iCE40 UltraPlus FPGA对传感器数据进行预处理,从而最大程度地降低了向SoC或云端传输数据进行分析的成本。例如,如果是用在智能门铃上,sensAI会初步读取来自图像传感器的数据。如果判断为不是人,比如说是一只猫,那么系统就不会唤醒SoC或连接到云端作进一步处理。因此,这种方法可以最大程度降低数据传输成本和功耗。如果预处理系统判断门口的对象是人,则唤醒SoC作进一步处理。这能极大减少系统需要处理的数据量,同时降低功耗要求,这对于实时在线的网络边缘应用来说至关重要。

 

 

结语:

 

莱迪思的FPGA具有独特的优势,可以满足网络边缘设备快速变化的市场需求。设计人员可以在不依赖云端的情况下,快速为网络边缘设备提供更多计算资源的其中一个方法是使用FPGA中本身的并行处理能力来加速神经网络性能。此外,通过使用针对低功耗运行而优化的低密度、小尺寸封装FPGA,设计人员可以满足新的消费和工业应用对功耗和尺寸的严格限制。

 

关键字:AI  FPGA  莱迪思 引用地址:AI+FPGA,低功耗智能探测系统将不再是难题

上一篇:BittWare全新RFX-8440 数据采集卡赋能无线应用新性能
下一篇:AMD收购赛灵思?FPGA的发展该走向何方

推荐阅读最新更新时间:2024-11-13 09:00

从机器人保姆到胶囊网络 这里有13个值得你关注的2018年AI大趋势
13个人工智能趋势正重塑各行各业。CBInsights分析了这些趋势,以及对未来几年产生的重要影响。 趋势一:机器人抢“蓝领”饭碗 AI推动下的机器自动化浪潮,将继续冲击劳动力密集的制造业,抢去蓝领工作饭碗,同时也催生出新的工作类型与机会。 在亚马逊仓库中,已经有超过10万个机器人投入使用,相应也创造了数千个人类的新工作机会。 中国T恤制造商天元服装与美国阿肯色州政府签署了谅解备忘录(MoU),以每小时14美元的价格在阿肯色州的新服装工厂雇用400名工人。操作计划于2017年底开始。天元位于阿肯色州小石城的工厂将使用佐治亚州初创公司SoftWear Automation开发称出缝纫机器人,可以代替工人制造服装。 在机器工人
[机器人]
汽车AI语音交互正在让机器交互更接近真人交互?
文|胡杨 胡皓 来源|智能相对论 - 今天天气怎么样? - 今日是晴天,气温17到22度,东北风3到4级。 - 那周五呢? - 周五距今天还有2天。 “重复唤醒,答非所问,这不是人工智能,是‘人工智障智障’。”这是大部分智能网联汽车用户对语音交互的抱怨。 现在,情况有了改善。当用户询问车机“明天出门需要带伞么?”,车机就会播报明天的天气情况,如果需要再查询其他时间或者城市的天气,那么用户不用重新唤醒,也不需要说出完整表达,只需要说“那大后天呢?”、“那杭州呢?”。在用户和车机在自然连续对话的过程中,语义理解服务会记住会话的历史,并结合历史处理用户的请求,通过这种方式,用户的多次连续交互就可以形成一个会话流,与用户的交互也更加自然
[机器人]
炒股机器人来了 AI交易平台“DetlaGrad”获数百万元融资
人工智能量化交易平台DetlaGrad宣布获得众海投资数百万人民币融资。据悉,本轮融资将主要用于团队建设、产品开发和硬件设备投入。 DetlaGrad是一家基于人工智能的量化投资公司,成立于2017年10月,主要将AlphaGo技术应用于量化投资领域,实现低风险高收益的投资回报。 中国私、公募基金规模呈大跨步发展,截止2018年2月底,中国私募基金规模已达12.01万亿元,公募资金规模已达12.64万亿,在控制风险的前提下,提高获得投资收益的效率,是公、私募投资最大需求,国外盛行的量化交易越来越被国内机构所接受。 在量化交易这个领域,目前已有不少项目:私人量化交易平台JoinQuant、RiceQuant以及优矿,为量化交易领域提
[嵌入式]
升级打怪不停歇 2016年百度秀人工智能“肌肉”
2016年,互联网巨头都在秀人工智能“肌肉”,百度也不例外。那么,2016年,百度的人工智能布局又有哪些关键词?   升级打怪不停歇 2016年百度秀人工智能“肌肉”    2016年,互联网巨头都在秀人工智能的肌肉,百度也不例外。事实上,云计算、、人工智能已成为百度最为重要的发力点,而2016年百度人工智能也是收获颇丰。 2016年1月,2015年度国家科学技术奖励大会在人民大会堂举行,百度机器翻译项目获颁国家科学技术进步奖二等奖,这是该奖项首次出现互联网巨头(BAT)的身影。百度机器翻译的突破性成果,使我国掌握了互联网机器翻译的核心技术,占领了技术制高点。 2016年6月,美国科技期刊TchnologyReview(《麻省理
[机器人]
用于汽车接口、安全和计算密集型负载FPGA的选择和使用
传统上,汽车中的计算任务由微控制器单元 ( MCU ) 和应用处理器 (AP) 执行。一辆典型的中档汽车可以包含 25 到 35 个 MCU/AP,而豪华车可能使用 70 个或更多。越来越多的汽车需要极其复杂的计算密集型功能来完成高级驾驶辅助系统 ( AD AS)、信息娱乐、控制、网络和安全等任务。其中许多应用涉及图像和视频处理形式的 机器视觉 以及人工智能 ( AI )。 单独的处理器架构很难处理 传感器 、相机和 显示器 等外围设备所需的所有电气接口和协议。此外,在许多情况下,这些处理器根本无法满足机器视觉和人工智能等任务的极端计算需求。 为了解决这种复杂性,汽车系统的设计人员正在转向现场可编程门阵列 ( FPGA )
[汽车电子]
软件定义汽车与AI驱动的车载技术革新
在当今汽车产业中,软件定义汽车(SDV)与人工智能(AI)的深度融合正引领着车载技术的飞速发展。众多汽车制造商已明确战略蓝图,致力于在全新架构上构建下一代车辆,旨在简化硬件与软件复杂度,实现车辆全生命周期的系统升级,不断推出创新功能。预计至2020年代中期,这一趋势将达到高潮,中央操作系统将成为新车的标配,这些系统依托AI与先进的系统级芯片(SoC)平台,开启智能化新篇章。 AI在数字座舱的革新作用 AI在数字座舱的广泛应用,核心在于提升用户体验。特别是大型语言模型(LLMs)的引入,使得车辆能够处理复杂对话,提供更为人性化的交互体验。用户可轻松通过语音指令获取信息、控制车辆功能及享受娱乐服务。AI通过学习用户习惯与偏好,实现
[嵌入式]
人工智能盯上彩电市场 能顺利颠覆吗?
  2016年,谷歌围棋 人工智能 程序AlphaGo战胜世界顶级围棋旗手李世石, 人工智能 (以下简称“AI”)概念迅速蹿红。近日谷歌中国与中国棋院宣布,围棋“人机大战”将于2017年5月下旬再次打响,AlphaGo将挑战目前世界排名第一的中国九段棋手柯洁。下面就随家用电子小编一起来了解一下相关内容吧。   目前,AI在制造业、金融、教育、医疗等各个领域的推进步伐加速。惯常喜欢搭车新概念的 彩电 企业更是不遗余力。近日, 彩电 企业前赴后继,纷纷将AI作为2017 彩电 产品的主要卖点。《中国经营报》记者调查发现,目前AI电视仅限于语音搜索阶段,也就是AI电视摸索的最初级阶段。 人工智能 技术在电视等细分垂直领域的应用效果,一
[家用电子]
在打击贩毒这件事上,AI扮演怎样的角色?
毫无疑问, 毒品 是这个星球的顽疾。   身处21世纪,令我们忧心忡忡的是,如今毒品这个恶症非但没有逐渐康复的迹象,反而愈演愈烈变本加厉——暗网带来的新销售网络、新型毒品的隐性危害、难以察觉的实验室毒品,都拷问着全世界对毒品犯罪的固有防线。   Netflix的热播剧《毒枭》(Narcos)中有一句经典台词:毒品就像暴风雨一样无法阻挡,但从来都不缺少在暴风雨中修篱笆的人。     面对着新的毒品犯罪趋势,也许人类已经该拿起技术的工具去修建一面新的篱笆了。而人工智能,恰好能提供一些选择。   今天我们来聊聊已经上阵和时刻准备登场的反毒战线 AI 们。当然,应用在反毒品犯罪当中,只是AI打击犯罪的众多可能之一。在更广阔的社会秩序与
[嵌入式]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
更多往期活动
随便看看

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved