为网络边缘人工智能应用提供更高性能的解决方案-电子工程世界

莱迪思半导体白皮书

存在检测和对象计数等网络边缘人工智能应用越来越受欢迎，但设计人员越来越多地要求在不影响性能的情况下实现低功耗和小尺寸的网络边缘人工智能解决方案。莱迪思的sensAI技术集合的最新版本，适用于ECP5和iCE40 UltraPlus FPGA，为设计人员提供了在网络边缘实现低功耗、高性能AI所需的硬件平台、IP、软件工具、参考设计和设计服务。

摘要
利用FPGA的优势
主要更新
sensAI设计案例
结论

摘要

低成本、高性能的网络边缘解决方案的市场竞争日益激烈。领先的市场研究公司预测，在未来六年内，网络边缘解决方案市场将迎来大爆发。IHS预计到2025年，将有超过400亿台设备在网络边缘运行，而市场情报机构Tractica预测，届时每年将出货超过25亿台网络边缘设备。

随着新一代网络边缘应用的出现，设计人员越来越倾向于开发结合低功耗和小尺寸而不降低性能的解决方案。推动这些新的AI解决方案的是越来越多的网络边缘应用，例如家庭控制中智能门铃和安全摄像头的存在检测，零售应用中用于库存的对象计数，以及工业应用中的物体和存在检测。一方面，市场要求设计人员开发出性能比以往更高的解决方案。另一方面，延迟、带宽、隐私、功耗和成本问题限制了他们依赖云的计算资源来执行分析。

同时，性能、功耗和成本限制因应用而异。随着实时在线网络边缘应用的数据需求不断推动对基于云的服务的需求，设计人员必须解决传统的功耗、电路板面积和成本问题。开发人员如何解决系统对于日益严格的功耗（毫瓦级）和小尺寸（5 mm2到100 mm2）要求。单论各种性能要求就已经很难满足。

利用FPGA的优势

莱迪思的FPGA具有独特的优势，可以满足网络边缘设备快速变化的市场需求。设计人员可以在不依赖云端的情况下，快速为网络边缘设备提供更多计算资源的其中一个方法是使用FPGA中本身的并行处理能力来加速神经网络性能。此外，通过使用针对低功耗运行而优化的低密度、小尺寸封装FPGA，设计人员可以满足新的消费和工业应用对功耗和尺寸的严格限制。例如，莱迪思的iCE40 UltraPlus™和ECP5™产品系列支持网络边缘解决方案的开发，功耗低至1 mW到1 W，硬件平台尺寸小至5.5 mm2到100 mm2。通过将超低功耗、高性能和高精度与全面的传统接口支持相结合，这些FPGA为网络边缘设备开发人员提供了满足不断变化的设计要求所需的灵活性。

图1：莱迪思半导体的低功耗、小尺寸FPGA提供适当的性能和功能组合，支持网络边缘人工智能应用

为了满足这一需求并加速开发，莱迪思推出了业界第一款技术集合sensAI™，为设计人员提供了开发智能家居、智能工厂、智能城市和智能汽车中低功耗、高性能网络边缘设备所需的所有工具。sensAI旨在满足支持AI的网络边缘设备不断增长的需求，提供全面的硬件和软件解决方案，用于在网络边缘运行的智能设备中实现低功耗、实时在线的AI功能。它于2018年推出，旨在无缝创建新设计或更新现有设计，其低功耗AI推理针对这些新应用要求进行了优化。

这个综合设计生态系统中有什么？首先，莱迪思的模块化硬件平台，如带有HM01B0Shield开发板的iCE40 UPduino 2.0和基于ECP5的嵌入式视觉开发套件（EVDK），为应用开发提供了坚实的基础。UPduino可用于仅需几毫瓦的AI设计，而EVDK支持需要更高功耗但通常工作在1W以下的应用。

软IP可以很容易地实例化到FPGA中，以加速神经网络的开发。因此，sensAI开发包包括CNN加速器IP，能让设计人员在iCE40 UltraPlus FPGA中实现深度学习应用。sensAI还提供完整的CNN可设置参数的加速器IP核，可以在莱迪思的ECP5 FPGA中实现。这些IP支持可变量化。这反过来又使设计人员能够在数据准确性和功耗之间进行权衡。

Lattice的sensAI技术集合允许设计人员通过易于使用的工具流程探索设计选项和权衡。设计人员可以使用Caffe、TensorFlow和Keras等行业标准框架进行网络训练。开发环境还提供神经网络编译器，将训练的网络模型映射为固定点表示，支持权重和激活的可变量化。设计人员可以使用编译器来帮助分析、仿真和编译不同类型的网络，以便在没有RTL经验的情况下在莱迪思的加速器IP核上实现。然后，设计人员可以使用传统的FPGA设计工具，如Lattice Radiant和Diamond来实现整个FPGA设计。

为加快设计实现，sensAI提供了越来越多的参考设计和演示。包括面部识别、手势检测、关键词检测、人员存在检测、面部跟踪、对象计数和速度标志检测。最后，设计团队通常需要一定的专业知识才能完成设计。为满足这一需求，莱迪思与全球各地的众多设计服务合作伙伴建立了合作关系，以便为AI / ML专业知识不足的客户提供支持。

图2：Lattice senseAI是一整套硬件和软件解决方案，适用于网络边缘人工智能应用的开发

主要更新

为了满足网络边缘AI快速增长的性能要求，莱迪思在2019年发布sensAI更新，增强了其性能并优化了设计流程。更新后的sensAI比上一版本的性能提升了10倍，这是由多个优化促成的，包括通过更新CNN IP 和神经网络编译器，新增8位激活量化、智能层合并以及双DSP引擎等特性，优化了存储器的访问。

在最新版本中，由于更新了神经网络编译器，支持8位输入数据，存储器访问序列得到大幅优化。因此不仅外部存储器的访问减少了一半，还支持使用更高分辨率的图像作为数据输入。使用更高分辨率的图像，解决方案自然更为精确。

为进一步加速性能，莱迪思优化了sensAI神经网络中的卷积层，减少了卷积计算耗费的时间。莱迪思将器件中的卷积引擎数量翻倍，减少了约50%的卷积时间。

莱迪思在不增加功耗的情况下提升了sensAI的性能，设计人员因此可以选择ECP5 FPGA产品系列中门数较少的器件。经优化的演示示例可以帮助实现性能提升。例如，针对低功耗运行进行优化、采用CMOS图像传感器的人员侦测演示，通过VGG8网络提供64 x 64 x 3的分辨率。该系统以每秒5帧的速率运行，使用iCE40 UltraPlus FPGA功耗仅为7 mW。第二个性能经优化的演示，针对人员计数应用，同样也使用CMOS图像传感器，通过VGG8网络提供128 x 128 x 3的分辨率。该演示以每秒30帧的速率运行，使用ECP5-85K FPGA功耗为850 mW。

图3：这些参考设计展示了sensAI提供的功耗与性能可选方案

与此同时，sensAI给用户带来无缝的设计体验，它支持更多神经网络模型和机器学习框架，从而缩短设计周期。全新可定制化的参考设计可简化对象计数和存在检测等常见的网络边缘解决方案的开发，同时设计合作伙伴生态也在不断拓展，为用户提供重要的设计服务。有了这些，莱迪思能为开发人员提供他们复制或调整其设计所需的全部关键工具。例如，下列框图展示了莱迪思提供的一系列全面的组件，包括训练模型、训练数据集、训练脚本、经过更新的神经网络IP和神经网络编译器。

图4: sensAI的设计流程包括了行业领先的机器学习框架、训练数据和脚本、神经网络IP等设计和训练网络边缘AI设备必需的资源

莱迪思还拓展了对机器学习框架的支持，致力于提供无缝的用户体验。最初版本的sensAI支持Caffe和TensorFlow，最新版本新增支持Keras，这是用Python编写的开源神经网络，可在TensorFlow、Microsoft Cognition Toolkit或Theano上运行。Keras旨在帮助工程师快速实现深度神经网络，它可以提供用户友

好、模块化和可拓展的环境，加速原型设计。Keras最初被当做一种接口而非独立的机器学习框架，它的高度抽象性能让开发人员加速开发深度学习模型。

为进一步简化使用，莱迪思更新了sensAI神经网络编译器工具，它可以在机器学习模型转换为固件文件时自动选择最精确的分数位数。sensAI更新还新增了一个硬件调试工具，让用户可以在神经网络每个层进行读取和写入。进行软件仿真之后，工程师也需要知道他们的网络在实际硬件上的表现。使用此工具，工程师可以在短短几分钟内看到硬件运行的结果。

此外，最新版本的sensAI得到了越来越多公司的支持，他们为莱迪思提供专为低功耗、实时在线的网络边缘设备而优化的设计服务和产品开发技能。这些公司通过无缝更新现有设计或针对特定应用开发完整的解决方案来帮助客户构建网络边缘AI设备。

sensAI设计案例

莱迪思这一更高性能的全新解决方案可用于下列四种不同的加速器设计案例。在第一个设计案例中（图5）,设计工程师使用sensAI来构建独立运行模式的解决方案。这种系统架构能让设计工程师在莱迪思iCE40 UltraPlus或ECP5 FPGA上开发出实时在线的集成解决方案，具有延迟低、安全性高的特点，其中FPGA资源可用于系统控制。典型的一种应用就是使用独立运行的传感器实现人员侦测和计数。

图5：将sensAI作为独立运行的网络边缘AI处理解决方案

设计人员还使用sensAI开发两种不同类型的预处理解决方案。第一种情况下（图6），设计人员采用了莱迪思sensAI以及一片低功耗的iCE40 UltraPlus FPGA对传感器数据进行预处理，从而最大程度地降低了向SoC或云端传输数据进行分析的成本。例如，如果是用在智能门铃上，sensAI会初步读取来自图像传感器的数据。如果判断为不是人，比如说是一只猫，那么系统就不会唤醒SoC或连接到云端作进一步处理。因此，这种方法可以最大程度降低数据传输成本和功耗。如果预处理系统判断门口的对象是人，则唤醒SoC 作进一步处理。这能极大减少系统需要处理的数据量，同时降低功耗要求，这对于实时在线的网络边缘应用来说至关重要。

图6：在此案例中，sensAI会预处理传感器数据来判断该数据是否需要发送到SoC作进一步处理

在第二个预处理应用中，设计人员可以使用ECP5 FPGA实现神经网络加速（图7）。在此案例中，设计人员利用ECP5 IO的灵活性将各类现有的板载器件（如传感器）连接到低端MCU，实现高度灵活的系统控制。

图7：第二个系统架构也采用了预处理，设计人员可以使用ECP5和sensAI预处理传感器数据，加强神经网络的综合性能

设计人员还可以在后处理系统中使用sensAI加速器（图8）。越来越多的设计案例表明，很多公司虽然已经开发出经过验证、基于MCU的解决方案，但是他们希望在不更换组件或重新设计的情况下新增某种AI功能。但是在某些情况下，他们的MCU性能相对不足。典型的例子就是智能工业或智能家庭应用，在进行分析之前需要图像滤波。设计人员可以在这里添加另一个MCU，然后经历耗时的设计验证过程，或者也可以在MCU和数据中心之间添加加速器进行后处理，最大限度地减少发送到云端的数据量。这种方法对想要添加AI功能的物联网设备开发人员尤其有吸引力。

图8：通过sensAI增强该基于MCU的设计，让现有的设计支持网络边缘AI功能

结论

显然，未来几年将是实时在线的网络边缘智能设备这一市场发展的关键时期。由于应用变得越来越复

杂，设计人员将急需能够以低功耗支持更高性能的工具。莱迪思最新版本的sensAI技术配合ECP5和iCE40 UltraPlus FPGA，将为设计人员提供硬件平台、IP、软件工具、参考设计和设计服务，帮助他们战胜竞争对手，快速开发出成功的解决方案。

关键字：莱迪思引用地址：为网络边缘人工智能应用提供更高性能的解决方案

上一篇：宜鼎与微软合作，合力推出InnoAGE SSD
下一篇：贸泽备货适用于医疗耗材的Maxim安全器件

推荐阅读最新更新时间：2024-10-30 22:07

为网络边缘人工智能应用提供更高性能的解决方案

莱迪思半导体白皮书存在检测和对象计数等网络边缘人工智能应用越来越受欢迎，但设计人员越来越多地要求在不影响性能的情况下实现低功耗和小尺寸的网络边缘人工智能解决方案。莱迪思的sensAI技术集合的最新版本，适用于ECP5和iCE40 UltraPlus FPGA，为设计人员提供了在网络边缘实现低功耗、高性能AI所需的硬件平台、IP、软件工具、参考设计和设计服务。目录摘要利用FPGA的优势主要更新 sensAI设计案例结论摘要低成本、高性能的网络边缘解决方案的市场竞争日益激烈。领先的市场研究公司预测，在未来六年内，网络边缘解决方案市场将迎来大爆发。IHS预计到2025

[物联网]

莱迪思FPGA助力风能发展，创造可持续发展的互连世界

如今科技持续快速发展，影响了我们生活的方方面面，人工智能的快速发展则进一步推动了技术进步，使能系统（enabling system）和数据中心也需要越来越多的能源。这会导致电子废物和二氧化碳的排放增加。事实上，服务器和冷却系统占美国数据中心直接用电量的最大比重，是当今碳密集度最高的领域之一。越来越多的企业希望在其业务的各个方面采用可持续发展的实践方法。为了实现更加可持续的运营，他们会寻求各种机遇和解决方案，尽量减少现有和新基础设施和技术对环境的影响，从而减少能源消耗和电子废物生成。作为低功耗可编程器件的领先供应商，可持续发展深深植根于莱迪思的使命。莱迪思拥有强大且不断增长的创新低功耗解决方案产品组合，帮助客户实现

[嵌入式]

<font color='red'>莱迪思</font>FPGA助力风能发展，创造可持续发展的互连世界

莱迪思更新其解决方案集合，加速网络边缘的工业自动化

莱迪思更新其解决方案集合，加速网络边缘的工业自动化 -利用符合行业标准、基于AI的机器视觉和自动化功能加速智能工厂应用开发- 中国上海——2023年3月27日——莱迪思半导体公司，低功耗可编程器件的领先供应商，近日宣布更新Automate™和sensAI™解决方案集合，帮助客户实现最新的工厂自动化和工业机器视觉应用。两款产品均在莱迪思低功耗FPGA上运行，可实现高效、灵活和安全的工业应用开发，同时带来低功耗和小尺寸优势。莱迪思Automate（v 3.0）现支持OPC-UA（开放平台通信统一架构）和TSN（时间敏感网络），包括以下特性：  更新了IP库，新增RISC-V® freeRTOS（实时操作

[嵌入式]

莱迪思半导体将在CES 2013上展示实时3D视频转换器

美国俄勒冈州希尔斯波罗市  2012年12月17日  莱迪思半导体公司（NASDAQ: LSCC）今日宣布将于1月8日至11日在拉斯维加斯举办的消费电子展（CES）上召开一个“移动应用创新”见面会，届时将展示3D Impact Media的基于低密度LatticeECP3™ FPGA的实时3D 视频转换器RealityBox。莱迪思展厅位于拉斯维加斯酒店东楼2980号套房。若您希望预约一个时间来参观莱迪思展厅，探讨移动应用创新可以如何帮助您解决具体的设计难题，请点击莱迪思移动应用创新进行注册。使用RealityBox，任何2D以及3D立体视频流可以被转换和实时显示在裸眼3D显示器上，可用于新的应用，如在公共场所的现场活动

[嵌入式]

并购Lattice或有小障碍，CFIUS态度是关键

中资公司文件显示，并购基金Canyon Bridge Capital Partners本月稍早同意以13亿美元收购总部位于美国的芯片公司莱迪思半导体(LSCC.O)，该基金的部分资金来自于中国中央政府，并且基金与中国的航天计划有间接联系。路透查阅一系列中国国有企业登记文件后证实，对Canyon Bridge的投资来自于中国国务院。芯片产业及关注美国政府对海外投资审查决定的分析师表示，这种关联可能招致美国监管机构对莱迪思半导体收购案更缜密的调查，因担心通过收购所获得的技术或被用于中国的军事领域。 “这是一个危险信号，”美国战略与国际研究中心(Center for Strategic and International Studie

[半导体设计/制造]

Lattice半导体推出可编程、零延迟和单端通用缓冲ispClock5300S

Lattice半导体公司近日推出其系统内可编程、零延迟和单端通用缓冲器件家族的第一款器件ispClock5300S，该器件具有四种操作配置，支持实现多时钟分布网络。 ispClock5300S器件具有三个5位片上输出计数器，使之能从一个参考时钟生成最多三个时钟频率。输出时钟频率范围高达267MHz。其高性能表现在：通用扇出缓冲器具有最大为100ps的引脚与引脚间时钟偏差，而与时钟斜度及频率无关；最大周期与周期间输出抖动小于70ps；周期抖动小于12ps(rms)。每一个时钟网络输出与参考输入之间的偏差可以通过插入156ps(超前或延迟)的延迟增量来进一步控制，从而补偿电路板时钟网络走线长度的差异。通用扇出缓冲器支持各种单端逻

[新品]

莱迪思即将举办线上研讨会探讨其最新的高级系统控制FPGA

中国上海——2023年8月9日—— 莱迪思半导体公司（NASDAQ: LSCC），低功耗可编程器件的领先供应商，今日宣布将举办免费的线上网络研讨会，会议的主题是探讨莱迪思控制FPGA——最近发布的MachXO5T™-NX FPGA系列产品。该产品旨在帮助客户解决日益增长的系统管理设计复杂性方面的挑战。在研讨会期间，莱迪思将提供MachXO5T-NX高级系统控制FPGA产品系列的技术细节。该系列产品拥有先进的互连、更多逻辑和存储资源、稳定的可编程IO以及领先的安全性等特性。 • 举办方：莱迪思半导体 • 内容：使用下一代控制功能简化您的设计管理 • 时间：北京时间8月17日周四下午2:00 • 地点：在

[嵌入式]

莱迪思将举办网络研讨会介绍采用硬件可信根技术的最新安全解决方案

中国上海——2024年9月9日——低功耗可编程器件的领先供应商莱迪思半导体公司今日宣布将举办一场关于最新版本莱迪思Sentry™解决方案集合的网络研讨会，该解决方案为客户提供基于FPGA、定制化的平台固件保护恢复（PFR）解决方案，支持全新的莱迪思MachXO5D-NX™ FPGA系列器件。在网络研讨会期间，莱迪思将讨论不断变化的网络安全形势以及FPGA技术在构建网络弹性中的作用。 • 主办方：莱迪思半导体公司 • 内容：采用硬件可信根技术的最新安全解决方案 • 时间：北京时间9月26日下午2: 00至3: 00 • 地点：莱迪思网络研讨会（需要提前注册）

[嵌入式]

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■PI 电源小课堂|无 DC-DC 变换实现多路高精度输出反激电源

■有奖直播报名:大联大世平集团&恩智浦 | AI 无所不在，单板电脑也可以

■2024 瑞萨电子MCU/MPU工业技术研讨会——深圳、上海站，火热报名中

■Follow me第二季第4期来啦！与得捷一起解锁蓝牙/Wi-Fi板【Arduino Nano RP2040 Connect】超能力！