作者:Arm物联网兼嵌入式事业部业务拓展副总裁 马健
智能摄像头技术正在逐步改变我们的生活,而未来,它将为我们彼此以及与周围世界的互动方式带来深刻的变化。从打造更安全、更高效的智慧城市,到实现安全、经济和绿色的无人驾驶技术,到在热带雨林中监控非法砍伐,这些场景都对先进机器视觉技术的需求日益增长。在多样而复杂的人工智能(AI)和机器学习(ML)应用场景对智能视觉系统的性能、实时性和可拓展性的推动下,摄像头系统越来越需要在端侧进行对图像、视频流以及其他传感器数据有效地进行分析处理,这就对摄像头硬件系统的处理能力的需求日益提高。简而言之,为了在边缘或终端摄像头上运行先进的AI工作负载,就需要更高性能的计算和智能数据处理技术,以满足高清成像、增强安全等应用需求。
随着笔记本电脑和智能手机的应用处理技术已经迁移到64 位,智能摄像头也开始转向采用64位处理技术,使得利用更先进功能的前沿应用也可以在智能视觉系统中无缝平滑实现。例如,在世界各地的智慧城市中,我们看到摄像头能够运行AI算法来检测人、宠物、包裹、车牌和其他物体。而且,随着摄像头本地算力的提升以及AI技术在智能摄像头中应用的不断扩展,智能视觉处理工作负载不仅有可能在摄像头内置的CPU以及日趋普遍的加速器上直接运行,而且这种边缘部署方式将越来越显示其优势,并有望成为主流。在这些技术发展的助力下,未来将有可能同时检测数百人或识别超速汽车的车牌,而无需再将大量数据传输到云端,影响处理的实时性。
为什么采用64 位处理技术至关重要?
通过迁移至64位处理技术,可以更好地利用先进的64位CPU硬件与身俱来的更高性能和效率。最重要的是,64位CPU架构具有增强的寄存器支持和更大的内存映射。寄存器数量和宽度的增加意味着可以在减少内存访问次数的情况下处理更大的数据集,从而加快数据处理速度。更强的寄存器支持也意味着开发者可以利用先进的编译器优化技术,从而进一步提高性能。由于数据集在进出本地内存的交换会影响性能,因此,当提升的寄存器支持结合了64位架构带来的内存映射增加,软件就可以直接访问更多的本地数据进行处理,从而减少了对内存交换的需求。
随着智能摄像头的成像要求日益提高,低端摄像头和中高端摄像头分别开始采用4K、8K分辨率。从1080p 提升至4K意味着在相同的编码方案下,摄像头传入视频流的数据率翻倍。此外,为了更好地识别物体,帧率需要从15fps 增加到30fps 甚至60fps,对数据率和性能的需求也将相应地继续扩增。更高的帧率将使摄像头能够以更高的精度检测、识别和辨别更小的物体与快速移动的物体。从多个视频流进行同步4K 编码的需求,也对CPU性能提出了更高的要求。而这些都能很好地通过64 位处理器获得满足。
此外,为了满足成像和机器学习工作负载对于性能和带宽不断增长的需求,智能摄像头需要支持浮点运算。Armv8-A64 位架构将单精度的每周期FLOPS1性能提高了2 倍,双精度中提高了5 倍,从而改善了用户体验。
另外,从Armv8架构中的可收缩矢量扩展(ScalableVector Extension, SVE)和Armv9 架构中的SVE2 开始,Arm通过对Neon的扩展在成像和机器学习方面取得了进展,这一点也很重要。
图1:面向当前和未来智能摄像头的Arm64 位CPU
提升机器学习性能
Arm64 位架构(称为AArch64)提供了更快、更大的内存访问,使机器学习模型能够更快地加载到内存。这种性能的提升可以加快执行来自智能摄像头的输入视频流的推理任务,从而更快地检测、识别和辨别图像中的物体。
为了充分利用视频编码器/解码器等片上加速器和处理器核心外部的机器学习硬件来实现高效的数据传输,必须优化内存带宽。提高系统内存流性能可以加快数据进出内存的速度,以供许多不同的硬件单元使用。图2显示了最常见的内存流基准,并展示了从32 位CPU 迁移到64 位CPU 时,性能可以提高3.75 倍。
图2:从Cortex-A7(32位)CPU迁移到Cortex-A35(64位)CPU时的内存流性能提升
实现高级安全功能
64位ARMv8-A 架构在其CPU中提供了原生安全功能,其中加密指令AES、SHA和CRC 可以在软件加密的基础上提供3 至11倍的性能提升,可用于小粒度加密技术。随着Arm继续提高关键加密操作的性能,智能摄像头能够持续改进其加密算法,以支持物联网应用对隐私和安全的持续需求。
图3:从Cortex-A7(32位)CPU迁移到Cortex-A35(64位)CPU(带有加密扩展)时的加密性能提升
对开发者的影响:软件和工具
与所有其他应用领域一样,软件和工具也将持续在智能摄像头领域发挥着重要作用,为广大的开发者持续创新提供动力,使新功能和应用源源不断地产生。随着对64 位Linux发行版的支持继续扩大,越来越多公司增加了对各种新功能的支持,如运行基于最新Arm 架构的容器调度器。
此外,Arm继续利用最新CPU 中的新功能来增强开源的GNU编译器工具链。Arm还增加了对领先的计算机视觉、图像处理和机器学习开源库OpenCV的支持,从而赋能更多的开发者能够轻松开发智能摄像头应用和产品。
来自Arm和更广泛生态系统的支持
Arm将持续在最新的64位架构规格版本中提供与数字信号处理、矢量处理、机器学习和安全有关的增强功能,所有这些都是未来几代智能摄像头需要的关键计算处理能力。
在所有智能摄像头中采用基于64 位的Arm处理器有诸多益处,其中关键的是可以得到来自生态系统的广泛支持。例如,AWS已经通过其AWS Sagemaker Neo服务,在任何支持64 位Armv8-A的设备上增加了对机器学习推理的支持,使得那些计划使用AWS云服务进行机器学习部署的公司可从中受益。
ProjectCassini等生态系统计划解决了物联网部署的两个主要障碍:可扩展性和碎片化。对于芯片合作伙伴、ODM、OEM、ISV、系统集成商和开发者来说,ProjectCassini 通过加快在不同的Arm64 位平台上部署云原生应用,释放了边缘和物联网计算潜力。而要能充分利用Project Cassini 和SystemReady® 计划的优势,64 位的计算平台是必不可缺的要素。
为了加速边缘设备的开发和部署,Arm在2021年10月发布了Arm 物联网全面解决方案(ArmTotal Solutions for IoT),其产品路线图呈现了包括Arm虚拟硬件在内的全面解决方案的愿景,使客户能够在芯片流片前启动软件开发的工作。
总结
如果您想要在智能摄像头生态系统中超越竞争对手,那么采用64 位处理技术至关重要。Arm乐于随时为开发者社区和合作伙伴提供支持,协助应对向64位处理技术过渡过程中的任何技术挑战。向64位迁移将会开创“双赢”局面。它将在性能、效率和安全方面为整个生态系统带来诸多裨益,并有助于摄像头满足未来的创新,进而改变我们的世界。
上一篇:LG开发出最新生物识别技术 用于汽车无钥匙启动
下一篇:苹果公司申请“车辆模块化充电系统”专利
推荐阅读最新更新时间:2024-11-03 13:39
- XR76112 PowerBlox、8A 和 12A 同步降压 COT 稳压器的典型应用原理图
- 使用 Analog Devices 的 LTC1595AIN8 的参考设计
- LT3091MPR 线性稳压器在并联器件中的典型应用
- IP5358-22.5W充电宝
- ESP8266NodeMCU
- 使用 ON Semiconductor 的 KA317TU 的参考设计
- 基于L7987L的、2A降压DC-DC开关稳压器(VIN = 4.5V至60V)
- 使用 Analog Devices 的 LT3091MPT7 的参考设计
- 适用于STM32L476RG MCU的STM32 Nucleo-64开发板,支持Arduino和ST morpho连接
- 使用 Analog Devices 的 AD6679BBPZ-500 的参考设计