CEVA推出新一代适用于AI/ML的NeuPro-M IP-电子工程世界

CEVA凭借NeuPro-M异构安全处理器架构重新定义边缘 AI 和边缘计算设备的高性能 AI/ML 处理

•第三代 NeuPro AI/ML 架构在 SoC 和小芯片层面提供 20至1,200 TOPS可扩展性能，能够将内存带宽消耗减低六倍

•目标是在汽车、工业、5G 网络和手机，监控摄像头和边缘计算领域中广泛使用 AI/ML处理

CEVA，全球领先的无线连接和智能传感技术及集成IP解决方案的授权许可厂商宣布推出用于人工智能和机器学习 (AI/ML) 推理工作的最新一代处理器架构NeuPro-M。NeuPro-M由多个专用协处理器和可配置硬件加速器组成，是瞄准广阔的边缘 AI 和边缘计算市场的异构处理器架构，能够同时无缝处理深度神经网络的各种工作，性能较上一代产品提升 5到15 倍。NeuPro-M支持系统级芯片(SoC)和异构SoC (HSoC)可扩展性，最高性能可达 1,200 TOPS，并提供可选的稳健安全启动和端至端数据隐私功能，开创了业界先河。

NeuPro–M系列处理器初始包含以下预配置内核：

•NPM11 – 单个 NeuPro-M 引擎，在 1.25GHz 下算力高达 20 TOPS

•NPM18 – 8 个 NeuPro-M 引擎，在 1.25GHz 下算力高达 160 TOPS

在处理 ResNet50卷积神经网络时，单个 NPM11内核可将性能提升至上一代产品的五倍，并将内存带宽消耗减少六倍，从而实现高达 24 TOPS/W的出色功效，完美体现其业界领先的性能水平。

以成功的上一代产品为基础，NeuPro-M能够处理所有已知的神经网络架构，并集成了下一代网络，如transformer、3D convolution、self-attention和全部类型的循环神经网络的原生支持。经优化的NeuPro-M可处理 250 多种神经网络、450 多种AI 内核和 50 多种算法。嵌入式矢量处理单元(VPU)确保对未来新的神经网络拓扑和AI处理工作提供基于软件的验证和支持。而且，对于常见基准测试，CDNN离线压缩工具可以将NeuPro-M的FPS/Watt性能提高 5到10 倍，并且对精度仅有极小的影响。

CEVA副总裁兼视觉业务部门总经理 Ran Snir评论道：“随着生成的数据越来越多，以及传感器相关软件工作负载不断迁移到神经网络以获得更好的性能和效率，对边缘 AI和边缘计算的人工智能和机器学习处理需求的增速惊人。由于这些设备的功率预算保持不变，我们必需找到创新方法，在这些日益复杂的系统边缘使用人工智能。我们利用在数百万台无人机、安全摄像头、智能手机和汽车系统应用等设备中部署 AI 处理器和加速器的丰富经验来设计NeuPro-M架构。NeuPro-M创新的分布式架构和共享内存系统控制器将带宽消耗和延迟降至最低，并提供出色的整体利用率和电源效率。这允许我们的客户在 SoC 或小芯片 (chiplet) 中连接多个NeuPro-M兼容内核来应对最严苛的 AI 工作，从而将智能边缘处理器设计提升至全新的水平。”

NeuPro-M异构架构由特定功能协处理器和负载平衡机制组成，相比上一代产品，这是实现巨大的性能和效率飞跃的重要因素。通过将控制功能分配给本地控制器并以分层方式实现本地内存资源，NeuPro-M 实现了处理数据流的灵活性，从而实现超过90%的利用率，并且在任意给定时间内防止不同协处理器和加速器出现数据不足现象。它使CDNN 框架根据特定网络、所需带宽、可用内存和目标性能来实施各种数据流方案，从而获得最佳的负载平衡。

NeuPro-M 架构亮点包括：

•由 4K MACs(乘累加单元)组成的主网格阵列，混合精度为 2到16 位

•用于权重和激活操作的Winograd transform引擎，可将卷积时间减少两倍，并允许在精度降低到少于0.5% 的情况下进行 8 位卷积处理

•用于避免每层具有零值权重或激活操作的Sparsity引擎，最多可将性能提升四倍，同时减少耗用内存带宽和降低功耗

•具有完全可编程的矢量处理单元，用于处理未获支持的全新神经网络架构(具有全部数据类型)，从 32 位浮点到 2 位二进制神经网络 (BNN)

•将可配置的权重数据压缩至两位，同时读取内存时进行实时解压缩以减少耗用内存带宽

•使用动态配置两级内存架构，最大限度地减少与外部 SDRAM 之间的数据传输功耗

使用NeuPro-M 架构中创新功能，同时使用 Winograd 变换正交机制、Sparsity引擎和低分辨率 4x4 位激活，可将网络(如 Resnet50 和 Yolo V3)的循环次数减少三倍以上。

由于神经网络权重和偏差以及数据集和网络拓扑成为所有者的重要知识产权，因而业界迫切需要保护这些信息免遭未经授权的使用。NeuPro-M架构可选用信任根、身份验证和加密加速器来支持安全接入。

针对汽车市场，CEVA提供NeuPro-M 内核及其 CEVA 深度神经网络 (CDNN)深度学习编译器和软件工具包，不仅符合汽车 ISO26262 ASIL-B 功能安全标准，并满足严格的质量保证标准 IATF16949 和 A-Spice要求。

结合CEVA 屡获殊荣的神经网络编译器 CDNN 及其功能强大的软件开发环境，NeuPro-M架构可为客户提供一个完全可编程的硬件/软件 AI开发环境，最大限度地提升 AI操作性能。CDNN 包含创新的软件，能够充分利用客户的 NeuPro-M定制硬件来优化功耗、性能和带宽。CDNN 软件还包含了用于减少耗用内存和优化负载平衡算法的内存管理器，并广泛支持各种网络格式(包括 ONNX、Caffe、TensorFlow、TensorFlow Lite、Pytorch 等)。CDNN 与常见的开源框架 (包括 Glow、tvm、Halide 和 TensorFlow) 兼容，并包含模型优化功能，例如“层融合(layer fusion)”和“训练后量化(post training quantization)”，同时使用精确的守恒方法。

目前CEVA向主要客户提供NeuPro-M授权许可，并于今年第二季提供全面授权许可。CEVA 还为客户提供异构 SoC 设计服务，帮助其进行系统集成并支持系统设计和小芯片开发，从而为NeuPro-M客户带来裨益。

关键字：CEVA 处理器 AI 边缘计算引用地址：CEVA推出新一代适用于AI/ML的NeuPro-M IP

上一篇：EML Payments Ltd.选择Netcetera提供新的访问控制服务器 (ACS)
下一篇：Bmmpr采用Nordic的蓝牙SoC作为其安全防盗器的核心处理器

推荐阅读最新更新时间：2024-11-11 11:14

一种基于DSP处理器的车载导航系统设计方案

　　数字信号微处理器DSP具有高速运行与数据处理的功能，以其高性能和低功耗的优势为实时导航系统的数学计算提供了有效的硬件平台。在现代武器装备中，设计了基于DSP芯片的车载导航系统，其在民用和军事领域均发挥着重要作用，系统具有高可靠性、安全性等特点。　　1 车载导航系统工作原理　　车载导航系统的主要功能是定时采集陀螺正交编码信号、加速度计的输入和里程计输入信号，并对采集的数据进行必要的处理，以实现导航解算。同时将采集数据通过RS422 总线和 CAN总线发送至地面监测设备;并通过RS422总线接收相关的命令及参数。该系统结构如图1所示。　　　　2 系统硬件设计　　2.1 处理器及存储器设计　　车载导航系统

[嵌入式]

芯鼎科技选择CEVA图像和视觉DSP用于数字视频和图像产品线

针对先进智能互联设备的全球领先信号处理IP授权许可厂商CEVA公司宣布中国台湾领先的数字视频和图像SoC系统解决方案供应商芯鼎科技已经获得授权许可，将CEVA图像和视觉DSP 用于瞄准汽车、无人机、监控摄像机市场的下一代SoC器件中。芯鼎科技将会充分利用这款DSP功能强大的计算机视觉和图像增强功能，显着提升其智能摄像机SoC支持的功能特性。芯鼎科技副总经理魏德宗表示：芯鼎科技致力于开发具有出色性能和成本效益的超低功耗高创新型SoC器件，CEVA图像和视觉DSP可让我们为SoC器件增添先进的计算机视觉功能，允许客户创建具有差异性的先进智能摄像机产品。 CEVA市场营销和企业发展副总裁Eran Briman表示：

[嵌入式]

芯鼎科技选择<font color='red'>CEVA</font>图像和视觉DSP用于数字视频和图像产品线

NVIDIA跨足智能城市 AI技术进驻安控应用

NVIDIA宣布推出NVIDIA Metropolis智能影像分析平台，为打造人工智能(AI)城市铺路。现已有超过50家AI城市合作厂商，采用NVIDIA深度学习解决方案进行实时洞察让小区生活更加安全且更智能化，并改善交通及资源使用。 NVIDIA副总裁暨Tegra事业部总经理Deepu Talla表示，深度学习促成许多功能强大的智能影像分析方案，将匿名影像实时转化为有用情资，进而提升安全并改善生活。 NVIDIA Metropolis平台让用户将人工智能技术应用于每个影像串流上，打造更智能化的城市。事实上，影像是全球最庞大的数据源，许多画面是透过成千上亿建置在政府资产、大众运输、商业建筑以及道路等区域的摄影机记录而成。预估

[半导体设计/制造]

贸泽Methods 技术杂志带你了解物联网智能边缘计算

专注于引入新品推动行业创新的电子元器件分销商贸泽电子 ( Mouser Electronics ) 宣布发表新一期 Methods 技术与解决方案电子杂志。本期为Methods杂志第2卷第3期，主要介绍了传统边缘设备如何演进为具备处理和决策能力且更智能的边缘设备，可代为执行当前云端任务。在此新一期Methods杂志中，贸泽专家详细分析了各个行业如何以及为何要向更智能边缘发展，从而将计算任务直接嵌入到设备中，使物联网 (IoT) 层转型为端到端解决方案平台。本期杂志还包含市面上少有的设备安全性内容，并分析了边缘计算对网络设计带来的影响。贸泽电子市场部资深副总裁Kevin Hess表示：“边缘计算对

[物联网]

ARM指令协处理器处理指令

ARM支持16个协处理器，在程序执行过程中，每个协处理器忽略属于ARM处理器和其他协处理器指令，当一个协处理器硬件不能执行属于她的协处理器指令时，就会产生一个未定义的异常中断，在异常中断处理程序中，可以通过软件模拟该硬件的操作，比如，如果系统不包含向量浮点运算器，则可以选择浮点运算软件模拟包来支持向量浮点运算 ARM协处理器指令包括如下三类： 1用于ARM处理器初始化ARM协处理器的数据操作 2：用于ARM处理器的寄存器和ARM协处理器的寄存器间的数据传送操作 3：用于在ARM协处理器的寄存器和内存单元之间传送数据这些指令包括如下5条 CDP协处理器数据操作指令 LDC协处理器数据读入指令

[单片机]

高通公司首席商务官Jim Cathey：5G+AI赋能数字未来

6月28日，2023 MWC上海盛大开幕。高通公司首席商务官Jim Cathey在GTI国际产业大会期间，发表主题为“5G+AI赋能数字未来”的演讲。演讲全文如下：下午好，很高兴再次来到上海，也很荣幸能参加今年的GTI峰会。当前，我们正快速迈向人与万物智能互联的世界。高能效处理、分布式智能和网络边缘侧连接的融合正在推动这一趋势，使得数十亿智能终端能够实时连接至云端，也可以与彼此相连。同时，这一趋势正赋能全新服务、商业模式和体验，不仅助力行业数字化变革，而且改变了人们工作、生活、沟通和联系的方式。 5G对于数字未来至关重要。5G的开启恰逢其时，它出现在疫情前，实现在AI发展的初期，并且为未来的6G打下了坚实的基础。5

[网络通信]

高通公司首席商务官Jim Cathey：5G+<font color='red'>AI</font>赋能数字未来

高通亮相2024世界人工智能大会暨人工智能全球治理高级别会议

高通亮相2024世界人工智能大会暨人工智能全球治理高级别会议，以创新与合作助力终端侧AI时代到来 7月4日-6日，2024世界人工智能大会暨人工智能全球治理高级别会议在上海举办。本届大会以“以共商促共享，以善治促善智”为主题，共商人工智能领域前沿技术、产业动向和向善治理。高通公司今年连续第七年参加大会，通过多场会议论坛分享自身在人工智能领域取得的创新成果，以及对于人工智能产业发展的新思考。同时，高通也在大会现场带来前沿技术演示，从AI基础技术研究、领先产品应用和未来行业赋能愿景等多个角度，展现了高通在终端侧AI领域的技术、产品和生态领导力，并分享了高通携手广泛生态伙伴以终端侧AI赋能产业合作创新的努力和成功实践。创新+合

[网络通信]

高通亮相2024世界<font color='red'>人工智能</font>大会暨<font color='red'>人工智能</font>全球治理高级别会议

回击ARM 英特尔将提供定制化X86处理器

ZDNet至顶网服务器频道 05月23日编译：据国外媒体报道，在新任CEO Brian Krzanich和新总裁Renée James掌管下的英特尔公司在策略上将面临一系列转变：这家芯片巨头希望进军除个人电脑和传统服务器市场以外的计算领域，扩大竞争优势。其中即包括为大型客户的服务器提供定制化X86处理器。英特尔过去曾在这方面做过一些尝试，现在则要与ARM及ARM的合作伙伴展开定制化竞争。英特尔此举也在意料之中，大家都希望处理器厂商应该提供带深度排序算法的芯片，芯片的器件应更耐高温，它们的电压和时钟频率是可改变的，以适应特别的温度环境。用户还期望芯片在因超频而超过标准处理器温度时的限时性能更理想。（在这方面ARM已有多年

[手机便携]

热门资源推荐
热门放大器推荐

小广播