GPU模型推论效能升级边缘运算装置AI更强大-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

GPU模型推论效能不断提升，各种边缘运算装置上所内建的人工智能(AI)能力也变得更加强大。 NVIDIA旗下软件目前已可协助客户做8位与16位的神经网络运算优化，不仅让GPU模型的推论(Inference)更形完善，同时对硬件资源的需求也明显降低，只需要一小块电路板就能支持AI算法。

针对边缘运算日益渐增的需求，NVIDIA近期推出了新款开发版Jetson TX2，将整套人工智能系统缩小在一块电路板之上，为商用无人机、工业机械、智能型摄影设备等领域，提供进阶的导航、影像与语音识别功能。相较前一代产品Jetson TX1，Jetson TX2的效能提升了两倍，耗电量则不到7.5瓦，能源效率提升了两倍多。这让Jetson TX2可在终端装置上运行更大、更深的神经网络，进而开发出更高智能化的装置，并提升影像分类、导航以及语音识别等作业的精准度与反应速度。

NVIDIA技术营销经理苏家兴表示，对于训练好的模型，NVIDIA也提供Tense RT软件来协助客户做模型优化、缩小化，其支持整数8位与浮点数16位的运算。目前的主流是以32位的运算去做训练，该16位运算也就减少了一半，增加了一倍的效能，8位则增加了四倍的效能，因此在模型推论上能运作的更好。

苏家兴进一步表示，无论是软件还是硬件公司，都需要对训练好的深度学习模型进行优化，除了边缘设备会采用缩小化的模型，在服务器与数据中心端，也会有某些情境需要采用这些优化过的模型去做推论。举例而言，Facebook、百度在做语音识别的推论时，若能透过优化的模型让运作更快，势必能让消耗的功耗越少。

不过，也并不是所有的应用都适合做前端边缘运算。以AlphaGo来看，其是以32台服务器在做运算，因AlphaGo运算量非常大，所以就不太可能进行边缘运算，因1台服务器与32台服务器运算的精准度，绝对是有差异的。若以语音识别来看，即便可以同时采用在线与脱机的方式进行，但精准度也势必会有落差。

苏家兴指出，应用开发商必须尽快分辨出哪些运算任务适合采用边缘运算，哪些部分还是得留在服务器端执行。举例来说，当无人机飞到有些没有网络的地方，便必须运用边缘运算，设计出可承载范围内的推论。 NVIDIA相信，未来数据中心与边缘运算将会并存，但在瞄准的应用上必定会有所不同。

关键字：GPU 编辑：王磊引用地址：GPU模型推论效能升级边缘运算装置AI更强大

上一篇：始于ARM与三星：苹果自行设计的SoC是怎么走到今天
下一篇：Gartner发表超乐观预期今年芯片市场规模可望成长12%

推荐阅读最新更新时间：2023-10-12 23:41

ARM Mali GPU: 抽象机器帧管线化

图形工作负载的优化对于许多现代移动应用程序而言往往必不可少，因为几乎所有渲染现在都直接或间接地由基于 OpenGL ES 的渲染后端负责处理。本文介绍如何将 ARM®DS-5™ Streamline™ 性能分析工具用于 Google Nexus 10，对利用Mali™-T604 GPU 的图形应用程序进行性能分析和优化。Streamline 是一款强大的工具，能够深入细致地洞悉整个系统的行为，但也需要驾驭它的工程师能够解读相关数据，识别问题区域，进而提出修复建议。对于初涉图形优化的开发人员而言，起步阶段总会遇到一些困难，所以我写了新的系列博文，给开发人员提供必要的知识，以便他们能够成功地针对 Mali GPU进行优化。在整个

[单片机]

ARM Mali <font color='red'>GPU</font>: 抽象机器帧管线化

英伟达赚钱能力创历史新高 GPU供不应求老黄也很急

　　英伟达不愧是英伟达。下面就随嵌入式小编一起来了解一下相关内容吧。　　昨晚，美国股市再次遭遇重挫，道琼斯指数惨烈下跌1033点，创出史上第二大单日下跌记录。市场一片愁云惨淡，累及全球股市。　　就在这样的一天，英伟达发布了第四季度和全年财报。财报发布后，英伟达股价逆市飙升，盘后交易时段股价一度上涨超过14%。　　这份财报显示，英伟达的赚钱能力，继续创出历史新高。　　黄仁勋的公司有多能赚钱? 　　过去一年，英伟达收入创历史新高，达到97.1亿美元;毛利率也比上一年高，达到60%;净利润30.5亿美元，同比增长83%。　　而刚刚过去的一个季度，英伟达的收入同样创历史新高，达到29.1亿美元。英伟达第四季度的营收

[嵌入式]

Imagination 的 PowerVR G6230 64 核 GPU 提升 UltraOcta A80 处理器的 GPU

2014 年 3 月 4 日 ——Imagination Technologies 表示，移动应用处理器的全球领导厂商全志科技（Allwinner Technology）今天发布了该公司的下一代 UltraOcta A80 处理器，其中内置了 PowerVR Series6 GPU，据称是全球第一款 8 核异构 SoC 芯片。全志科技表示，UltraOcta 处理器是为了实现以更低价格将顶级性能设备带给消费者而设计的，能为平板电脑、OTT 媒体播放器、笔记本电脑、一体机，以及甚至智能电视等产品开创新的细分市场并推动价值创新的机会。全志科技首席执行官张建辉（Mike Zhang）表示：“我们非常兴奋能发布这款与 Imag

[嵌入式]

台媒：华为海思正在向电脑CPU和GPU进军

过去10年华为坚持自主研发芯片的大计，已由旗下海思完成大半。不过近期在台湾半导体上、下游产业链中流传，面对当前的局势变化，华为已经将坚持自主研发芯片的大计进行了升级。供应链相关人士指出，海思目前正在开发设计多种芯片，从移动设备使用的一系列芯片，到多媒体显示芯片及电脑使用的CPU、GPU，海思都在尝试，且有新品力作。而且，海思芯片使用的技术全部集中在台积电7纳米以下先进制程技术，同时顺势包下台湾后段封测厂及下游PCB行业的产能。半导体人士透露，海思最新开发的芯片解决方案较偏重于多媒体及运算技术。一般预测，海思此举是为了填补海思在主力移动设备芯片之外的技术空白。但也有可能是为了满足华为在5G时代积极布局的智能显示

[嵌入式]

台媒：华为海思正在向电脑CPU和<font color='red'>GPU</font>进军

NVIDIA为AI研究人员开放GPU云端服务

NGC进一步导入NVIDIA TensorRT推论加速器、ONNX相容模式并支援MXNet 1.0 辉达(NVIDIA)宣布，采用桌上型GPU的AI研究人员即日起可透过NVIDIA TITAN获取 NVIDIA GPU云端(NGC)的强大运算效能，并宣布扩充NGC功能，将新软体与其他重要功能导入容器中，为研究人员提供范围更广、功能更强的工具组合，协助推展AI与高效能运算的研究与发展。 NVIDIA Pascal架构TITAN GPU的使用者可免费注册NGC帐号并获得完整涵盖针对深度学习和HPC所进行GPU最佳化的软体与工具。其他支援的运算平台也包括NVIDIA DGX-1与DGX Station以及在Amazon EC2上以N

[半导体设计/制造]

自研GPU/ISP 苹果宣布全新处理器A11

今年的重头大戏已经来开序幕，iPhone 8跟我们见面了，没错还有iPhone 8 Plus，你可以把这两者看作是iPhone 7和7 Plus的升级版，只是名称换的更高大上了。iPhone 8、8 Plus最大升级，应该是都搭载了新的A11处理器，性能比A10更强是情理之中的事情。苹果在发布会上强调，A11的CPU（6核CPU）性能至少比A10快了25%。此外，A11中最大的改变就是内置了苹果自研的GPU，官方强调比上代快了至少30%，更重要的是，独立的ISP也是苹果自研的，其可以在低光或者暗光下有更好的进光表现。最后，苹果强调A11在AR上有更好的支持，而这代新处理器拥有43亿个晶体管，作为对比麒麟970华为官方强调是5

[半导体设计/制造]

黄仁勋狂怼CPU:摩尔定律已死未来属于GPU

今天上午，GPU芯片厂商NVIDIA在北京召开了GTC技术大会。会上，NVIDIA声称要开启AI时代的计算新纪元，不仅重磅发布了首款可编程推理加速平台NVIDIA TensorRT 3、自动驾驶开放平台NVIDIA DRIVE、首款自主机器处理器Xavier，同时宣布，NVIDIA Tesla V100 AI平台已经被包括BAT在内的大多数中国巨头采用。 | 摩尔定律已终结，GPU将引领计算革命黄仁勋声称，摩尔定律已经终结，设计人员无法再创造出可以实现更高指令集并行的GPU架构，晶体管数量每年增长50%，但CPU的性能每年仅增长10%。接着，黄仁勋介绍了基于Volta的全新系统的核心NVIDIA V100数据中心GPU。该G

[半导体设计/制造]

CPU+GPU希望重燃?

通过对ATI的大胆收购，Jerry Sanders等人共同创立的AMD公司近期内将使PC产业的供应商关系重新“洗牌”；而从长远意义上来说，随着个人计算机逐渐演进为一个娱乐平台，AMD的收购将重新燃起CPU与图形处理器集成的希望。另外，此次交易强力推动AMD进入利润丰厚的高端手机和HDTV市场(英特尔也已冒冒失失地试水这些领域)。“在这个技术融合的时代，我们认为将一个具有快速增长的、成功的消费电子业务的公司纳至麾下，是一个巨大优势。”AMD主席兼CEO Hector Ruiz在此次兼并声明后的一次电话会议上表示。这次封顶之作为时数周，但仍然引起诸多惊异。某些人对54亿美元的成交价啧啧称奇；另一些人则对AMD的收购行为

[焦点新闻]