AI加速器竞争白热化 NVIDIA捍卫江山有筹码-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

随着人工智能(AI)服务器GPU加速器需求转热，越来越多大厂投入市场，不禁令人好奇，面对新对手接连进逼，一直处于领先地位的NVIDIA如何捍卫江山，未来是否有筹码还击。

当市场需求攀升，少数供应商得到丰厚的获利时，更多的厂商即会相继投入抢食大饼，这是基本的经济运作。在AI加速器市场亦然，NVIDIA早期跨入此领域，拜企业和云端服务业者AI相关投资与日具增之赐，NVIDIA的Tesla GPU需求畅旺，公司业绩也大进补。

以2017年上半为例，NVIDIA首季数据中心产品销售激增逾2倍，第2季续增186%。NVIDIA在AI领域耀眼的表现引起其他科技大厂的注意，过去1年来包括英特尔(Intel)、超微(AMD)、富士通(Fujitsu)和Alphabet相继推出AI服务器加速器，或宣布准备进军市场。

随着市场竞争逐渐白热化，NVIDIA该如何维持竞争优势？这可以从比较NVIDIA的GPU和对手产品找到答案。服务器CPU与PC和移动CPU一样，仅能容纳少量相对强而有力的CPU核心，例如最强而有力的英特尔Xeon Scalable服务器CPU有28核。反观GPU可以有上千个小核心并行运作。也因此，对于不断地进行演算和推论的AI深度学习训练而言，GPU比CPU更适合。

推论演算法不一定要求巨大的处理能力，GPU就可以应付这些任务，有鉴于此，NVIDIA试着让GPU在此获得更多的采用。不过，许多服务器端的推论工作仍然以英特尔的Xeon CPU为主。苹果(Apple)因隐私权的关系，偏好直接在iOS装置以AI演算法处理用户数据。

然而，训练深度学习模型来创造演算法解读数据，例如自动驾驶系统翻译简讯或侦测交通号志等都需要密集的运算，训练过程中，数千甚至数百万个人工神经元化分成许多“层”(layer，如输入层、隐藏层、输出层等)来负责不同的任务，以及和其他层的神经元沟通，以便判断数据分析后的结果是否无误，例如输入的影像是否为停车标志(stop sign)等。

比起不到30核心的CPU，AI研究人员利用多个拥有数千个核心的Tesla GPU来分担人工神经元的工作，训练深度学习模型将加快许多。深度学习演算是一种复杂的数学，而这正是NVIDIA的Tesla GPU擅长的领域，它还可以提供一个具有众多存储器频宽的模型，以及高速连结芯片来进行沟通。

但这并不意味着GPU是唯一适合训练深度学习模型的处理器，理论上芯片制造厂也可以开发一个配备数千个核心，专为处理深度学习演算而设计的特殊应用积体电路(ASIC)，让它们能与存储器或其他ASIC快速沟通。

英特尔似乎有这样的想法，2016年收购Nervana Systems取得必要的技术和人才后，着手打造深度学习ASIC“Lake Crest”。英特尔号称Lake Crest的并行处理能力是前所未见的水准，原始运算能力比当前最先进的GPU(显然指的是NVIDIA)还强。此外，Lake Crest还可支援每秒1兆位元(TB)的存储器频宽，连结速度比标准PCI Express快20倍。

Lake Crest将于年底问世，英特尔同时也准备推出Knights Crest，此为整合Nervana技术的Xeon Phi协同处理器其中的一个版本。Xeon Phi芯片应用于较不复杂的AI专案，以及高速运算(high-performance computing；HPC)工作负载上。

Google最近发表第二代Tensor Processing Unit(TPU)，第一代TPU仅有推论能力，新的TPU则可训练深度学习模型。Google宣称TPU模组在特定的深度学习运作中，可以达到每秒180兆次的浮点运算(teraflop)，比NVIDIA最近发表的Tesla V100旗舰服务器GPU的120 teraflop还快。不过，TPU仅能与Google的TensorFlow软件架构并用，而且Google不打算销售TPU，只用于公司内部AI开发，以及让云端客户使用。

其他大厂如AMD最近推出Radeon Instinct服务器GPU，其中最强的M125是不错的产品，但以原始效能来看仍落后V100，特别是64-bit运算时，而且存储器频宽也比较少，目前显然不至于对Tesla GPU构成威胁。此外，富士通最近也宣布要在2018年会计年度发布一个ASIC深度学习处理器。

不过，尽管新对手来势汹汹，NVIDIA拥有强有力的武器来予以迎击。其中之一是庞大的GPU研发支出，NVIDIA主要用于打造新的GPU架构，特别是深度学习的GPU。例如Tesla V100采用新的Volta GPU架构，同时使用了5,120个传统的CUDA GPU核心和640个tensor核心作为深度学习训练之用。

但就长期而言，NVIDIA最大的竞争优势或许起步比别人早，围绕着Tesla GPU的AI生态系统已经成形。现在开发者逐渐习惯使用NVIDIA的CUDA GPU应用程式介面(API)，以及深度软件开发套件的各种工具，包括cuDNN软件图书馆等。

NVIDIA的生态系统也吸引其他科技巨擘的参与，4月NVIDIA和Facebook宣布共同合作，为Tesla GPU提升Facebook的Caffe2 AI软件架构。不久之后，微软(Micorsoft)也宣布，该公司新版SQL服务器数据库将可与Tesla GPU一起运作处理深度学习的工作。

关键字：AI 编辑：王磊引用地址：AI加速器竞争白热化 NVIDIA捍卫江山有筹码

上一篇：AI应用需要何种芯片 CPU、GPU、FPGA、ASIC各有所长
下一篇：英特尔物联网策略排除Quark处理器

推荐阅读最新更新时间：2023-10-12 23:50

AI徕卡双加持华为Mate 10发布会看点汇总

10月20日华为将在上海举办新品发布会，最新旗舰华为Mate 10就将正式与国内的朋友见面。尽管Mate 10已经在德国慕尼黑正式发布，关于产品的一些细节都已公布，但Mate系列作为国产旗舰手机的代表，依旧承载了众多期待。特别是作为麒麟970的首发机型，结合人工智能的Mate 10会带来怎样的体验？与徕卡在成像方面又会有怎样的突破？都等10月20日发布会正式揭晓。　　延续双机型配置，Mate 10 Pro将推全面屏　　已经确认，华为Mate 10会有两个版本，其中一个版本是我们熟知的Mate 10，传承了Mate系列成熟的设计语言，搭载5.9英寸2K屏幕，进一步缩小手机额头与下巴的面积，带来更高的屏占比。与先前的全金属

[手机便携]

人工智能新力量puppy进军机器人市场

5月17日，小狗机器人技术有限公司（下文简称“小狗机器人”）品牌暨新品发布会邀请函曝光后，引发了业内的好奇。2016年，谷歌旗下DeepMind公司AI系统“阿尔法狗”和世界围棋冠军李世乭的“划时代大战”，让从业者看到了人工智能、机器人领域的光明前景。大批企业踊跃投身于这个行业，“小狗机器人”就是其中之一。大背景是，近两年云计算、大数据等互联网技术发展越来越快，在此基础上，视/听觉语义理解、处理和反馈，自然语言理解和处理，神经网络、情感识别算法等技术获得了长足进步。人工智能得到多重技术的共同作用，在人机交互层面带来了颠覆性的应用改进。未来机器人与人工智能结合是大趋势，具备良好的人机交互应用体验之后，“智能机器人”才算真正落地。

[机器人]

英国警方准备使用人工智能预测犯罪

AI 在未来或许可以帮助警察在犯罪发生之前对其进行预测，并及时制止。但与「少数派报告」不同的是，英国警方提出的计划采取更为友善的干预方式，而不会像电影中一样，让特警队破门而入。不过该计划仍然引发了对伦理问题的大量争论。近日，据 New Scientist 报道，英国警察正希望使用人工智能预测严重暴力犯罪。这一计划的执行方式是：被计算机系统标注的高风险人群将被提前干预，例如接受询问，以避免潜在的犯罪行为。然而，世界领先的数据科学研究机构在看到这一提案的编辑版本之后表达了对该项目的严重关切。英国提出的 AI 系统名为国家数据分析解决方案（NDAS），它使用人工智能和统计数据来评估个人试图持枪或持刀犯罪的可能性，同时也可以评估个人

[安防电子]

医疗AI要怎么做才能实现技术场景落地？

从AlphaGo大战柯洁，到Open AI 血虐Dota2半职业选手，AI再次登上了历史的舞台。自2012年以后，得益于数据量的上涨、深度学习的出现的运算力的大幅提升，人工智能开始大爆发。然而，就在今年3月，“中国AI公司遭遇C轮死”引起哗然；5月有报道称IBM 医疗部门大幅度裁员，规模达50％－70％；随后美国医学媒体STAT有消息传出，STAT拿到了来自时任IBM Watson Health副首席健康官的Andrew Norden的文件，该报告显示正在使用Watson for Oncology（Watson肿瘤解决方案）的医生们提出了强烈的批评，指出 Watson经常提出不准确的医疗建议，这让IBM Watson陷入了历

[医疗电子]

脚踏实地的AI黎明：我们将会在CES上看到的智能技术

在过去的几年里，人工智能驱动的设备和服务一直是全球技术展会上最受欢迎和有趣的项目。2018年除此之外还在市场上有了明显的新趋势。首先，主流消费产品越来越多地集成人工智能，而不仅仅是那些高端和高级产品。第二，很多产品将人工智能内置到前端设备中，而不是依赖于云端。这些趋势正在改善智能应用程序的易可访问性、隐私和效率，使它们被更广泛地采用。全球最大的消费类电子产品和技术贸易展就在眼前，来看看今年将会有哪些引人注目的创新和有趣的产品以及驱动它们的最新技术。 3D视觉的力量：从陪伴机器人到解构的单反相机 Buddy是一个家庭助理机器人，可以在家中导航移动，它获得了CES最佳创新奖（机器人和无人机类别）。这个机器人配备了3D视觉和多个传感器，

[手机便携]

谷歌迷你Coral开发板即将发售

到2020年10月，谷歌推出的mini-SBC，迷你Coral开发板终于要发售了，会放在Coral Store和Seeed Studio上，预计发货日期为10月31日。这种新的SBC有一个40针连接器，用于与先前发布的TPU加速器模块接口，在设计之初Google就考虑了人工智能属性。它运行的是Debian的Linux衍生产品Mendel，对许多Linux工具和应用程序开放支持。它还支持AutoML Vision Edge。新的主板采用联发科8167s SoC（四核Arm Cortex-A35）处理器，采用IMG PowerVR GE8300集成图形，它有2GB的LPDDR3内存。它支持蓝牙和无线连接。您可以

[嵌入式]

俄欲借人工智能实现高新技术产业突破

据报道，俄罗斯总统网站公布的一份文件表示，俄罗斯将于2019年6月制定人工智能领域的国家战略。根据总统网站公布的总统国情咨文所涉任务实施清单，俄政府被责成在2019年6月15日之前制定出俄在人工智能领域的国家战略，并在7月1日之前制定出额外措施，以刺激对人工智能、物联网、机器人技术和大数据处理领域内的中小企业高科技项目的投资。与美国、法国等综合性世界科技强国相比，俄罗斯在高新技术市场的表现并不抢眼，除了军工与航天领域外，综合实力并不突出。因此，作为尚未定型的未来市场，人工智能可能成为俄罗斯实现高新技术产业突破的“潜力股”。俄罗斯现代人工智能研究始于上世纪70年代。经过约50年的研究开发，俄人工智能技术已取得诸多研发成果并逐渐

[机器人]

瑞萨电子整合Reality AI工具与e2 studio IDE 扩大其在AIoT领域的卓越地位

设计人员能够在嵌入式和AI/ML项目间共享数据，从而简化边缘与端点AI应用的创建 2023 年 9 月 21 日，中国北京讯 - 全球半导体解决方案供应商瑞萨电子今日宣布已在其Reality AI Tools®和e2 studio集成开发环境间建立接口，使设计人员能够在两个程序间无缝共享数据、项目及AI代码模块。实时数据处理模块已集成至瑞萨MCU软件开发工具套件（注），以方便从瑞萨自有的工具套件或使用了瑞萨MCU的客户硬件收集数据。此次整合将缩短物联网网络边缘与终端人工智能（AI）及微型机器学习（Tiny ML）应用的设计周期。瑞萨自2022年收购Reality AI以来，一直致力于研究、改进并简化AI设计。Re

[半导体设计/制造]