英特尔：GPU 已过时，Nvidia 的人工智能之路会越来越难-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

刚刚上任的英特尔人工智能事业部（AIPG）首席技术长 Amir Khosrowshahi 表示，目前所使用 GPU 等级太低了，半导体产业需要构建全新的神经网络架构。

在出任这个新职位之前，Khosrowshahi 是 Nervana System（下简称 Nervana）的联合创始人兼首席技术长，Nervana 于 2016 年 8 月被英特尔收购，但并未对外披露具体的收购金额。 Nervana 利用最先进的技术来使用 GPU，而且还自行研发替代了标准的 Nvidia 汇编程序，从而让 Nervana 能够生成「次优」的架构体系。在英特尔大力部署人工智能战略的大背景下，该公司所能提供的技术迅速成为了发展的核心力量。

Khosrowshahi 本周四向 ZDNet 透露：「早在 Nervana 成立之初我们就着手研发自己的汇编程序，当时只是为了我们自己的研发需求，不过后来我们发现它要比 Nvidia 官方的库存快两到三倍，所以我们就将其开源了。」

Nervana 并不仅仅在软件方面发力，而且还创建了自己的目标向神经网络训练。

他说道：「神经网络是预先设定好操作的系列整合。它并不像人类和系统之间的互动，而是被描述为数据流的系列指令集。」

Khosrowshahi 表示，在执行图形渲染过程中辅助图形处理单元的部分功能是没有必要的，比如大容量暂存、顶点着色处理、渲染和纹理等。他表示：「GPU 中的大部分电路在部署机器学习之后是没有必要的... 这些东西会随着时间的推移而不断积累，最终产生了非常多无用的东西。」

他进一步解释：「对你来说并不需要的电路，在 GPU 芯片中不仅占据了很大一片空间，而且从能源利用率上考虑也产生了相当高的成本。神经网络则相当简单，利用小巧的矩阵乘法和非线性就能直接创建半导体来实现 GPU 的功能，而且你所创建的半导体非常忠诚于神经网络架构，显然这是 GPU 所无法给予的。」在设计思路上，CPU 有复杂的控制逻辑和诸多优化电路，相比之下计算能力只是 CPU 很小的一部分；而 GPU 采用了数量众多的计算单元和超长的流水线，但只有非常简单的控制逻辑并省去了快取，因而在需要大量计算的机器学习方面表现更好，而TPU则是专为机器学习的矩阵乘法设计和优化，因而在机器学习方面比 GPU 更胜一筹。

Khosrowshahi 给出的答案：就是目前尚在开发中的 Lake Crest，这是英特尔今年会针对部分客户提供离散加速器。但伴随着时间的推移，它将会成为 Xeon 处理器的最佳伙伴。

Khosrowshahi 解释：「这是一个张量（tensor）处理器，能够处理带矩阵运算的指令。因此指令集是矩阵 1 和矩阵 2 的相乘，不仅透过查询表运行而且这些大型的指令都是高级别的。」

「GPU 主要依靠一个个寄存器（Register），当访问（或者跳转到）某个寄存器，所执行的是元素和元素之间的相乘，这个级别是相当的低了。」

Khosrowshahi 表示，最近几年 Nvidia 已经努力让他们的 GPU 对神经网络更加友善，但是他们的 AI 芯片依然承担了大量图形功能。他表示：「如果只是依靠自己来推动芯片方面的改进，我认为未来 Nvidia 的进化将会变得越来越困难。」

与之对应的，英特尔则通过收购的方式来推进人工智能。

Khosrowshahi 说：「芯片产业的挑战是即将迎来颠覆性的全新架构：而现在英特尔所做的事情就是将其收入麾下。他们想要获得 FPGAs（现场可程序逻辑门数组），所以他们收购了 Altera。这真的是一个非常酷炫非常神经网络的架构。」

此外 Khosrowshahi 还纠正了很多人对神经网络的错误想法，他表示并不是将神经网络蚀刻到半导体上，大部分的功能依然通过软件方面来形成。

他说道：「神经网络大部分都体现在软件方面。所以即使是 Lake Crest，指令并不是『神经网络，执行这项任务』，而是透过矩阵和矩阵的相乘。芯片外层部分就是一些我们所熟知的神经网络，在经过培训之后能够根据用户需求来执行各种任务或者搜寻某种参数，当你拥有神经网络之后你就能做任何可以完成的事情。」

英特尔的其中一个人工智能架构将会对抗 Google 的定制 TPU。在 4 月 5 日搜寻龙头 Google 表示， TPU 的平均运转速度要比标准的 GPU/CPU 组合（比如 Intel 的 Haswell 处理器和 Nvidia 的 K80 GPU）快 15~30 倍。在数据中心计算功耗时，TPU 还提供 30-80 倍的 TeraOps/瓦特（如果未来使用更快的储存装置，这一数字可能还会提高）。

同样在今年 4 月 5 日，IBM 和 Nvidia 还宣布 Big Blue 在今年 5 月开始向特斯拉 P100S 提供 IBM Cloud 服务。

关键字：英特尔 GPU 编辑：王磊引用地址：英特尔：GPU 已过时，Nvidia 的人工智能之路会越来越难

上一篇：敦泰：Q1 IDC芯片出货量估季增双位数
下一篇：Google 公布 TPU 细节后，AI 界怎么看？

推荐阅读最新更新时间：2023-10-12 23:41

分析称2014年三星电子将在芯片市场赶超英特尔

　　北京时间12月10日早间消息，Gartner公布的数据显示，以销售额计算，今年英特尔在芯片市场仍将排名第一。这将是英特尔连续第19年排名第一。不过英特尔的市场份额预计将从去年的14.2%下降至13.8%。　　Gartner预计，英特尔的销售额今年预计将同比增长24.6%，至414亿美元。英特尔的销售增长将低于行业平均水平的31.5%。与此同时，作为市场排名第二的厂商，三星电子的销售额今年将同比增长约60%，至283亿美元。该公司的市场份额将从去年的7.9%上升至9.4%。　　Gartner的数据再次表明，近年来三星电子芯片业务的增长势头超过英特尔。今年8月，IC Insights也指出，从1999年至2009年

[半导体设计/制造]

英特尔助力多屏联动体验进入千家万户

新闻要点 − 英特尔携手行业伙伴，助力多屏联动及无线高清体验进入千家万户 − 歌华飞视业务、快播科技、TCL和联想等厂商的多款WiDi产品亮相2013英特尔信息技术峰会 − 基于第四代智能英特尔®酷睿TM处理器的超极本TM均将配备英特尔®WiDi技术 − 英特尔®WiDi技术推动全产业链支持Wi-Fi®联盟MiracastTM认证标准，为用户带来革命性体验突破英特尔信息技术峰会，北京，2013年4月10日 — 在今天开幕的英特尔信息技术峰会（Intel Developer Forum，IDF2013）上，英特尔携手北京歌华飞视业务、快播科技、TCL和联想等业界伙伴，共同展示了

[工业控制]

英特尔新款芯片开发剑指iPhone！

英特尔在旧金山举行的IDF（英特尔开发商大会）上展示了其产品路线图的新进展，该路线图的目标是要推出类似于iPhone并采用x86处理器和WiMax网络的新设备。在IDF上，英特尔公司展示了多套采用45纳米Silverthorne处理器（将于明年年初开始供货）的手持数据系统，并披露了一个名为Mooretown的平台的计划。Mooretown采用了一个45纳米集成式处理器。该CPU包含了一个图形内核、显示处理和视频编码逻辑块以及一个内存控制器。另一个芯片被英特尔称为通信集线器，尽管它并没有披露该芯片是否可以实现Wi-Fi和WiMax或其它网络。英特尔目前不愿透露有关该产品的更多详情，但表示这将是它的第一款可实现超越iPhone

[焦点新闻]

英特尔推出物联网处理器：瞄准非PC市场

北京时间10月9日早间消息，英特尔(22.48, -0.35, -1.53%)智能系统集团总经理托恩·斯迪恩曼(Ton Steeneman)周二在一次活动上介绍了英特尔新款芯片在医疗设备、汽车娱乐系统，以及其他非PC设备中的应用。　　英特尔等科技公司正关注“物联网”的发展。基于物联网的理念，浴室体重秤、工厂机器人和摩天大楼通风系统都可以被连接至互联网。这在未来几年中将创造出对新型电子设备和软件的庞大需求。　　斯迪恩曼此次表示，约十余家相关的电子设备厂商已开始使用英特尔新款凌动E3800低功耗移动处理器。他表示：“这帮助我们覆盖此前未能涉足的全新一类应用及数十亿设备。” 　　斯迪恩曼表示，这款凌动处理器于本季度推出，提供

[手机便携]

英特尔和高通竞相将计算机视觉引入手机和无人机

上周，在英特尔（Intel）开发者大会上，首席执行官布莱恩科兹安尼克（Brian Krzanich）宣布，该公司正在与谷歌（Google）的探戈项目（Project Tango）合作给安卓智能手机带来深度感知能力。台上的一个演示视频显示了配备英特尔RealSense摄像头的手机如何在短短几秒钟内完成对客厅的 3D扫描。表现干净利落，甚至可能让英特尔有机会最终打入移动领域。但问题是，高通（Qualcomm）已经先人一步。几个月前，在谷歌的开发者大会上，高通为配备自己公司骁龙移动处理器的手机推出了自己的深度感知参考设计。显然，英特尔和高通都认为计算机视觉领域很快将有大事发生。计算机视觉是指计

[工业控制]

金士顿宣布其两款DDR5内存已通过英特尔认证

据外媒techpowerup报道，金士顿于10月6日宣布其两款DDR5 UDIMMS台式机内存条已通过英特尔平台认证（ Intel Platform Validation），这是一项重要的里程碑，代表着其产品将与第12代酷睿处理器兼容。金士顿将推出一系列高性能DDR5内存，覆盖低容量至高容量，提供多种外形。官方表示，在开发出最新DDR5内存之后，已经向主板制造商和合作伙伴发出了10000多个DDR5 UDIMM内存条样品，以便尽早为产品的正式发布奠定基础。根据研究机构TrendForce的最新数据，金士顿已经成为全球顶级的DRAM内存模组供应商，收入排名第一。金士顿高管指出，公司已经为DDR5内存产品进行了大量

[半导体设计/制造]

金士顿宣布其两款DDR5内存已通过<font color='red'>英特尔</font>认证

AMD将联手IBM挑战英特尔芯片霸主地位

　　联手IBM涉足全新工艺　　IBM日前联合AMD合作生产出了首批采用22纳米工艺技术的SRAM芯片产品，而这一重磅消息的发布或将挑战英特尔在该领域的领先地位。　　SRAM芯片是典型的半导体行业测试新工艺手段的首选设备，是迈向微型处理器的关键第一步。该设备是由AMD、飞思卡尔、IBM、意法半导体、东芝以及纳米科学与工程学院联合开发和制造的。这种22纳米工艺的SRAM芯片是从300mm晶圆上切割而来，采用传统的六晶体管设计方案，整个芯片面积仅有0.1平方微米。而英特尔的45纳米处理器的SRAM芯片面积为0.346平方微米。　　和目前主流的处理器工艺水平相比，22纳米工艺水平则是两代之后的技术(60纳米一代，4

[焦点新闻]

掌握半导体领域最有价值专利的38家公司，中国企业都有谁

　　IEEE Spectrum发布了其年度最具价值专利组合的科技类公司名单，这些公司来自全球的多个产业。下面就随半导体小编一起来了解一下相关内容吧。其中半导体相关企业的名单如下：　　英特尔　　三星　　半导体能源实验室　　霍尼韦尔　　台积电　　科锐　　Peregrine 　　闪迪　　Marvell 　　Invensense 　　京东方　　Cirrus Logic 　　RF Micro 　　博通　　Qorvo 　　德州仪器　　格罗方德　　Rambus 　　美光　　OSI Systems 　　Crossbar 　　UTC Aerospace Systems 　　洛克希德·马丁　　罗克韦尔·

[半导体设计/制造]