AlphaGo来袭、谷歌TPU芯片发力,英特尔和英伟达该如何应对

发布者:快乐旅途最新更新时间:2017-05-24 来源: 虎嗅网关键字:TPU  英特尔  英伟达 手机看文章 扫描二维码
随时随地手机看文章

日前,去年击败世界围棋第一人李世石,由DeepMind(已被谷歌收购)开发的围棋AI—AlphaGo,已移师中国,再战目前等级分排名世界第一的中国棋手柯洁九段,且率先拿下一局暂时领先的消息再次引发了业内的高度关注。


那么问题来了,AlphaGo缘何如此“聪明”和超乎人类的思考和反应能力?


就在AlphaGo与柯洁“人机大战”不久前,Google I/O 2017 大会上,谷歌“移动为先”向“AI优先”再次升级,其中最典型的表现之一就是更新升级了去年公布的TPU(Tensor Processing Unit),一款谷歌自己高度定制化的AI(针对AI算法,例如其自己开发的Tensor Flow深度学习架构)芯片。

这款芯片也是AlphaGo背后的功臣,即AlphaGo能以超人的熟练度下围棋都要靠训练神经网络来完成,而这又需要计算能力(硬件越强大,得到的结果越快),TPU就充当了这个角色,更重要的是借此显现出了在AI芯片领域相对于英特尔CPU和英伟达GPU的优势。何以见得?


在去年的“人机大战”中,起初AlphaGo的硬件平台采用的是CPU+GPU,即AlphaGo的完整版本使用了40个搜索线程,运行在48块CPU和8块GPU上,AlphaGo的分布式版本则利用了更多的芯片,40个搜索线程运行在1202块CPU和176块GPU上。


这个配置是和当时樊麾比赛时使用的,所以当时李世石看到AlphaGo与樊麾的对弈过程后,对“人机大战”很有信心。但是就在短短几个月时间内,谷歌就把运行AlphaGo的硬件平台切换到了TPU上,之后对战的结果是AlphaGo以绝对优势击败了李世石。也就是说,采用TPU之后的AlphaGo的运算速度和反应更快。那么究竟TPU与CPU和GPU相比,到底有多大的优势(例如性能和功耗)?


据谷歌披露的相关文件显示,其TPU与服务器级的英特尔Haswell CPU和英伟达K80 GPU进行比较,这些硬件都在同一时期部署在同个数据中心。测试负载为基于TensorFlow框架的高级描述,应用于实际产品的NN应用程序(MLP,CNN和LSTM),这些应用代表了数据中心承载的95%的NN推理需求。


尽管在一些应用上利用率很低,但TPU平均比当前的GPU或CPU快15~30倍,性能功耗比(TOPS/Watt)高出约30~80倍。此外,在TPU中采用GPU常用的GDDR5存储器能使性能TPOS指标再高3倍,并将能效比指标TOPS/Watt提高到GPU的70倍,CPU的200倍。

尽管英伟达对于上述的测试表示了异议,但TPU相对于CPU和GPU存在的性能功耗比的优势(不仅体现在AI,还有数据中心)已经成为业内的共识。值得一提的是,在刚刚举办Google I/O 2017 大会上发布的新一代TPU已经达到每秒180万亿次的浮点运算性能,超过了英伟达刚刚推出的GPU Tesla2 V100每秒120万亿次浮点运算性能。那么是什么造就TPU的优势?


简单来说,CPU是基于完全通用的诉求,实现的通用处理架构。GPU则主要基于图像处理的诉求,降低了一部分通用性,并针对核心逻辑做了一定的优化,是一款准通用的处理架构,以牺牲通用性为代价,在特定场合拥有比CPU快得多的处理效率。


而TPU,则针对更明确的目标和处理逻辑,进行更直接的硬件优化,以彻底牺牲通用性为代价,获得在特定场合和应用的极端效率,也就是俗话所言的“万能工具的效率永远比不上专用工具”。而这正好迎合了当下诸多炙手可热的人工智能的训练和推理等均需要大量、快速的数据运算的需求。


到目前为止,谷歌的TPU已经应用在各种领域的应用中,例如谷歌图像搜索(Google Image Search)、谷歌照片(Google Photo)、谷歌云视觉API(Google Cloud Vision API)、谷歌翻译以及AlphaGo的围棋系统中。实际上我们上述提到的Google I/O 2017大会推出和更新的诸多AI产品和服务背后均有TPU的硬件支持。


当然,我们在此并非否认CPU和GPU在AI中的作用,例如鉴于CPU的通用性,其灵活性最大,不仅可以运行各种各样的程序,也包括使用各种软件库的深度学习网络执行的学习和推理。GPU虽然不像 CPU那样通用和灵活,但它在深度学习计算方面更好,因为它能够执行学习和推理,并且不局限于单个的软件库。相比之下,TPU则几乎没有灵活性,并且只能在自家的TensorFlow中效率最高,这也是为何谷歌对外声称TPU不对外销售,且仍会继续采用CPU和GPU。


但谷歌的这一做法印证了一个芯片产业的发展趋势,即在AI负载和应用所占数据中心比重越来越大的今天和未来,像谷歌、微软、Facebook、亚马逊、阿里巴巴、腾讯等这些数据中心芯片采购的大户,其之前对于CPU和GPU的通用性需求可能会越来越少,而针对AI开发应用的兼顾性能和能效的定制化芯片需求则会越来越多。


而作为通用芯片厂商的英特尔和英伟达,如何顺应芯片产业在AI驱动下的发展趋势,则关系着其在AI时代到来之时,其能否继续满足客户的需求和引领产业的发展。或许,应该特尔和英伟达都应该未雨绸缪。

关键字:TPU  英特尔  英伟达 引用地址:AlphaGo来袭、谷歌TPU芯片发力,英特尔和英伟达该如何应对

上一篇:晶心科技成为第一家采用RISC-V的主流CPU IP公司
下一篇:IMEC成功研发可以作曲的芯片

推荐阅读最新更新时间:2024-05-03 01:12

英特尔股价连续下挫 已不及AMD一半
  英特尔的股价在22日纳斯达克收盘时下滑2.3%,仅为20.15美元,创下17个月以来的历史新低。而且在盘中曾跌破20美元。与之形大较大反差的是AMD,它的股价上涨了2%,收于40.80美元。与去年相比,增长了近2倍。   今年2月8日,投资机构ThinkEquity Partners将英特尔股票的由“买进”降低为“择机买进”,日前又进一步将为“卖出”,甚至预计英特尔的股价将跌至16美元。   分析人士表示,为了从AMD手中夺回市场份额,Intel连续大幅降价,但这一举措并未奏效,因为虽然减缓了AMD的攻势,但却在营收上付出了代价,本季度的利润目标也将难以完成。RBC Capital Markets分析师甚至表示,从Inte
[焦点新闻]
解读英特尔/谷歌/Valve的VR招数,谁才是老大?
任何一个行业,在其发展初期,抢占了先机的企业,几乎将在这个行业永远占据霸主地位。 虚拟现实 行业并未完全爆发,但巨头们意欲抢占先机、在行业发展的未来拥有绝对话语权的的大动作已接踵而来。    与其他加入到虚拟现实行业的企业不同, 谷歌 、 英特尔 、Valve都不局限于成为行业的参与者,为力图成为行业标准的制定者、生态链顶端的技术提供者,纷纷祭出自己的大招。简单一点说,就如同英特尔之于PC、谷歌之于安卓手机,这三家都想做虚拟现实领域的老大。    那么,究竟谁强谁弱,谁能笑到最后?   谷歌——发布Daydream计划 2016年5月19日,谷歌全球开发者大会上,谷歌对外公布虚拟现实领域的Daydream计划
[嵌入式]
NVIDIA NGC软件在AWS Marketplace上线,加速AI部署
AI正在改变各行各业。如其他业务一样,好的开始就是成功的一半。 为了帮助企业快速的起动,NVIDIA正与AWS展开合作,在AWS Marketplace中直接提供21种NVIDIA NGC软件资源。客户可在AWS Marketplace中搜索、购买,并即刻使用在AWS上运行的软件和服务。 NGC是经过优化、可在NVIDIA GPU云实例上运行的软件目录。这些云实例包括,采用了性能创下MLPerf纪录的NVIDIA A100 Tensor Core GPU的Amazon EC2 P4d实例等。AWS用户可免费部署这些软件,以加速其AI部署。 2017年开始,NVIDIA通过NVIDIA NGC目录提供GPU优化软件
[物联网]
<font color='red'>NVIDIA</font> NGC软件在AWS Marketplace上线,加速AI部署
英特尔、超微无力冲刺 PC供应链首季吹寒风
    受到PC市场需求锐减冲击,2013年CPU双雄英特尔(Intel)、超微(AMD)业绩并不理想,英特尔获利衰退13%,超微全年仍未能转亏为盈,目前英特尔、超微均保守看待2014年第1季PC买气,预期营收将呈现下滑趋势,整体PC供应链亦难有好表现。英特尔2013年净利下滑13%,毛利率跌破60%关卡,尽管陆续推出新平台处理器,然推升获利力道却不如往年,英特尔PC新旧平台转换已难刺激买气。至于超微2013年第4季净利达8,900万美元,但受到PC市况低迷不振冲击较预期严重,若非来自Sony与微软(Microsoft)游戏机晶片订单支撑,以及绘图晶片新品加持,业绩恐惨不忍睹,全年亏损仍达8,300万美元。      2014年首
[手机便携]
SK海力士收购英特尔NAND闪存及SSD业务获得反垄断机构批准
SK海力士今日宣布,针对公司的英特尔NAND闪存及SSD业务收购案获得了中国反垄断机构-国家市场监督管理总局(SAMR)的批准。 随着SAMR的批准,SK海力士获得了所有8个不同司法辖区的反垄断机构批准。 SK海力士将继续为交割做准备, 达成所有交割条件。第一阶段交割的对价为70亿美元,交割时SK海力士将从英特尔接管包括SSD相关的IP及员工在内的SSD业务和大连资产。 SK海力士表示,“真诚欢迎和感谢中国反垄断机构的批准。SK海力士将继续推进并购后的整合流程以提高NAND闪存及SSD业务的竞争力。” SK海力士官方说明:此前外界猜测,鉴于中美两国在半导体领域的紧张关系以及该交易涉及各国利益的复杂局面,SK海力士将难以获得中国对该
[手机便携]
英特尔世界公开赛将在北京2022 年冬奥会前落户中国
英特尔世界公开赛将在北京2022 年冬奥会前落户中国,释放玩家电竞热情 今天,英特尔宣布 “英特尔世界公开赛” (Intel World Open,简称 IWO)落户中国,DOTA 2 成为英特尔世界公开赛指定的竞赛游戏。英特尔希望通过赛事将体育精神带给更多年轻人,鼓舞他们奋发向上。英特尔世界公开赛今年将在中国开启面向校园和网咖的海选竞赛,通过四个月的角逐,决胜者最终将在北京 2022 年冬奥会前举办的赛事上与职业战队一决胜负,让更多年轻人在竞技的舞台上绽放光芒。 (英特尔市场部总经理吕冬与DOTA 2 负责人顾黎明先生合影) 英特尔市场部总经理吕冬表示:“作为奥运会TOP合作伙伴,英特尔一直致力于在奥运赛事
[家用电子]
<font color='red'>英特尔</font>世界公开赛将在北京2022 年冬奥会前落户中国
陈春章:英特尔架构日的启示 创新非一蹴而就
数字化已经成为推动新旧世界转换的源动力,这也给整个技术产业界带来了前所未有的挑战。“我们所面临的艰巨计算挑战,一定要通过革命性的架构和平台创新来解决。”英特尔CEO帕特·基辛格在架构日发布会上提出,英特尔已经开发出了许多架构和平台,包括针对性能和能效的微架构,从边缘和终端设备到网络、再到云,一切设计旨在智能地使用最佳计算资源,即用最优架构来完成每项任务。 对此,鹏城实验室研究员,中国科学院大学和浙江大学兼职教授陈春章博士认为,英特尔的架构创新,主要针对了三个应用方向:传统的台式电脑、数据中心和深度学习,这些都是对数字技术要求最高的领域。 鹏城实验室研究员,中国科学院大学和浙江大学兼职教授陈春章博士 “这些创新涉及到了超大规模处
[手机便携]
强化AI生产力,英特尔将收购SigOpt
英特尔近日宣布将收购位于旧金山的 SigOpt ,一家为AI软件模型进行大规模优化的领先平台供应商。SigOpt的AI软件技术能够在包括深度学习、机器学习和数据分析方面的软硬件参数、使用场景和工作负载层面提升生产力和性能。英特尔计划在其AI硬件产品中使用SigOpt的软件技术来帮助加速、增强以及扩展英特尔为开发者提供的AI软件解决方案。 “在全新的智能时代,AI正在驱动未来的计算需求。在扩展AI模型的同时能够自动提取最佳计算性能,对软件而言尤为重要。SigOpt的AI软件平台和数据科学人才,将能够增强提升英特尔的软件、架构、产品和团队实力,并为英特尔提供宝贵的客户洞察。我们欢迎SigOpt团队及其客户加入英特尔大家庭。”
[半导体设计/制造]
强化AI生产力,<font color='red'>英特尔</font>将收购SigOpt
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved