场景定义AI专用芯片和异构计算是计算架构变革周期的主旋律

发布者:大泉人家最新更新时间:2018-07-31 来源: 36kr关键字:AI芯片 手机看文章 扫描二维码
随时随地手机看文章

本文是创投观察系列的第82篇


分享人:北极光创投投资经理 赵顾



编者按:近期关于AI芯片(ASIC)与FPGA的关系、地位正在业内被讨论。因此,我们也就这个话题邀请了一些业内创业者、投资人进行探讨。本文是这个系列中的其中一篇,分享人为北极光创投投资经理赵顾。以下为正文。也欢迎对这个话题感兴趣的业内人士投稿参与讨论(投稿邮箱:syq@36kr.com;投稿微信:15300063873)


回顾芯片发展史,是一部摩尔定律驱动的制程演进史,也是一部应用定义的架构演进史,所以谈起ASIC是不是会被FPGA取代,本身是一个门外汉的问题。


在摩尔定律放缓的背景下,应用场景定义的芯片架构乃至软硬件系统将更加重要。正如GPU、DSP、视频处理芯片等一波波新应用带来的专用芯片架构的变革,AI在这一波浪潮当中也会随着算法的演进和收敛,逐渐沉淀出一些更加高效的架构来,并且这些芯片架构是和场景应用软件高度融合,平衡功耗、性能、成本的设计。


计算架构主要有三个核心要素组成,包括计算,存储和网络,因此芯片种类也基本上可以按照三类来划分,这样方便理解。


首先,我们谈一谈计算芯片,Intel和ARM的CPU、nVidia的GPU、CEVA的DSP都属于这一类芯片或者IP,主要任务就是完成逻辑和数学运算,支撑了IT世界的云计算,手机终端应用和信号处理,乃至AI等等。FPGA是其中一个小门类,在整个Intel的营收当中不到5%,通常FPGA可以做到一些CPU不擅长的加速运算,比如信号处理,AI推理等场景。但是FPGA的缺点也非常明确,FPGA强调的是逻辑的通用性,支持软件改写和配置,导致计算密度是有瓶颈的,并且通用逻辑带来了大量冗余,这意味着成本和功耗的大幅度上升。在移动互联网和物联网时代,用户数和应用复杂度急剧上升,计算密度(单位功耗支撑的计算力)是核心竞争力,FPGA显然无法胜任,虽然FPGA可以在加速场景能够比CPU提升一个数量级,但是相对于专用的AI引擎又低了至少一个数量级。


有人会质疑ASIC是不是通用型不够,其实这个答案很简单,通用型和计算密度是一种折衷,比如理论上CPU是可以做任何的运算,但是通用架构带来了计算密度的损失,举个例子,最好的服务器CPU大致也只能提供1Tflops的AI推理算力;再看看GPU,轻松可以做到10Tflops,但是GPU并不能完成复杂的逻辑运算,因此它永远无法取代CPU;FPGA是介于CPU和ASIC中间的一个物种,有一定的灵活性但是性价比低,无法满足主流的需求,比如说手机行业,为了节省几美分的成本在不停的优化设计,面对如此巨大的行业,点滴的成本节省都是巨大的利益,因此FPGA的命运一直是市场早期的过渡产品或者服务于小批量的细分市场


最近我们注意到一件有趣的事情,Intel收购了一家从事结构化ASIC设计的公司,可以基于FPGA的设计裁剪掉部分冗余逻辑加速从FPGA逻辑设计到ASIC的开发过程,从这一点也可以看出ASIC才是主流市场的终极答案。


基于这样的逻辑,北极光投资了四家AI芯片公司,分别针对云计算的登临,自动驾驶的黑芝麻,消费电子和安防的亿智,超低功耗传感器融合的Ours,这些公司分别是针对不同应用场景优化过AI引擎,未来的芯片公司不能只是生产硬件的公司,必须深刻理解用户的需求,界定灵活性的边界,才能定义出最好的产品。客户真正关心的不是通用性,否则用CPU就好了,而是满足场景需求的计算密度下的成本。


还有人质疑新兴公司抢不到产能,ASIC的目的就是用最主流和相对便宜的制程去完成FPGA用最先进制程才能做到的事情,不存在产能问题,比如说北极光投资的亿智只需要用40nm和28nm的制程就可以提供1TOPS以上的算力,成本只是FPGA的1/10甚至更低,最先进的制程适合的是通用芯片设计,但是在摩尔定律放缓的背景下,会成为一个巨大的负担。


这里也想谈下深鉴被收购的个人观点,FPGA开发者非常少,使用困难,因此自动化工具对FPGA是有价值的,深鉴的软件工具可以加速FPGA的AI开发进度,但是Xilinx是否还会继续投入AI专用芯片的研发拭目以待。作为行业老大的Intel在自动驾驶,消费,安防和云计算都有专用AI芯片的布局,包括BAT都在各自研发AI芯片,这个方向还是具有相当的共识。

我们概括一下观点,场景定义AI专用芯片和异构计算是下一个计算架构变革周期的主旋律。


其实,中国投资AI芯片公司不是太多而是太少了,真正具备产业经验的成熟团队才是投资界应该追逐和主持的标的,也是国家未来的战略资源。


图片来自于:腾讯研究院发布的《中美两国人工智能产业发展全面解读》


关键字:AI芯片 引用地址:场景定义AI专用芯片和异构计算是计算架构变革周期的主旋律

上一篇:印度研制出第一款RISC-V芯片原型Shakrti
下一篇:美高森美推出高性能企业级Gen 4 PCIe控制器样品

推荐阅读最新更新时间:2024-05-03 03:09

AI芯片又来新玩家!华人团队创业,主打智能存储
安妮 发自 凹非寺 热闹的AI芯片市场现在又有新玩家。 InnoGrit——英韧创 ,华人团队创业,主打智能存储,第一代样片已进入流片阶段。 创始人吴子宁为芯片老兵,手握280多项技术专利,清华电子系毕业,斯坦福硕博出身,随后在美国芯片制造商Marvel一待17年,直接领导SSD控制器、硬盘控制器、无线互联和中央研发团队,离职前已是CTO。 智能存储的AI芯片,是吴子宁看到的新机会。 △ 英韧创董事长兼CEO吴子宁(量子位 摄) 智能存储芯片 “智能存储芯片”,还是个新概念。 此前,存储芯片单纯管理数据,并不负责计算或处理。系统架构基本上计算、存储和传输三部分功能分开,数据在CPU端时CPU才能发挥高
[嵌入式]
<font color='red'>AI</font><font color='red'>芯片</font>又来新玩家!华人团队创业,主打智能存储
缺少独立NPU的AI芯片,或许将错过一个真AI手机时代
最近几个月,AI芯片一度成为手机圈热词。各大手机厂商也纷纷蜂拥而至,奏响了属于AI芯片的命运交响曲。而业内也一致认为,AI芯片将成为众多上游厂商的新发力点。 不过,作为传统移动芯片“老大哥”的高通却在新趋势面前表现乏力。不仅后发而至,且其旗舰级芯片骁龙845因缺失极为重要的独立NPU单元而饱受行业诟病。 或许,一直深陷舆论漩涡的高通,颓势终于显现在了最重要的芯片产品上。笔者认为,错失了提前布局AI产业的机会,没能跟上AI芯片的浪潮,将让高通很“芯痛”,甚至可能错过一个手机向前推进的关键节点和全新时代。 步入全新时代,独立NPU不应缺失 当下,手机行业遇到了多重问题:增量触及天花板且呈现下行趋势、利润贴地飞行、技术创
[半导体设计/制造]
大数据重塑新芯片架构 AI处理器寻求突破
  业界共同的愿景是开发一款人工智能( AI ) 处理器 ,它可为神经网络处理训练与推理等任务,甚至可能出现一些新的自我学习技术;这种 AI 处理器 还必须能透过大规模的平行化方式提供强大的性能,同时具有高功效且易于编程...下面就随嵌入式小编一起来了解一下相关内容吧。   由亚马逊(Amazon)、Google和Facebook等网络巨擘所收集的大量数据集,正推动处理这些巨量数据的新芯片复兴。预计在六月底的年度计算机架构大会上将亮相其中两项最新成果。   史丹佛大学(StanfordUniversity)的研究人员将介绍一种可重配置 处理器 ——Plasticine,它可支持比FPGA更高近100倍的每瓦特性能,同时也更易于编
[嵌入式]
7nm工艺+542亿个晶体管,Nvidia安培GPU拉高AI芯片门槛
在近日的GTC上,Nvidia发布了最新的安培架构,以及基于安培架构的A100 GPU。A100 GPU使用台积电7nm工艺实现,包含了542亿个晶体管,据官方消息可以实现比起上一代V100高7倍的性能。除了算力提升之外,Nvidia还加入了GPU虚拟多实例(multi-Instance GPU,MIG)特性,可以让一块GPU虚拟化称为7个独立的GPU。 与安培架构同时公布的还有Nvidia DGX A100超级计算机,该超算平台包含了8块A100 GPU,峰值算力可达10 PetaOPS。 在发布会上,Nvidia对于算力做了非常多的渲染。然而,在我们看来,Nvidia在算力之外的特性扩展将成为更重要的门槛,中国半
[嵌入式]
7nm工艺+542亿个晶体管,Nvidia安培GPU拉高<font color='red'>AI</font><font color='red'>芯片</font>门槛
英特尔旗下再添新武器,收购人工智能芯片制造商Habana Labs
英特尔公司宣布以20亿美元收购Habana Labs。该公司总部位于以色列,是一家为数据中心提供可编程深度学习加速器的厂商。此次收购将增强英特尔的人工智能产品组合,并加快其在快速增长的人工智能芯片新兴市场的发展。英特尔预计,到2024年,这一市场规模将超过250亿美元 。 英特尔数据平台事业部执行副总裁兼总经理孙纳颐(Navin Shenoy)认为:“此次收购推进了我们的人工智能战略,即:从智能边缘到数据中心,为客户提供适合各种性能需求的解决方案。具体来说,通过高性能训练处理器系列产品和基于标准的编程环境,Habana Labs大大增强了我们数据中心人工智能产品的实力,以应对不断变化的人工智能负载。” 英特尔的人工智
[物联网]
英特尔旗下再添新武器,收购<font color='red'>人工智能</font><font color='red'>芯片</font>制造商Habana Labs
炬芯科技人工智能早教芯片备受关注
2017年11月16日-21日,以“聚焦创新驱动,提升供给质量”为主题的第十九届中国国际高新技术成果交易会在深圳会展中心盛大开展。作为目前中国规模最大、最具影响力的“中国科技第一展”,本次高交会吸引了来自30多个国家和地区的逾万个项目参展,是目前中国规模最大、也是最具世界影响力的科技类展会。高交会作为国内科技界最有看头的博览会,今年照样不会让大伙失望。AI 人工智能 无疑是本届高交会最热门关键词之一,除了主办方专设的人工智能专区以外,其他各个展区都展出了各种人工智能相关的前沿产品,更有多家企业携其“全球首发首创”或“全国首发首创”人工智能产品参展本届高交会。 人工智能作为近年来国家政策大力支持的朝阳产业及科技行业追逐的热点风口
[物联网]
炬芯科技<font color='red'>人工智能</font>早教<font color='red'>芯片</font>备受关注
阿里达摩院自主研发AI芯片 加入中国“芯”的新征程
  中新社北京4月19日电 (夏宾)记者19日从阿里巴巴获悉,阿里巴巴达摩院正研发一款神经网络芯片――Ali-NPU,该芯片将运用于图像视频分析、机器学习等AI(人工智能)推理计算,据悉,此款芯片的研发,未来将实现在AI在商业场景中的运用,提升运算效率、降低成本。   阿里达摩院研究员骄旸告诉中新社记者,CPU、GPU作为通用计算芯片,为处理线程逻辑和图形而设计,处理AI计算问题时功耗高,性价比低,在AI计算领域急需专用架构芯片解决上述问题。   骄旸透露,阿里巴巴自主研发的Ali-NPU,基于阿里机器智能技术实验室等团队在AI领域积累的大量算法模型优势,根据AI算法模型设计微结构以及指令集,以最小成本实现最大量的AI模型算法运算
[嵌入式]
深鉴不见 AI芯片战局“深不可见”?
今日凌晨,国内AI芯片独角兽——深鉴科技宣布被FPGA开山鼻祖、美国赛灵思(Xilinx)公司收购,具体交易金额未知。此事在业界引起巨大反响,赛灵思方面对集微网独家表示,赛灵思从FPGA器件向自适应计算加速平台提供商演变的战略,就是要加速从云到端应用上FPGA 加速技术的部署,经深鉴科技优化的神经网络剪枝技术运行在赛灵思FPGA 器件上,可实现突破性的性能和行业最佳的能效,这是赛灵思新CEO继ACAP三月的发布会后,提升机器学习研发能力,推进战略发展的重大一步。 收购水道渠成? 其实两者已有多年的交情。 深鉴成立于2016年3月3日,由清华电子系背景的汪玉、韩松、姚颂、单羿一同创办,专注于以FPGA实现AI落地,由于深厚
[嵌入式]
小广播
热门活动
换一批
更多
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

更多每日新闻
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved