华为五年前已在布局AI芯片，寒武纪团队注定是最优选择-电子工程世界

上周六，DT 君在柏林 IFA 现场深度报道了华为最新发布的移动端 AI 芯片。此后，DT 君独家专访了深度参与麒麟 970 方案设计的一位相关人士，但这位相关人士拒绝在文章中透露其姓名及身份。

图丨华为麒麟970

这位相关人士表示，麒麟 970 整合NPU（Neural Processing Unit，神经处理单元）构想早在五年前就已经开始酝酿。

就当初的情况而言，产业界已经逐渐看到 CPU 的应用瓶颈，而 GPU 虽然也开始参与计算工作，但其主要的显示工作随着分辨率的提高而负担不断加重，所以要让这个已经分身乏术的架构继续增加负荷，对整体性能以及功耗表现也是会产生负面影响。

可以说，为追求更高的应用效率，以及更好的功耗表现，只让 CPU 或 GPU 架构参与计算已经远远不够满足需求。

事实上，当初的主流移动芯片架构也已经不会只内建此两种架构，而多半会增加额外的 DSP 单元或者是 ISP 架构，不仅分担主系统的沉重计算负担，也因为让不同类型的计算工作可以摆到更适合的计算架构上，整体功耗也有了明显的改善。

可以说，AI 正是基于同样的概念：让适合的架构来做适合的工作，效率才会得到提高。

这位相关人士对 DT 君表示，华为在当时就决定了未来 AI 相关计算，将会以专用架构的设计方式进行，这就好比绘图工作会交给 GPU 而不是 CPU 是一样的道理。

寒武纪的生态经营和架构优势赢得华为青睐

当然，以华为旗下海思的芯片设计功力，如果要从无到有设计出专用的 NPU 单元，也不是不可能的事情——此类 NPU 架构单纯，设计难度也不会比 CPU 更高，但问题出在生态方面。

这位相关人士表示，如果完全自主开发，从无到有的经营生态，华为有可能在未来方案推出时，缺乏市场开发者以及相关生态的支持，恐怕结果只会是事倍功半。

众所周知，寒武纪的前身是中国科学院计算技术研究所下的一个课题组，由陈云霁、陈天石教授领导。

该课题组早在 2008 年就已经开始研究神经网络算法以及芯片设计。寒武纪第一代方案在 2012 年推出，65nm 工艺下功耗为 0.485W，面积 3.02mm²。平均性能超过主流 CPU 核的 100 倍，但面积和功耗仅为 1/10，表现相当惊人。

图丨寒武纪1A处理器（Cambricon-1A）

不过，当初寒武纪有个非常直白的命名代号，叫做 DianNao，就是中文拼音的“电脑”——顾名思义就是拿来做计算工作的、用电的“大脑”。当初，这个命名并不是中国人的主意，而是研究团队中法国人的建议——不用当时已经烂大街的神经网络芯片之类的命名，反其道而行用中文取名，外国人反觉得十分高大上，相当有趣。

中科院在 DianNao 的基础上开发出 DaDianNao（第二代，功能增强）、PuDianNao（第三代，普电脑，通用型机器学习晶片）、ShiDianNao（视电脑，图像识别处理器）、DianNaoYu（电脑语，神经网络指令集）等延伸规格，针对不同应用或目的特化，也看得出研究团队对命名规则的坚持。

这位相关人士对 DT 君表示，寒武纪实际上是基于对整个软硬件优化的平台，拥有成熟的硬件，以及软件界面设计，生态支持能力绝佳，且因为知识产权完全自有，不怕受制于人。也因此，华为一方面为了节省成本，一方面又要有足够竞争优势的架构设计，考量二者得出的唯一解答：就是寒武纪了。

图丨寒武纪科技

NPU到底有多强大？

NPU 本身可达到 1.92 TFLOPS 的半精度（16bits）计算能力，以 IFA Keynote 上提到的应用案例为例，使用 NPU 可在一分钟内辨识超过两千张图片。换句话说，每秒可辨识超过 30 张图片，这对于需要及时分析的场景识别或者是合成，所需要的数据分析，已经可以达到几乎实时的地步。

而就华为给出的 25 倍速度，50 倍效率推算，该 NPU 功耗全负载大约只有 CPU 的一半，如果以计算效率/功耗换算，大概是 0.8 TFLOPS/W，如果以 NVIDIA 的 V100 方案作比较，V100 约为 0.4 TFLOPS/W。

可见，麒麟970内建的 NPU 效率之高了。

从云端到本地端硬件的AI应用

DT 君在之前的报道分析中也提及，云端性能强大，学习快速，但学习得出来的模型是通用模型，很难针对小众有订制化的调整，并满足消费者的应用场景。

但过去本地端硬件性能不足，虽然可通过云端学习，但数据这么一来一往，效率极低，无法做到实时处理。若本地端硬件拥有强大的 AI 学习能力，那么就不需要把数据上传到云端，直接在本地端处理即可，效率更高，且更能确保数据的安全与隐私。

这位相关人士表示，环顾业界，其实不是只有华为在做终端的 AI 计算工作，但华为提出的方案是以能够实现快速规模化，并以成熟的商业思维为基础。其他竞争业者，比如说高通或苹果，也都在各自的技术领域有所成就。

然而，这个市场目前才处于刚刚在酝酿的时期，所以根本也不存在什么竞争问题。如果产业竞争者能够共同把饼做大，让生态更成熟，其实整个 AI 的市场规模足以撑起许多大型企业，而华为抢先卡位，自然是为了届时能够处在一个相对优势的市场地位。

但任何事物的发展都需要时间，所以只有把眼前的移动生态先做好，未来才能够实现对其他应用场景的布局。

那么生态系统的支持如何拓展？不同架构是否会冲突？

当然，目前业界采取的 AI 加速芯片设计，在结构和理念上都各有不同，计算特性也不一致，但这名相关人士表示，其实也不用担心未来会有不同架构各据山头，导致生态撕裂、饼做大前先起内讧的状况出现。

由于目前主流操作系统（包括Windows、Linux或Android）都已经支持了针对终端 AI 计算的相关开放规范，也提供了共同的软件界面，从而借以接入各种不同架构的 AI 加速芯片。

未来 AI 加速芯片的设计会有标准功能，也会有作为差异化速求的额外附加功能，前者透过一般标准界面就可存取，后者也同样是透过标准界面，但只需要小幅修改开发者端的程式码即可取用，不会造成业界的混淆。

移动应用是短期目标，未来将打生态战拓广其他领域

这位相关人士也表示，华为在 IFA 上的应用方向其实是短期目标，由于手机生态成熟，也容易接受新技术的导入，而把 AI 加速能力放在手机方案上，最有机会得到回报。

就当前的三大应用方向而言，包含视觉处理、AR 以及自然语言，都是近来最热门的高端智能手机应用发展方向，如果华为能够用更低的功耗，更好的效率来处理好这些事情，一来可以提升品牌价值，创造更高的利润，二来熟悉相关终端 AI 处理技术之后，也可以把这些方案拓展到其他智能应用上，而不是只有手机而已。

这位相关人士也强调，华为内部也已经有下一个三年计划，针对未来 AI 技术的演进，配合市场应用的需要来进行改善和微调，并随着麒麟芯片的世代更替来推新架构。

图丨麒麟 970的细部架构，NPU是最大亮点（资料来源：华为）

然而，虽然目前手机上的 AI 方案主要都着眼于 Inference（推理），而 Learning（学习）的部分则较少被提及。但凭借 NPU 的导入，一旦性能足够之后，要做到小规模的学习也不是不可能的事情，这部分与个人化的使用体验息息相关，各大厂都不会轻易放过这块大饼。

初期以高端方案布局NPU应用，未来将可能打入中端市场，扩大生态的发展

麒麟 970 作为第一代整合 NPU 的应用处理器芯片，定位最高端，也不吝于用最好的工艺，搭最顶尖的计算核心，但考虑到未来市场的走向，AI 应用一定会普及化、平民化，所以未来在相关 AI 芯片的布局规划上，肯定会往中端，甚至低端的方向走，但是在 NPU 的规模方面恐怕就会有所调整，一方面是成本考量，一方面也是产品定位问题。

目前，华为正在积极和第三方软件开发商合作，希望将整个生态基础快速扩大，这方面也不会仅止于 IFA 上所公布的三大应用方向，而是会鼓励产业合作伙伴积极尝试，华为也会尽力协助合作厂商做出他们想要的 AI 应用。

这位相关人士表示，麒麟 970 的发表只不过是短期指标，长期来看还有不少需要加强的地方，但华为至少已经踩出第一步了。虽不能说就已经是立于不败之地，但至少快了竞争对手一些，也让华为可以提早思考下一步的布局。

关键字：华为引用地址：华为五年前已在布局AI芯片，寒武纪团队注定是最优选择

上一篇：加密货币将成为绘图芯片下一个竞技场
下一篇：展讯携手合作伙伴开启国产移动金融安全终端解决方案

推荐阅读最新更新时间：2024-05-03 17:10

华为震撼车圈的三十天

问界风潮席卷市场变化仿佛是在一瞬间产生。 9月12日下午两点半，肖华和一些顾客聚在门店的壁挂电视前看直播，当问界新M7价格正式公布的一刻——24.98万的起售价比预售价格还要低1万元——她觉得自己“人都傻了”，店里很多人欢呼，低头一看，之前的小订订单纷纷转大定，“莫名其妙地”，她说后台系统里正源源不断多出很多个新订单。从这一天开始，肖华的双休不见了——以往清闲的周末变成了最繁忙的两天，看车、试驾的人源源不断。9月的4个周末里，他们都要在门口支起一张小桌子，摆出号码牌，拿着麦克风喊话，指挥试驾的用户排队等待。最夸张时，这张贴在手臂或胸前的标记数字一口气写到了60，进店总组数达到90组。仅有的一台新M7试驾车陡然

[汽车电子]

中普CEO焦叔：中普射频PA芯片已成功打入华为智能手机供应链

集微网消息文/徐伦 “让你看一款手机，你能看出他有什么不同就送你”，3月20日无锡中普电子CEO焦健堂突然将一款不起眼的手机扔到小编面前。初略看了一眼，是华为的一款Y系列的手机。这不是华为的千元系列机型吗？有何特别？ “这部手机搭载的我们中普电子的射频PA芯片，也就意味着我们已经打进了华为智能手机供应链啦！” 焦健堂兴奋的说道。 PA（功率放大器）是手机除主芯片外最重要的外围元件之一，直接影响手机的信号强度、通信质量。这么重要的元器件华为之前一般都只选择国外厂商。焦健堂说：“华为是业内对元器件要求最高的企业之一，能打入华为供应链，也意味着中普的产品质量进入了业内最优行列。” 焦叔加入中普半年，业

[手机便携]

台积电松口，华为这个事儿还有缓

自从美国对华为的出口管制升级后，业界持续关注华为在台积电的晶圆代工业务能否延续，因为后者的先进制程将直接影响华为的终端产品竞争力。昨（16）日，台积电在第二季度法说会中明确表示，未计划在9月14日之后给华为继续供货。有媒体报道指出，台积电方面“暗示”称，美国将放宽通用产品出货给华为的限制，这又让外界不禁开始遐想台积电与华为的业务有望续存，例如代工用于视频监控芯片、机顶盒STB芯片等小海思芯片，然而事实真是如此吗？手机业务尚有退路据集微网了解，台积电在法说会上答记者问时的原话是：“目前的法规并没有禁止标准产品或通用产品向华为发货，因此我们认为华为的智能手机业务将

[半导体设计/制造]

台积电松口，<font color='red'>华为</font>这个事儿还有缓

华为称新石墨烯电池性能秒杀市场大部分锂电池

最近的材料科学界，因为石墨烯与一家中国企业华为的结合，变得热闹非凡。自12年前首次被人工制出，将在电子信息、新材料、新能源、生物医药等领域显现广阔应用前景的石墨烯带入工业化生产领域，成了全球的努力目标。因此，当华为中央研究院瓦特实验室于第57届日本电池大会上宣布“推出业界首个高温长寿命石墨烯基锂离子电池”时，国内一片沸腾。尽管后来的事实表明，此“石墨烯基电池”非“石墨烯电池”，但丝毫不影响人们对华为在石墨烯领域取得突破的期待。石墨烯电池是“泡泡”吗自2015年10月23日华为与英国曼彻斯特大学达成石墨烯应用研究项目后，大家就期待着华为推出“颠覆性”成果，但是谁都明白，没那么容易。实际上，华为在日本电池大会上宣布的是“

[手机便携]

Sprint考虑与软银交易审批问题拟弃用华为中兴设备

据国外媒体报道，Sprint Nextel首席执行官丹·海塞（Dan Hesse）日前表示，公司计划避免采用华为公司制造的网络设备，以消除美国政府对于该中国公司可能造成安全威胁的担忧。海塞在接受《金融时报》（FinancialTimes）一系列有关软银集团拟议交易的采访时表示：“Sprint公司是美国政府的主要供应商，因此，我不会采用任何可能引发些许安全担忧的设备。”海塞正在与软银集团首席执行官孙正义（MasayoshiSon）商讨该公司斥资201亿美元收购Sprint公司70%股份的事宜。目前，Sprint与软银的交易已经进展至监管部门审批过程，有些人表示，软银将华为列为设备供应商可能会招致监管机构的严格审查。海

[网络通信]

最新ARM A77对华为麒麟芯片有何冲击

台北电脑展开幕第一天最引人注目的是，ARM推出了自家下一代旗舰设计方案Cortex-A77（CPU）和Mali-G77（GPU）。据悉，相比Cortex-A76，Cortex-A77性能提升20%，同时机器学习能力也有大幅提升，是两年前芯片的35倍！而基于Valhall架构的 Mali-G77性能提升高达30%！能效提升30%，机器学习能力提升60%！可以说，ARM新一代内核定义了更强悍的旗舰机，很多人关注华为麒麟是否有影响？我的看法是没有影响。有一些质疑华为或无缘最新架构的声音，更是无稽之谈！ ARM 最新A77和G77性能提升情况首先，按照我对ARM公司的了解，一般在新一代内核正式发布之前，早在半年

[嵌入式]

最新ARM A77对<font color='red'>华为</font>麒麟芯片有何冲击

华为鸿蒙系统的开源

鸿蒙开源吗？这个问题其实早已有了定论，早在2020年，部分鸿蒙系统的代码就已经在开放原子开源基金会中公开，任何开发者都可以自由下载、使用和修改开源代码，实质上已经是开源系统。但是，开源的是哪一部分系统？什么时候实现完全开源？却因为华为不同部门的不同说法而产生了各种各样的误解，有的说仅仅捐赠部分代码，有的则说是完全开放。而在各种消息满天飞后，华为终于是在官方社区公开了一封标题为《关于规范HarmonyOS沟通口径的通知》的“总裁办电子邮件”，给出了华为的鸿蒙系统开放问题的官方回答。根据华为的官方统一回复，华为已经于2020年、2021年分两次将鸿蒙系统的所有基础能力全部捐献给开放原子开源基金会，形成OpenHarm

[嵌入式]

华为完成新一代绿色5G天线验证：功耗不变速率提高40%

近日，中国移动四川公司携手华为率先完成新一代绿色Massive MIMO 产品解决方案预商用验证，该方案通过突破式软硬件创新，实现了绿色节能、覆盖以及体验的阶跃式提升。　　测试结果表明，相比传统天线单元，在不增加发射功率的情况下，新一代绿色Massive MIMO实现上下行覆盖提升2dB，客户上下行边缘速率提升30-40%。　　据介绍，该设备在硬件和软件方面都有提升：　　硬件方面，应用新材料和新技术，通过使用新型超轻、超大规模天线阵子和直通馈电网络，减少信号传输损耗，降低设备能耗，提高基站覆盖能力。　　软件方面，应用新算法，创新自适应高分辨率波束赋形算法，实现了窄波束宽幅扫描、自适应波束寻优、高分辨波束域降噪，提升

[手机便携]

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■2024 瑞萨电子MCU/MPU工业技术研讨会——深圳、上海站，火热报名中

■罗姆有奖直播 | 重点解析双极型晶体管的实用选型方法和使用方法

■STM32N6终于要发布了，ST首款带有NPU的MCU到底怎么样，欢迎小伙们来STM32全球线上峰会寻找答案！

■免费下载 | 安森美电动汽车充电白皮书，看碳化硅如何缓解“里程焦虑”！