XSY芯师爷

文章数:6059 被阅读:18077454

账号入驻

国产AI全面崛起!盘点11款2019年热门国产AI芯片

最新更新时间:2019-12-13
    阅读数:

人工智能的崛起主要得益于算法、数据和计算能力三方面的突破,这三方面的能力展现离不开AI芯片。由此,AI芯片的研发制造成了人工智能技术发展过程中的关键环节。


不同于其它传统芯片,AI芯片是近年新兴产品,拥有强大市场需求的中国一直对AI芯片的发展寄予厚望,希望在这个新的技术领域中能占领优先发展位置,缩短与半导体发达国家的距离。


截止中商产业研究院在今年上半年发布的《2019年中国IC设计行业投资前景研究报告》显示,彼时中国的AI芯片创企已经超过20家。


2019年,芯师爷发起了“硬核中国芯”评选活动,旨在推动国产芯片应用。本次评选中,AI类别共有11家企业入选参评“硬核中国芯——2019年度最佳国产AI芯片产品奖”,本文盘点了入选企业的十一款AI芯片产品,希望能为“国产替代”选型提供AI芯片选择。
(注:以下排序仅为介绍产品,不代表评选名次)



1

虎贲T710

紫光展锐

虎贲T710采用8核CPU架构,由4颗2.0GHz的Arm Cortex-A75及4颗1.8GHz的Arm Cortex-A55组成,搭载工作频率为 800MHz 的IMG PowerVR GM 9446 图形处理器。虎贲T710包含了 CPU、GPU、NPU、ISP、VDSP等处理单元,为各类丰富的AI应用提供了高效能、低功耗的技术基础。


2019年7月,苏黎世联邦理工学院AI Benchmark公布了AI芯片算力排行榜,排名第一是紫光展锐虎贲T710,28097分;


除了架构和算力,虎贲T710在能效和商用成熟度上也领先业界,其中:能效 ≥ 2.5TOPS/W,超过业界平均水平30%;支持多种AI训练框架, 如TensorFlow、TensorFlow Lite、Caffe……;支持多种AI模型量化方式,包括INT4、INT8、INT16和FP16……;支持Android NN,并且提供紫光展锐自研SDK,使第三方应用程序更高效部署AI功能。


此外,虎贲T710还整合了如4K@30fps编解码,802.11AC,BT 5.0等强大的多媒体能力和先进的无线通信能力。


2

DeepEye1000

云天励飞


云天励飞芯片平台-Moss于2018年推出了第二代自主知识产权的人工智能芯片DeepEye1000。DeepEye1000是一款异构多核视觉分析SoC芯片,内嵌一颗自定义指令集神经网络处理器。


与通用GPU相比,DeepEye1000单位性能提升20倍,单位能效提升100倍,系统时延降低200倍,具有低功耗、高能效、智升级、可编程等特点,可广泛用于摄像机、机器人、无人机,以及数字城市、新零售等场景,实现视觉AI城市大脑终端摄像机的安全、独立、自主、可控。


3

思元270

寒武纪


思元270芯片集成了寒武纪在处理器架构领域的一系列创新性技术,理论峰值性能达到每秒128万亿次人工智能基本运算(INT8);同时兼容INT4和INT16运算,理论峰值分别达到每秒256万亿次和64万亿次;思元270采用寒武纪公司自主研发的MLUv02指令集,可支持视觉、语音、自然语言处理以及传统机器学习等高度多样化的人工智能应用。


 理论峰值性能提升4倍,思元270集成了120亿个晶体管,处理稠密机器学习模型的理论峰值性能提升至上一代思元100的4倍,达到128万亿次(INT8)。定点训练领域取得关键性突破 在定点训练领域取得关键性突破。


4

XS2001

芯声智能

XS2001是一款专用的离线语音识别前端芯片,它兼顾了超低功耗和近/远场识别高强度计算的两方面需求。


一方面,低功耗芯片技术和人工智能算法支持Always-on唤醒模式,唤醒功耗小于0.8mW;另一方面,内部有可编程低功耗的神经网络计算引擎和支持SIMD功能的CPU(基于RISC-V架构),以及丰富的内存资源,最高频率可达150MHZ。最高同时支持4个模拟(或数字)MIC输入。


芯片自带AGC,AEC,波速成型,去混响,复杂降噪算法,语音识别等超过10种自有知识产权的音频算法。当前产品已经与数个主流平台厂商、ODM以及众多终端厂商完成了design-in。广泛应用于TWS耳机,手机,智能家居,智慧照明等领域。


5

雨燕(Swift)

云知声

云知声耗时近3年,打造了全球首款面向物联网的AI芯片UniOne,并于2018年5月16日发布了第一代UniOne芯片及其解决方案——雨燕(Swift)。


该芯片由云知声自主设计研发,采用云知声自主AI指令集,拥有具备完整自主知识产权的DeepNet、uDSP(数字信号处理器),支持DNN/LSTM/CNN等多种深度神经网络模型,性能较通用方案提升超50倍。 


发布芯片四个月后,云知声便选择将基于UniOne雨燕的解决方案进行开源,于9月12日以“芯玩家”为主题发布了智能家居、智能音箱的两套标杆解决方案。通过云端芯结合,提供给客户与合作伙伴面向具体场景的软硬件Turn-key解决方案。


6

求索(QuestCore)

依图科技

 

求索(QuestCore)是全球首款云端视觉AI芯片,也是目前性价比最高的云端AI推理芯片。设计和制造全部在国内完成,加速高端处理器芯片自主可控进程。


单芯片支持50路高清视频实时全解析,单路摄像头功耗仅为NVIDIA Tesla P4的30%,AI计算能效比是先进GPU方案的5-10倍。


基于拥有自主知识产权的神经网络加速核ManyCore,SoC设计,可不依赖Intel x86 CPU在云端独立运行,本身即是一颗具有完整端到端业务处理能力的异构运算处理器,平衡了传统的CPU计算、AI计算、存储和片上数据传输,灵活可扩展的架构使其能兼顾云端和边缘的视觉推理需求。



7

征程二代

地平线

 

地平线推出了中国首款车规级AI芯片——征程二代,征程二代芯片基于地平线自主研发的高性能计算架构BPU2.0,于2019年初流片成功,并已实现量产。目前,征程二代的开发套件已完全准备就绪,可支持客户直接进行产品设计。


搭载地平线自主创新研发的高性能计算架构BPU2.0(Brain Processing Unit),可提供超过4 TOPS的等效算力,典型功耗仅2瓦。征程二代能够高效灵活地实现多类AI任务处理,对多类目标进行实时检测和精准识别,可全面满足自动驾驶视觉感知、视觉建图定位、视觉ADAS等智能驾驶场景的需求,以及语音识别,眼球跟踪,手势识别等智能人机交互的功能需求,充分体现BPU架构强大的灵活性,全方位赋能汽车智能化。



8

太行语音芯片:TH1520

深聪智能

 
TH1520是深聪智能根据语音交互市场及算法的需求和发展方向,定义开发的“芯片+算法”人工智能人机语音交互解决方案,具有高性能、低功耗等特点。


技术亮点
A)体验好:最高支持六麦克风拾音,抗干扰能力强,反应迅速,唤醒率高;
B)低功耗:毫瓦级待机功耗,百毫瓦级全速工作功耗,适用于可移动设备。
C)离线识别:支持全离线识别,可离线识别多达100条指令;
D)快速部署:芯片内置算法,可定制关键词并快速部署于各类设备;
E)灵活适用:支持多种布置方案,可满足各种IOT产品的需求。



9

人工智能语音芯片CI110X系列

启英泰伦

2019年9月,由启英泰伦自主研发的人工智能语音芯片CI110X系列正式发布。该系列芯片基于NPU+MCU架构设计,是行业首款降噪识别一体的多核人工智能语音专用芯片。


在架构、技术方面,CI110X系列芯片实现了多项创新。
① 自主研发脑神经网络处理器核( BNPU),可支持64个神经元节点的并行计算,计算能力大大提高;
② 自主研发降噪等硬件算法模块,可实现噪声抑制、混响消除、回声消除、声纹识别、波束成形,声源定位等丰富功能,另还加持了公司自主研发的新一代本地命令词自学习技术;
③ 高度集成:集成 Audio Codec 模块,硬件音频处理模块,多路 UART、I2C、SPI、PWM、GPIO、SDIO 等外围接口,极大降低了方案模组的硬件成本;
④ 采用特色低功耗技术,其功耗相对于采用CPU计算的软件方案下降20倍左右。


  

10

GP8300

华夏芯

GP8300实现了在华夏芯自主Unity ISA指令集下,CPU、DSP、GSNN在异构计算架构下的缓存共享实现,达到了真正意义上的异构计算。由于GP8300 SoC上的CPU、DSP、GSNN都采用了华夏芯统一的Unity ISA指令集,使得整个系统的运行功耗非常低,运行效率非常高。如在Tiny YOLO环境下,GP8300的识别速度可达60FPS。同档位的英伟达TX2识别速度只有17~18FPS。


GP8300采用华夏芯全自主知识产权、4核64位超标量CPU:采用三发射、乱序猜测、动态多级流水线架构,包含 MMU,运行频率2GHz@28nm,标量(IU & FU) 计算:支持64位整数指令,支持半精度(16位)、单精度(32位)和双精度(64位)浮点指令;具有可变长向量(VLV)计算单元:向量寄存器长度1KB,向量计算宽度256位,支持8/16/32位整数、半精度 (16位)浮点数据类型,运行频率2GHz@28nm;采用AI专用处理器内核:华夏芯全自主知识产权、双核 AI计算处理器,采用可编程RISC架构异步多核架构。



11

星空加速卡

鲲云科技

星空加速卡是一款面向服务器端进行深度学习推断的计算加速卡,基于鲲云自主研发的定制数据流架构CAISA 2.0,可实现76%~98%的芯片利用率。在同等峰值芯片性能情况下,鲲云的产品为人工智能应用提供更高的算力支撑。   


鲲云的星空加速卡基于其自主研发的定制数据流CAISA架构和端到端自动编译工具链RainBuilder。该架构不同于传统的指令集的架构方式,采用数据流的方式,摆脱对于数据的依赖性,避免过多与运算无关的资源浪费,最大化利用硬件资源,性能实现线性增长;同时专为CAISA架构设计的RainBuilder编译工具链支持TensorFlow、Caffe及ONNX等主流框架下深度学习算法无缝链接,提供从算法模型到芯片级算法部署的一整套开发套件,保证了其通用性和易用性。


CAISA硬件架构与RainBuilder编译器结合,使鲲云产品在达到高效能的同时具有高拓展性,为人工智能算法的快速应用落地提供高性能算力支撑。         
以上十一款参评AI芯片产品,现已经过18天20万电子工程师线上评选+30位资深业内人士线下评分。综合所有评分,本次评选最终结果将于12月19日在会展中心1号展馆1B会议厅举办的“2019硬核中国芯领袖峰会暨颁奖盛典”中揭晓,欢迎半导体行业人士报名,现场共同见证中国芯片的崛起。



若您也有国产AI芯片推荐,也可以在评论区以“公司+产品名称+产品简介”格式展示产品,如:紫光展锐,虎贲T710:该芯片......

- END -


您也有AI芯片要推荐?


更多AI芯片介绍,欢迎在留言区评论展示!


 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: TI培训

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved