近年来人工智能技术发展迅速,在金融、交通、制造、安保等众多领域的应用已经让人们见识到人工智能社会到来可能带来的巨大变革。世界各国也高度重视人工智能发展,纷纷出台相关战略和政策,并加大研发投入。根据中国电子学会统计,2018年全年,全球人工智能核心产业市场规模超过555.7亿美元,相较于2017年同比增长50.2%。目前中国人工智能行业的企业总数达到670家,占全球的11.2%。
面对人工智能市场持续升温,人们对于这些系统应如何建构仍十分分歧。随着人工智能与机器学习的应用场景快速发展演进,新的解决方案都要去应对在高性能、灵活和上市时间等方面的不同需求。根据市场调研公司Semico Research的预测,人工智能应用中FPGA的市场规模将在未来4年内增长3倍,达到52亿美元。
在这种趋势下,日前Achronix半导体公司在北京召开了新品发布会宣布推出了全新的Speedster7t FPGA系列产品,以满足人工智能/机器学习(AI/ML)和高带宽数据加速应用日益增长的需求。在Achronix 总裁兼首席执行官Robert Blake看来:AI/ML的应用场景快速发展演进,对芯片的算力、安全性等提出更高要求。Speedster7t是灵活的FPGA技术与ASIC核心效率的融合,从而提供了一个全新的‘FPGA+’芯片品类,它们可以将高性能技术的极限大大提升。
图 Achronix总裁兼首席执行官Robert Blake
专为机器学习和高带宽网络应用打造的Speedster7t
说起Achronix这个名字,也许业界人士还感到陌生,其实Achronix历来都是高性能FPGA市场向前发展的推动者之一。Robert介绍Achronix半导体公司是一家私有的、采用无晶圆厂模式的半导体公司,总部位于美国加利福尼亚州圣克拉拉市,同时提供高性能FPGA和嵌入式FPGA(EFPGA)解决方案。目前,Achronix提供的产品包括可编程的FPGA结构、具有硬连线系统级模块的分立式高性能和高密度FPGA、数据中心和HPC硬件加速器板,以及支持所有Achronix产品的一流EDA软件。
由于通常情况下,相对于ASIC而言,FPGA有上市时间和成本上的优势。另外,在很多环境下FPGA执行某些功能较CPU更高效。这就是为什么它不但运用在数据中心的服务器、交换器、存储层的各个角落,并且具有加速整个工作流程的功能。随着人工智能/机器学习的应用场景快速发展演进,低功率、高吞吐量及低延迟则是AI系统的通用需求。然而很多情况下,增加系统的处理速度势必代表着更多的投入和成本的攀升,两者很难同时满足。
正是看到这种发展趋势,Achronix推出了突破性的Speedster7t FPGA系列产品,该系列产品对高带宽数据加速应用提供ASIC级性能,并具有FPGA的灵活性。
Robert在会上强调Speedster7t FPGA系列产品是专为高带宽应用进行设计,具有一个革命性的全新二维片上网络(2D NoC),以及一个高密度全新机器学习处理器(MLP)模块阵列。通过将FPGA的可编程性与ASIC的布线结构和计算引擎完美地结合在一起,Speedster7t系列产品创造了一类全新的“FPGA +”技术。
“Speedster7t是Achronix历史上最令人激动的发布,代表了建立在四个架构代系的硬件和软件开发基础上的创新和积淀,以及与我们领先客户之间的密切合作。”Robert表示在开发Speedster7t系列FPGA的产品过程中,Achronix的工程团队完全重新构想了整个FPGA架构,以平衡片上处理、互连和外部输入输出接口(I / O),以实现数据密集型应用吞吐量的最大化,这些应用场景可见于那些基于边缘和基于服务器的AI / ML应用、网络处理和存储。
五大能力奠定Speedster7t独特优势
Robert介绍Speedster7t器件采用了TSMC的7nm FinFET工艺制造,是专为接收来自多个高速来源的大量数据而设计,同时还需要将那些数据分发到可编程片上算法性和处理性单元中,然后以尽可能低的延迟来提供那些结果。Speedster7t系列产品包括高带宽GDDR6接口、400G以太网端口和PCI Express Gen5等接口,所有这一切单元都互相连接以提供ASIC级带宽,同时保留FPGA的完全可编程性。此外,它还包括以下特点:
1、为计算性能进行了高度的优化
Speedster7t FPGA的核心是其全新机器学习处理器(MLP)中大规模的可编程计算单元平行阵列,它们可提供业界最高的、基于FPGA的计算密度。MLP是高度可配置的、计算密集型的单元模块,可支持4到24位的整点格式和高效的浮点模式,包括对TensorFlow的16位格式的支持,以及可使每个MLP的计算引擎加倍的增压块浮点格式的直接支持。
MLP与嵌入式存储器模块紧密相邻,通过消除传统设计中与FPGA布线相关的延迟,来确保以750 MHz的最高性能将数据传送到MLP。这种高密度计算和高性能数据传输的结合使得处理器逻辑阵列能够提供基于FPGA的最高可用计算能力以每秒万亿次运算数量为单位(TOPS,Tera-Operations Per Second)。
2、世界级的带宽
高性能计算和机器学习系统的关键之处是高片外存储器带宽,从而为多个数据流提供存储源和缓冲。 Speedster7t器件是唯一支持GDDR6存储器的FPGA,该类存储器是具有最高带宽的外部存储器件。每个GDDR6存储控制器都能够支持512 Gbps的带宽,Speedster7t器件中有多达8个GDDR6控制器,可以支持4 Tbps的GDDR6累加带宽,并且以很小的成本就可提供与基于HBM的FPGA等效存储带宽。
除了这种非凡的存储带宽,Speedster7t器件还包括业界最高性能的接口端口,以支持极高带宽的数据流。Speedster7t器件拥有多达72个业界最高性能的SerDes,可以达到1到112 Gbps的速度。还有带有前向纠错(FEC)的硬件400G以太网MAC,支持4x 100G和8x 50G的配置,以及每个控制器有8个或16个通道的硬件PCI Express Gen5控制器。
3、超高效率的数据移动
来自Speedster7t高速I / O和存储器端口的数万兆比特数据很容易淹没传统FPGA面向比特位的可编程互连逻辑阵列的路由容量,而Speedster7t架构包含一个可横跨和垂直跨越FPGA逻辑阵列的创新性的、高带宽的二维片上网络(NOC),它们连接到所有FPGA的高速数据和存储器接口。它们就像叠加在FPGA互连这个城市街道系统上的空中高速公路网络一样,Speedster7t的NoC支持片上处理引擎之间所需的高带宽通信。NoC中的每一行或每一列都可作为两个256位实现,单向的、行业标准的AXI通道,工作频率为2Ghz,同时可为每个方向提供512 Gbps的数据流量。
通过在Speedster中实现专用二维 NoC,极大地简化了高速数据移动,并确保数据流可以轻松地定向到整个FPGA结构中的任何自定义处理引擎。最重要的是,NOC消除了传统FPGA使用可编程路由和逻辑查找表资源在整个FPGA中移动数据流中出现的拥塞和性能瓶颈。这种高性能网络不仅可以提高Speedster7t FPGA的总带宽容量,还可以在降低功耗的同时提高有效LUT容量。
4、针对安全性至上和硬件确保应用的安全防护功能
Speedster7t FPGA系列产品在面临第三方攻击的威胁时,可用最先进的比特流安全保护功能应对,它们具有的多层防御能力可保护比特流的保密性和完整性。密钥是基于防篡改物理不可克隆技术(PUF)进行加密,比特流由256位的AES-GCM加密算法进行加密和验证。为了防止来自旁侧信道的攻击,比特流被分段,每个数据段使用单独导出的密钥,且解密硬件采用差分功率分析(DPA)计数器措施。 此外,2048位RSA公钥认证协议被用来激活解密和认证硬件。用户可以确信的是当他们加载其安全比特流时,它是预期的配置,这是因为它已通过RSA公钥、AES-GCM私钥和CRC校验进行了身份验证。
5、经验证的、可向低成本ASIC转换的途径,用以满足大批量需求
Achronix是唯一一家既提供独立FPGA芯片又提供Speedcore嵌入式FPGA(eFPGA)半导体知识产权(IP)的公司。Achronix在Speedcore eFPGA IP中采用了与Speedster7t FPGA中使用的同一种技术,可支持从Speedster7t FPGA到ASIC的无缝转换。FPGA应用通常具有必须保持可编程性的功能,而其他固定功能则是专用于特定的系统应用。对于ASIC的转换而言,固定功能可以被固化进ASIC结构中,从而减小芯片面积、成本和功耗。当使用Speedcore eFPGA IP将Speedster7t FPGA转换为ASIC时,客户有望节省高达50%的功耗并降低90%的成本。
持续创新推动高性能FPGA市场向前发展
Achronix长期以来在可编程逻辑领域总是不断创新,为业界树立了领先性能、功耗和成本的标准。早在2013年,随着其Speedster22i FPGA产品系列开始量产,Achronix提供了业界最先进的、带有面向高性能有线通信应用的嵌入式系统级IP的FPGA产品。Speedster22i系列是第一款专用的FPGA,可支持全新的、创新的和高性能的可编程设计。
2016年10月,Achronix宣布其Speedcore 嵌入式FPGA(eFPGA) IP产品实现量产供应,实现了客户在自己的SoC中对可编程逻辑的集成。在发布之时,Achronix已经向多家客户付运了Speedcore IP产品;自那时起,出现了对Speedcore IP产品的前所未有的需求。Speedcore IP是专为计算和网络加速应用而设计的。
本次Achronix推出了突破性的Speedster7t FPGA系列产品,让FPGA的小尺寸、低功耗以及高灵活性等特点契合人工智能/机器学习(AI /ML)和高带宽应用。未来,全球人工智能市场仍将持续高速增长,“Achronix将继续发挥自身在FPGA领域的技术优势及专业服务能力,满足用户对于产品灵活性、低成本、高性能方面的需求。”Robert总结道。
上一篇:Telexistence智能机器人成为人类分身 上演隔空取物和远程旅游
下一篇:现代机器人之父再出发 为工业机器人建立一个更好的大脑
- 【CW32】自律定时器
- 使用 ROHM Semiconductor 的 BU4848 的参考设计
- 开源功率计:带电源功能,专用于物联网功耗测量
- LFRD001:MAX1472 / MAX1473 / MAXQ610远程无钥匙进入参考设计
- 智能手机FM音频发射器设计方案
- 具有反向电流阻断功能的 ADP198 1A、WLCSP 高端负载开关的典型应用电路
- 使用 Infineon Technologies AG 的 IR2159 的参考设计
- LF33ABDT-TR 3.3V 极低压降稳压器的典型应用
- Zkong 2.13三色屏驱动板 ZKC21V ESL-BWR
- PM8903ATR 3 A 降压单片开关稳压器的典型应用