英特尔为何敢说Agilex是首款面向数据中心的FPGA

2019-04-04来源: 互联网关键字:英特尔  Agilex

在英特尔收购Altera的两年后,宣布推出首款全新系列FPGA,命名为Agilex,英特尔表示,这是首款面向数据中心领域的FPGA,正如词根Agil所述,该产品旨在强调英特尔为实现超高敏捷性和灵活性进行的创新。

 

英特尔可编程解决方案事业部首席产品营销官Patrick Dorsey表示,Agilex并不是Stratix的延续,而是一个全新的平台,该产品是英特尔第一次利用了公司里面所有的资源和能力,集大成所为,在一个平台上面完成整个的解决算法。

 

“这是我们推出的第一款该类型产品,因此值得有一个新名字!”Dorsey说道。

 

纵观Altera此前的产品线,Max系列是上世纪90年代推出的,Stratix和Cyclone是2002年推出的,Arria系列是2007年推出。值得注意的是,此前Altera FPGA的系列命名都是依据产品的密度和性能来分类,而今为了瞄准单一应用的FPGA系列问世。10年没有新系列推出的英特尔/Altera,能否凭借双方在FPGA和数据中心上的积累,进一步拓展在数据中心领域的优势呢?

 

实际上不久前在英特尔2019中国媒体纷享会上,英特尔中国区总裁杨旭也指出,英特尔将从以晶体管为中心向以数据为中心全面转型。而此次Agilex的发布,也是英特尔数据化转型过程中至关重要的一步。

 

图片.png

英特尔可编程解决方案事业部首席产品营销官Patrick Dorsey

 

Agilex的性能优势

 

 

根据规划,Agilex将推出3大系列产品,以适用于不同的应用场景。

 

 

从英特尔提供的数据来看,和Stratix 10相比,在处理性能、存储能力和传输能力方面,Agilex都有着明显提升。总体来说,性能提高40%同时能耗降低40%。

 

全面借助英特尔黑科技 


Dorsey介绍道,在基础架构、处理技术、3D封装、软件等方面,Agilex系列产品都全面借助了英特尔的技术,那么全面借助都包含什么?让我们一项项来探寻。

 

最重要的就是异构 3D SiP 技术:这也是英特尔最尖端工艺的集中体现,实际上2018年英特尔技术日上,就展示了Foveros技术——3D逻辑芯片封装。

 

凭借成熟的嵌入式多芯片互连桥接 (EMIB) 技术,英特尔 Agilex FPGA 和 SoC 家族可提供面向异构芯片的高密度芯片到芯片互连,并以低成本提供高性能。由收发器、自定义 IO、自定义计算和英特尔 eASIC 设备块组成的大型设备块库提供了各种应用所需的敏捷性、灵活性和自定义功能。

 

Dorsey介绍道,eASIC是英特尔去年收购的,通过并购,英特尔现在既拥有强大的可编程能力及设计灵活性,同时也可以针对客户的要求,快速进行模组定制化或优化。“我们未来可以把FPGA和eASIC结合,我们可以生产IP硬件,可以在ASIC或FPGA中同时使用,这对客户来讲也是非常方便。”

 

 

异构 3D SiP,也是英特尔及业界所提出的Chiplet技术的最佳实践。chiplet的概念其实很简单,就是硅片级别的重用。设计一个系统级芯片,以前的方法是从不同的IP供应商购买一些IP,软核(代码)或硬核(版图),结合自研的模块,集成为一个SoC,然后在某个芯片工艺节点上完成芯片设计和生产的完整流程。未来,对于某些IP,你可能不需要自己做设计和生产了,而只需要买别人实现好的硅片,然后在一个封装里集成起来,形成一个SiP(System in Package)。所以chiplet也是一种IP,但它是以硅片的形式提供的,比如未来eASIC所做的工作。

 

Hyperflex:英特尔 Hyperflex FPGA 架构在整个 FPGA 结构中引入了额外的可旁路寄存器。每一互联布线段以及所有功能模块的输入上都有这些名为超级寄存器的寄存器。超级寄存器支持采用三种关键设计方法将内核性能提高 2 倍:

 

精细粒度超级重新定时,避免了关键路径。

零延时超级管线,避免了布线延时。

灵活的超级优化,实现了最佳性能。

 

在设计中使用这些方法时,超感知设计工具会自动使用超级寄存器,以实现最大的内核时钟频率。

 

Optane DC:英特尔宣布推出Optane DC Persistent Memory模块,单条最大容量可达512GB,这是专为数据中心使用而设计的新的内存和存储技术,用于从数据中提取更多的价值。Optane DC Persistent Memory目前正在送样,将在今年晚些时候对特定客户出货,预计将在2019年得到广泛应用。

 

与传统的DRAM不同,英特尔Optane DC Persistent Memory可提供高容量、稳定性以及持久性的完美组合。终端用户可以使用这种新的存储系统,通过移动和维护更接近处理器的大量数据,最小化从系统存储中获取数据的延迟,从而更好地优化其工作负载。

 

数据中心中的高容量持久存储器允许应用程序运行,而不会导致在PCIE总线上产生存储延迟。当开发人员设计软件时,这个新的内存种类被设计成能够实现成本效益高、容量大的内存数据库解决方案;保证更多的系统正常运行时间,同时在功率循环之后得以更快恢复;加速虚拟机存储;向多节点分布式云应用提供更高性能;并为硬件内置的持久数据提供高级加密。

 

Dorsey表示,尤其是Optane DC Persistent Memory,可以让英特尔有能力在至强(XEON)和FPGA处理器之间建立一种非常密切的内存一致性。

 

HBM:在Stratix 10 MX版本中,已经实现了对3D 堆栈式高带宽内存(HBM)的支持, Stratix 10 Mx 设备的带宽比 DDR4 SDRAM 等目前的独立内存解决方案的带宽高 10 倍。传统的 DDR4 DIMM 带宽大约为 21 Gb/秒,而 1 个 HBM2 区块高达 256 GB/秒。

 

英特尔 Stratix 10 MX 设备在一个封装中集成了兩台 HBM2 设备,最大内存带宽高达 512 GBps。

 

DDR5:众所周知,英特尔在不遗余力的开发对于DDR5的支持,而业界也都会看英特尔对于新型内存接口的反映。

 

PCIe 4/5:相比Stratix10,Agilex支持PCIe 4以及即将到来的PCIe 5,这得益于英特尔在总线方面的历史积累。

 

计算快速链接(Compute Express Link):英特尔 Agilex FPGA 和 SoC 家族通过Compute Express Link 提供了业界首个面向英特尔至强处理器的缓存和内存一致性互连技术。这项革命性的 FPGA 互连技术将为具有大量数据处理需求的内存密集型应用提供低延迟和性能优势。这是由英特尔、微软、阿里巴巴、思科、戴尔、Facebook、谷歌、惠普企业以及华为组成的科技联盟,正创建名为Compute Express Link(简称CXL)的新计算互联标准,以便在数据中心CPU和加速器芯片之间实现超高速互连。这个科技联盟的目标是提供突破性的数据中心性能,帮助计算机跟上物联网时代数据爆炸性增长的步伐。英特尔数据中心执行副总裁兼总经理纳文·谢诺伊(Navin Shenoy)表示,CXL将消除CPU和数据中心专用加速器芯片之间的瓶颈,加速数据工作负载,如人工智能和机器学习、丰富的媒体服务、高性能计算和云计算应用。这个新成立的组织已经批准了CXL Specification 1.0,它将改进CPU与其他设备(如二级处理器或加速器)之间的通信,并为数据密集型应用程序提供更好的互连和更好的内存一致性。Dorsey说道:“在系统里面很大的一个挑战或者是瓶颈所在,你要是不停地复制这些数据,在处理器和加速器之间不停地要复制,这就造成了一个瓶颈。但是呢,在我们的解决方案当中你不需要再这样复制了,在处理器和FPGA之间,数据不需要再进行这样反复复制了。这也意味着它的TCO会更低,而它的性能会更高。”

 

更强大的DSP处理器:英特尔Agilex FPGA 和 SoC 家族提供了一个可配置的 DSP 引擎,可提供对单精度 FP32、半精度 FP16、BFLOTA16 和 INT8 计算的增强型支持。英特尔Agilex FPGA 和 SoC 家族还支持从 INT7 到 INT2 的低精度配置,以实现最大的灵活性。英特尔 Agilex FPGA 可编程性与 DSP 模块创新相结合,非常适合用于不断变化的人工智能工作负载。值得注意的是BFLOAT16标准,谷歌的TPU里面已经采用了这个标准,目前得到了越来越广泛的应用。与此同时,Agilex还可与英特尔其他AI或其他处理器结合,共同解决AI计算棘手难题。

 

更强大的收发器:Agilex收发器最高支持112Gbps,同时家族拥有包括 28.3Gbps、58Gbps 和 112Gbps 收发器块。再加上对PCIe5的支持,从而为400G、边缘分析、数据中心负载等应用提供高带宽。

 

软硬件开发工具:英特尔除了是硬件公司之外,在软件领域,英特尔同样是有着强劲的实力。从OpenVINO开始,英特尔力求为开发者提供完整的软件解决平台。此次英特尔宣布推出面向软件开发者的One API 软件,为各种计算引擎提供了一个统一、单源、面向软件的异构编程环境。该软件包含一个全面统一的开发人员工具组合,用于将软件映射到可加速代码的硬件。面向 FPGA 的 One API 的主要目标受众是希望使用 FPGA 进行加速的软件开发人员。


在硬件开发软件上,英特尔Quartus Prime进一步升级,19.1相比18.1版本,编译时间缩短30%,内存利用率提高15%。

 

Agilex完成从边缘到云的加速

 

Dorsey表示,随着数据量的不断增长,客户越来越需要高性能的数据处理方案,同时也需要更高灵活性可定制的产品及方案以解决人工智能、深入学习、编码视频等快速发展的领域所遇到的难题。

 

“我们的客户很多,他们所面临的问题各种各样,很难统一地总结。客户的问题数以万计,同时世界上还有那么多的国家和地区,有众多差异化的市场。”

 

Dorsey以英特尔的三类客户,解释了嵌入式边缘、通讯业以及云计算所面临的不同问题。

 

对嵌入式或边缘计算来讲,客户需要提取实时数据,并进行边缘推理。而对于通信来说,包括5G、光纤网络和需要数据分析处理之后进行负载平衡,又或者通过网络硬件虚拟化,从而提高数据处理效率。而对于云计算客户来说,需要在云端进行数据处理、分析及存储加速。这一切,都离不开灵活的数据的处理与分析。

 

Dorsey举例道:“每家云供应商都有自己的想法,可是实际上,在落地的时候,可能都会有一些困难。所以通过FPGA,可以让他们能够在网络方面实现快速创新。而对于数据中心这一块,无外乎是功率和TCO整体拥有成本。数据中心往往是希望能够在同样的配置之下,尽可能地多做一些事情,但是他们的工作负载不同,只有通过与加速器共享内存,网络效率才能更高。”

 

另外,Dorsey强调,5G无线市场的各个阶段,Agilex都可以体现出强大的灵活性和敏捷性等特点。“现在无线市场越来越多的是跟数据有关,比如C-RAN等技术商业化的落地。如今对于5G市场,客户希望可以即可开始导入产品,并根据应用进行优化,以便可以跟上最新标准。”FPGA此前就在通信市场有着充分的市场应用空间,如今通过更多eASIC的Chiplet模式,客户可以获得更多灵活性和更高的性能/功耗比。

 

“Agilex FPGA可以在多个市场、多个领域应用,它的处理器可以是至强,也可以是其他处理器,它还可以单独地工作。比如说在智能城市、智能制造、智能工厂中,Agilex就是一个非常适合的解决方案平台。”

 

“FPGA并不只是小小的一块,而是利用英特尔的全部能力打造出来的解决方案。现在英特尔有超过10万员工,我们希望借助强有力的解决方案,最终端对端地帮助客户解决问题。”Dorcey强调道。


关键字:英特尔  Agilex

编辑:muyan 引用地址:http://news.eeworld.com.cn/FPGA/2019/ic-news04043834.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:FPGA虚拟化技术将成为未来主攻方向
下一篇:新型 FPGA 服务器提供双倍密度的计算资源和网络资源

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

科技版偷袭珍珠港?Intel 处理器的最初设计来自于日本?

这世上的大机遇,从来都不是天上掉下来的,也有可能是别人放弃的! 日本人的大订单1969年,日本商事公司来到美国硅谷拜访英特尔公司,他们想要做一款计算器,愿意花60000美元请英特尔生产12块芯片,并且拿出了他们的设计图纸,一套6种极其复杂的芯片设计方案。 其中一位日本人非常客气的说,如果设计有什么问题,还请不吝赐教。 没想到的是,三个月以后,英特尔负责技术开发的年轻人霍夫居然“大言不惭”非常不客气的对日本人说,你们的设计果然有大问题,我可能要重新设计一个更牛逼的方案。  日本人气炸了,奶奶的,我跟你客气,你还当真了。这几位代表听完以后都不说话,最后有一位站起来,盛气凌人的告诉霍夫
发表于 2019-07-19
科技版偷袭珍珠港?Intel 处理器的最初设计来自于日本?

“模拟大脑”再迈进一大步:英特尔神经拟态系统问世

正在底特律举办的美国国防部高级研究计划局(DARPA)电子复兴峰会上,英特尔公司展示了其最新的可模拟800多万个神经元的Pohoiki Beach芯片系统。该神经拟态系统的问世,预示着人类向“模拟大脑”这一目标迈出了一大步。 该全新神经拟态系统包含多达64颗Loihi芯片,集成了1320亿个晶体管,总面积3840平方毫米,拥有800多万个“神经元”(相当于某些小型啮齿动物的大脑)和80亿个“突触”。英特尔介绍说,该芯片系统在人工智能任务中的执行速度要比传统CPU快一千倍,能效可提高一万倍。新形态芯片可在图像识别、自动驾驶和自动化机器人等方面带来巨大技术提升。 与人脑中的神经元类似,Loihi拥有数字“轴突”用于
发表于 2019-07-19

强势合作 结果必然——英特尔携海信发布智能会议解决方案

会议是日常办公的主要活动。在2018年,根据IDC的数据报告,在整个中国智能会议市场,智能平板销售数量达到17万台,金额34亿人民币,这是爆炸性的成长,相比于中国现有的将近两千万个会议室来说,市场潜力非常巨大。针对这些现状和挑战,英特尔携多家合作伙伴亮相2019 InfoComm展会,一同展示了基于英特尔技术的视觉产品。展会召开期间,英特尔举办了英特尔视觉技术高峰论坛,分享了英特尔在视觉领域的最新技术突破及合作进展,介绍了英特尔物联网生态合作伙伴计划,并宣布将携手合作伙伴海信共同打造下一代智能会议整体解决方案。命中注定的强强联合海信商用显示股份有限公司副总经理杨俊先生海信商用显示股份有限公司副总经理杨俊,首先介绍了双方的合作基调
发表于 2019-07-19
强势合作 结果必然——英特尔携海信发布智能会议解决方案

英特尔成立51年,公司名称竟然是买的

1968年7月18日,集成电路发明者罗伯特.诺伊斯和戈登.摩尔以及工艺开发专家安迪.格鲁夫从仙童半导体辞职,并创立了英特尔公司,其中诺伊斯和摩尔都是知名的八叛逆成员。诺伊斯带着两个人去拜访风险资本家之王阿瑟·罗克,总共只用了五分钟就筹集了足够的创业资金250万美元。后来,罗克回忆道:“我们早已是莫逆之交………正式文件?其实一点也没用。光凭诺伊斯的声誉和人品就足够了。我们发出了仅有的一页半的简单通知,不过在人们看到它之前,我早就筹集到那笔钱了。如果你今天试图做完这件事,也许要写5厘米厚的文件。”洛克也成为英特尔第一任董事长。英特尔最初的商业计划由摩尔撰写,只有三个简单的段落。新公司开张了,起初公司取名是两个创始人的联合名称:摩尔
发表于 2019-07-19

英特尔发布神经拟态计算系统 算力远超PC 可用于自动驾驶

导语:英特尔公布了神经拟态芯片系统Pohoiki Beach,该系统在运行用于自动驾驶、义肢等领域的人工智能算法时,算力远超传统CPU。车东西7月17日消息,据Engadget报道,在推出神经拟态芯片Loihi两年后,英特尔终于又公布了一款主要由Loihi芯片组成的新系统。Pohoiki Beach在运行神经元类任务,如稀疏编码、路径规划、同步定位和地图构建(SLAM)方面表现优异。此外,Pohoiki系统的性能与基于GPU/CPU的系统表现相当,但功耗低得多——这点对于如独立的自动驾驶汽车来说至关重要。一、英特尔公布新系统Pohoiki Beach虽然整个5G智能手机的事情没有成功,但英特尔依然在努力研发Loihi。2017年
发表于 2019-07-18

英特尔携手海信变革协作体验 迈向智能会议新时代

今日,专业视听和集成体验展览会InfoComm China在北京开幕,英特尔携多家合作伙伴亮相展会,一同展示了基于英特尔技术的视觉产品。展会召开期间,英特尔举办了英特尔视觉技术高峰论坛,分享了英特尔在视觉领域的最新技术突破及合作进展,介绍了英特尔物联网生态合作伙伴计划,并宣布将携手合作伙伴海信共同打造下一代智能会议整体解决方案。英特尔与海信共同宣布将携手打造智能会议整体解决方案当前,企业跨区域乃至全球协作的需求日益增长,移动办公、远程办公的趋势愈发明显,与此同时,人们对工作场景下的协作环境提出了更高的要求。会议是协作的重要场景,也是协作环境智能化中备受关注的领域。由于传统的会议系统存在平台复杂,接口标准不一,会议室资源利用
发表于 2019-07-18
英特尔携手海信变革协作体验 迈向智能会议新时代

小广播

夏宇闻老师专栏

你问我答FPGA设计

北京航空航天大学教授,国内最早从事复杂数字逻辑和嵌入式系统设计的专家。

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2019 EEWORLD.com.cn, Inc. All rights reserved