Altera FPGA实现的加速功能具有优异的每瓦性能

发布者:huanli最新更新时间:2015-03-02 来源: EEWORLD关键字:Altera 手机看文章 扫描二维码
随时随地手机看文章
    据报道,使用具有硬核浮点DSP模块的Altera高端FPGA,性能和功效得到了大幅度提高

    Altera公司(NASDAQ: ALTR)今天宣布,微软(NASDAQ: MSFT)采用Altera Arria® 10 FPGA (现场可编程门阵列)实现基于CNN (卷积神经网络)算法的数据中心加速功能,其每瓦性能非常优异。这些算法通常用于图像分类、图像识别,以及自然语言处理等。

    微软研究人员在云技术上不断取得进展,采用Arria 10开发套件和Arria 10 FPGA工程样片,展示了每瓦40 GFLOPS的性能——数据中心业界最好的性能水平。而且,与GPGPU相比,在CNN平台上,这一FPGA的性能功耗比是CNN的3倍。之所以能够达到这一性能水平,是由于采用了开放软件开发语言OpenCL,以及VHDL对Arria 10 FPGA及其IEEE754硬核浮点DSP (数字信号处理)模块进行编程。

    微软研究院客户和云应用总监Doug Burger评论说:“我们看到,采用了Arria 10工程样片后,CNN性能和功效大幅度提升,硅片中DSP模块的高精度硬核浮点功能是我们取得令人注目的研究成果的主要原因。”在微软的一篇博客文章中,http://bit.ly/1MMMzvG,Burger介绍了数据中心在基础设施上遇到的难题,以及微软是怎样通过采用可编程FPGA替代传统CPU来解决这些难题的。

    Altera计算和存储业务部总监Michael Strickland说:“FPGA在神经算法上有体系结构方面的优势,能够非常高效的进行卷积和汇集,其灵活的数据通路支持大量的OpenCL内核直接互相传送数据,而不需要使用外部存储器。Arria 10在体系结构上还有更多的优势,乘法和加法都支持硬核浮点——这种硬核浮点功能在逻辑数量和时钟速度上要优于传统的FPGA产品。”

    Altera曾宣布微软使用其Stratix V FPGA在创新的Catapult电路板上加速进行搜索,这类电路板于去年年底部署在第一个必应数据中心的服务器中。

相关评论

    具有硬核浮点DSP功能的Altera 20 nm FPGA展示了业界最好的性能和功效水平

    很多公司使用具有内置硬核浮点DSP功能的Altera Arria® 10 FPGA产品获得了令人瞩目的每瓦性能。Altera与客户和合作伙伴在解决方案上密切协作,实现高性能计算(HPC)、数据中心加速,以及金融系统。

微软——Doug Burger,客户和云应用总监

    微软研究院客户和云应用总监Doug Burger评论说:“我们看到,采用了Arria 10工程样片后,CNN性能和功效大幅度提升,硅片中DSP模块的高精度硬核浮点功能是我们取得令人注目的研究成果的主要原因。”微软的一篇博客文章,http://bit.ly/1MMMzvG

Bittware——Jeff Milrod,总裁兼CEO,Bittware

    Bittware总裁兼CEO Jeff Milrod评论说:“Altera的Arria 10真正的改变了游戏规则。利用这些器件中的自然浮点引擎,系统设计人员能够非常方便、高效的使用FPGA中大量的浮点资源。传统的信号处理应用现在可以直接连接Arria 10模拟信号,以浮点方式处理它们。对于HPC和加速应用,再也不需要将FPGA算法导出至定点,也不用对浮点进行低效的定点仿真来实现。Arria 10自然的浮点功能性能高达40 GFLOPS/W,而且Fmax更高,只使用了三分之一的逻辑资源。与以前任何其他的解决方案相比,它使用方便,功耗低,速度快,占用的资源更少。”

Gidel——Reuven Weintraub,创始人兼CTO,Gidel

    Gidel创始人兼CTO Reuven Weintraub评论说:“我们对于Altera Arria 10前所未有的单位功耗触发性能非常感兴趣。长期以来,FPGA在比特、字节和整数处理方面的单位功耗性能非常优秀。Altera Arria 10强大的单位功耗浮点性能为Gidel产品开辟了新天地,非常适合很多HPC和DSP应用。”

Nallatech——Allan Cantle,总裁,创始人,Nallatech

    Nallatech总裁、创始人Allan Cantle评论说:“Nallatech移植了我们客户的产品代码,这需要使用Altera OpenCL编译器的浮点数学功能。把这些功能在具有专用浮点DSP的新Arria 10 FPGA中实现,我们减少了对逻辑资源的占用,而且提高了时钟频率,进一步提高了每瓦性能指标,使得Nallatech新的基于Arria 10的加速器在更多的应用领域中脱颖而出。”

ReFLEX CES——Yann Casteignau,首席工程师,ReFLEX CES

    ReFLEX CES首席工程师Yann Casteignau评论说:“ReFLEX CES最近发布了基于Altera Arria10 FPGA的FPGA电路板,这主要受益于这一第10代FPGA系列中新的浮点DSP模块。我们的目标是帮助客户大幅度提高GFLOPS/W比(预期有三倍),同时,减少实现复数浮点计算所需要的逻辑资源,为客户实现自己的设计留有更大的空间。我们很多客户在高性能计算中都使用了ReFLEX CES电路板,功耗是他们面临的主要难题。采用Arria10 FPGA,不但降低了功耗,而且计算性能更好。对于ReFLEX CES电路板,Arria10新的硬核DSP浮点运算是决定性的优势,提高了性能,减少了所使用的逻辑资源,优化了GFLOPS/W比。”
关键字:Altera 引用地址:Altera FPGA实现的加速功能具有优异的每瓦性能

上一篇:低成本DSP开发平台加快成像检测和高级音频应用上市时间
下一篇:Altera和中国移动在MWC 2015上展示5G的虚拟化C-RAN平台

推荐阅读最新更新时间:2024-05-02 23:30

英特尔宣布成立全新独立运营的FPGA公司—Altera
Altera致力于为客户提供端到端的FPGA、易于使用的AI、软件和弹性供应链 今天,英特尔宣布成立全新独立运营的FPGA公司——Altera。在FPGA Vision线上研讨会期间,首席执行官Sandra Rivera和首席运营官Shannon Poulin进行了分享,展示其在超过550亿美元的市场中保持领先性的战略规划,强调将通过打造集成AI功能的FPGA等举措,进一步丰富公司的产品组合,同时亦表明将持续助力客户应对不断增加的挑战。会上,Altera也作为新公司的品牌正式对外公布。 Altera首席执行官Sandra Rivera表示,“现阶段,客户正面临日益复杂的技术挑战,而我们始终致力于打造差异化优势,加快产
[嵌入式]
英特尔宣布成立全新独立运营的FPGA公司—<font color='red'>Altera</font>
Altera Quartus II软件v13.1编译时间缩短70%
新版软件包括在编译时间上的进步,增强了高级设计流程,提高了效能 2013年11月6号,北京——Altera公司 (NASDAQ: ALTR)今天宣布发布Quartus® II软件13.1版,通过大幅度优化算法以及增强并行处理,与前一版本相比,编译时间平均缩短了30%,最大达到70%,进一步扩展了在软件效能方面的业界领先优势。软件还包括最新的快速重新编译特性,适用于客户对Altera Stratix® V FPGA设计进行少量源代码改动的情形。采用快速重新编译特性,客户可以重新使用以前的编译结果,从而保持性能,不需要前端设计划分,进一步将编译时间缩短了50%。 软件和IP产品市场主任Alex Grbic评论说:“我们的Quartu
[嵌入式]
首届5G算法创新大赛:SCMA赛事评述
作者:西南交通大学 范平志教授 多址接入是无线通信物理层最核心的技术之一,它使得无线基站能区分且同时服务多个终端用户,并使得相互干扰(多址干扰)最小。现有系统大多采用正交多址接入方式,即多个用户通过在不同维度上(频分、时分、码分等)正交划分资源来接入,如目前4G系统中采用的OFDMA多址技术就是其中之一。 正交多址技术由于其可容纳的接入用户数与正交资源成正比,而正交资源数量受限于正交性要求,因此不能满足未来5G时代广域连续覆盖,热点高容量、海量连接、低延时接入等的业务需求。于是,非正交多址接入就成为当下备受瞩目的5G多址接入的研究重点。SCMA(Sparse Code Multiple Access)稀疏码多址接入就是
[网络通信]
首届5G算法创新大赛:SCMA赛事评述
FPGA运算加速平台成新宠 Xilinx、Altera各有支持者
美商FPGA大厂赛灵思(Xilinx)近年来极力布局云端服务器资料中心的商机,和百度的合作关系更上一层楼,百度正式在全新的公有云加速服务器中,采用赛灵思FPGA产品线包括Kintex FPGA、工具和软件,主要是提前布局卡位机器学习和资料安全等商机。百度FPGA云端服务器是百度云的一项新服务,可为每位用户提供一个独享的FPGA加速平台,每个FPGA都是一款专用的加速平台,而实例或用户之间不会共享,包含深度学习加速、加解密等FPGA加速实例。 赛灵思表示,相较于仅使用CPU的服务器,使用百度FPGA云端服务器在赛灵思FPGA所驱动的服务器中,提供10~80倍的每瓦效能比,且因为赛灵思FPGA具有动态可重组性,能支持广泛的作业负载,包
[半导体设计/制造]
整合Altera之后,英特尔的物联网之路该如何走下去?
去年12月份,英特尔宣布斥资167亿美元收购可编程芯片厂商Altera,它是英特尔迄今为止规模最大的一笔收购,标志着该公司要加速推进在日渐萎缩的PC业务以外的市场发展的计划。 到现在为止,这项收购已经过去了七个月,被收购之后的Altera有了哪些改变呢?Altera的产品和市场策略在未来会是怎样的呢?2016年7月28日,英特尔可编程解决方案事业部在北京举行媒体见面会,会上英特尔可编程解决方案事业部(PSG)产品营销资深总监Patrick Dorsey向笔者详细介绍了收购之后的一些情况和未来的发展思路。 英特尔+FPGA,进军物联网 对于高性能计算来说,FPGA可以说是一颗大补丸。Alte
[嵌入式]
整合<font color='red'>Altera</font>之后,英特尔的物联网之路该如何走下去?
Altera 推出具有530K逻辑元件FPGA 的开发套件
Altera 公司 (NASDAQ: ALTR) 今天宣布推出其面向 Stratix® IV FPGA 的最新开发套件。Stratix IV E FPGA 开发套件具有业界最高密度、最高性能的 FPGA。该套件为用户提供了全面的设计环境,其中包括迅速开始其高密度原型产品设计所需的硬件和软件。 Stratix IV E FPGA 开发套件基于高性能、高密度的 Stratix IV EP4SE530 FPGA。该 FPGA 具有 530K 逻辑单元 (LE),比当前市场上同类竞争产品的 FPGA 性能平均高 25%。Stratix IV EP4SE530 FPGA 所具有的性能和密度优势,让使用 Stratix IV
[嵌入式]
<font color='red'>Altera</font> 推出具有530K逻辑元件FPGA 的开发套件
辟谣最强音:有了Intel,Altera与台积电、ARM还是好朋友
当Intel宣布收购Altera后,竞争对手开始向市场吹风,如除了数据中心市场,短时间不会重视其他市场;与台积电和ARM的合作关系恐怕会有问题......这让FPGA整个市场疑云密布。 近日,在北京举办的Altera技术日(ATD)期间,记者从Altera公司产品营销资深总监Patrick Dorsey先生那里得到了一些 维稳 重要信息。其实这次采访更像是一次辟谣发布会,让记者和客户对Altera的未来更加明朗化,更加有信心。 与台积电、ARM是朋友还是敌人? 我们会百分之百继续与台积电合作。答案很简单,现在的收入都是和台积电有关的,因为我们和Intel新的产品还没有出货。我们与台积电之间的合作关系是非常密切的
[嵌入式]
辟谣最强音:有了Intel,<font color='red'>Altera</font>与台积电、ARM还是好朋友
革新推出基于ALTERA Nios II SOPC系列开发实验平台
革新科技近日全面推出其GX-SOC/SOPC-Dev-Lab。该平台适合IC集成电路设计、IP CORE设计验证应用、图像/通讯创新开发设计等。适用于计算机和电科类等专业本科生、研究生、博士生及全国相关各科研院所。 GX-SOC/SOPC-Dev-Lab Platform系列实验平台采用ALTERA公司Cyclone系列FPGA处理器,先进的模块化设计、丰富的人机交互方式使得平台具有较好的灵活性。系统集成了很多常见接口,包括4个速度大于1Gb/s的100Pin高速板对板接插件接口、专为开发设计的2个64Pin 32位PCI标准总线PMC高速接口、2组与Altera开发板相兼容的扩展接口等。 实验平台包含基础实验、综合实验、创新
[新品]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved