美国阿尔特拉公司(Altera)发布了预定于2015年底供应样品的高端FPGA“Stratix 10”的详情。Stratix 10由2015年6月1日(美国时间)宣布收购阿尔特拉的美国英特尔公司代工,是利用14nm工艺制造的FPGA。
Stratix 10虽然以前就公布了概要,但披露器件产品线等详情还是首次。预定于2015年第四季度供应样品。
图1:接受《日经电子》采访的阿尔特拉产品营销高级总监Patrick Dorsey
Stratix 10通过改善FPGA架构,将实现该公司以往产品“Stratix V”约2倍的性能。不仅在逻辑元件(LE)内,还在LE外部的布线部分设置几百万个寄存器,将管道细分,视用户逻辑的类型,最大工作频率可达900MHz左右。
Stratix 10与已经在供应样品的该公司的中档FPGA“Arria 10”一样,DSP硬宏支持浮点运算。最多的品种配备1.1万个以上的DSP硬宏,浮点运算性能超越美国英伟达的GPU、高达10TFLOPS。该公司的产品营销高级总监Patrick Dorsey说:“我们的产品已经可以与英伟达的GPU展开全面竞争”,显露出对GPU的竞争意识。
与赛灵思在发展方向上的差异明确
Stratix 10的特点主要有4个:(1)实现Stratix V约2倍性能的“HyperFlex架构”;(2)耗电量的削减;(3)采用英特尔的2.5D封装技术;(4)考虑到云端多租户使用的安全功能。
(1)的HyperFlex架构,是类似于微处理器的超级管道技术。是细分管道,增加段数,使其能以更高的时钟频率工作的技术。
具体来说,Stratix 10在接线段设置了专用的“Hyper寄存器”。使用该Hyper寄存器,将细分管道以提高频率。而一般的FPGA,寄存器只配置在LE内,接线段是不配置寄存器的。
图2:利用Hyper寄存器细分管道
据称,因Hyper寄存器的插入,是由编译器端自动进行的,逻辑电路设计者无需顾虑。阿尔特拉2015年5月发布的新设计工具“Quartus II”,配备了实现这一操作的功能。
按照该公司的估算,某无线通信基础设施用电路,Stratix V的最大工作频率为491MHz,而Stratix 10则为982MHz。在数据中心用的加速电路,Stratix V的最大工作频率为156MHz,而Stratix 10为452MHz。
图3:与Stratix V相比的高速化程度
关于(2),与Stratix V相比,Stratix 10的耗电量最大可减少70%。除利用14nm工艺制造技术,降低了电源电压外,与Stratix V相比,还能以较窄的位宽实现相同的性能,据称这也有助于降低耗电量。
图4:与Stratix V相比减少的耗电量
图5:数据中心的使用示例
利用2.5D封装分离PHY,为与Xeon整合作准备?
(3)利用了代工商英特尔的2.5D封装技术“EMIB(Embedded Multi-die Interconnect Bridge)”(参阅本站报道)。
英特尔的竞争对手——美国赛灵思公司(Xilinx)也在使用2.5D封装技术,但阿尔特拉和赛灵思的使用方式完全不同。
赛灵思是把FPGA架构分成数枚芯片,用内插器连接。而阿尔特拉的战略,则是FPGA架构封装在单一芯片中,收发器电路按照不同接口,准备不同的芯片。阿尔特拉把这种芯片叫作“区块”(Tile)。
图6:区块的示意图
阿尔特拉将收发器电路作为单独芯片的理由主要有两个。一是为了方便支持今后可能面世的新一代高速接口。在支持对PCI Express Gen 4等数据速率的高速化,以及含光通信在内等新调制方式时,分芯片更容易替换,实现起来方便。
另一个是FPGA架构收纳在单一芯片中,LE之间的通信“不像赛灵思那样,无需经由不同的内插器,可以提高可靠性”(Dorsey)。赛灵思和阿尔特拉最近在片上存储器、浮点运算等许多方面,战略上的差异逐渐明确,2.5D封装的利用方法也明显不同。
阿尔特拉将收发器电路另分芯片,也可以看作是与英特尔的服务器微处理器“Xeon”整合之前的准备。英特尔在宣布收购阿尔特拉之前,一直在计划推出将Xeon与FPGA集成于同一封装的产品。通过像英伟达GPU配备的接口“NVLINK”那样,使在FPGA端容易配备可以与CPU高速连接的接口,以提高其作为加速器的利用价值。关于这一点,阿尔特拉的Dorsey表示“无可奉告”。
立足云端使用,FPGA终将实现多租户化
关于(4),Stratix 10加入了用来防范非法访问、防范篡改等的“安全设备管理器(SDM)”技术。在芯片内设置约15~150个扇区并予以隔离,使扇区可以单独配置和认证。
作为扇区的使用示例,阿尔特拉举出了防御设备中加密算法的隐藏、无线通信基础设施设备中特定电路的更新(在持续使用特定电路的同时,更新其他部分的电路)等。在该公司列举的示例中,最有特点的当属云服务的例子。
具体来说,就是云服务运营商在自己的基础设施中采用FPGA,把单一FPGA器件分割为多个扇区,出租给多位客户的使用形态。
这就像是在云计算领域,多家用户企业共用同一系统的“多租户”。可以说象征了“重视数据中心用途”这一阿尔特拉的现行发展方向。
图7:将单一FPGA分割使用的“扇区”使用示例
最左侧的云端“多租户”使用象征着阿尔特拉如今的发展方向
美国微软计划于2015年下半年,将为本公司数据中心大量引进FPGA,用来提高搜索引擎的速度,提供基于深度学习(CNN)的图像识别。
估计微软也在考虑把引进的大量FPGA,经由该公司的云服务“Azure”出租给客户。Stratix 10规模最大的品种配备550万个LE。达到如此规模后,在单一FPGA中划分区域,提供给多个应用、多家企业共用的利用形式便成为了可能。
PUF电路为Intrinsic ID制造
Stratix 10为加强防篡改性、加密密钥等,在高端FPGA中首次配备了PUF(physical unclonable function)电路。PUF电路是利用半导体制造误差造成的微小个体差异,生成芯片固有ID的技术。采用的PUF电路为荷兰Intrinsic ID公司制造。
配备PUF的FPGA此前美国美高森美公司(Microsemi)曾推出过,“在赛灵思和阿尔特拉的高端FPGA中配备,估计Stratix 10还是第一个”(Dorsey)。
ARM内核也实现64位化
Stratix 10与以往产品一样,也将准备配备ARM内核的“Stratix 10 SoC”。阿尔特拉的FPGA过去一直配备32位ARM内核,Stratix 10 SoC将配备64位四核“Cortex-A53”。最大工作频率为1.5GHz。(记者:进藤智则,日经Robotics)
图8:Stratix 10的品种一览
关键字:英特尔 阿尔特拉
引用地址:英特尔收购阿尔特拉,发布向GPU的宣战宣言——新FPGA
Stratix 10虽然以前就公布了概要,但披露器件产品线等详情还是首次。预定于2015年第四季度供应样品。
图1:接受《日经电子》采访的阿尔特拉产品营销高级总监Patrick Dorsey
Stratix 10通过改善FPGA架构,将实现该公司以往产品“Stratix V”约2倍的性能。不仅在逻辑元件(LE)内,还在LE外部的布线部分设置几百万个寄存器,将管道细分,视用户逻辑的类型,最大工作频率可达900MHz左右。
Stratix 10与已经在供应样品的该公司的中档FPGA“Arria 10”一样,DSP硬宏支持浮点运算。最多的品种配备1.1万个以上的DSP硬宏,浮点运算性能超越美国英伟达的GPU、高达10TFLOPS。该公司的产品营销高级总监Patrick Dorsey说:“我们的产品已经可以与英伟达的GPU展开全面竞争”,显露出对GPU的竞争意识。
与赛灵思在发展方向上的差异明确
Stratix 10的特点主要有4个:(1)实现Stratix V约2倍性能的“HyperFlex架构”;(2)耗电量的削减;(3)采用英特尔的2.5D封装技术;(4)考虑到云端多租户使用的安全功能。
(1)的HyperFlex架构,是类似于微处理器的超级管道技术。是细分管道,增加段数,使其能以更高的时钟频率工作的技术。
具体来说,Stratix 10在接线段设置了专用的“Hyper寄存器”。使用该Hyper寄存器,将细分管道以提高频率。而一般的FPGA,寄存器只配置在LE内,接线段是不配置寄存器的。
图2:利用Hyper寄存器细分管道
据称,因Hyper寄存器的插入,是由编译器端自动进行的,逻辑电路设计者无需顾虑。阿尔特拉2015年5月发布的新设计工具“Quartus II”,配备了实现这一操作的功能。
按照该公司的估算,某无线通信基础设施用电路,Stratix V的最大工作频率为491MHz,而Stratix 10则为982MHz。在数据中心用的加速电路,Stratix V的最大工作频率为156MHz,而Stratix 10为452MHz。
图3:与Stratix V相比的高速化程度
关于(2),与Stratix V相比,Stratix 10的耗电量最大可减少70%。除利用14nm工艺制造技术,降低了电源电压外,与Stratix V相比,还能以较窄的位宽实现相同的性能,据称这也有助于降低耗电量。
图4:与Stratix V相比减少的耗电量
图5:数据中心的使用示例
利用2.5D封装分离PHY,为与Xeon整合作准备?
(3)利用了代工商英特尔的2.5D封装技术“EMIB(Embedded Multi-die Interconnect Bridge)”(参阅本站报道)。
英特尔的竞争对手——美国赛灵思公司(Xilinx)也在使用2.5D封装技术,但阿尔特拉和赛灵思的使用方式完全不同。
赛灵思是把FPGA架构分成数枚芯片,用内插器连接。而阿尔特拉的战略,则是FPGA架构封装在单一芯片中,收发器电路按照不同接口,准备不同的芯片。阿尔特拉把这种芯片叫作“区块”(Tile)。
图6:区块的示意图
阿尔特拉将收发器电路作为单独芯片的理由主要有两个。一是为了方便支持今后可能面世的新一代高速接口。在支持对PCI Express Gen 4等数据速率的高速化,以及含光通信在内等新调制方式时,分芯片更容易替换,实现起来方便。
另一个是FPGA架构收纳在单一芯片中,LE之间的通信“不像赛灵思那样,无需经由不同的内插器,可以提高可靠性”(Dorsey)。赛灵思和阿尔特拉最近在片上存储器、浮点运算等许多方面,战略上的差异逐渐明确,2.5D封装的利用方法也明显不同。
阿尔特拉将收发器电路另分芯片,也可以看作是与英特尔的服务器微处理器“Xeon”整合之前的准备。英特尔在宣布收购阿尔特拉之前,一直在计划推出将Xeon与FPGA集成于同一封装的产品。通过像英伟达GPU配备的接口“NVLINK”那样,使在FPGA端容易配备可以与CPU高速连接的接口,以提高其作为加速器的利用价值。关于这一点,阿尔特拉的Dorsey表示“无可奉告”。
立足云端使用,FPGA终将实现多租户化
关于(4),Stratix 10加入了用来防范非法访问、防范篡改等的“安全设备管理器(SDM)”技术。在芯片内设置约15~150个扇区并予以隔离,使扇区可以单独配置和认证。
作为扇区的使用示例,阿尔特拉举出了防御设备中加密算法的隐藏、无线通信基础设施设备中特定电路的更新(在持续使用特定电路的同时,更新其他部分的电路)等。在该公司列举的示例中,最有特点的当属云服务的例子。
具体来说,就是云服务运营商在自己的基础设施中采用FPGA,把单一FPGA器件分割为多个扇区,出租给多位客户的使用形态。
这就像是在云计算领域,多家用户企业共用同一系统的“多租户”。可以说象征了“重视数据中心用途”这一阿尔特拉的现行发展方向。
图7:将单一FPGA分割使用的“扇区”使用示例
最左侧的云端“多租户”使用象征着阿尔特拉如今的发展方向
美国微软计划于2015年下半年,将为本公司数据中心大量引进FPGA,用来提高搜索引擎的速度,提供基于深度学习(CNN)的图像识别。
估计微软也在考虑把引进的大量FPGA,经由该公司的云服务“Azure”出租给客户。Stratix 10规模最大的品种配备550万个LE。达到如此规模后,在单一FPGA中划分区域,提供给多个应用、多家企业共用的利用形式便成为了可能。
PUF电路为Intrinsic ID制造
Stratix 10为加强防篡改性、加密密钥等,在高端FPGA中首次配备了PUF(physical unclonable function)电路。PUF电路是利用半导体制造误差造成的微小个体差异,生成芯片固有ID的技术。采用的PUF电路为荷兰Intrinsic ID公司制造。
配备PUF的FPGA此前美国美高森美公司(Microsemi)曾推出过,“在赛灵思和阿尔特拉的高端FPGA中配备,估计Stratix 10还是第一个”(Dorsey)。
ARM内核也实现64位化
Stratix 10与以往产品一样,也将准备配备ARM内核的“Stratix 10 SoC”。阿尔特拉的FPGA过去一直配备32位ARM内核,Stratix 10 SoC将配备64位四核“Cortex-A53”。最大工作频率为1.5GHz。(记者:进藤智则,日经Robotics)
图8:Stratix 10的品种一览
上一篇:物联网开创三大IC潜力股 MCU/无线IC/传感器后势俏
下一篇:中国双雄竞相展示超大型面板
推荐阅读最新更新时间:2024-05-03 14:49
Altera CEO荣获半导体产业协会的Robert N. Noyce奖
SIA授予Daane这一殊荣旨在表彰其对半导体产业发展做出的杰出贡献 。 2014年11月25号,北京——Altera公司(Nasdaq: ALTR)今天宣布,总裁、CEO兼董事会主席John P. Daane今年获得了半导体产业协会(SIA)著名的Robert N. Noyce奖。2014年11月14号圣何塞Fairmont酒店举行的年度SIA晚宴上,在半导体产业优秀领导人和400多名SIA成员面前,IBM研究院资深副总裁兼主任和2014年度SIA主席John Kelly授予了Daane这一奖项。这一奖项是由SIA董事会和成员选出的,表彰Daane对美国以及全世界半导体产业多年以来的贡献。 SIA总裁兼CEO
[半导体设计/制造]
苹果终止和高通的合作,谁受影响大?
无论是好是坏, 苹果 公司都有着保持封闭式产品生态系统的声誉。自从乔布斯和沃兹成立公司以来,就一直是这样,并一直延续到蒂姆库克时代。苹果喜欢保持对其产品和技术的控制,以保持和他们标准相符的消费者体验。 作为 iPhone ,Apple Watch,iPad和Macbook用户,我显然对他们的公司战略毫无异议。我甚至可冒昧地表示,我更愿意捍卫他们的产品开发方法,因为他们的产品始终保持在同类产品的前列,同时保持对更广泛的消费者市场的承诺。 所有这一切都表明,苹果公司的行为可能导致iPhone在接下来的几个年度周期中陷入糟糕的境地。任何消费者都不应该对这种前景感到兴奋和激动。 更重要的是,关于苹果2018-2020
[嵌入式]
NVIDIA以显示芯片挑战英特尔数据中心龙头地位
NVIDIA显示卡原本主打的是较小众的高阶游戏市场,但NVIDIA的人工智能(AI)运算能力也逐渐崭露头角,并广泛应用在语音辨识与自驾车系统中,甚至有机会威胁独霸数据中心市场的英特尔(Intel)。 根据彭博(Bloomberg)报导,与电脑处理器及智能型手机市场相比,电脑游戏市场显然小了许多,NVIDIA因此试图走出游戏市场,跨足人工智能与自驾车市场,并在2016年获得了丰硕的成果。2016年第3季,受到数据中心与驾驶系统需求增加的影响,NVIDIA的芯片销售成长了54%,获利也达到新高。 然而NVIDIA未来须面对的大敌,有研发资本雄厚的英特尔,以及现金余额领先所有芯片厂的高通(Qualcomm)。NVIDIA执行长黄
[手机便携]
消息称英特尔 Lunar Lake 处理器 17W 下多核性能相比 15W Meteor Lake-U 提升 50%
3 月 11 日消息,博主 @SquashBionic 近日爆料称,英特尔 Lunar Lake 处理器在 17W 下的性能相比 15W 下的现款 Meteor Lake-U(2P + 8E)处理器,在 Cinebench R23 与 GeekBench 5 跑分中取得了 50% 的多核性能提升。 此外,该博主还于评论区表示,17W 是单风扇 Lunar Lake 笔记本的 PL1 设定,为应对 OEM 厂商的需求,英特尔还提供了 30W cTDP 的选项。此外,无风扇被动散热的 Lunar Lake 电脑项目仍然存在,但是其长时功耗可能不足 17W。 该博主还确认,与 Arrow Lake 处理器相同,Lunar Lak
[嵌入式]
Intel AVX-512指令集发飙 性能暴涨17倍:自家CPU却不能跑
Intel近日更新了开源的C++头文件库,正式支持AVX-512 SIMD指令集,相比此前的AVX-2指令集,可以提供更高性能的SIMD排序。 基于AVX-512指令集,C++头文件库可以对16位、64位数据类型进行快速排序,实测在一套Intel Tiger Lake 11代酷睿系统上,NumPy Python的性能提升了多达10-17倍。 具体来说,16位数据排序性能提升了17倍,32位数据也有12-13倍,64位浮点数据则可以提速10倍。 这证明,AVX-512只要适配优化得当,带来的性能提升是十分显著的,而且不一定非得吃掉多高功耗。 不过,Intel 12/13代酷睿因为引入混合架构,不得不牺牲了AVX-51
[家用电子]
英特尔第一款Moorestown手机明年初上市
英特尔星期三称,它预计采用其Moorestown平台的第一种手机将在明年年初上市。采用这个平台的平板电脑上市的时间会早一些。 Moorestown 平台把一个Atom处理器和一个图形处理器集成到一个芯片封装之中,其目标应用是平板电脑和智能手机。英特尔在台北举行的Computex IT展会上说,这种芯片与竞争对手的产品相比耗电量更低并且性能更高。 英特尔高级副总裁兼超移动事业部总经理Anand Chandrasekher在接受采访时说,我说你们在明年上半年应该会看到这种手机。在此之后,你们肯定会看到其它厂商推出这种产品。平板电脑的上市时间会比手机早一些。手机需要更长的时间才能上市是因为手机要通过比计算机更严格的
[嵌入式]
英特尔收购阿尔特拉的真正目的是什么?
“收购FPGA(field programmable gate array)业务与英特尔公司的成长战略相符合。这是因为,将阿尔特拉公司的产品与英特尔公司的IP相组合,可以提供合乎数据中心、IoT(Internet of Things)市场客户需求的新门类产品”。美国英特尔公司的经营高管,就收购美国阿尔特拉公司发表了这样的评论。
图1:英特尔发展数据中心用半导体的目的 (点击放大)
正如这番评论所说,英特尔公司通过收购阿尔特拉公司,大致可以强化两个细分市场。一个是数据中心市场,另一个是IoT市场。关于前者数据中心,为达成处理的数据量激增的大数据分析等所要求的性能,英特尔公司希望提高微处理器与FPGA的
[手机便携]
机构:英特尔1.8nm量产早于台积电2nm 或可“颠覆剧本”
近日,台积电公布其N2(即2nm制程)时间表,或到2025年底启动量产,晚于英特尔18A节点(相当于1.8nm制程)。机构指出,英特尔在先进制程开发上的加速使其相信,这家芯片制造商可以“颠覆剧本”,并凭借18A节点在性能上超越竞争对手台积电和三星。 据科技网站theRegister报道,在台积电N2时间表发布的几天前,英特尔刚刚透露,其下一代18A节点将于2024年下半年投产,比此前预计的2025年提前了几个月。英特尔CEO基辛格认为,该公司将凭借其18A节点成为工艺性能的领导者,投产提前表明其目前有十足的信心。 在最近的一份分析报告中,半导体咨询公司IC Knowledge的负责人Scotten Jones表示,如果英特尔真能如
[手机便携]
小广播
热门活动
换一批
更多
最新手机便携文章
- 曝iPhone SE 4首发苹果自研5G基带:明年3月登场
- 曝iPhone 17全系首发3nm A19系列芯片:无缘台积电2nm工艺制程
- 供应链称上游元器件要大降价:国产手机现涨价潮后会主动下调售价吗
- 消息称苹果将拿出近 1 亿美元用于解除印尼 iPhone 16 系列销售禁令
- 消息称塔塔公司收购和硕在印度的唯一一家iPhone工厂,深化与苹果合作
- 苹果遭4000万英国iCloud用户集体诉讼,面临276亿元索赔
- 消息称苹果、三星超薄高密度电池均开发失败,iPhone 17 Air、Galaxy S25 Slim手机“变厚”
- 美光亮相2024年进博会,持续深耕中国市场,引领可持续发展
- Qorvo:创新技术引领下一代移动产业
更多精选电路图
更多热门文章
更多每日新闻
更多往期活动
11月25日历史上的今天
厂商技术中心