英特尔XPU全面创新,面向HPC与AI领域发展

发布者:EE小广播最新更新时间:2021-06-29 来源: EEWORLD关键字:英特尔  AI 手机看文章 扫描二维码
随时随地手机看文章

内置高带宽内存(HBM)的Sapphire Rapids至强可扩展处理器进一步打造性能标杆;英特尔GPU、网络和存储能力丰富高性能计算产品组合


新闻要点


最新的第三代英特尔®至强®可扩展处理器将驱动下一代超级计算机和高性能计算系统。

下一代英特尔至强可扩展处理器(代号“Sapphire Rapids”)将集成高带宽内存(HBM)。

基于英特尔 Xe架构的HPC GPU (Ponte Vecchio)已成功启动,正在进行系统验证,包括OAM规格的产品及其子系统。

英特尔宣布推出基于以太网的高性能网络(HPN),此举将使英特尔以太网扩展到高性能计算应用。

英特尔宣布引入对 DAOS(分布式异步对象存储)的商业支持。


加州圣克拉拉,2021年6月28日——在2021年国际超算大会(ISC)上,英特尔通过一系列技术披露、重点合作与客户成功案例,全面展现了其在高性能计算领域日益强化的领导地位。目前,英特尔处理器是全球超级计算机中部署最广泛的计算架构,持续助力全球医学探索和科学突破。英特尔还宣布了用于高性能计算与人工智能领域的至强处理器的重大发展,以及用于一系列高性能计算用例的内存、软件、E级存储和网络技术方面的创新。

英特尔副总裁兼高性能计算部总经理Trish Damkroger表示:“为了最大限度地提高高性能计算性能,我们必须尽可能地利用所有计算机资源与技术进步。英特尔是整个行业迈向E级计算的重要推动力,而我们在 CPU、XPUs、oneAPI工具包、E级DAOS存储和高速网络方面的突出优势正在逐步将这一目标变为现实。”


扩大高性能计算的性能领先优势


今年早些时候,英特尔凭借最新推出的第三代英特尔至强可扩展处理器进一步扩大了其在高性能计算的领先地位。相较于前代产品,它能够为广泛的高性能计算工作负载提供高达53%的性能提升,其中包括生命科学、金融服务和制造等领域。


对比最接近的x86竞品,第三代英特尔至强可扩展处理器能够为一系列主流高性能计算工作负载提供更强大的性能。例如,在英特尔®至强®可扩展8358处理器和AMD EPYC 7543处理器的对比中,至强可扩展处理器的NAMD性能表现胜出62%,LAMMPS性能表现胜出57%,RELION性能表现胜出68%,二项式选项性能表现胜出37%。此外,蒙特卡罗(Monte Carlo)模拟在全新的英特尔®至强®可扩展处理器上的运行速度比在AMD霄龙处理器上快两倍,这将使金融类公司仅通过一半时间就能实现定价结果。英特尔®至强®可扩展8380处理器在关键AI工作负载上的性能也优于AMD EPYC 7763处理器,在20个常见基准测试中都能提供高达50%的性能提升。全球诸多高性能计算实验室、超算中心、大学及原始设备制造商正在利用英特尔最新的计算平台开发高性能计算解决方案,其中包括戴尔科技集团、HPE、韩国气象局、联想、马克斯•普朗克计算和数据机构(MPCDF)、甲骨文、大阪大学和东京大学。


在下一代英特尔至强可扩展处理器内集成高带宽内存(HBM)


如今,建模和模拟(例如计算流体动力学、气象和天气预报、量子色动力学)、人工智能(例如,深度学习训练和推理)、分析(例如大数据分析)、内存数据库、存储等广泛的工作负载正在显著推动人类的科学突破。下一代英特尔至强可扩展处理器(代号“Sapphire Rapids”)将集成高带宽内存(HBM),可显著提高处理器的可用内存带宽。通过在处理器内封装高带宽内存,运行高性能计算与人工智能应用等内存带宽密集型工作负载的处理器性能将获得大幅提升。集成高带宽内存的Sapphire Rapids处理器可在仅使用高带宽内存或结合 DDR5 的情况下处理工作负载。


集成高带宽内存的 Sapphire Rapids 处理器深受客户青睐,目前成功部署在美国能源部在阿贡国家实验室的Aurora超级计算机、以及洛斯阿拉莫斯国家实验室的Crossroads 超级计算机上。


阿贡国家实验室的计算、环境与生命科学实验室副主任Rick Stevens表示:“实现E级计算需要快速访问和处理海量数据。在英特尔至强可扩展处理器中集成高带宽内存将大幅提升Aurora超级计算机的内存带宽,并让我们利用人工智能和数据分析来进行高级模拟和3D建模。”


洛斯阿拉莫斯国家实验室的物理学实验室副主任Charlie Nakhleh表示:“洛斯阿拉莫斯国家实验室的Crossroads超级计算机旨在推动用于科学和国家安全的复杂物理系统的研究工作。下一代英特尔至强处理器Sapphire Rapids结合高带宽内存(HBM),将在我们的Crossroads系统中大幅提升内存密集型工作负载的性能。[Sapphire Rapids-HBM]产品能够加速目前最大型的复杂物理学和工程运算,让我们能够进行全球安全、能源技术和经济竞争力领域的大型研发项目。”


基于Sapphire Rapids的平台将提供独特的功能,为高性能计算提供加速,包括搭配PCI express 5.0的更高的I/O带宽(与PCI express 4.0相比),以及对Compute Express Link (CXL) 1.1的支持,从而在跨计算、网络和存储的情况下支持先进用例。


除了内存和 I/O 方面的提升外,Sapphire Rapids还借助全新内置人工智能加速引擎——英特尔® 高级矩阵扩展 (AMX) ,针对高性能计算和人工智能工作负载进行了优化英特尔 AMX, 旨在显着提升深度学习推理和训练的性能。目前,已经决定采用了Sapphire Rapids的客户包括CINECA、莱布尼茨超级计算中心(LRZ)和阿贡国家实验室,以及洛斯阿拉莫斯国家实验室和桑迪亚国家实验室的Crossroads系统团队。


基于英特尔Xe架构的HPC GPU(Ponte Vecchio)已成功启动 


今年早些时候,英特尔基于Xe架构的HPC GPU(代号“Ponte Vecchio”)已成功启动,目前正处于系统验证阶段。Ponte Vecchio是一个基于Xe 架构的GPU产品,为高性能计算和人工智能工作负载进行了优化。Ponte Vecchio将利用英特尔的Foveros 3D封装技术,对多个IP进行封装,其中包括HBM内存和其它 IP。这款GPU的架构包含计算、内存和Fabric,以满足像Aurora这样的全球最先进的超级计算机不断演进的算力需求。


Ponte Vecchio将会支持OCP加速器模块(OAM)规格及子系统,提供高性能计算应用所需的横向与纵向扩展功能。


将英特尔以太网能力注入高性能计算


在2021年国际超算大会(ISC)上,英特尔还宣布了其全新的以太网高性能网络 (HPN) 解决方案,该解决方案通过使用标准的英特尔以太网 800 系列网络适配器控制器、基于英特尔® Tofino™ P4 可编程以太网交换机 ASIC 和英特尔® 以太网结构套件软件的交换机,为 HPC 领域的小型集群扩展以太网技术功能,HPN能够对以太网提供的易用性进行充分利用,以更低的成本实现与InfiniBand相当的应用程序性能。


对DAOS进行商业化支持


英特尔正在引入对 DAOS(分布式异步对象存储)的商业支持。DAOS是一种开源软件定义对象存储,旨在优化跨英特尔高性能计算架构的数据交换。DAOS同时是阿贡国家实验室此前宣布的英特尔®E级存储堆栈的基础,被英特尔的LRZ和JINR(联合核研究所)等客户广泛采用。


DAOS 支持现已作为 L3 的支持产品对英特尔合作伙伴开放,这使广泛的合作伙伴能够将完整的交钥匙存储解决方案与服务相结合,持续赋能产业下游。除了英特尔自身的数据中心构建模块,这一新商业支持计划的早期合作伙伴还包括慧与、联想、美超微、Brightskies、Croit、Nettrix、广达和RSC集团。


关键字:英特尔  AI 引用地址:英特尔XPU全面创新,面向HPC与AI领域发展

上一篇:英特尔“AI赋能”大学计划首站落地
下一篇:厚积薄发,研华Arm-Based业务的15年耕耘路

推荐阅读最新更新时间:2024-11-11 12:59

AI诊断皮肤癌准度胜医生 专家:能超越但无法取代
据外媒报道,人工智能(AI)技术一日千里,很多人类从事的工作未来可能会被人工智能取代。德国、法国与美国科学家的一项联合研究发现,人工智能诊断皮肤癌的能力首次超越皮肤科医生,有助加快诊断过程,帮助病人尽早对抗癌症,并降低正常的痣被误诊为癌症的风险。 资料图:沙特人工智能机器人“索菲亚”。中新社记者 余瑞冬 摄   报道称,科学家利用卷积神经网络(CNN)系统,制造出这项研究使用的人工智能系统。CNN模仿人类大脑神经细胞运作,使计算机能像人类肉眼,辨认眼前影像。累积的影像数量越多,人工智能的判断就越准确。   研究人员首先输入逾10万张图片,指引人工智能系统分辨良性与有潜在危险的病灶,其后分别向58名医生和人工智能系统,展示100
[医疗电子]
AI独角兽云从科技拟IPO上市 或进入“快速通道”
  据多家媒体报道, 作为国内行业市场占有率最高、正在进行B+轮融资的AI国家队云从科技走上了即审即过的“快速通道”。   “国家队”,“独角兽”,满足互联网、人工智能、生物医药、生态环保四大行业,符合现有法律法规,在当前制度框架下进行IPO申报,这是云从科技能进入“快速通道”的秘诀。   据悉,云从科技是计算机视觉头部企业中唯一的国家队,承建了国家发改委的基础项目重大工程——“人工智能基础资源公共服务平台”与产业化项目重大工程“人脸识别系统产业化应用平台”。   与公安部、四大银行、证通、民航总局建立联合实验室,推动人工智能产品标准的建立,成为唯一同时制定国标、部标、行标的人工智能企业。   同时,云从也是头部企业中唯一的非VI
[嵌入式]
英特尔在7nm将依靠EUV技术实现
随着晶圆代工厂台积电及记忆体厂三星电子的7纳米逻辑制程均支援极紫外光(EUV)微影技术,并会在2019年进入量产阶段,半导体龙头英特尔也确定正在开发中的7纳米制程会支援新一代EUV技术。 英特尔10纳米制程推进不如预期,导致14纳米产能供不应求,并造成2018年第四季以来的处理器缺货问题,预期要等到2019年第二季才会获得纾解。英特尔日前已宣布将扩大资本支出提升产能,并且预期10纳米Ice Lake处理器将在今年第四季量产出货。 至于英特尔未来制程微缩计划,据外电报导,掌管英特尔制程及制造业务技术及系统架构事业的总裁兼首席工程师Murthy Renduchintala日前指出,10纳米制程与2014年订定的制程标准相同,不
[半导体设计/制造]
<font color='red'>英特尔</font>在7nm将依靠EUV技术实现
前百度高管研发全球首款AI筛查眼底相机
在眼底筛查领域,北京至真互联网技术有限公司推出全球首台手持便携型“智能筛查眼底相机”,其定位是为基层医生量身打造,拍摄过程更加简单,便携和智能。 据创始人代黎明表示,本款智能设备即将投入到百家基层 医疗 机构,2019年的计划是赋能千家基层医疗服务机构,助力更多基层进行眼健康管理服务落地。 代黎明曾在百度任职十年之久,并担任过百度商业部门高管,此次的数千万A轮融资也由百度领投。他表示,正是这次与老东家的合作,给至真带来了技术上的转折点。这也是在整个AI赛道里,在早期就被百度投资的唯一一家医疗企业。 与此同时,去年,该公司完成了由百度和盛景嘉成联合领投,梅花天使、华耀资本,华健资本跟投,进化资本担任独家财务顾问的数千万Pre-A 轮
[医疗电子]
IC设计两天王ARM英特尔:物联网将是新救世主
     随着全球智能手机出货量成长趋缓,英美两地芯片设计巨擘都把投资焦点转向物联网(Internet of Things)! 英国金融时报11日报导,Strategy Analytics指出,全球智能手机出货量第1季出现史上首见的衰退景象。报导指出,拥有智能手机芯片授权市场超过95%市占率的英国IC设计公司安谋(ARM Holdings Plc)早已展开分散产品组合的动作。安谋上个月公布今年第1季授权芯片出货量有超过半数是瞄准非移动装置市场。这段期间,安谋与16家公司签订新技术授权协议、其中的15家是从事非移动产品开发。 安谋执行长Simon Segars透露,公司瞄准物联网等非行动市场已有一段时日。他说,芯片设计开发循
[手机便携]
e络盟新一期AI电子书,为读者阐述ML、DL之间的秘密
全球电子元器件与开发服务分销商e络盟新近发布名为《AIoT时代——AIoT发展背景、功能与未来》的电子书,旨在为专业工程师、创客和电子爱好者提供人工智能相关专业知识,助力他们更加顺利地进行人工智能应用开发并开拓出更多新型市场应用。本册电子书汇集了人工智能详细路线图和类别,阐释了人工智能、机器学习(ML)和深度学习(DL)之间的关系,并详细介绍了神经网络相关技术。书中还向读者推荐了数款适用于首次进行人工智能物联网方案开发的优质平台。 人工智能和物联网将彻底改变人类的工作方式。目前,人工智能已从算法演变为自主学习和大数据管理。处理、连接、感知和执行能力以及安全性是人工智能的主要驱动因素。融合人工智能和物联网功能将有助于发挥两者的最
[物联网]
英特尔14nm八核处理器曝光,这是要断了谁的生路?
九月份的IDF峰会上,Intel正式宣布了“Xeon D”,也就是此前代号Broadwell-DE、面向微型服务器、嵌入式通信与存储市场的第三代产品,将取代此前的Atom S1200/C2000。 Xeon D自然也是14nm工艺产物,它会是一个很大的单芯片SoC,身材和功耗更小,而且最多八个CPU核心,同时支持DDR3/DDR4 ECC。 这可要比消费领域Broadwell的双芯片、最多四核心、仅支持DDR3要强太多了。 而除了TXT、AVX2、TSX指令集,VT-x、VT-d虚拟化这些常规技术,它还会额外支持内存RAS特性,并且有大量的I/O接口。 Xeon D将在2015年上半年发布,但是第二季度首发的
[单片机]
英飞凌推出超高电流密度功率模块,助力高性能AI计算
【2024年11月5日, 德国慕尼黑讯】 数据中心目前占全球能源消耗的2%以上。在人工智能的推动下,预计到2030年,这一数字将增长到7%左右,相当于整个印度目前的能耗 。实现从电网到核心的高效功率转换对于实现卓越的功率密度至关重要,从而在降低总拥有成本(TCO)的同时提高计算性能。因此,英飞凌科技股份公司将推出 TDM2354xD和TDM2354xT双相电源模块 ,具有出色的功率密度,适用于高性能AI数据中心。这些模块实现了真正的垂直功率传输(VPD),并提供了业界领先的电流密度1.6A/mm2。英飞凌在今年早些时候还推出了TDM2254xD双相功率模块。 TDM23541D双相功率模块 英飞凌科技公司电源IC副总裁
[汽车电子]
英飞凌推出超高电流密度功率模块,助力高性能<font color='red'>AI</font>计算
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved