接下来的超算普及化时代,英特尔将满足永无止境的计算需求,并将可持续发展作为重中之重。
本文作者:Jeff McVeigh英特尔副总裁兼超级计算事业部总经理
随着我们进入 E 级(Exascale)计算时代并迈向 Z 级(Zettascale)计算时代,科技行业也越来越影响着全球的碳排放。据估计,到 2030 年数据中心的能耗估计将达到全球能源产量的 3%-7%1,而计算基础设施将成为新增用电量的主要驱动因素。
今年,英特尔承诺到 2040 年实现全球业务的温室气体净零排放,并开发更加可持续的技术解决方案。在创造可持续未来的同时满足对计算永无止境的需求,这是高性能计算(HPC)面临的最大挑战之一。这个任务虽然艰巨,但如果我们能够把芯片、软件和系统这些 HPC计算堆栈的每个部分都做好,它就是可以实现的。
我在德国汉堡举行的 2022 国际超算大会(ISC 2022)上发表了主题演讲,上述内容就是我在演讲中传达的核心信息。
从芯片和异构计算架构开始
英特尔公布了直到 2024 年的高性能计算产品路线图,期间我们将致力于提供多样化的异构架构。这些架构不仅将使我们能够实现几个数量级的性能提升,同时亦可降低通用工作负载及诸如人工智能、加密、分析等新兴工作负载的能耗。
以内置高带宽内存(HBM),代号为 Sapphire Rapids的英特尔® 至强® 处理器为例,该款处理器能够很好地展示我们如何利用先进的封装技术和芯片创新,为高性能计算带来性能、带宽和节能方面的显著提升。通过封装高达 64 GB 的高带宽内存 HBM2e 并把加速器集成到 CPU 中,我们能够释放内存敏感型工作负载的潜力,为这些关键的高性能计算应用场景大幅提升性能。在对比第三代英特尔® 至强® 可扩展处理器和即将推出的内置高带宽内存(HBM)的 Sapphire Rapids 处理器时,我们发现,后者把气候研究、能源、制造和物理学工作负载的性能提升了 2-3倍2。在主题演讲中,Ansys 首席技术官 Prith Banerjee还展示了内置高带宽内存的 Sapphire Rapids 为 Ansys Fluent 和 ParSeNet 的实际工作负载带来了高达 2 倍的性能提升3。
为实现跨 HPC 和 AI 超算工作负载的几个数量级的性能提升,计算密度是另一必不可少的要素。代号为 Ponte Vecchio 的英特尔首个旗舰级数据中心图形处理器(GPU),已经在复杂的金融服务应用以及 AI 推理和训练工作负载方面展现出了卓越的优势。
创新不止于此。今天,我们还宣布这款出色数据中心 GPU 的下一代产品代号为Rialto Bridge。通过升级 Ponte Vecchio 架构,并结合使用下一代制程节点技术制造的增强型芯片子模块,Rialto Bridge 将大幅提高计算密度、性能和效率,同时提供软件一致性。
展望未来,Falcon Shores 是我们路线图中下一个重要的架构创新,即把 x86 CPU 和 Xe GPU 集成在同一插槽中。这一架构计划将在 2024 年推出,它将在每瓦性能、计算密度、内存容量与带宽方面均实现超过 5 倍的性能提升4。
成功的软件战略遵循三个原则:开放、选择、信任
如果没有软件为芯片注入活力,它将仅仅只是砂砾。英特尔的软件策略是促进整个堆栈的开放式发展,并提供工具、平台和软件 IP,以帮助开发者提升工作效率,产出可扩展、更高性能、更高效的代码,这些代码能充分利用最新的芯片创新,没有重构代码的负担。oneAPI行业计划为 HPC 开发者提供了跨架构编程,使代码能透明、可迁移地适用于 CPU、GPU 和其他专用加速器。
目前,在世界各地领先的科研和学术机构中已有 20 多个 oneAPI 卓越中心(CoE),它们正取得重要的进展。例如,布里斯托大学科学系的 Simon McIntosh-Smith 和他的团队,正在使用 oneAPI 和 Khronos Group 的 SYCL 抽象层进行跨架构编程,为在 E 级计算规模上实现性能可移植性开发最佳实践。他们的工作将确保科学代码能在大规模异构超算系统上实现高性能。
聚力整合:实现可持续的异构计算
随着数据中心和 HPC 工作负载越来越多采用分布式架构和异构计算,我们需要借助工具来帮助有效管理和应对复杂多样的计算环境。
今天,我们将推出一款开源解决方案 Intel® XPU Manager,它可以在本地或远程监测和管理英特尔数据中心 GPU。该解决方案旨在简化管理,并通过综合诊断更好地实现可靠性和延长设备运行时间,以及提升利用率并支持固件更新。
针对能耗很高的数据传输和存储任务,分布式异步对象存储(DAOS)文件系统提供了系统级的优化。DAOS 可以显著地改善文件系统的性能,它不仅可以缩短整体访问时间,而且能够降低存储所需的容量,从而减少数据中心的占用空间并提高能源效率。相比于 Lustre 在 I/O 500 中的测试结果,DAOS 实现了直接写入文件系统性能 70 倍5的提升。
应对HPC的可持续性挑战
我们很荣幸能够与全球志同道合的客户和行业领先的科研机构合作,朝着实现更具可持续性和开放性的高性能计算而努力。我们近期取得了一系列成果——我们与巴塞罗那超算中心合作建立了开创性的 RISC-V Z 级计算实验室;并与剑桥大学和戴尔继续合作,将当前的 E 级计算实验室进一步打造成为新的剑桥 Z 级计算实验室。
独木难支,完整生态的构建需要在制造、芯片、互连、软件和系统等各方面携手共进。通过与整个生态的协作,我们致力于将本世纪最大的 HPC 挑战转化为前所未有的机遇,创造改变世界的技术,让未来更美好。
上一篇:拥有10万个“大脑”的人:AI对科学的丰富馈赠
下一篇:TI推出全新处理器推动边缘AI普及并使其功耗减半
推荐阅读最新更新时间:2024-11-17 14:54
- EVAL-ADF7021-NDBIZ,基于 ADF7021-N 421 - 458 MHz ISM 频段收发器的子板,带有外部电感 VCO
- LTC7149IUFD 24V 输入至 -12V 输出、1MHz 降压稳压器的典型应用电路
- MIC2090-2Y限流配电开关典型应用
- LTC2908ITS8-B1、12V、5V、3.3V、2.5V、1.8V、1.5V六电源监视器的典型应用电路
- MC34163 外部 NPN 开关稳压器的典型应用
- LF50CV 5V 顺序极低压降稳压器多输出电源的典型应用
- LTC3119EUFD 5V、2MHz 宽输入稳压器的典型应用电路
- 具有 6V 输入 UVLO 的 LTC3633AEUFD-1 3.3V/1.8V 顺序降压稳压器的典型应用电路
- 胡桃摇面贴图纸
- DER-538 - 使用 InnoSwitch3-CE 的 25 W 高功率充电器