在GPU计算市场上,英特尔不只是需要芯片和NVIDIA竞争,还需要与CUDA竞争的软件。通过 oneAPI,它希望创建一个开放的生态系统,其中包括一个名为 oneAPI 的编程框架,主要基于由 Kronos Group 维护的 SYCL 框架、一个数据并行 C++ 编译器和一组用于加速 AI 和HPC应用的高性能库。
为此,英特尔需要一些帮助,该公司正在收购 Codeplay 的 80 人团队,该团队是 2014 年创建的 SYCL 编程模型的管理者之一,它是英特尔的 oneAPI 跨平台、跨设备编程工作的基础,是 Apple 于 2009 年创建的 OpenCL 编程框架的衍生产品(或者称为一个组成部分)。SYCL 和 OpenCL 均由 Khronos Group 指导。
该交易的财务条款尚未披露,但我们可以说,与几年前首次推出 oneAPI 工作时相比,Codeplay 对于今天的英特尔来说更有价值。英特尔在 oneAPI 道路上走得更远,更接近发布其“Ponte Vecchio”Xe HPC GPU 计算引擎,它需要一个软件的故事来串联其 GPU 以及 CPU、FPGA 和定制 ASIC。特别是 AMD 凭借其“Aldebaran” Instinct MI250X GPU加速器及其 ROCm 5.0 开发环境赢得了 HPC 领域的关注。 ROCm 编程环境是开源的,包括 HIP 转换器,除了在 AMD GPU 上运行的本机模式之外,它还可以创建在 NVIDIA GPU 上运行的 GPU 代码。
英特尔希望成为最开放的平台供应商,这是因为它必须这样做。 NVIDIA 作为无可争议的 GPU 计算领导者(除了美国和欧洲的几台大型超级计算机),可以围绕 CUDA 平台及其库建立护城河,并通过“免费”提供该软件继续赚取硬件收益。 (没有什么是免费的,特别是当 NVIDIA 75% 的员工都在编写软件时。软件的成本已经涵盖在硬件中——这毫无疑问。)英特尔希望 oneAPI 堆栈不仅是免费的,而且是开放的,而 AMD 想要的ROCm 也是如此,因为这将刺激其软件的采用,并降低选择英特尔硬件来开发应用程序的风险。在 SYCL 上使用 DPC++ 开发并访问 oneAPI 库的代码可以在 Intel、AMD 或 NVIDIA 的 GPU 上运行。
Codeplay 是已经证明可以平衡高性能系统编程的三个 P(生产力、性能和可移植性)的公司之一,这样您就可以实现可移植性并仍然获得性能并具有合理的生产率。为了证明这一点,Codeplay 的团队由美国能源部的三个主要机构支持——劳伦斯伯克利国家实验室、阿贡国家实验室和橡树岭国家实验室——为 AMD 和 NVIDIA GPU 创建了 oneAPI SYCL 编译器。 Codeplay 还编写了自己的 SYCL DNN 神经网络和 SYCL BLAS 线性代数加速库,可以在 AMD、Intel 和 NVIDIA GPU 上运行,并参与制作 NVIDIA 为核心 CUDA 运行创建的 cuDNN 和 cuBLAS 库在 oneAPI 环境中。
“我们在性能和便携性方面做了很多工作,而不仅仅是便携性。”Codeplay 的联合创始人兼首席执行官 Andrew Richards 告诉 The Next Platform。 “SYCL 实现了可移植性,但 Codeplay 的团队证明你实际上可以在上面构建性能可移植的库。尽管能够在 NVIDIA、AMD 和 Intel GPU 以及各种其他硬件上运行,但 SYCL DNN 和 SYCL BLAS 库实现了真正具有竞争力的性能。”
开源或开放是如今最好的开发形式,通过一次写入,多次调整的方法,将与硬件供应商或感兴趣的参与者对编译器和库进行高度调整形成鲜明对比——Cray 用于跨架构的 CPU 编译器或 NVIDIA 用于 GPU 编译器和库只是两个例子。
“作为一家公司,Codeplay 所做的就是向人们展示如何做到这一点,”Richards说。 “我们向人们展示了他们如何可以一次编写并到处运行。但我们实际上并没有编写整个库,因为我们更像是一家编译器公司。但我认为通过这笔英特尔交易,我们将能够在我们所做的事情上更加雄心勃勃,并且能够在更大范围内做事。但我会补充很多这些库是由领域专家编写的,这就是为什么我们作为编译器领域专家,可以向人们展示如何编写这些库,并实现高水平的性能和可移植性。”
英特尔为什么要收购 Codeplay 是绝对清楚的,但不清楚为什么 Codeplay 不想继续成为中立公司。显然,这涉及到金钱,Codeplay 的工作无疑得到了回报,并得到了英特尔的照顾。
但是,尽管如此,要成为中立第三方是非常艰难的。例如,让我们考虑 IBM 的“Bluelink”OpenCAPI 加速器接口。它拥有所有正确的技术细节,但英特尔想要的是推动 CXL 标准,作为全球 CPU 的主要供应商,英特尔不仅获胜,而且还获得了 Gen-Z、CCIX、Infinity 背后公司的支持。现在,至少,我们给出了一个已经出现的单一标准,用于将加速器和内存快速连接到计算引擎,在不久的将来也会将 PCI-Express 和 DDR 内存控制器融合到一个协议。
毫无疑问,英特尔需要 Codeplay 来增加 oneAPI 在其自己的计算引擎之外被采用的几率,但 Codeplay 也确实需要英特尔的力量来扩展其业务并使 SYCL 和 DPC++普及得更广。
上一篇:瑞萨电子率先推出面向下一代服务器、存储和通信系统应用的I3C智能开关产品家族
下一篇:Microsoft 香港与中大商学院携手培育数码人才迎接未来
推荐阅读最新更新时间:2024-10-29 14:18
- LT1182 具有双极性对比的浮动 CCFL
- AL1696EV1,基于 AL1696 高亮度降压 LED 驱动器的评估板
- LT3091EFE 并联器件使用 IMONN 消除镇流器电阻压降的典型应用
- MA5671A/G-010S-A SFP刷机板
- LTC3526LBEDC-2 固定频率 1 节电池至 2.85V 低噪声升压转换器的典型应用电路
- 具有跟踪功能的 LTM4650AEY-1 2.5V 和 3.3V 输出的典型应用电路
- 正电流升压降压转换器(28V 至 5V)
- 使用 Semtech 的 SC440AMLTRT 的参考设计
- NCV97200GEVB:NCV97200 评估板
- IP5306高亮充电宝