Habana Gaudi2性能稳超英伟达A100,助力实现高效AI训练

最新更新时间:2022-07-04来源: EEWORLD关键字:Habana  英伟达  AI 手机看文章 扫描二维码
随时随地手机看文章

MLPerf测试结果验证了Gaudi2在ResNet和BERT模型训练时间上的优势


近日,英特尔宣布Habana® Gaudi®2深度学习处理器在MLPerf行业测试中表现优于英伟达A100提交的AI训练时间,结果突显了5月在英特尔On产业创新峰会上发布的Gaudi2处理器在视觉(ResNet-50)和语言(BERT)模型上训练时间的优势。


英特尔公司执行副总裁兼数据中心与人工智能事业部总经理 Sandra Rivera表示:“非常高兴能与大家分享Gaudi 2在MLPerf基准测试中的出色表现,我也为英特尔团队在产品发布仅一个月取得的成就感到自豪。我们相信,在视觉和语言模型中提供领先的性能能够为客户带来价值,有助于加速其AI深度学习解决方案。”


借助Habana Labs的Gaudi平台,英特尔数据中心团队能够专注于深度学习处理器技术,让数据科学家和机器学习工程师得以高效地进行模型训练,并通过简单的代码实现新模型构建或现有模型迁移,提高工作效率的同时降低运营成本。


Habana Gaudi2处理器在缩短训练时间(TTT)方面相较第一代Gaudi有了显著提升。Habana Labs于2022年5月提交的Gaudi2处理器在视觉和语言模型训练时间上已超越英伟达A100-80G的MLPerf测试结果。其中,针对视觉模型ResNet-50,Gaudi2处理器的TTT结果相较英伟达A100-80GB缩短了36%,相较戴尔提交的同样针对ResNet-50和BERT模型、采用8个加速器的A100-40GB服务器,Gaudi2的TTT测试结果则缩短了45%。


 image.pngimage.png

 

MLCommons发布的数据,2022年6月。


相比于第一代Gaudi处理器,Gaudi2在ResNet-50模型的训练吞吐量提高了3倍,BERT模型的训练吞吐量提高了4.7倍。这些归因于制程工艺从16纳米提升至7纳米、Tensor处理器内核数量增加了三倍、增加GEMM引擎算力、封装的高带宽存储容量提升了三倍、SRAM带宽提升以及容量增加一倍。对于视觉处理模型的训练,Gaudi2处理器集成了媒体处理引擎,能够独立完成包括AI训练所需的数据增强和压缩图像的预处理。


两代Gaudi处理器的性能都是在没有特殊软件操作的情况下通过Habana客户开箱即用的商业软件栈实现的。


通过商用软件所提供的开箱即用性能,在Habana 8个GPU服务器与HLS-Gaudi2参考服务器上进行测试比对。其中,训练吞吐量来自于NGC和Habana公共库的TensorFlow docker,采用双方推荐的最佳性能参数在混合精度训练模式下进行测量。值得注意的是,吞吐量是影响最终训练时间收敛的关键因素。


 image.png

图形测试配置详见说明部分。

 image.png

图形测试配置见说明部分。


除了Gaudi2在MLPerf测试中的卓越表现,第一代Gaudi在128个加速器和256个加速器的ResNet基准测试中展现了强大的性能和令人印象深刻的近线性扩展,支持客户高效系统扩展。


Habana Labs首席运营官Eitan Medina表示:“我们最新的MLPerf测试结果证明Gaudi2在训练性能方面显著优势。我们将持续深度学习训练架构和软件创新,打造最具性价比的AI训练解决方案。”


关键字:Habana  英伟达  AI 编辑:张工 引用地址:http://news.eeworld.com.cn/qrs/ic615427.html

上一篇:中国企业构建边缘计算解决方案的最佳实践
下一篇:使用交互式人工智能(CAI)实现语音转录成本降低高达90%

推荐阅读

经济日报:英伟达财报“雪崩”说明了什么
当地时间8月8日,半导体巨头英伟达在美股盘前预披露了一份远不及预期的财报。有媒体形容这份财报之差堪称“雪崩”。为什么这么说?根据公告,英伟达第二财季的营收预期为67亿美元,而在今年5月份,该公司给出的业绩指引是81亿美元。短短两个多月,指引就大幅证伪了。这说明美国乃至全球宏观经济的下滑程度远超企业管理层预期。  宏观经济下滑的影响体现在许多方面,对英伟达最显著影响是导致其游戏业务收入大幅减少。第二财季,公司游戏业务营收为20.4亿美元,相比去年同期的30.6亿美元下降33%,环比下滑幅度则达到44%。  英伟达的显卡配备了图形处理器芯片,可将代码转换成显示器中的图像,是帮助游戏玩家获取逼真流畅游戏体验的核心产品。过去两年,英伟达的显
发表于 2022-08-11
全新 NVIDIA 神经图形 SDK 使每个人都能创建元宇宙内容
新发布的 NeuralVDB和 Kaolin Wisp 等十几款工具和程序使数百万设计师和创作者能够轻松、快速地创建 3D 内容。一直以来,创建游戏、虚拟世界(包括元宇宙)、产品设计或视觉效果场景中的 3D 物体都是一项高度精细的工作,即便是技艺精湛的艺术家也必须在细节逼真度与期限和预算压力之间取得平衡。要制作出在物理世界中看起来无异的物品需要耗费很长的时间,更复杂的是有时需要让多个物体和角色在虚拟世界中互动。模拟物理已变得和模拟光线一样重要,例如虚拟工厂中的机器人不仅要有与真实机器人完全相同的外观,还要有完全相同的承重和制动能力。完全做到这一点很难,但这也蕴含着巨大的机遇。除了产品设计外,它还影响到交通运输、医疗、电信、娱乐等多个
发表于 2022-08-10
全新 <font color='red'>NVIDIA</font> 神经图形 SDK 使每个人都能创建元宇宙内容
NVIDIA与合作伙伴扩展通用场景描述
NVIDIA与合作伙伴扩展通用场景描述,加速工业元宇宙的发展和下一波人工智能浪潮NVIDIA Announces Open Source USD Resources and Test Suite在皮克斯、Adobe、Autodesk、西门子以及媒体、游戏、机器人、工业自动化和零售业等领域创新者的领导下,将USD进一步发展成为开放元宇宙和3D互联网的基础;NVIDIA发布开源USD资源和测试套件加利福尼亚州圣克拉拉 - SIGGRAPH - 2022年8月9日 – NVIDIA于今日宣布了一项发展通用场景描述(USD)的大型计划,准备将该3D世界的开源和可扩展语言发展成为开放元宇宙和3D互联网的基础。NVIDIA将与USD的发明者皮克
发表于 2022-08-10
<font color='red'>NVIDIA</font>与合作伙伴扩展通用场景描述
全新NVIDIA Omniverse Avatar Cloud Engine助力虚拟助手和数字人通过图灵测试
全新NVIDIA Omniverse Avatar Cloud Engine助力虚拟助手和数字人通过图灵测试Omniverse Avatar Cloud Engine( ACE)为游戏、聊天机器人、数字孪生和虚拟世界的开发者提供用于构建和部署交互式虚拟形象的云原生AI模型加利福尼亚州圣克拉拉 - SIGGRAPH - 2022年8月9日 – NVIDIA于今日发布NVIDIA Omniverse Avatar Cloud Engine(ACE) 。这套云原生AI模型和服务能够让用户更轻松地构建和自定义栩栩如生的虚拟助手和数字人。通过将这些模型和服务迁移到云端,ACE使任何规模的企业都能够立即获得创建并部署助手和虚拟形象所需的大规模算
发表于 2022-08-10
全新<font color='red'>NVIDIA</font> Omniverse Avatar Cloud Engine助力虚拟助手和数字人通过图灵测试
NVIDIA发布Omniverse重要版本,新增USD连接器和工具、模拟技术及开发者框架
NVIDIA新发布的工具和功能包括: Avatar Cloud Engine;DeepSearch AI 3D搜索引擎;用于稀疏体积数据的NeuralVDB AI升级;与用于科学数字孪生的NVIDIA Modulus的连接;以及PhysX、MDL等技术的更新加利福尼亚州圣克拉拉 - SIGGRAPH - 2022年8月9日 – NVIDIA于今日宣布,为基于通用场景描述(USD)连接和构建元宇宙世界的平台——NVIDIA Omniverse™提供一系列新的开发者框架、工具、应用和插件。此次针对Omniverse的扩展包括多项AI工具和功能,它们让艺术家、开发者和工程师能够比以往更加轻松地构建虚拟世界和内容,并且更加无缝地连接当今领先
发表于 2022-08-10
<font color='red'>NVIDIA</font>发布Omniverse重要版本,新增USD连接器和工具、模拟技术及开发者框架
Xfuse利用专有ISP技术研发新一代AI视觉技术 可推进自动驾驶发展
据外媒报道,近日,定制化成像与视频技术研发商Xfuse, LLC 宣布进军研发下一代人工智能视觉技术,该公司的专有高性能图像信号处理(ISP)技术能够为多种不同的传感器提供支持,同时实时融合数据丰富的HDR视频,且可实现最小的延迟。XfusePhoenix HDR ISP 技术的位置感知数据可让内部和独立的工程师对关键成像管道实行完全控制,这一点对快速推进自我感知机器人、自动导航车辆、机器视觉等应用至关重要。
发表于 2022-08-09
Xfuse利用专有ISP技术研发新一代<font color='red'>AI</font>视觉技术 可推进自动驾驶发展
小广播
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2022 EEWORLD.com.cn, Inc. All rights reserved