英特尔全新Gaudi2处理器面世中国市场,加速大规模深度学习训练与推理

发布者:EE小广播最新更新时间:2023-07-11 来源: EEWORLD关键字:英特尔  处理器  深度学习 手机看文章 扫描二维码
随时随地手机看文章

2023年7月11日,北京 —— 今日,英特尔AI产品战略暨Gaudi2新品发布会在京举行。会上,英特尔正式于中国市场推出第二代Gaudi深度学习加速器——Habana® Gaudi®2。作为英特尔从云到端产品组合的重要组成,Gaudi2致力于以领先的性价比优势,加速AI训练及推理,为中国用户提供更高的深度学习性能和效率,从而成为大规模部署AI的更优解。


 image.png

英特尔于中国市场推出Gaudi2深度学习加速器


英特尔执行副总裁兼数据中心与人工智能事业部总经理Sandra Rivera指出,“英特尔致力于通过为客户提供广泛的硬件选择,并支持开放的软件环境,加速人工智能技术的发展。凭借包括至强可扩展处理器和Gaudi2深度学习加速器在内的产品组合,英特尔正在降低人工智能的准入门槛,并强化客户在云端通过网络和智能边缘部署这一关键业务技术的能力,从而帮助构建中国人工智能的未来。”


image.png

为深度学习而生的全新Gaudi2训练加速器


该Gaudi2深度学习加速器暨Gaudi2夹层卡HL-225B,以第一代Gaudi高性能架构为基础,以多方位性能与能效比提升,加速高性能大语言模型运行。该加速器具备:

24个可编程Tensor处理器核心(TPCs)

21个Gbps(RoCEv2)以太网接口

96GB HBM2E内存容量

2.4TB/秒的总内存带宽

48MB片上SRAM

集成多媒体处理引擎


 image.png

Habana® Gaudi®2深度学习加速器


Gaudi2加速器的出色性能在6月公布的MLCommons® MLPerf®基准测试中得到了充分认证,其在GPT-3模型、计算机视觉模型ResNet-50(使用8个加速器)、Unet3D(使用8个加速器),以及自然语言处理模型BERT(使用8个和64个加速器)上均取得了优异的训练结果。与市场上其他面向大规模生成式AI和大语言模型的产品相比,Gaudi2拥有卓越的性能与领先的性价比优势,能够帮助用户提升运营效率的同时,降低运营成本。


此外,Gaudi2可为大规模的多模态和语言模型提供出色的推理性能。在最近的Hugging Face评估中,其在大规模推理方面的表现,包括在运行Stable Diffusion(另一个用于从文本生成图像的最先进生成式AI模型之一)、70亿以及1760亿参数BLOOMz模型时,在行业内保持领先。


满足大语言和多模态模型的需求


Gaudi2深度学习加速器的架构旨在高效扩展,以满足大规模语言模型及生成式AI模型的需求。其每张芯片集成了21个专用于内部互联的100Gbps(RoCEv2 RDMA)以太网接口,从而实现低延迟服务器内扩展。


在Stable Diffusion训练上,Gaudi2展示了从1张卡至64张卡近线性99%的扩展性。此外,MLCommons刚刚公布的MLPerf训练3.0结果,亦验证了Gaudi2处理器在1750亿参数的GPT-3模型上,从256个加速器到384个加速器可实现令人印象深刻的接近线性的95%扩展效果。


具备成熟的软件支持,Gaudi2产品在中国市场正式上市


伴随日益增长的生成式AI及大语言模型需求,英特尔亦致力于打造领先、成熟的软件支持,充分释放Gaudi2深度学习加速器性能。


为支持客户轻松构建模型,或将当前基于GPU的模型业务和系统迁移到基于全新Gaudi2服务器,并帮助保护软件开发投入,SynapseAI®软件套件针对Gaudi平台深度学习业务进行了优化,旨在与广泛的软件生态系统一起,帮助简化模型的开发和迁移。SynapseAI集成了对TensorFlow和PyTorch框架的支持,并提供众多流行的计算机视觉和自然语言参考模型,能够满足深度学习开发者的多样化需求。


目前,英特尔正与浪潮信息合作,打造并发售基于Gaudi2深度学习加速器的浪潮信息AI服务器NF5698G7。该服务器集成了8颗Gaudi2加速卡HL-225B,还包含双路第四代英特尔至强可扩展处理器。


 image.png

基于Gaudi2加速器的浪潮NF5698G7服务器



携手中国产业生态,共启人工智能新篇


多年来,借助强大的AI软硬件基础,英特尔一直致力于为AI领域的各类工作负载提供业界领先的卓越性能,并通过开放的生态、丰富多样的产品选择不断降低AI部署的门槛,并为中国的AI发展提供坚定支持。


本次发布会上,美团、百度与浪潮信息等生态伙伴分别分享了其基于英特尔软硬件产品组合的多样化智能业务进展。百度智能云服务器高级经理何永占表示,集成英特尔®AMX加速引擎的第四代英特尔®至强®可扩展处理器为ERNIE-Tiny模型带来了多倍的性能优化,百度将持续构建领先的AI全栈能力和全面的开放生态,并期待与英特尔在未来的AI领域展开更为广泛、深入的合作。浪潮信息高级产品经理王磊强调,NF5698G7是专为面向生成式AI市场创新开发的新一代AI服务器,支持8颗OAM高速互联的Gaudi2加速器,具备高性能、高扩展、高能效和开放生态等优点,将为AI客户提供强大的大模型训练和推理能力。未来,浪潮信息将继续携手英特尔,为行业打造创新、领先的产品方案。


此外,多家本土生态伙伴亦表明了与英特尔在当下及未来产品合作上的坚定立场与长远展望。新华三集团计算存储产品线副总裁刘宏程指出,新华三智慧计算秉持内生智能的技术理念,基于硬件使能、前瞻技术、绿色低碳等全方位能力,助力AI产业的高速发展。基于英特尔Gaudi2 AI加速器,新华三正与英特尔紧密合作,开发适合大模型训练和推理的高性能AI服务器,推动智能算力的普惠创新。与此同时,超聚变数字技术有限公司算力基础设施领域总裁唐启明表示,非常荣幸见证英特尔Gaudi2的发布。作为英特尔的长期战略合作伙伴,超聚变将一如既往地携手英特尔,共同推出基于Gaudi2的全新产品与解决方案,助力企业的AI场景成熟商用和规模落地。


未来,英特尔将持续引领产品技术发展,进一步加速大规模深度学习部署,助力中国本地AI市场发展。


关键字:英特尔  处理器  深度学习 引用地址:英特尔全新Gaudi2处理器面世中国市场,加速大规模深度学习训练与推理

上一篇:中国工程院院士:5G网速比4G快7倍 但体验几乎没差
下一篇:5G网络的时序设计和管理同步方式

推荐阅读最新更新时间:2024-10-22 19:23

英特尔全新Gaudi2处理器面世中国市场,加速大规模深度学习训练与推理
2023年7月11日,北京 —— 今日, 英特尔AI产品战略暨Gaudi2新品发布会在京举行。会上,英特尔正式于中国市场推出第二代Gaudi深度学习加速器——Habana® Gaudi®2 。作为英特尔从云到端产品组合的重要组成,Gaudi2致力于以领先的性价比优势,加速AI训练及推理,为中国用户提供更高的深度学习性能和效率,从而成为大规模部署AI的更优解。 英特尔于中国市场推出Gaudi2深度学习加速器 英特尔执行副总裁兼数据中心与人工智能事业部总经理Sandra Rivera指出,“英特尔致力于通过为客户提供广泛的硬件选择,并支持开放的软件环境,加速人工智能技术的发展。凭借包括至强可扩展处理器和Gaudi2深度学习
[网络通信]
<font color='red'>英特尔</font>全新<font color='red'>Gaudi2</font><font color='red'>处理器</font>面世中国市场,加速大规模<font color='red'>深度学习</font>训练与推理
英特尔深度学习处理器 加快人工智能创新步伐
近期在法兰克福举办的国际超级计算大会上,涌现了很多令人兴奋的新技术,驱动着广泛应用于各行各业的人工智能和深度学习技术的发展。英特尔为人工智能技术的各个层面提供了一套广泛全面的产品组合,其中包括即将推出的英特尔®至强®可扩展处理器以及英特尔现场可编程门阵列(FPGA),还有即将推出的代号为Knights Mill的英特尔®至强融核™处理器,将深度学习技术提升到了一个新高度。 英特尔®至强融核™处理器Knights Mill加速深度学习处理 这个英特尔至强融核系列的新成员是专门针对深度学习训练进行了优化,预计在2017年第四季度投产。该处理器旨在满足数据科学家、工程师以及所有致力于机器学习技术应用领域的用户独特需求。Kni
[网络通信]
<font color='red'>英特尔</font><font color='red'>深度学习</font><font color='red'>处理器</font> 加快人工智能创新步伐
Gaudi2走向“高地”,推理性能超过A100
ChatGPT和GPT-4引发的大模型军备赛不仅没有熄火,反而愈加激烈,随着大模型竞赛来到下半场,其自身也不断展现出越来越大潜力,比如让AI自动设计芯片,或者让AI自动编程。为抢占领先地位,企业使出浑身解数,AI模型也越做越大,以达到力大砖飞的效果,实现智能涌现。但这引发一个大问题——算力不够用了。 A100和H100是这次浪潮中的主力军,几乎所有人都在抢购这些AI芯片。芯片行业中,所有企业一直以来,都倾向于采用多供应链的策略,其中不乏苹果、谷歌,有谁能够替代英伟达? 7月11日,英特尔正式于中国市场推出第二代Gaudi深度学习加速器—Habana Gaudi2,证明跑大模型也有所替代。作为一款针对中国市场的新产品,刚刚崭
[嵌入式]
<font color='red'>Gaudi2</font>走向“高地”,推理性能超过A100
Habana Gaudi2性能稳超英伟达A100,助力实现高效AI训练
MLPerf测试结果验证了Gaudi2在ResNet和BERT模型训练时间上的优势 近日,英特尔宣布Habana® Gaudi®2深度学习处理器在MLPerf行业测试中表现优于英伟达A100提交的AI训练时间,结果突显了5月在英特尔On产业创新峰会上发布的Gaudi2处理器在视觉(ResNet-50)和语言(BERT)模型上训练时间的优势。 英特尔公司执行副总裁兼数据中心与人工智能事业部总经理 Sandra Rivera表示:“非常高兴能与大家分享Gaudi 2在MLPerf基准测试中的出色表现,我也为英特尔团队在产品发布仅一个月取得的成就感到自豪。我们相信,在视觉和语言模型中提供领先的性能能够为客户带来价值,有助于加速其
[嵌入式]
Habana <font color='red'>Gaudi2</font>性能稳超英伟达A100,助力实现高效AI训练
Genetec推出新车牌自动识别系统 采用英特尔深度学习视觉处理单元
据外媒报道,在2019年10月26至29日于芝加哥召开的IACP上,加拿大Genetec公司推出了下一代ALPR(车牌自动识别)系统。该系统由英特尔Movidius™ Myriad™ X VPU(视觉处理单元)提供支持,新款Genetec AutoVu™ SharpZ3是全球首批采用英特尔最新深度学习和计算机视觉技术的车载专业ALPR系统之一。AutoVu™ SharpZ3系统具备深度学习能力,能够将车载分析、态势感知功能和准确度提升至新的创新高度。Genetec是统一安全、公共安全、运营和商业智能技术领先供应商。 (图片来源:Genetec) Genetec公司AutoVu产品总经理Stephan Kaiser表示:“
[汽车电子]
Genetec推出新车牌自动识别系统 采用<font color='red'>英特尔</font><font color='red'>深度学习</font>视觉处理单元
英特尔谈OpenVINO是如何助力边缘到云的深度学习全流程开发
日前,在2019英特尔人工智能与物联网生态合作伙伴峰会上,英特尔视频业务市场拓展总监Thomas Neubert详细介绍了目前OpenVINO的部署情况,Thomas首先表示,OpenVINO的三大特色包括:免费开源、迅速地产品迭代以及跨平台的扩展性三大方面,这也是英特尔对于OpenVINO发展蓝图的一贯承诺。 OpenVINO™(Open Visual Inference & Neural Network Optimization,开放视觉推理及神经网络优化)软件平台是一个快速开发高性能计算机视觉和深度学习视觉应用的工具包。其中包括英特尔®深度学习部署工具包,具有模型优化器和推理引擎,以及面向OpenCV*和OpenVx*的
[嵌入式]
16nm工艺、32GB HBM2,英特尔Nervana深度学习加速器问市
现在深度学习已成为人工智能的重要方向,而且研究成果已经应用于日常使用中。但训练人工智能模型需要强大的算力支持,所以除了使用GPU加速训练外,很多厂商开始推出专用于深度学习训练的ASIC芯片。英特尔在人工智能领域投入颇多,除了FPGA产品线外,也推出了Nervana深度学习加速器,在今天的Hot Chips 31会议中,英特尔公布了旗下Nervana NNP-T深度学习加速器的细节。 这款Nervana NNP-T深度学习加速器代号为Spring Cast,是目前英特尔最新款的专用深度学习加速器。这款加速器被命名为NNP-T,表示其主要用于深度学习网络模型训练工作定制。随着深度学习模型越来越庞大,所以专用的训练加速器也逐渐
[物联网]
16nm工艺、32GB HBM2,<font color='red'>英特尔</font>Nervana<font color='red'>深度学习</font>加速器问市
AlphaICs 开始提供深度学习处理器Gluon样片
AlphaICs 是一家领先的 AI 无晶圆厂半导体公司,开发边缘推理和边缘学习技术,该公司宣布向监控、工业、零售、汽车和工业物联网垂直领域提供一流FPS/Watt性能的AI芯片Gluon。 Gluon 将附带一个完整的SDK(软件开发套件),可以轻松部署神经网络。先进的边缘推理芯片使客户能够在当前基于 X86 / ARM 的系统中添加 AI 功能,从而显着节省成本。 Gluon 为分类和检测神经网络提供市场上最佳的 fps/watt 性能,执行对象检测模型 Yolo-V2 为32 FPS/watt,而执行分类模型VGG-19 为 22 FPS/Watt。 目前AlphaICs 正在为早期客户提供 样品,以开发他们的视
[嵌入式]
小广播
最新网络通信文章
换一换 更多 相关热搜器件
随便看看

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved