NVIDIA 宣布推出 Hopper 架构,掀起新一代加速计算浪潮

发布者:EE小广播最新更新时间:2022-03-23 来源: EEWORLD关键字:NVIDIA  Hopper  架构  AI 手机看文章 扫描二维码
随时随地手机看文章

作为全球 AI 基础设施的全新引擎,NVIDIA H100 GPU 实现了数量级的性能飞跃 

 

加利福尼亚州圣克拉拉市 —— GTC 大会 —— 太平洋时间 2022 年 3 月 22 日 —— 为推动 AI 数据中心的新一轮发展,NVIDIA 于今日宣布推出采用 NVIDIA Hopper™ 架构的新一代加速计算平台。与上一代产品相比,该平台实现了数量级的性能飞跃。 


 image.png


这一全新架构以美国计算机领域的先驱科学家 Grace Hopper 的名字命名,将取代两年前推出的 NVIDIA Ampere 架构。


NVIDIA 同时发布其首款基于 Hopper 架构的 GPU — NVIDIA H100。该款 GPU 集成了 800 亿个晶体管。H100 是全球范围内最大的性能出众的加速器,拥有革命性的 Transformer 引擎和高度可扩展的 NVIDIA NVLink® 互连技术等突破性功能,可推动庞大的 AI 语言模型、深度推荐系统、基因组学和复杂数字孪生的发展。


NVIDIA 创始人兼 CEO 黄仁勋表示: “数据中心正在转变成‘AI 工厂’。它们处理大量数据,以实现智能。NVIDIA H100 是全球 AI 基础设施的引擎,让企业能够利用其实现自身 AI 业务的加速。”


H100 技术突破


H100 NVIDIA GPU 为加速大规模 AI 和 HPC 设定了新的标准,带来了六项突破性创新:


世界最先进的芯片 —— H100 由 800 亿个晶体管构建而成,这些晶体管采用了专为 NVIDIA 加速计算需求设计的尖端的 TSMC 4N 工艺,因而能够显著提升 AI、HPC、显存带宽、互连和通信的速度,并能够实现近 5TB/s 的外部互联带宽。H100 是首款支持 PCIe 5.0 的 GPU,也是首款采用 HBM3 的 GPU,可实现 3TB/s 的显存带宽。20个 H100 GPU 便可承托相当于全球互联网的流量,使其能够帮助客户推出先进的推荐系统以及实时运行数据推理的大型语言模型。


新的 Transformer 引擎 —— Transformer 现在已成为自然语言处理的标准模型方案,也是深度学习模型领域最重要的模型之一。H100 加速器的 Transformer 引擎旨在不影响精度的情况下,将这些网络的速度提升至上一代的六倍。


第二代安全多实例 GPU —— MIG 技术支持将单个 GPU 分为七个更小且完全独立的实例,以处理不同类型的作业。与上一代产品相比,在云环境中 Hopper 架构通过为每个 GPU 实例提供安全的多租户配置,将 MIG 的部分能力扩展了 7 倍。


机密计算 —— H100 是全球首款具有机密计算功能的加速器,可保护 AI 模型和正在处理的客户数据。客户还可以将机密计算应用于医疗健康和金融服务等隐私敏感型行业的联邦学习,也可以应用于共享云基础设施。


第 4 代 NVIDIA NVLink —— 为加速大型 AI 模型,NVLink 结合全新的外接 NVLink Switch,可将 NVLink 扩展为服务器间的互联网络,最多可以连接多达 256 个 H100 GPU,相较于上一代采用 NVIDIA HDR Quantum InfiniBand网络,带宽高出9倍。


DPX 指令 —— 新的 DPX 指令可加速动态规划,适用于包括路径优化和基因组学在内的一系列算法,与 CPU 和上一代 GPU 相比,其速度提升分别可达 40 倍和 7 倍。Floyd-Warshall 算法与 Smith-Waterman 算法也在其加速之列,前者可以在动态仓库环境中为自主机器人车队寻找最优线路,而后者可用于 DNA 和蛋白质分类与折叠的序列比对。 


H100 的多项技术创新相结合,进一步扩大了 NVIDIA在 AI 推理和训练的领导地位,利用大规模 AI 模型实现了实时沉浸式应用。H100 将支持聊天机器人使用功能超强大的monolithic Transformer 语言模型 Megatron 530B,吞吐量比上一代产品高出 30 倍,同时满足实时对话式 AI 所需的次秒级延迟。利用 H100,研究人员和开发者能够训练庞大的模型,如包含 3950 亿个参数的混合专家模型,训练速度加速高达9倍,将训练时间从几周缩短到几天。


NVIDIA H100 的广泛采用


NVIDIA H100 可部署于各种数据中心,包括内部私有云、云、混合云和边缘数据中心。这款产品预计于今年晚些时候全面发售,届时企业可从全球各大云服务提供商和计算机制造商处购买,或者直接从 NVIDIA 官方渠道购买。


NVIDIA 的第四代 DGX™ 系统 DGX H100 配备 8 块 H100 GPU,以全新的 FP8 精度提供 32 Petaflop 的 AI 性能,并支持扩展,能够满足大型语言模型、推荐系统、医疗健康研究和气候科学的海量计算需求。 


DGX H100 系统中的每块 GPU 都通过第四代 NVLink 连接,可提供 900GB/s 的带宽,与上一代相比,速度提升了 1.5 倍。NVSwitch™ 支持所有八块 H100 GPU 通过 NVLink 全互联。新一代 NVIDIA DGX SuperPOD™ 超级计算机可通过外部 NVLink Switch 互联,最多可连接 32 个 DGX H100 节点。


Hopper 已在行业内获得各大云服务提供商的广泛支持,包括阿里云、AWS、百度智能云、Google Cloud、Microsoft Azure、Oracle Cloud、腾讯云和火山引擎,这些云服务商均计划推出基于 H100 的实例。


全球领先的系统制造商,包括源讯、BOXX Technologies、思科、戴尔科技、富士通、技嘉、新华三、慧与 (HPE)、浪潮、联想、宁畅和超微预计推出各种采用 H100 加速器的服务器。


规模各异的 NVIDIA H100


H100 将提供 SXM 和 PCIe 两种规格,可满足各种服务器设计需求。此外,NVIDIA还会推出融合加速器,耦合 H100 GPU 与 NVIDIA ConnectX®-7 400Gb/s InfiniBand 和以太网智能网卡


NVIDIA H100 SXM 提供 4 GPU 和 8 GPU 配置的 HGX™ H100 服务器主板,可助力企业将应用扩展至一台服务器和多台服务器中的多个 GPU。基于 HGX H100 的服务器可为 AI 训练和推理以及数据分析和 HPC 应用提供更高的应用性能。


H100 PCIe 通过 NVLink 连接两块 GPU,相较于 PCIe 5.0,可提供 7 倍以上的带宽,为主流企业级服务器上运行的应用带来卓越的性能。PCIe规格便于集成到现有的数据中心基础设施中。


H100 CNX 是一款全新的融合加速器。这款加速器将 H100 与 ConnectX-7 智能网卡相结合,可为 I/O 密集型应用(如企业级数据中心内的多节点 AI 训练和边缘 5G 信号处理)提供强劲性能。


NVIDIA Hopper 架构 GPU 还可与 NVIDIA Grace™ CPU 通过 NVLink-C2C 互联,与 PCIe 5.0 相比,可将 CPU 和 GPU 之间的通信速度提高 7 倍以上。这一组合,即Grace Hopper 超级芯片,可用于大规模 HPC 和 AI 应用。


NVIDIA 软件支持


H100 NVIDIA GPU 由功能强大的软件工具提供支持,可助力开发者和企业构建并加速 AI、HPC 等一系列应用。其中包括用于语音、推荐系统和超大规模推理等工作负载的 NVIDIA AI 软件套件的重大更新。


NVIDIA 还发布了 60 多个针对 CUDA-X™ 的一系列库、工具和技术的更新,以加速量子计算和 6G 研究、网络安全、基因组学和药物研发等领域的研究进展。 


供货信息


NVIDIA H100 将自第三季度起开始供货。


观看 NVIDIA 创始人兼首席执行官黄仁勋的 GTC 2022 主题演讲,进一步了解NVIDIA Hopper 和 H100。免费注册 GTC 2022,与NVIDIA和行业领导者共襄盛会。


关键字:NVIDIA  Hopper  架构  AI 引用地址: NVIDIA 宣布推出 Hopper 架构,掀起新一代加速计算浪潮

上一篇:ARM与安谋,中国模式的平衡之道
下一篇:2022年MLPerf的新一轮推理测试有何亮点?

推荐阅读最新更新时间:2024-11-17 13:18

拉夫堡大学提出ADAS协作式动作管理控制架构理念
据外媒报道,英国拉夫堡大学(Loughborough University)与捷豹路虎提出了ADAS系统的协作式动作管理控制架构(coordinated control architecture for motion management)理念,旨在提升所有车辆的安全性及舒适性,适用于所有ADAS规格。 如今,在应用的ADAS系统种类繁多,该类系统通常都能为用户提供特色功能,可借助车载系统的新增控制件来实现,例如:制动或转向系统。ADAS系统通常被用作驾驶员的辅助工具,但不得被用于代替驾驶员完成车辆的驾驶操控。 ADAS系统的物理建模与控制架构是利用MATLAB/Simulink来执行的,该类开放性平台可供各方开展进一步的研发
[汽车电子]
科大讯飞董事长刘庆峰:芯片不是人工智能的天花板
出席博鳌亚洲论坛2018年会,科大讯飞董事长刘庆峰忙于推荐自己的人工智能产品:随身携带的讯飞实时翻译机能听懂22种中国地方方言并实时转化为英语;在媒体说明会上,刘庆峰讲的“长江普通话”,借由“听见会议系统”展示为电脑屏幕上的汉字。 但刘庆峰告诉时间财经记者,翻译机的推出不是基于短期商业变现考虑,只是为了解决用户刚需。他还提醒说,创业公司要做翻译机、卖翻译机,投资人一定要谨慎。 在刘庆峰的设想里,科大讯飞的人工智能技术要做的事比赚钱更伟大。“机器能不能做全科医生?安徽已经开通了面对150多个机器人自动帮患者看病,它们现在的准确率达到一线资深医生的水平,但科大讯飞希望未来机器能成为最顶尖的医生。”刘庆峰说,“科大讯飞还承担了汉
[嵌入式]
科大讯飞董事长刘庆峰:芯片不是<font color='red'>人工智能</font>的天花板
王飞跃:人工智能是下一个全球化推动轴心
王飞跃 中国自动化学会副理事长兼秘书长、复杂系统管理与控制国家重点实验室主任、中国科学院大学中国经济与社会安全研究中心主任、青岛智能产业技术研究院院长、西安交通大学软件学院院长。主要研究领域为智能控制、社会计算、平行系统、知识自动化等。 观点一:人工智能是下一个全球化推动轴心 人工智能在很久以前就出现,以前叫自动化、智能自动化、工业自动化,现在“变身”为投资者耳熟能详 机器人 公司、人工智能公司、智能科技公司。 中国政府提出的《 中国制造2025 计划》旨在通过加快大数据、云计算、物联网等技术应用,实现制造业制造力升级,也将促进中国从早期的廉价劳动力供应强国向科技强国转变。有很多人对《中国制造2025年计划》有批评,但是看看中国
[嵌入式]
联通在线“AI防疫调研机器人”助力疫情防控获好评
随着疫情的扩散,部分城市陆续发生了“公职人员上门走访被新型冠状病毒感染”的情况。在这个危急时刻,联通在线信息科技有限公司推出 “AI防疫调研机器人”公益项目,协助相关单位进行疫情防控工作。 “AI防疫调研机器人”具备强大语义分析能力,可以帮助防疫单位快速、准确地完成外呼调研并进行统计分析,有效降低上门走访可能带来的传染风险。 包含的服务有: 1、特殊人群信息调查:流动人员情况排查等 2、特定人群提醒通知:紧急疫情信息通知等 3、重点人员摸排:重点人员情况摸排核实,重要情况定期跟进调查等 4、防控知识宣讲:返工人员知识宣讲等 日前,该项目已成功协助天津五大道街社区卫生服务中心完成社区儿童疾控方案通知,2小时内完成3000余次呼叫,有
[机器人]
AI生物识别可通过笑容识别男女性别
随着智能手机上普遍都搭载了人脸识别,原本高深莫测的技术如今已经变得在普通不过了。而目前大部分人脸识别都是通过面部特征来分辨用户的性别,也就是说如果长得清秀一点的男生留了长头发就无法辨别了。近日国外一家研究机构研制出了可以通过笑容来分辨男女的人工智能,准确度大大提高。 负责这一项目的是Hassan Ugail教授说道:“有趣的是,女性认为自己的笑容更有表现力,而且我们的研究已经证实了这一点,女性有面积更广泛的笑容,嘴唇扩大的面积远远超过男性”也就是说这个程序可以根据男人和女人在微笑时的细微面部特征,就可以准确的分析出用户的性别。 据了解,该技术可以在人类微笑的瞬间测量面部肌肉的运动,并不是依赖于某一个特征来分辨,因此这项生物
[嵌入式]
<font color='red'>AI</font>生物识别可通过笑容识别男女性别
AI大模型的算力焦虑,最终要靠CPU?
ChatGPT引发的AI大模型概念已经持续火爆一年,直至今日,AI的热度不仅没有下降,行业也迸发出越来越多具有颠覆性的应用。2024年初以来,AI PC、AI手机、AI边缘等产品相继开售,过年期间,Sora又引发了大规模讨论。 可以说,AI领域,永远都在革新。但随着大模型对算力需求的高速增长,现阶段生产的芯片很难满足业界需求。 在AI热潮之中,GPU、AISC等加速器是行业中的主角。而事实上,任何数据中心都无法脱离CPU,比喻起来就是鱼和水的关系。去年12月,英特尔第五代至强可扩展处理器(代号为Emerald Rapids)正式面世,它有着许多令人惊喜的AI秘籍。 做AI, 只有一个选择? 众所周知,面对大模
[嵌入式]
<font color='red'>AI</font>大模型的算力焦虑,最终要靠CPU?
安如普郭学滨:X86架构不适合数字告示播放器
数字告示目前已得到广泛应用,在银行、教育、美容店、加油站、商场、电影院、博物馆等众多公共场所,你都能看到数字告示的身影。 为什么要做数字告示?在安如普科技总经理郭学滨看来,消费者外出时间增加,显示设备价格下降,显示技术及多媒体芯片解码技术提高以及宽带的普及,综合因素促成了数字告示的飞速发展。据资料统计,2007年数字告示产业链包括约25家企业,而2010年,增长至超过450家。 尽管数字标牌增长迅猛,且户外显示屏安置量为世界第一,但目前仍处于摸索期,郭学滨指出中国的广告运营商数量多规模小,而且缺乏统一的行业标准,广告发布无法共享。因此,郭学滨表示,未来将打造一个平台化的广告交流系统,为中小广告商提供支持。
[嵌入式]
Imagination出大招,增强客户与高通和英伟达GPU竞争
一年前,Canyon Bridge收购了Imagination,这使得该公司在财务上稳健了很多,Imagination销售和市场营销执行副总裁David McBrien表示,我们的母公司Canyon Bridge会持续推高我们的研发水平,对一家IP公司来说,要想在市场竞争中领先,持续的投入是非常重要的。因此,我们很开心Canyon Bridge收购我们,此外,未来我们在中国的投入也会非常大。 关于竞争,David McBrien表示,移动应用是我们的主要市场,我们的目标是帮助客户跟高通在GPU上竞争,因此,要确保合作伙伴得到SoC的最佳性能,要想实现这一点,除了GPU IP之外,软件和固件也要有绝佳的性能,因此,我们在研发人员
[手机便携]
Imagination出大招,增强客户与高通和<font color='red'>英伟达</font>GPU竞争
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved