在过去几年时间里,NVIDIA 深耕 AI 领域,他们的 GPU 不仅成为 HPC 的首选,也成为包括 AI 和深度学习生态系统在内的数据中心的首选。在最新公布的开发者博文中,NVIDIA 宣布正利用 AI 来设计和开发 GPU,其最新的 Hopper GPU 拥有将近 13000 个电路实例,而这些实例完全由 AI 创建。
计算机芯片中的算术电路是使用逻辑门网络(如 NAND、NOR 和 XOR)和电线构成的。理想的电路应具有以下特点:
● 小:较小的区域,以便更多电路可以安装在芯片上。
● 快速:降低延迟以提高芯片的性能。
● 消耗更少的功率:芯片的功耗更低。
NVIDIA 使用这种方法设计了近 13000 个 AI 辅助电路,与同样快速且功能相同的 EDA 工具相比,它们的面积减少了 25%。但是 PrefixRL 被提到是一项计算要求非常高的任务,并且对于每个 GPU 的物理模拟,它需要 256 个 CPU 和超过 32,000 个 GPU 小时。为了消除这个瓶颈,NVIDIA 开发了 Raptor,这是一个内部分布式强化学习平台,它特别利用 NVIDIA 硬件进行这种工业强化学习。
Raptor 具有多项可提高可扩展性和训练速度的功能,例如作业调度、自定义网络和 GPU 感知数据结构。在 PrefixRL 的上下文中,Raptor 使得跨 CPU、GPU 和 Spot 实例的混合分配工作成为可能。
这个强化学习应用程序中的网络是多种多样的,并且受益于以下几点。
● Raptor 在 NCCL 之间切换以进行点对点传输以将模型参数直接从学习器 GPU 传输到推理 GPU 的能力。
● Redis 用于异步和较小的消息,例如奖励或统计信息。
● 一种 JIT 编译的 RPC,用于处理大容量和低延迟的请求,例如上传体验数据。
NVIDIA 得出结论,将 AI 应用于现实世界的电路设计问题可以在未来带来更好的 GPU 设计。
在 NVIDIA Develope 上发布的新博客中,该公司重申了其优势以及它自己如何利用其 AI 功能来设计其迄今为止最强大的 GPU--Hopper H100。 NVIDIA GPU 主要是使用最先进的 EDA(电子设计自动化)工具设计的,但在利用 PrefixRL 方法的 AI 的帮助下,使用深度强化学习优化并行前缀电路,公司可以设计更小、更快、更节能的芯片,同时提供更好的性能。
关键字:NVIDIA AI GPU
引用地址:
NVIDIA利用AI来设计和开发GPU 最新Hopper已拥有1.3万个电路实例
推荐阅读最新更新时间:2024-11-13 10:12
自动驾驶世界的汽车后市场将变成什么样?
自滴滴在上海走出自动驾驶商用化第一步之后,给大家一种自动驾驶世界离我们越来越近的感觉,自动驾驶又变成饭后闲聊的重点,大家憧憬着这一技术的普及,可以不用驾驶汽车,将更多的道路时间用来休息消遣。 自动驾驶会普及吗?答案是肯定的,自动驾驶终究会走进每家每户,只是短期内并不可能实现,真正普及还需要有技术、政策、定价制定、保险判定、后市场后勤保障等各方面的加持(后续会写话题专门讨论),只有像现在对于普通车辆在各方面都拥有了完善的闭环控制,才有可能实现最终的普及。 聊到自动驾驶,更多人会想到自动驾驶技术的先进性,但很少有人会去考虑如果自动驾驶实现了普及,汽车后市场会变成什么样,这个问题离我们还很遥远,但是确是自动驾驶普及之路上不可或缺
[嵌入式]
高端AI GPU入手大不易,半导体链“微调”生产计划
AI高效运算芯片(HPC)龙头NVIDIA掀起全球旋风,CEO黄仁勋巨星光芒直逼以往的苹果(Apple)Steve Jobs,也甚至略为盖过了Tesla CEO Elon Musk。 尽管AI风潮炽热,不过,供应链也确实传出现在要取得高端AI GPU难上加难,至少要观察到2023年底,这背后,台湾半导体供应链也传出为了AI大客户「微调」生产计划。 业界传出,原订NVIDIA 2023年第4季才要大举增加对台积投片与先进封装CoWoS产能,目前已改为平均于第2、3、4季分配生产,但加计先进制程晶圆代工、先进封装流程,估计到成品测试端(FT),最快要再4~5个月时间。 以台积为首的大联盟阵营,目前仍是NVIDIA非常重要
[半导体设计/制造]
收购Nervana,人工智能的这场军备竞赛英特尔怎能缺席
英特尔宣布,将收购创业公司Nervana Systems。英特尔将获得该公司的软件、云计算服务和硬件,从而使产品更好地适应人工智能的发展。
根据Gartner分析师马丁·雷诺兹(Martin Reynolds)的说法,英特尔至强处理器目前在数据中心市场保持领先,但并不适用于人工智能独特的计算任务。利用Nervana的产品和专业性,英特尔在这一快速增长的市场将有能力占据一席之地,应对英伟达等对手的挑战。
雷诺兹表示:“市场规模还没有那么大,但这是个潜在良机。”
数据中心业务是英特尔目前盈利能力最强、增长速度最快的业务。不过,这一业务需要探索适应语音和图像识别等新技术的产品。未来,在搭载英特尔处理器
[嵌入式]
黄仁勋谈3金矿:AI、机器人、自驾车
全球绘图处理器龙头辉达(NVIDIA)创办人暨执行长黄仁勋近日指出, AI (人工智慧)和自主 机器人 、自驾车三大技术正进入产业元年,数以兆计的装置将注入人工智慧,为所有产业创造前所未有的大商机。下面就随网络通信小编一起来了解一下相关内容吧。 黄仁勋认为,我们处在新世界开端,未来将可与电脑沟通、车辆能自动驾驶、 机器人 融入生活中,辉达为世界打造无数平台,使这些产品与体验得以成真;而台湾拥有台积电、鸿海、广达、华硕等 AI 相关企业,台湾产业链将因 AI 创造商机。 辉达在台举办GPU技术大会(GTC Taiwan),由参加完台积电卅周年庆生会的黄仁勋亲自主持开场演说,对即将迈入的AI新纪元提出更完整的看法。
[网络通信]
Sachin Katti:边缘平台有望增强AI功能
Sachin Katti,英特尔公司网络与边缘事业部高级副总裁兼总经理 过去一年,我们开始意识到AI蕴含的巨大能量及其激发的创新潜能,围绕AI的热议居高不下,其中许多创新将深刻改变科技行业乃至整个世界的发展进程。 未来,Al的命脉将依赖于开放的生态系统。这个生态系统能够为开发者提供各种选择,并帮助其实现跨领域、跨供应商移植应用软件。 这意味着开发的平台和解决方案,会将世界上的物理基础设施转变为无缝连接、无处不在的软件 。 以往,Al一直集中在数据中心,但市场调查公司 Gartner®预测 :“到2025年,50%以上由企业管理的数据,将在数据中心或云之外进行创建和处理。”如今,企业正在通过基于Al的自动化运营寻求更多
[网络通信]
英伟达黄仁勋:坚守法规服务中国,展望人形机器人未来
在飞速发展的今天,作为图形()领域的佼佼者,其一举一动都牵动着全球科技界的目光。近日,英伟达CEO在接受专访时,就美国对中国大陆的出口禁令、人形技术的发展、应用的电力挑战等热点问题发表了深刻见解。
谈到美国对中国大陆的芯片出口禁令,黄仁勋坦言,作为一家国际性的高科技企业,英伟达有责任遵守美国政府的政策。然而,他也强调,中国大陆市场是一个极为重要且规模庞大的市场,对于英伟达而言,这一市场具有不可忽视的战略意义。因此,在遵守法规的前提下,英伟达将致力于为中国大陆客户提供高质量的服务和。
黄仁勋表示,尽管面临出口禁令的挑战,但英伟达将积极调整战略,制造可出口的产品,以满足中国大陆客户的需求。他相信,在双方的共同努力下
[机器人]
京东启动人工智能加速器,CanYa作为重要成员
据国外媒体报道, 京东 将启动一项名为“ 人工智能 加速器(AICA)”的项目,开启创业公司在 区块链 技术领域所拥有的变革潜力。其中作为该领域的重要成员,CanYa被选为该加速器项目中的成员之一。该计划还包括了另外五家区块链技术公司,分别为Bluzelle、Nuggets、Republic Protocol、Devery和Bankorus。 作为“中国版eBay”,京东已经拥有超过2.5亿规模的用户。在过去的一年里,京东通过利用技术创新和对物流链的投入实现了近500亿美元的市值。同时作为一家电子商务公司,京东一直都走在创新的前沿,希望能够将区块链技术融入到现有业务中,成为降低成本、提高用户满意度的关键。 通过此次合作,C
[嵌入式]
台积电:2nm比3nm更受欢迎 A16工艺对AI服务器极具吸引力
10月21日消息,据媒体报道,台积电董事长兼首席执行官魏哲家最近确认了人工智能(AI)的需求是“真实的”,表示未来五年内,台积电有望实现连续、健康的增长。客户对于2nm的询问多于3nm,看起来更受客户的欢迎。 据统计,在2024年第三季度里,3nm、5nm和7nm工艺的出货量分别占台积电总收入的20%、32%和17%,主要增长动力来自于3nm工艺的收入推动。 目前3nm显示出强劲的出货势头,占比相比第一和第二季度的9%和15%有较大幅度攀升。在主要客户的支持下,3nm的贡献在明年会继续上升,到了2026年仍然是台积电收入的主要驱动力。 按照台积电的说法,2nm不但能复制3nm的成功,甚至有超越的势头。有市场研究机构表示,苹果、英伟
[半导体设计/制造]