商业计算、可选研究、以及 4K 多屏游戏等需求,不断推升着对现代 GPU 的性能需求。根据一份近期的研究报告,Nvidia
认为正在迅速接近当前 GPU 架构模型的极限,因此需要寻找新的方法去攻坚。当前这个想法仍处于模拟阶段,但文中提到的“多芯片模块
GPU”(MCM-GPU)的概念,有望最终将多颗 GPU 模块整合到一处。
在意识到 Nvidia 将很快难以通过当前架构榨取 GPU 性能之后,亚利桑那州立大学、英伟达、德州大学奥斯汀分校、以及巴塞罗那超算中心携手展开了研究。
此前,厂商还可以通过在每次制程迭代时堆积更多的流处理器来提升 GPU 性能。但遗憾的是,在单一模块中塞入更多晶体管的方法,已经变得越来越困难。
以 Nvidia V100 GPU 为例,其已经需要代工厂商(台积电)将制程推到 12nm 的极限。此外,制造规模越来越大的模块,其成本和相关问题也不可忽视(比如因制造错误遇到的数量减少)。
虽然 Nvidia 可以通过将多颗 GPU 装在一块 PCB 上的方式来提升显卡性能(比如 Tesla K10 和 K80),但当前仍有一些未能解决的问题 —— 比如跨多 GPU 的任务分配就需要编程来提升硬件效率。
于是研究人员们另辟蹊径,决定在封装技术上寻找新方法,让 Nvidia 可以将多个 GPU 模块(GPMs)封装到一块。这些 GPMs 比当代 GPU 要小一些,制造起来也更容易和便宜。
尽管人们对其性能仍有疑问,但研究人员声称近期基板技术的发展(PDF)已经能够帮助其部署一种快速、强健的模块通信互联架构。从理论上来讲,其带宽可达数 TB/s 。
在 Nvidia 内部 GPU 模拟中,研究团队将 MCM-GPU 堆到了 256 组 SMs,而 Pascal 架构仅为 56 组 SMs 。然后团队基于当前架构进行了预测,结果显示 MCM-GPU 可提速 45.5% 。
此外,在同一板子上进行的多 GPU 性能对比表明,MCM-GPU 有 26.8% 的领先优势。最后,有消息称 AMD 公司也有类似的点子(基于 Navi GPU)。
关键字:Nvidia GPU
编辑:冀凯 引用地址:Nvidia探索将多GPU封装到一块:轻松打破旧架构极限
推荐阅读最新更新时间:2023-10-12 23:47
英特尔推进全新架构,面向数据中心、HPC-AI和客户端计算
英特尔推出两大x86 CPU内核、两大数据中心SoC、两款独立GPU,以及变革性的客户端多核性能混合架构 Raja M. Koduri 英特尔公司高级副总裁兼加速计算系统和图形事业部总经理 架构是硬件和软件的“炼金术”。它融合特定计算引擎所需的先进晶体管,通过领先的封装技术将它们连接,集成高带宽和低功耗缓存,在封装中为混合计算集群配备高容量、高带宽内存和低时延、可扩展互连,并确保所有软件无缝地加速。披露面向新产品的架构创新,是英特尔架构师在每年架构日上的期许,今年举办的第三届英特尔架构日令人十分兴奋。 今天,我们公布了英特尔®架构在近年来重大的改变和创新。 这包括:第一次深入介绍了英特尔首个性能混合架构Alder
[嵌入式]
NVIDIA股价再刷历史新高!GPU将颠覆CPU时代?
集微网消息,据《Forbes》报导,全球绘图芯片龙头厂英伟达 (NVIDIA)(NVDA-US) 周二 (19日) 再度上涨 1.04% 至每股 53.52 美元,再度刷新了历史新高,而统计最近一年以来英伟达股价更是已大涨了 171.62%,成为美股电子股中的耀眼明星。
NVIDIA 于今年二月初时推出该公司史上最强的 GPU 芯片 Tesla P100 后,该公司股价旋即喷出大涨;Tesla P100 是一项大幅提升高效能运算应用项目,与深度学习表现的最新型高性能运算处理器。
NVIDIA 股价日线走势图 (近一年以来表现)
《Forbes》分析,英伟达股价近一年以来之所以表
[手机便携]
英伟达、三星、美光三强联手,制造全新游戏芯片
据报道,英伟达公司(Nvidia)周二宣布了一系列功能强大的游戏芯片,这些芯片使用美光科技公司(Micron Technology Inc)的新存储技术设计,并且由三星电子有限公司生产。 英伟达总部位于加利福尼亚州圣克拉拉市。该公司表示,其GeForce RTX 3090、3080和3070芯片将以比以往芯片版本高两倍的性能和几乎两倍的功率改善视频游戏图形。 英伟达长期以来一直与各种芯片制造商合作制造设备,最近则更多依靠台湾半导体制造有限公司(Taiwan Semiconductor Manufacturing Co Ltd)生产最先进的芯片。 三星将采用8纳米芯片制造工艺而不是最新的5纳米工艺制造新的GeForce芯
[嵌入式]
GPU与汽车ADAS将会碰撞出哪些火花?
当今汽车行业最受关注的话题之一是先进的驾驶辅助系统(ADAS),该系统可以多种方式帮助驾驶员处理潜在问题。它们可以为驾驶员提供视觉和听觉警告,也可以控制制动器、加速器和转向装置,使汽车远离危险。 ADAS系统依赖于来自越来越多的离散传感器的高质量数据,例如光探测和测距传感系统(LiDAR),它使用脉冲激光测量与目标物体之间的距离;还有无线电探测和测距传感系统(RADAR),其类似于LiDAR,但RADAR使用无线电波代替激光和红外(IR)相机系统。 以上这些都使ADAS能够更好地认知周边环境并提高其辅助驾驶的能力。 ADAS中的GPU 在汽车的中央电子控制单元(ECU)中,您可以找到一个或多个大型硅器件,其
[汽车电子]
ARM发布CORELINK 400系统IP,释放高性能CPU和GPU系统潜力
ARM公司今日在加州圣克拉拉举行的ARM技术大会上推出了CoreLink™ 400系列顺从ARMB® 4协议的系统IP,使得系统设计者能够完全发挥最新的CPU和GPU技术的全部潜力。CoreLink 400系列能够对SoC计算系统的性能和效率最大化,这也是先进的移动、消费和企业应用的需求。
CoreLink 400系列完美地补充了最新的ARM Mali™-T604和Cortex™-A15高性能处理器,后者是针对具有多核处理器簇的复杂SoC而设计的。CoreLink 400系统IP使得设计者能够解决多核一致性、虚拟机、延迟性以及功耗管理等关键问题,确保每一个处理器都能够分享内存资源,并将总体系统性能最大化。
[嵌入式]
数据中心大变形:看英伟达怎样颠覆冯·诺伊曼架构
数据正在撬动我们的地球,更改变着人类的各个小世界——制造、工业、商业、医疗、教育……所有的行业都在经历前所未有的智能化重塑。 数据作为重要的资源和生产要素,已经成为世界范围内的共识。而这一切背后的支点——数据中心——计算和存储数据的区域,必将是未来科技企业角逐的圣地。 如今,这个“支点”也必须面临大变革。 因为随着AI、机器学习等应用的深入所带来的数据大爆炸,对算力提出了更高要求。据IDC统计,全球算力的需求每3.5个月就会翻一倍,远远超过了当前算力的增长速度。在此驱动下,全球计算、存储和网络基础设施必须发生根本转变。 “数据中心目前正进行一场变革,即从冯·诺依曼架构的数据中心转向以数据为中心的架构。”英伟达网络事业部亚太区市场
[手机便携]
元宇宙爆发前夜,移动GPU如何打造真实光影游戏?
随着智能手机性能不断升级,手机游戏市场蓬勃发展,越来越多场景逼真的游戏深受游戏玩家喜爱,可以说,打造一个真实的游戏世界是人类不断追求的目标。随着元宇宙概念的走红,如果要在未来元宇宙的虚拟世界中重现真实环境,需要找到方法实现人眼对于这些目标的直觉感知,实时光线追踪技术或许就是关键的支撑技术之一。 一直以来,光线追踪技术主要应用在游戏领域,它通过模拟真实世界的光线变化、反射、倒影等特性,在游戏世界中展示与真实世界光影高度相似的3D场景,随着场景的不断增大,画面复杂程度的升高,光线追踪的效果会愈发明显。 在现实生活中,光源发出的虚拟光束会照射到物体上。然后光线会与该物体相互作用,并根据物体的表面性质再反射到另一个表面上。之后,光线会不停
[手机便携]
英特尔欧洲投资1200万美元 研发图形处理器
英特尔日前表示,将向欧洲投入研究资金近1200万美元,用于图形处理和视觉计算方面的研究。
据国外媒体报道,这笔款项将在未来五年作为德国萨尔兰大学项目资金的一部分,它将成为英特尔公司有史以来向欧洲研发项目拨款的最高记录。
英特尔公司首席技术官兼高级研究员贾斯廷拉特纳(Justin Rattner)表示,英特尔公已经在萨尔兰大学与世界顶尖级研究人员合作多年,共同致力于视觉计算的研究。
拉特纳补充称,鉴于目前视觉计算技术的研究已处于越来越重要的地位,建立这样一个新的研究所,以扩大我们与其它研究机构的合作是非常必要的。
英特尔称,该项目将重点放在改善图像处理方式、改善用户日常计算处理中
[嵌入式]