早在20世纪80年代,并行信息处理技术先驱吉恩•阿姆达尔(Gene Amdahl)就提出了一个提升大型机计算速度的计划:制造一种硅晶片大小的处理器。通过将大部分数据移动保留在处理器内部进行,计算速度可以更快,并且更节能。阿姆达尔拿到了当时数额最大的一笔风险投资,投资额是2.3亿美元。之后,他创办了Trilogy System公司,期望将他的愿景变为现实。可惜首次“晶圆级集成”的商业尝试很失败,导致“跳火坑”成为了一个金融新闻词汇。伊利诺伊大学厄巴纳-香槟分校和加州大学洛杉矶分校的工程师们认为,现在是时候再尝试一次了。
在2月举行的IEEE高性能计算机体系结构国际研讨会上,伊利诺伊的电子与计算机工程副教授拉科什•库玛(Rakesh Kumar)及其合作者阐述了有关包含多达40个GPU的晶圆级计算机的思路。这个多处理器“怪物”将计算速度提高了约19倍,而且能耗和信号延迟降低到了原来的1/140以下。
库玛表示:“计算单元之间的通信开销是我们想要解决的一个大问题。”超级计算机中的应用程序一般分布在数百个GPU中,这些GPU位于不同的印刷电路板上,并通过长数据链路进行通信。与芯片内部的互连相比,这些链路耗能更多而且速度较慢。此外,由于芯片和印刷电路板的机械特性不同,必须对处理器进行封装,而且要严格限制芯片可使用的输入和输出数量,因此,将数据从一个GPU转移到另一个GPU的“开销惊人”,库玛说。
因此,需要让GPU模块之间互相连接,这些连接要与芯片内的互连一样快,一样丰富,能耗一样低。这种快速连接能够将这40个GPU集成到一起,成为一个巨型GPU。从程序员的角度来看,“整体就像一个GPU。”库玛说。
一种解决方案是使用标准的芯片制造技术,在同一块硅片上构建这40个GPU,然后在它们之间添加互连,但正是这种思路导致阿姆达尔在20世纪80年代的尝试失败。芯片越大,出现缺陷的可能性也越大。如果芯片与餐盘一样大,那么几乎可以保证,它上面总会有一个可使系统崩溃的缺陷。
更合理的方法是,从已经通过质量测试的普通尺寸的GPU芯片着手,寻找一种能够更好地连接它们的技术。该团队相信他们的硅互连结构(Si-IF)技术可实现这种方式。Si-IF技术用硅代替了电路板,不存在芯片与电路板之间的机械特性不符问题,也就不需要芯片封装。Si-IF晶圆上有一层或多层宽2微米、间距仅有4微米的铜线互连,这相当于芯片上最高级别的互连。在要插入GPU的地方,硅片上有间距约为5微米的短铜柱。将要插入的GPU对齐插入,然后加热即可。这种工艺已经很成熟,称为热压接合,能将铜柱熔接到GPU的铜互连线。伊利诺伊大学厄巴纳-香槟分校和加州大学洛杉矶分校的研究人员表示,由于互连线较窄且间距紧密,一块芯片上的输入和输出引脚数量最少可以提高到原来的25倍。
在设计晶圆级GPU时,库玛和他的同事不得不考虑许多限制因素,包括可以从晶圆上移除多少热量、GPU间怎样能够最快速地相互通信,以及如何为整个晶圆供电。
供电是其中一个较大的限制因素。使用标准的1伏芯片电源,Si-IF晶圆的布线将消耗整整2千瓦功率。因此,库玛的团队将供电电压提高到了48伏,降低了所需电流,从而减少了电能损失。这种方法需要在晶圆周围安置电压调节器和信号调理电容器,因此会占用原本可以用于更多GPU模块的空间。
尽管如此,他们还是在一个设计中塞进了41个GPU。通过对这种设计进行模拟测试,他们发现它比40台标准GPU服务器消耗的能量更少,数据计算和移动速度更快。
Si-IF晶圆级GPU“克服了早期晶圆级设计无法解决的问题”,位于加州圣何塞的Horst技术咨询公司的罗伯特•W.霍斯特(Robert W. Horst)说。20多年前,在天腾电脑公司(Tandem Computer)工作的霍斯特参与开发了唯一商业化的晶圆级产品——在证券交易所取代高速硬盘的存储系统。他预计,散热将是晶圆级芯片开发中最具挑战性的问题之一。“在这么狭小的空间内加入这么密集的逻辑,功耗可能会相当高。”他说。
库玛表示,该团队已经开始着手构建一个晶圆级原型处理器系统,但并未披露更多细节。
上一篇:泛林集团自维护设备创生产率新纪录
下一篇:欲赋能基础设施ASIC市场 Marvell 将收购 Avera Semi
推荐阅读最新更新时间:2024-10-24 15:26
- 英特尔中国正式发布2023-2024企业社会责任报告
- 贸泽电子与Analog Devices联手推出新电子书
- AMD 推出第二代 Versal Premium 系列:FPGA 行业首发支持 CXL 3.1 和 PCIe Gen 6
- SEMI:2024Q3 全球硅晶圆出货面积同比增长 6.8%、环比增长 5.9%
- 台积电5nm和3nm供应达到"100%利用率" 显示其对市场的主导地位
- LG Display 成功开发出全球首款可扩展 50% 的可拉伸显示屏
- 英飞凌2024财年第四季度营收和利润均有增长; 2025财年市场疲软,预期有所降低
- 光刻胶巨头 JSR 韩国 EUV 用 MOR 光刻胶生产基地开建,预计 2026 年投产
- Imagination DXS GPU 已获得ASIL-B官方认证
- MAXREFDES161#:频率合成器
- MC34074ADR2G 单位增益缓冲器的典型应用 (AV = +1)
- AMSR-7812-NZ 7.5W DC-DC 开关稳压器的典型应用
- LTC3871ELXE 高效双向充电器和电源的典型应用电路
- LTC3897IFE 高效两相 48V 升压转换器的典型应用电路,具有浪涌电流控制、输入电压浪涌保护和过流保护
- DS1302时钟模块
- LT3973HMSE-5 2.5V 降压转换器的典型应用
- 双路DAC模块(倒T型网络)适用于FPGA
- DC2073B-A,基于 LTC6905 SOT23 硅振荡器的演示板
- TWR-S12G240: MC9S12G240超可靠的16位塔式系统模块
- 跟 TI工程师 立下你的金猪Flag!立Flag & 分享赢双重好礼!
- TI 汽车照明解决方案知多少?一起闯关抽好礼
- 是德科技有奖问答活动之三,极限温度测试示波器探头方案,答题闯关赢好礼!
- 【芯币兑换】活动一:用社区芯币兑换51开发板PCB板!
- 下载有礼:看“智””造“热”侦探 FLIR ETS320 红外热像仪如何纠错!
- 报名观看TI嵌入式主题月直播,场场精彩,好运连连
- 提出你的电源问题&技术解答,提升自我电源知识,赢取好礼
- 【答题有礼】了解PI推出的全新LinkSwitch-XT2离线反激式开关电源IC产品系列
- 预约有礼:预约理想配电网络的电源完整性设计等直播,涨知识赢好礼
- 等值现金悬赏,等你揭榜!