同一块硅片居然能放40个GPU?一起了解下硅互连结构

发布者:紫菜包饭最新更新时间:2019-05-17 来源: 悦智网关键字:硅互连结构 手机看文章 扫描二维码
随时随地手机看文章

早在20世纪80年代,并行信息处理技术先驱吉恩阿姆达尔(Gene Amdahl)就提出了一个提升大型机计算速度的计划:制造一种硅晶片大小的处理器。通过将大部分数据移动保留在处理器内部进行,计算速度可以更快,并且更节能。阿姆达尔拿到了当时数额最大的一笔风险投资,投资额是2.3亿美元。之后,他创办了Trilogy System公司,期望将他的愿景变为现实。可惜首次“晶圆级集成”的商业尝试很失败,导致“跳火坑”成为了一个金融新闻词汇。伊利诺伊大学厄巴纳-香槟分校和加州大学洛杉矶分校的工程师们认为,现在是时候再尝试一次了。

 

在2月举行的IEEE高性能计算机体系结构国际研讨会上,伊利诺伊的电子与计算机工程副教授拉科什库玛(Rakesh Kumar)及其合作者阐述了有关包含多达40个GPU的晶圆级计算机的思路。这个多处理器“怪物”将计算速度提高了约19倍,而且能耗和信号延迟降低到了原来的1/140以下。

 

库玛表示:“计算单元之间的通信开销是我们想要解决的一个大问题。”超级计算机中的应用程序一般分布在数百个GPU中,这些GPU位于不同的印刷电路板上,并通过长数据链路进行通信。与芯片内部的互连相比,这些链路耗能更多而且速度较慢。此外,由于芯片和印刷电路板的机械特性不同,必须对处理器进行封装,而且要严格限制芯片可使用的输入和输出数量,因此,将数据从一个GPU转移到另一个GPU的“开销惊人”,库玛说。

 

image.png

因此,需要让GPU模块之间互相连接,这些连接要与芯片内的互连一样快,一样丰富,能耗一样低。这种快速连接能够将这40个GPU集成到一起,成为一个巨型GPU。从程序员的角度来看,“整体就像一个GPU。”库玛说。

 

一种解决方案是使用标准的芯片制造技术,在同一块硅片上构建这40个GPU,然后在它们之间添加互连,但正是这种思路导致阿姆达尔在20世纪80年代的尝试失败。芯片越大,出现缺陷的可能性也越大。如果芯片与餐盘一样大,那么几乎可以保证,它上面总会有一个可使系统崩溃的缺陷。

 

更合理的方法是,从已经通过质量测试的普通尺寸的GPU芯片着手,寻找一种能够更好地连接它们的技术。该团队相信他们的硅互连结构(Si-IF)技术可实现这种方式。Si-IF技术用硅代替了电路板,不存在芯片与电路板之间的机械特性不符问题,也就不需要芯片封装。Si-IF晶圆上有一层或多层宽2微米、间距仅有4微米的铜线互连,这相当于芯片上最高级别的互连。在要插入GPU的地方,硅片上有间距约为5微米的短铜柱。将要插入的GPU对齐插入,然后加热即可。这种工艺已经很成熟,称为热压接合,能将铜柱熔接到GPU的铜互连线。伊利诺伊大学厄巴纳-香槟分校和加州大学洛杉矶分校的研究人员表示,由于互连线较窄且间距紧密,一块芯片上的输入和输出引脚数量最少可以提高到原来的25倍。

 

在设计晶圆级GPU时,库玛和他的同事不得不考虑许多限制因素,包括可以从晶圆上移除多少热量、GPU间怎样能够最快速地相互通信,以及如何为整个晶圆供电。

 

供电是其中一个较大的限制因素。使用标准的1伏芯片电源,Si-IF晶圆的布线将消耗整整2千瓦功率。因此,库玛的团队将供电电压提高到了48伏,降低了所需电流,从而减少了电能损失。这种方法需要在晶圆周围安置电压调节器和信号调理电容器,因此会占用原本可以用于更多GPU模块的空间。

 

尽管如此,他们还是在一个设计中塞进了41个GPU。通过对这种设计进行模拟测试,他们发现它比40台标准GPU服务器消耗的能量更少,数据计算和移动速度更快。

 

Si-IF晶圆级GPU“克服了早期晶圆级设计无法解决的问题”,位于加州圣何塞的Horst技术咨询公司的罗伯特W.霍斯特(Robert W. Horst)说。20多年前,在天腾电脑公司(Tandem Computer)工作的霍斯特参与开发了唯一商业化的晶圆级产品——在证券交易所取代高速硬盘的存储系统。他预计,散热将是晶圆级芯片开发中最具挑战性的问题之一。“在这么狭小的空间内加入这么密集的逻辑,功耗可能会相当高。”他说。

 

库玛表示,该团队已经开始着手构建一个晶圆级原型处理器系统,但并未披露更多细节。

 


关键字:硅互连结构 引用地址:同一块硅片居然能放40个GPU?一起了解下硅互连结构

上一篇:泛林集团自维护设备创生产率新纪录
下一篇:欲赋能基础设施ASIC市场 Marvell 将收购 Avera Semi

推荐阅读最新更新时间:2024-10-24 15:26

同一块硅片居然能放40个GPU?一起了解下互连结构
早在20世纪80年代,并行信息处理技术先驱吉恩 • 阿姆达尔(Gene Amdahl)就提出了一个提升大型机计算速度的计划:制造一种硅晶片大小的处理器。通过将大部分数据移动保留在处理器内部进行,计算速度可以更快,并且更节能。阿姆达尔拿到了当时数额最大的一笔风险投资,投资额是2.3亿美元。之后,他创办了Trilogy System公司,期望将他的愿景变为现实。可惜首次“晶圆级集成”的商业尝试很失败,导致“跳火坑”成为了一个金融新闻词汇。伊利诺伊大学厄巴纳-香槟分校和加州大学洛杉矶分校的工程师们认为,现在是时候再尝试一次了。 在2月举行的IEEE高性能计算机体系结构国际研讨会上,伊利诺伊的电子与计算机工程副教授拉科什 • 库玛(R
[半导体设计/制造]
同一块硅片居然能放40个GPU?一起了解下<font color='red'>硅</font><font color='red'>互连</font><font color='red'>结构</font>
单片单向互连带宽最高 8×256Gb / s,国内首款 2Tb / s 三维集成光芯粒成功出样
5 月 10 日消息,国家信息光电子创新中心(NOEIC)公众号昨日发布博文,携手鹏城实验室组建光电融合联合团队,成功研制出国内首款 2Tb / s 硅光互连芯粒(chiplet),且在国内首次验证了 3D 硅基光电芯粒架构,实现了单片最高达 8×256Gb / s 的单向互连带宽。 2Tb / s 硅基 3D 集成光发射芯粒 图源:NOEIC 2Tb / s 硅基 3D 集成光接收芯粒 图源:NOEIC 该团队在 2021 年 1.6T 硅光互连芯片的基础上,进一步突破了光电协同设计仿真方法,研制出硅光配套的单路超 200G driver 和 TIA 芯片,并攻克了硅基光电三维堆叠封装工艺技术,形成了一整套基于硅光芯片的
[半导体设计/制造]
单片单向<font color='red'>互连</font>带宽最高 8×256Gb / s,国内首款 2Tb / s 三维集成<font color='red'>硅</font>光芯粒成功出样
国内首款1.6Tb/s互连芯片完成研制
近日,针对1.6T光接口的MSA(Multi-Source Agreement,多源协议)行业联盟宣布成立,宣告1.6Tb/s光模块将成为下一步全球竞相追逐的热点。然而,1.6Tb/s光芯片在速率、集成度、封装技术等方面都具有极高挑战,国际上还没有明确和完善的解决方案。 近日,国家信息光电子创新中心(NOEIC)、鹏城实验室、中国信息通信科技集团光纤通信技术和网络国家重点实验室、武汉光迅科技股份有限公司,在国内率先完成了1.6Tb/s硅基光收芯片的联合研制和功能验证,实现了我国硅光芯片技术向Tb/s级的首次跨越。 据介绍,研究人员分别在单颗硅基光发射芯片和硅基光接收芯片上集成了8个通道高速电光调制器和高速光电探测器,
[半导体设计/制造]
国内首款1.6Tb/s<font color='red'>硅</font>光<font color='red'>互连</font>芯片完成研制
Molex即将发布光子有源光学互连解决方案
模块化、低功耗、长距离互连解决方案支持 100、200、400 Gbps数据中心设计。 (新加坡–2014年3月27日) 随着业界对支持下一代28 Gbps产品和数据中心应用的长距离、低功耗互连解决方案的需求大幅增长, Molex 公司发布最近计划推出设计用于100、200和400 Gbps产品的一系列QuatroScale™ 有源光学互连解决方案。 Molex有源光学产品经理Brent Hatfield表示:“市场迹象表明现在美国的数据中心互连长度平均超过了130m,而其采用的25 Gbps MM VCSEL解决方案的目标长度却仅为100m。数据中心架构和OEM提供商发现基于硅光子的光学产品在延长距离方
[网络通信]
一种基于LTCC技术毫米波垂直互连过渡结构设计
用LTCC技术实现微波器件具有结构紧凑,损耗小,体积容量大等特点。该技术将多层陶瓷介质薄片和印刷技术结合,还具有低的烧结温度。LTCC多层技术可将传输线和微波 电路在不同层排布,从而实现了各种微波、毫米波传输线和直流信号线等的混合多层设计,大大提高了微波毫米波组件的空间密度。LTCC技术成为微波多芯片组件(microwave multichip module,MMCM)设计中的关键技术。LTCC技术在毫米波波段的应用存在的问题一方面是因为在毫米波频段上电路结构对加工工艺的要求更高,受限于工艺水平;另一方面是由于微波信号在LTCC这种多层的不连续传输结构中带来了更多的寄生效应,甚至激励起了电磁场的寄生模式,对其传输特性的研究变得异常复
[嵌入式]
改进RGC结构的光互连CMOS前置放大器设计
该前置放大器采用了改良后的RGC结构作为输入端。Cadence Virtuoso 仿真软件的仿真结果表明:在光探测器结电容为0.62pF,1.8V单电压源供电情况下,电路跨阻增益为55.75dBΩ,-3dB带宽可达3.77GHz,直流功耗29.66mW。当输入电流信号峰峰值为30μA时,输出信号摆幅为18.50mV。可望工作于5Gbps的光互连通信系统中。
[模拟电子]
改进RGC<font color='red'>结构</font>的光<font color='red'>互连</font>CMOS前置放大器设计
研究发现拱形阳极结构 可提高锂离子电池性能
据外媒报道,冲绳科学技术大学院大学(OIST)研究发现了一种特定的构建基块,由纳米粒子技术构建,可改善锂离子电池负极。 锂离子电池功能强大、便携且可充电,在智能手机、笔记本电脑和 电动汽车 都有广泛应用。随着人们逐渐放弃使用化石燃料,2019年,锂离子电池在改变未来储能和用电方式上的极大潜能获得了广泛认可。OIST理事会新成员Akira Yoshino博士还获得了诺贝尔奖,以表彰他在开发锂离子电池方面的工作。石墨通常被用作锂离子电池的阳极,但这种碳材料具有很大的局限性。 (图片来源: 冲绳科学技术大学院大学 ) OIST前研究员、该研究第一作者Marta Haro博士解释说:“电池充电时,锂离子会从电池的阴极通过电解
[汽车电子]
研究发现拱形<font color='red'>硅</font>阳极<font color='red'>结构</font> 可提高锂离子电池性能
车身储能结构性电池研发中 比特斯拉最新纯阳极电池更先进
车身储能设计    北京时间11月9日消息,据国外媒体报道,埃隆·马斯克今年9月在特斯拉的“电池日”活动上宣布,该公司将很快推出一款使用纯硅阳极电池的汽车,以提高电池的性能,并减少阴极中的钴含量,以降低汽车价格。这种电池组将被整合到底盘上,以便在提供动力的同时提供机械支持。马斯克称称赞特斯拉的结构电池是工程领域的一场“革命”。然而但对于一些电池研究人员来说,马斯克的未来展望不过是他们曾经努力的范畴,而现在,他们已超越这一领域,正在开发一种结构性电池。这种结构性电池在未来有可能会淘汰现有电池组,用车身来储能。    伦敦帝国理工学院的材料学家兼皇家学院新兴技术工程系主任埃米尔·格林哈尔希(Emile Greenhalgh)在评价特
[汽车电子]
车身储能<font color='red'>结构</font>性电池研发中 比特斯拉最新纯<font color='red'>硅</font>阳极电池更先进
小广播
最新半导体设计/制造文章
换一换 更多 相关热搜器件
随便看看

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 市场动态 半导体生产 材料技术 封装测试 工艺设备 光伏产业 平板显示 EDA与IP 电子制造 视频教程

词云: 1 2 3 4 5 6 7 8 9 10

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved