3D芯片堆栈技术向数据中心抛媚眼-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

运算密度跟不上因特网流量增加速度，数据中心分析之数据量的成长速度前所未有；要解决这个问题，需要更大的内存带宽，而这是3D芯片堆栈技术展现其承诺的一个领域。

被甲骨文(Oracle)取消的一个微处理器开发项目，在传统制程微缩速度减缓的同时，让人窥见未来高阶芯片设计的一隅；该Sparc CPU设计提案的目标是采用仍在开发的芯片堆栈技术，取得越来越难透过半导体制程技术取得的优势。

在上述概念背后的研究人员，是甲骨文在今年初被裁撤的硬件部门之一员；但他的点子化为一家顾问公司而存活了下来，并且已经开始与美国硅谷的半导体业者进行合作。甲骨文前任资深首席工程师、创办了一家三人新创公司ProPrincipia的Don Draper表示：「我看得越深，越觉得这是一条可以走的路。」

Draper指出：「运算密度跟不上因特网流量增加速度，数据中心分析之数据量的成长速度前所未有；要解决这个问题，需要更大的内存带宽，而这是3D芯片堆栈技术展现其承诺的一个领域。」

在一场去年底举行的研讨会上，Draper展示了现有的Sparc处理器如何能重新设计成两颗尺寸较小、相互堆栈的裸晶；其中一颗只有处理器核心与高速缓存(caches)，另一个则是以N-1或N-2制程节点制造，以一半数据速率运作，乘载串行器-解串行器(serdes)等周边，以及L4高速缓存与芯片上网络──可降低成本与功耗。

Draper表示，新架构芯片的核心数量与L3高速缓存也能增加近一倍，特别是如果堆栈技术采用新兴的微流体冷却(microfluidic-cooling)技术：「在相同的技术节点，可以将性能提升两倍。」

一颗大型CPU能被重新设计成两颗成本较低的芯片，并取得在功耗、性能方面的优势

（来源：ProPrincipia）

高风险却适用机器学习的设计提案

Draper并指出，新兴的芯片堆栈技术是将一个主处理器与一个加速器绑在一起、以因应内存密集任务例如机器学习应用的理想方案；而相反的，若采用芯片对芯片互连例如CCIX与OpenCAPI：「就像在用吸管吸汽水。」此外Draper也建议在后缘的裸晶采用整合式稳压器(integrated voltage regulator，IVR)；他估计，采用相对较小的磁性电感(magnetic inductors)，该IVR能节省功率以及电路板站为面积，并将芯片的数据传输速率提升到150MHz。

尽管如此，Draper坦承，这个他在甲骨文提出的设计提案，也就是在最顶级的M系列处理器采用芯片堆栈技术，是非常高风险且巨大的承诺；举例来说：「如果在(芯片堆栈)实作过程中出了任何问题，最顶端的裸晶可能就会无法使用。」

该芯片堆栈采用内存堆栈使用的硅穿孔(TSV)技术，该结构是规律的，但对于高密度、不规则的逻辑芯片来说会很棘手；TSV在厚度上也相对较高，在周遭也需要有保留区域。 Draper声称，芯片堆栈的散热问题大部分可以被解决；具备高导热性的铜接口能轻易地将热从温度较高的顶部裸晶，透过散热片或是风扇从对温度较低的底部裸晶排出。

Sparc T2处理器重新设计为两颗中型尺寸芯片，能将功耗降低17.3%

（来源：Moongon Jung, Georgia Institute of Technology）

Xperi (编按：原为Tessera)旗下的Invensas，在室温晶圆/裸晶堆栈技术方面是领导者；其技术也是新创公司ProPrincipia创办人Don Draper认为微处理器设计工程师将会用到的。 Invensas的DRAM堆栈可望在2019年量产，接着是处理器、ASIC、GPU与FPGA等各种组件。

Invensas总裁Craig Mitchell表示：「我们现在的目标是与客户沟通，取得他们的晶圆片，因为每个人的制程与硅穿孔(TSV)技术都有点不太一样。」

另一个障碍是避免晶圆切割时产生的微小颗粒污染；他指出：「我们正在取得良好的进展，能展现4层的DRAM堆栈；另外我们正以3D DRAM为出发点，因为这是一个大规模的市场，而且如果你能在DRAM领域证实技术，将技术转移到任何地方就会容易许多。」

Invensas是为Sony等厂商采以6~14微米间距的晶圆对晶圆技术接合氧化物，来堆栈CMOS影像传感器而立足市场；在明年某个时候，Invensas预期能迈向下一步，提供能封装一组MEMS传感器的制程技术。

接下来Invensas则将提供新开发的裸晶等级直接结合互连(die-level Direct Bond Interconnect，DBI)，以链接传感器与逻辑芯片；该技术已经授权给具备一座大型MEMS晶圆代工厂的Teledyne Dalsa。最终Invensas的目标是让DBI互连能小于1微米，好将大型芯片转换成相互堆栈的小芯片数组。

Draper展示了类DBI芯片堆栈的横切面

（来源：ProPrincipia）

也有其他厂商准备进军此一领域，以较低成本的2.5D芯片堆栈技术，将裸晶并排在相对尺寸较大、较昂贵的硅中介层(interposer)上。

例如台积电(TSMC)在不久前宣布，正在开发一个新版本的晶圆级扇出式封装技术，名为整合式扇出封装(InFO)，目前应用于手机应用处理器。此外台积电也将扩展其2.5D CoWos制程，可在约1,500 mm2面积的基板上放最多8颗的HBM2 DRAM。

Mitchell表示，扩展的InFO技术之40微米I/O焊垫与65mm2基板，不会与Invensas采用DBI技术的更大、更高密度芯片堆栈直接竞争。但市场研究机构Yole Developpement封装技术分析师Emilie Jolivet表示，最近联发科(Mediatek)宣布，将在一款数据中心应用之芯片使用InFO，显示该技术正在伸展触角。

不过Mitchell表示，DBI与InFO式两种完全不同的技术，后者是一种封装技术、将精细节点的芯片链接到较大节点的印刷电路板链路，而DBI则是采用精细链接的芯片对芯片互连。

举例来说，苹果(Apple)的A10应用处理器采用InFO技术，将220微米间距的裸晶接口，转接至印刷电路板的350微米接口；相反的，DBI正被测试应用DRAM之间40微米的触点，可望在未来能堆栈到8层高。

至于英特尔(Intel)，则是开发了EMIB (Embedded Multi-Die Interconnect Bridge)技术，一开始使用于大型FPGA链接外部的串行/解串器；Jolivet认为EMIB技术将改变市场局势，并扩大封装技术领域的战场。

而Mitcell则指出，EMIB也不会与DBI直接竞争，并质疑该技术能扩展到多大程度；他表示，DBI目前最大的竞争对手是热压接合(thermal compression)技术，但被限制在25微米以上的互连：「25微米看来是一道难以突破的障碍。」

Yole Developpement表示，Apple在A10处理器采用的台积电InFO技术，可说是扇出式封装技术发展在去年的一个转折点；最近该机构有一篇报告指出，扇出封装的设备与材料可望取得40%的复合成长率。

编译：Judith Cheng

(参考原文：3D Chip Stacks Eye Data Centers，by Rick Merritt)

关键字：堆栈 3D芯片处理器引用地址：3D芯片堆栈技术向数据中心抛媚眼

上一篇：XMC4300和XMC4800微控制器和认证开发套件加快EtherCAT®应用实现
下一篇：如何充分利用各种类型的断点

推荐阅读最新更新时间：2024-03-16 15:34

Intel酷睿第八代移动处理器偷跑：六核时代正式到来

根据外媒VideoCardz提前拿到的消息，英特尔将在今天正式推出移动端Coffee Lake-H标压处理器，从而补齐了八代酷睿全部阵容。八代酷睿移动端处理器家族包括Coffee Lake-U低压系列，Kaby Lake-G系列和Coffee Lake-H标压系列。低压系列中，除了I7-8109U之外，全都采用了4核8线程设计，TDP最高28w，高压系列中除I5外都采用了6核12线程设计，相比上代，提升巨大。以下为标压处理器参数对比： Core i9-8950HK：6核12线程，主频2.9GHz，加速频率4.6~4.8GHz（TurboBoost 2.0），热设计功耗45W+，缓存12MB； Core i7-8850H：6

[嵌入式]

23亿个晶体管处理器挑战集成度及性能极限

尽管高登-E-摩尔（Gordon E. Moore）提出警告，认为“摩尔法则”无法继续有效，但微处理器的高集成度化仍在进一步发展，并为性能的提高作出重大贡献。虽然处理器内核的数量及缓存容量持续增加，但目前仍存在诸多应该解决的重要课题，其中包括芯片间的通信性能出现瓶颈、耗电量增加、以及由于软错误及缺陷造成的错误等导致的可靠性低下等。另外，芯片内的时钟及电源分配难度也很高，因此要求进一步革新电路技术。在“ISSCC 2009”的“Session3：Microprocessor Technology”中，共发表了8篇有关高性能处理器及相关电路技术的论文。有关处理器的论文数量受全球经济不景气的影响，较上年的20篇大幅减少，

[嵌入式]

32nm坚挺 22nm Atom处理器明年四季度见

Intel正在全力铺货22nm处理器，然而在Cedar Trail平台却没有一点动静，卖了一年多的32nm处理器依然坚挺，而据最新消息表明，采用22nm处理器新一代Atom平台Bay Trail预计要在2013年第四季度才能推出。目前Cedar trail平台卖得很好，可能这也是Intel不急于推出Bay Trail的原因。同时Intel还计划在2013年为手机和平板推出22nm工艺的Atom处理器，而其显然比上网本和台式机部分有更高的优先级，Bay Trail能否如预期时间推出也成了谜。

[工业控制]

ARM与神经网络处理器的通信方案设计

摘要：基于ARM芯片和FPGA的特点，设计了一种ARM与FPGA人工神经网络处理器之间的通信方案。该方案采用ARM的ZDMA控制器对数据传输进行控制，完成ARM与神经网络处理器的控制寄存器组、分布式存储器、样本存储器等存储体的数据交换。引言人工神经网络在很多领域得到了很好的应用，尤其是具有分布存储、并行处理、自学习、自组织以及非线性映射等特点的网络应用更加广泛。嵌入式便携设备也越来越多地得到应用，多数是基于ARM内核及现场可编程门阵列FPGA的嵌入式应用。某人工神经网络的FPGA处理器能够对数据进行运算处理，为了实现集数据通信、操作控制和数据处理于一体的便携式神经网络处理器，需要设计一种基于嵌入式ARM内核及现场可编程

[单片机]

ARM与神经网络<font color='red'>处理器</font>的通信方案设计

纬颖科技今日在OCP美国峰会上展示其基于新一代Intel Xeon 处理器（代码 Skylake）的48V 服务器平台

　　高质量计算及储存产品的云端基础架构及数据中心机架解决方案领先供应商纬颖科技服务股份有限公司 (Wiwynn® Corporation) 今日在 OCP 峰会上预先展示了其 48V 服务器平台 M1，该产品的展示将在 B3 展位进行。这款服务器平台设计，不仅将满足服务器使用 48V 不断增长的需求、降低总体拥有成本 (TCO)，而且还将满足新兴 CPU 日益提升的电源需求。纬颖科技将通过推出其使用 48V 电源技术的首款开放式计算项目 (OCP, Open Compute Project)平台，进一步巩固其在云计算领域的领先地位。该电源技术适用于各种类别的服务器及 CPU。下面就随网络通信小编一起来了解一下相关内容吧。

[网络通信]

芯片“Sing”现身东京大学，512核顶级片上系统开发成功！

双核？这个概念对于东京大学来说简直太古老了，该大学最近刚刚和台湾半导体制造公司以及台湾无晶圆厂ASIC公司世芯电子股份有限公司(Alchip Technologies)合作开发出了一款512核的芯片。这款名为Sing的芯片开发是大型的Grape DR计划的一部分，该计划的目的是创造每秒运算能达到2000万亿次的下一代超级计算机。这款芯片本身被设计成一个数学协处理器，每秒能够进行5120亿次浮点操作，频率达到了500MHz。它的分离式超级架构使功率被降到了60瓦。在整个行业的片上系统热潮中，这一系统无疑是个顶级的片上系统设计。Alchip的工程师们制作了6000万个逻辑门和1000万位的SRAM，由TSMC来在其90纳米八层

[焦点新闻]

高通智能表处理器性能和功耗是否能兼得？

Wear OS手表终于可以得到它们迫切需要的升级版芯片了(通过9to5Google)。高通公司在Twitter上发布的一段视频中预告了这种可能性，表示其下一个Snapdragon智能手表芯片 “即将推出”。去年夏天，在三星和谷歌宣布合作开发Wear OS 3之后，高通公司表示它将在明年推出一款新芯片。看起来高通公司正在履行这一承诺，尽管我们不知道它将何时推出。(也许谷歌会在其即将推出的Pixel Watch中使用它)。骁龙芯片为一些Wear OS手表提供动力。但其最近的一款，即Wear 4100系列，只包含在少数几款手表中，包括TicWatch Pro 3，乏善可陈的Fossil Gen 6，以及价格昂贵的Montbl

[嵌入式]

德州仪器处理器显著提升车载显示屏的图形性能与集成度

TMS470 MCU、OMAP 处理器与达芬奇技术紧密结合充分满足高性能 LCD 与 TFT 显示屏的需求 2006 年 10 月 20 日，北京讯日前，德州仪器 (TI) 宣布推出 32 位 TMS470 MCU 平台的扩展版本。新版本将为仪表板主机控制器应用提供了全新器件，以充分满足客户对车载仪表板系统日益增长的性能要求。从增强型车辆诊断、辅助倒车摄像头 (rear park assist camera) 等驾驶员辅助功能，到数字媒体与全实时导航系统，随着时下车辆信息掌控量的不断加大，对更高图形性能与集成度的显示屏的需求就愈加迫切。为了解决这一技术难题，全新 TMS470PLFx

[新品]