2020 Hotchips:虽在线上,但不乏创新

2020-08-18来源: EEWORLD关键字:Hotchips  ML

“Hotchips”每年8月举行,去年在斯坦福大学纪念礼堂开幕时,大约有1200人参加了这次活动,参加人数创了历史记录,这使得斯坦福大学会场的容量更加庞大。此次2020年的Hotchips将会在形式上有很大的不同,但在内容上不会有任何的精简。期间许多牛叉的芯片公司将带来最新的处理器创新。

 

大规模数据中心机器学习

 

8月16日的专题报告涵盖了大规模数据中心机器学习部署,百度、Cerebras、谷歌和Nvidia都会参加。在下午的会议上,来自Facebook、谷歌、IBM、英特尔、微软和UCSB的研究人员进行了演讲,探讨了量子计算机。两者都应该对广泛的群体感兴趣。

 

两个主题演讲

 

今年的两个keynote包括英特尔高级副总裁、首席架构师和架构、图形和软件总经理Raja M. Koduri,演讲题目《No Transistor Left behind》。

 

在强调机器学习处理的会议上,来自DeepMind的杰出工程师Dan Belov,进行了精彩的演讲。

 

服务器处理器

 

周一的会议从服务器处理器开始,其中,最有意思的可能是IBM POWER 10。该芯片是对POWER架构的一次重大重新设计,因为它为更先进的三星芯片厂7nm EUV工艺保留了12nm内嵌DRAM。IBM还将对z15大型机系列进行更新。在会议的最后,英特尔公布了更多关于10nm+ Icelake-SP Xeon扩展处理器的细节,而Marvell提供了更多关于其即将推出的基于arm的ThunderX3服务器处理器的细节。所有主流服务器处理器都装载了10个高性能CPU核,具有大量的内存带宽和I/Os。

 

Ice Lake-SP技术细节大揭秘

 

其中Intel带来的Ice Lake-SP,也是他们的首款10nm制程服务器处理器的架构详情。

 

 

Ice Lake-SP将作为第三代Xeon可扩展处理器登场,是Whitley平台的组成部分,只有单路或双路,四路和八路是前不久发布的Cooper Lake独占。它在内核上换用了Sunny Cove微架构,相比起原本各种基于Skylake的衍生微架构,Sunny Cove在IPC上面有很大的提升。

 

 

Ice Lake-SP处理器使用10nm+制程,就是宣传名为10nm SuperFin的制程,单个处理器最多应该能够集成28个核心,其基础架构仍然沿用Skylake-SP开始的Mesh架构。

 

随着新内核到来的是一系列新的指令集,这里面有一些我们在消费级的Ice Lake上面就已经见到了。

 

 

通过专用指令集,Ice Lake-SP在诸多加解密计算上的性能相比起Cascade Lake要高出很多,最夸张的有8倍。不过如果想要享受到性能增幅,软件需要针对新的指令集进行重新编译。

 

 

看完内核,再来说说SoC上面的周边模块。Ice Lake-SP引入了新的“基础设施”,一条新的通用目的总线,将管理端和RAS服务与内部相连,另一条电源管理总线,同样连接到内部的核心、IO单元等元器件上。两条新总线的加入使得Ice Lake-SP的所有IP Core与外界有一个不间断的通讯,能够更好的被控制、管理。此外所有的子系统均有自己专用的一套电源管理单元。

 

Intel还在Ice Lake-SP上引入了新的速度选择技术(Speed Select Technology),允许用户重新对处理器的频率进行重新配置,可以进行配置的规格有性能Profile、基础频率、核心功率和睿频频率。这项技术将会在部分Ice Lake-SP处理器上可用,同时它可以在处理器运行时进行动态修改。

 

微软Xbox Series X系统架构闪亮登场

 

此外,微软公布了Xbox Series X系统架构,公开SoC细节。微软这次给到了非常详尽的资料,详细描述了Xbox Series X上面所用SoC的架构。

 

 

官方介绍了一番这台主机新支持的诸多特性,诸如DXR、VRS、Mesh着色等等,这些我们大多都烂熟于心,而右边的某些特性则是首次公开,尤其是在音频方面,Xbox Series X支持了许多新特性。

 

 

对于我们这帮架构爱好者来说,最兴奋的莫过于这张Die Shot。这是Xbox Series X上所使用的SoC的Die Shot,它使用台积电的N7e工艺(与N7P之间有什么关系有待考察),集成有153亿个晶体管,核心面积高达360.4mm2,SoC与AMD合作开发。

 

 

简化一下就是上面这张图,可以看到其整体结构仍然类似于AMD近几年的APU,不过相比起Renoir,它还是有很大的不同。CPU部分跟Renoir比较相近,同样是两组Zen 2 CCX,每组CCX带有4MB的三级缓存。CPU在关闭超线程的情况下可以跑到3.8 GHz,开启超线程会降低0.2 GHz的最高频率。

 

CPU和SoC的其他部分通过一条可扩展的数据总线进行互联,推测是基于IF总线。总线上面连接了显示控制单元、媒体编解码单元、安全模块、存储加密解密解压缩单元、GPU、IO Hub和内存控制器。

 

 

GPU部分设计了28组Dual CU单元,其中有两组被屏蔽,实际会有26组工作的Dual CU,也就是52组CU。由于GPU部分基于RDNA 2架构,我们也由此可以一窥RDNA 2架构的细节。

 

 

从Dual CU单元的组成来看,RDNA 2的基础单元架构与RDNA没有太大的区别,比较亮眼的是每个Dual CU中集成了两个硬件加速光线追踪的处理单元,也就是每CU有一个,这也是RDNA 2支持硬件光追的秘诀所在。

 

移动处理器

 

在这次的移动处理器会议中,x86处理器的竞争对手AMD的7nm Ryzen 4000 APU将与英特尔的Tiger Lake移动客户端CPU展开竞争。这已经成为一场真正的角逐,因为AMD的移动处理器有了很大的改进。

 

中国阿里巴巴公司就RISC-V在云计算和边缘计算中的应用进行了演示。这是关于RISC-V设计的两个报告之一,揭示了生态系统的告诉发展。Arm对它的高性能Cortex-M55微控制器核心和Ethos ML加速器进行了详细介绍,证明了与它的高度相容性。

 

FPGA

 

周二的会议以最新的FPGA和可重构逻辑开始,老牌英特尔(Agilex)和Xilinx (Versal Premier)以及新面孔Tenstorrent将悉数登场。后者正在研究机器学习应用程序,使用芯片和软件为ML数据流配置小型处理元素。

 

SOC,可替代的DPU

 

在网络和分布式系统上有一个更加开放的会议,包括一个用于数据中心的Intel/Barefoot高性能以太网交换机。这是阿里巴巴关于裸金属云存储扩展SoC的第三次发布会。随后DPU(分散处理单元)将会登场。

 

谷歌会带来惊喜吗?

 

在大数据中心机器学习会议上,没有Nvidia(它在GPU会议上展示了A100)的身影。谷歌又回到了TPUv2和TPUv3的话题上,看起来这是在倒退,因为他们已经为TPUv4预置了一些MLPerf数据。也许谷歌会带来一些惊喜。此外,苏黎世联邦理工学院的第二个RISC-V展示了采用4096核的芯片设计,用于高效浮点处理。

 

去年Hotchips最大胆的设计是Cerebras Wafer Scale Engine。黑马MegaChips是一个集成逻辑和内存的芯片,面积为46225平方毫米,拥有40万个核心和18GB内存。该公司今年将会带来下一代设计蓝图——预计至少会从第一代产品的16nm工艺缩减到7nm工艺。

 

会议以ML推理为主题,共计四个演讲,其中三个来自中国公司:阿里巴巴、百度和商汤科技。最激进的ML推理设计是Lightmatter,它使用硅光子学进行ML加速。

 

虽然普通消费者不会关注Hot Chips,但是对芯片架构等相关技术感兴趣的朋友,可以从这次会议中了解很多新芯片的技术架构。虽然Hot Chips是一个学术性会议,但也不是你想的那样拘谨,

 

这是一个可以和朋友聊聊天、了解最新行业八卦的好机会。但是现在会议是虚拟的。但另一方面,由于有了三天的打包内容,包括实时视频和录制回放,现在比以往任何时候都更容易访问。没有活动场地和食物的费用,世界各地的工程师、教授和学生也更能负担得起这个会议。幸运的是,这次会议的赞助商一直在支持这次活动,这也使会议的费用保持在可承受的水平。

 



关键字:Hotchips  ML 编辑:muyan 引用地址:http://news.eeworld.com.cn/qrs/ic506717.html 本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:助力汽车智能化发展,纳芯微传感器信号调理芯片问市
下一篇:新一代硅光子芯片Lightmatter Mars问市

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

2020年的Hotchips能给我们带来哪些启示
HotChips全称为A Symposium on High Performance Chips,每年8月份举行。不同于其他会议以学术研究前沿为主,HotChips是一场产业界的盛会,以各大处理器设计公司的最新产品或在研产品为主。IBM、Intel、AMD、ARM等都是HotChip会议的常客。HotChips能够让从业者了解产业发展趋势。 由于疫情的影响,HotChips2020改为在线进行。原本昂贵的参会成本降低到了100美元。组织者还贴心地提供了回放功能,不需要熬夜就可以观看。除了不能与业界大佬们面对面交流之外,参会效果还是很不错的。目前,HotChip的回放通道仍然开启。 HotChips2020一共
发表于 2020-09-03
2020年的<font color='red'>Hotchips</font>能给我们带来哪些启示
英特尔移动处理器Tiger Lake闪耀Hotchips
在今年的移动处理器战场,AMD最新的移动锐龙4000系列凭借更先进的7nm制程工艺、更多的物理/逻辑核心数量以及集成更强大的Vega核显,在性能层面全方位领先同期的英特尔第十代酷睿处理器。 英特尔面对挑战也不含糊,在原有产品上继续精进,推出了全新Tiger Lake移动cpu。并在今年的Hotchips终于公开了Tiger Lake的架构细节。 工艺上,Tiger Lake CPU用10nm+技术制造,相当于10纳米制程的进化版本,Tiger Lake的新一代10nm工艺首次引入了革命性的SuperFin晶体管结构,将增强型FinFET晶体、Super MIM(金属-绝缘体-金属)电容器相结合,能够提供增强
发表于 2020-08-20
英特尔移动处理器Tiger Lake闪耀<font color='red'>Hotchips</font>
含光800 NPU闪亮Hotchips 2020
去年,阿里巴巴达摩院院长张建锋发布了号称“全球性能最强的含光800芯片”,在业界标准的ResNet-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。那么这款芯片强在哪里呢?在2020的Hotchips上,阿里介绍了利用含光800 NPU在数据中心的AI推理解决方案。  发言人详细的介绍了NPU基本构架: 4核环形总线192mb本地内存,分布式共享,无DDRPCIe 4.0 x16每个核都有三个引擎: Tensor, Pooling, Memory  这是张量引擎的吞吐量,数据
发表于 2020-08-19
含光800 NPU闪亮<font color='red'>Hotchips</font> 2020
Arm全新NPU可完成两倍终端ML性能,加速AI Everywhere脚步
为加速实现AI Everywhere愿景,强化AI、机器学习(ML)运算性能,Arm今天宣布推出新款微型类神经网络处理器(NPU)Arm Ethos-U65。该NPU不仅提升AI、ML的运算处理,同时还保有前代产品Arm Ethos-U55的功耗效率,并将其可应用性从Arm Cortex-M延伸到Arm Cortex-A与Arm Neoverse架构的系统,更完成两倍的终端ML性能。  Arm表示,随着边缘与终端设备快速采用AI与ML,不但带动功能性的提升,同时也增加设备与系统的需求。因此也意味着供应商必须推出配备更高性能与终端ML能力的系统,同时维持或改善功耗效率。 也因此,Arm推出全新Ethos
发表于 2020-10-21
Arm全新NPU可完成两倍终端<font color='red'>ML</font>性能,加速AI Everywhere脚步
恩智浦发起人工智能伦理倡议,让边缘ML、AI更安全的发展
恩智浦半导体(NXP Semiconductors N.V.,纳斯达克代码:NXPI)今日公开发起人工智能伦理倡议,强调了公司对人们工作和生活所使用的人工智能组件与系统(又称计算机网络的“边缘”)的伦理发展的承诺。有了安全的高能效边缘计算和人工智能,日常设备不仅可以感知环境,还能解读、分析所收集的数据并实时采取行动。 在名为《算法道德》的白皮书中,恩智浦详细介绍了人工智能原则的全面框架:不作恶、人类自主、可解释性、持续关注与警惕、以及通过设计确保隐私性与数据安全性。这些原则根植于恩智浦的企业价值观与道德准则中,并且在恩智浦构建全球复杂安全设备的悠久传统中得到了践行。人工智能框架是跨公司协作的产物,汇聚了全球工程团队及面向客
发表于 2020-10-12
恩智浦发起人工智能伦理倡议,让边缘<font color='red'>ML</font>、AI更安全的发展
格芯联手Mentor推出内嵌先进ML功能增强型可制造性设计套件
作为先进的特殊工艺半导体代工厂,格芯®(GLOBALFOUNDRIES®,GF®)近日于年度全球技术大会(GTC)上宣布推出内嵌先进机器学习(ML)功能的增强型可制造性(DFM)设计套件。这一行业领先的全新ML增强型DFM解决方案由格芯与西门子公司Mentor合作开发,以Mentor的Calibre® nmDRC平台为基础,可为客户提供更有效的设计和开发体验,进而帮助加快产品上市。 新的ML增强型DFM套件将作为格芯12LP+差异化半导体解决方案的工艺设计套件(PDK)更新推出。12LP+采用久经考验的平台,依托稳健的生产生态系统,并针对人工智能(AI)训练和推理应用进行了优化,即将在纽约州马耳他的格芯Fab
发表于 2020-09-30
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2020 EEWORLD.com.cn, Inc. All rights reserved