NVIDIA在GTC 2017上发布了基于Volta架构的旗舰计算卡Tesla V100,这可是NVIDIA制造出有史以来最多晶体管的GPU,足足有5120个CUDA单元,比上一代增长了42%,尽管使用了台积电最先进的12nm FFN工艺,但是GPU核心面积已经暴涨至815mm2水平。下面就随嵌入式小编一起来了解一下相关内容吧。
尽管Tesla V100性能足够强大,不过NVIDIA似乎仍不满足,在一篇研究论文中透露,NVIDIA正在积极探索MCM-GPU的东西,说白了其实就是如何最优化整合多个GPU模块在一起,每个GPU都发挥出百分百的实力。
在GTC 2017上NVIDIA CEO黄仁勋曾说过“目前制造高性能GPU有一个很严重的限制——芯片尺寸的限制,因为目前现有技术的光刻机受限于光刻模板、光刻光源,几乎不可能制造出更大的GPU核心”。单GPU核心价值几乎被榨干殆尽,堆流处理器提升性能即将进入历史的坟墓,因此核心尺寸不能无止境变大已经成为NVIDIA继续提升GPU性能的瓶颈。
NVIDIA的MCM-GPU芯片比多核GPU更厉害?
因此NVIDIA想到了“胶水**”,就是讲多个GPU核心通过某种方式连接起来,组成一个GPU整体实行运算。这个方法可能就像是之前的GTX 590,两个Fermi架构的GF110-351核心整合到同一块PCB上,不过这样的坏处显而易见,类似于SLI、CF一样,由于两个核心之间连接的数据链路带宽、速度、任务调度存在大量问题,没有产生1+1=2的实际效果,双芯卡的命运也就渐渐没落了。
NVIDIA现在要做的就是探索出一种高效连接多个GPU的方案,MCM-GPU就是这样一个具有前瞻性的实验项目。Multi-Chip-Module Package这种形式的封装其实有点类似于闪存的做法,16层容量不够,那就堆高,堆到64层。这样的好处不仅是制造方式简单,成本有优势,还可以成倍地提高性能。目前,NVIDIA内部的模拟测试中,研究团队已经在研究“堆砌”SMs单元,目前进度已经研发至256组SMs单元(大家算一算有多少个CUDA单元),而Pascal最强的Tesla P100只有56组,Volta最强的Tesla V100也仅仅为80组。说的白了,其实就像我们的高楼大厦,土地面积不够,我们就往高处建,MCM-GPU同样也是叠高,节省核心面积。如果研发过程顺利,以后GPU显卡性能暴增不是梦!
NVIDIA的MCM-GPU芯片比多核GPU更厉害?
NVIDIA表示MCM-GPU与今天的最大GPU核心相比,可以缩小40-60%的核心面积,将来还可能会用上10nm或者转折性的7nm工艺制造。
此外还有一个很严峻的问题,不同层之间的SM单元到底如何连接,如何使用显存依然是个头疼的问题。因此NVIDIA在将来还有很长的路要走,但是这个MCM-GPU设计有望在明年的CTG大会上与我们见面,适用于下一代显卡架构上。
NVIDIA的MCM-GPU芯片比多核GPU更厉害?
MCM-GPU性能要比普通的多核心GPU性能更好。
以上是关于嵌入式中-NVIDIA的MCM-GPU芯片比多核GPU更厉害?的相关介绍,如果想要了解更多相关信息,请多多关注eeworld,eeworld电子工程将给大家提供更全、更详细、更新的资讯信息。
关键字:NVIDIA 芯片 GPU
引用地址:
NVIDIA的MCM-GPU芯片比多核GPU更厉害?
推荐阅读最新更新时间:2024-05-03 01:18
茂德重庆芯片项目获国务院批准
1月20日,江北金源大饭店,市委书记汪洋高兴地接过台湾茂德有限公司陈民良赠送的高科技产品-一张8英寸集成芯片。当日,投资70多亿元的重庆2007年一号工程-台湾茂德科技重庆西永8英寸集成项目正式签约。 据重庆日报消息 昨天上午,重庆市西永微电子产业园茂德重庆芯片项目经国家发改委初审并上报,正式获得国务院办公会批准。至此,今年重庆市工业“一号工程”——茂德重庆芯片项目尘埃落定。消息传出后,本报记者第一时间就此事采访了我市主管工业的常务副市长黄奇帆。 黄奇帆介绍,茂德重庆芯片项目是指台湾著名的集成电路制造商——茂德集团在我市西永微电子产业园投资建设的一条8英寸芯片生产线,该项目总投资9.6亿美元,采用集设计、制造、应用于一体IDM
[焦点新闻]
业界首款车规级全栈语音AI芯片流片成功 预计四季度量产
日前,安徽芯智科技正式宣布业界首款 车规级 全栈语音 AI 芯片流片成功,未来在完成 车规级 认证之后,预计将在四季度正式量产。 芯智科技是由云知声和吉利集团旗下亿咖通科技共同合资成立的,致力于打造云、端、芯一体化的全栈式车载语音解决方案。未来量产的芯片也将优先供应亿咖通的GKUI系统,并搭载在吉利的车型上。不过芯智科技也不仅仅只靠股东方的支持,未来量产的芯片将优先在吉利品牌的车型上进行验证,后续也会陆陆续续地应用到其他汽车品牌上。 据悉该款芯片采用开源的RSIC--V架构,可以在复杂的环境下进行语音识别,通过采用面向深度学习和语音信号处理的 AI 定制指令以及体系架构,极大提高了本地语音识别及语义处理速度,延时更低,而端
[汽车电子]
未来最令人激动的科技产品在汽车上?高通CEO为啥这么说
还记得第一代iPhone带来的激动吗?我们可能再次找回那样的感觉,不过场景将换成在驾驶汽车时。 这是 高通 首席执行官史蒂夫·莫伦科夫(Steve Mollenkopf)的设想,他认为,未来10年最令人激动的科技进步将出现在汽车中。 上周四在法兰克福汽车展上接受采访时,莫伦科夫表示,“汽车将经历一大波创新潮”,许多创新将出现在高通的专业领域,“我们的技术会被越来越多地应用在汽车中”。 莫伦科夫的上述评论彰显了高通——全球第一大智能手机 芯片 厂商——重心的变化。高通的技术把设备——包括苹果部分最新型号的iPhone——连接到手机网络,而且是手机的大脑,例如三星Galaxy S8。但手机市场增速已经在放缓,高通一直在考虑
[嵌入式]
详解USB接口芯片原理及应用
随着计算机技术的快速发展,USB移动存储设备的使用已经非常普遍,因此在一些需要转存数据的设备、仪器上使用USB移动存储设备接口的芯片便相继产生了,CH375就是其中之一,它是一个USB总线的通用接口芯片,支持HOST主机方式和SLAVE设备方式。 在本地端,CH375具有8位数据总线和读、写、片选控制线以及中断输出,可以方便地挂接到 单片机 /DSP/MCU等控制器的系统总线上。在USB主机方式下,CH375还提供了串行通信方式,通过串行输入、串行输出和中断输出与单片机/DSP/MCU等相连接。CH375的USB主机方式支持各种常用的USB全速设备,外部单片机/DSP/MCU可以通过CH375按照相应的USB协议与US
[嵌入式]
基于复位芯片MAX6383的可调滞后的微处理器
摘要:简单的电路可调整,否则固定滞后(上升和下降之间的阈值电压VCC上的差异)是管理着一个3针微处理器复位IC的工作。 基于微处理器的系统往往包括许多可用的3针微处理器复位芯片之一。这些设备监控单电源轨,并提供了响应系统复位信号,欠压条件。通常表现出这种芯片的固定滞后(上升和下降之间的阈值电压VCC上的差异),但一个简单的电路(图1)可让您调整的电压差。 图1。在这个电路中,相对湿度和RP值让你决定调整滞后复位时序。 如上所述1.0V的VIN的上升,低电平有效复位输出低电平表明,输入电压低于阈值的监测。电流从VIN通过反相内部MOSFET驱动器,并通过RH至地面,制定一项全面湿度偏移电压。由于内部参考电压
[单片机]
“蜂鸟”振翅,中国的北斗导航芯片飞了
它是一枚绿豆大小的芯片,因为体积小、能耗低被命名为“蜂鸟”。在业内,它被誉为我国十年以来卫星导航接收芯片从无到有、打破国外集成电路高端技术垄断的优秀典范。近日,北京市科委重点支持的和芯星通科技(北京)有限公司北斗导航核心芯片(和芯蜂鸟Humbird)项目获得了2014年度北京科技奖。如今,这枚京产“蜂鸟”已经展翅高飞,在我国的北斗导航领域发挥着重要的作用。
获奖项目
蜂鸟是世界上已知最小的鸟类,飞行时,蜂鸟翅膀的振动频率非常快,每秒钟在50次以上。北京和芯星通采用完全自主知识产权GNSS技术研发的55nm(纳米)北斗芯片正因为其体积小、能耗低而被命名为和芯蜂鸟芯片。目前,和芯蜂鸟芯片已广泛应用于我国北斗导航应用市场。为
[嵌入式]
Imagination全新BXS GPU助力德州仪器汽车处理器系列产品实现先进图形处理功能
英国伦敦,2020年11月4日– Imagination Technologies 宣布其 BXS-4-64 GPU 将用于 德州仪器 (TI)Jacinto™处理器系列产品中,以支持汽车应用。得益于针对汽车市场需求所进行的定制化设计,BXS可以助力环绕视图技术等汽车图形处理应用实现高达60%的性能提升。 IMG BXS是首款增加了安全功能且设计流程符合ISO 26262标准的XS GPU知识产权(IP) 产品,可以帮助客户获得ISO 26262认证。它采用了Imagination全新的B系列多核架构,具有更高的性能和安全功能。除了硬件虚拟化等现有功能外,该架构还包含了全新的功能和安全机制,例如分块区域保护(Tile Regi
[汽车电子]
三星否认“3纳米芯片量产延后”:仍按进度于第二季度开始量产
据新浪科技消息,三星否认了有关延后3纳米芯片量产的报道。三星的一位发言人通过电话表示,目前仍按进度于第二季度开始量产3纳米芯片。 此前有媒体报道称,由于良率远低于目标,三星3纳米芯片量产将再延后。 媒体报道表示,三星为赶超台积电,加码押注 3nm GAA 技术,并计划在 2025 年量产以 GAA 工艺为基础的 2nm 芯片。 消息称,三星在 6 月初将 3nm GAA 工艺的晶圆用于试生产,成为全球第一家使用 GAA 技术的公司。三星希望通过技术上的飞跃,快速缩小与台积电的差距。3nm 工艺将半导体的性能和电池效率分别提高了 15% 和 30%,同时与 5nm 工艺相比,芯片面积减少了 35%。
[半导体设计/制造]