QbitAI量子位

文章数:10350 被阅读:146647018

账号入驻

半年内第二块国产全功能GPU,附带首个游戏显卡!摩尔线程造芯神速,张建中“黄”气逼人

最新更新时间:2022-11-07 17:29
    阅读数:
金磊 发自 凹非寺
量子位 | 公众号 QbitAI

他来了,他来了。

手持GPU,一身黑皮衣、下装牛仔裤、黄皮肤长头发,黑框眼镜之下挡不住硬汉气场。

但他不是英伟达的老黄。

他是曾经老黄左膀右臂之一的老张——

张建中,James,此前在英伟达中国区任职一把手长达15年时间。

现在更被人熟知的头衔,是国内GPU公司摩尔线程的创始人兼CEO。

而这次刚刚捂热的GPU,已经是他在今年量产上市的第2个——

时隔,仅半年之久。

不仅如此,附着在这块GPU上的标签还有更多:

国产全功能全球首个中高端……

而且基于它,张建中更是发布了国内首个中高端游戏显卡

讲真,很难想象这般“速度”是由一家刚刚成立2年的公司所创造的。

由此不免让人心生疑问:

在做到快的同时,质量和性能上是否也一并跟上了呢?

我们不妨一同来看看。

全球首个支持PCIe接口的全功能GPU

摩尔线程的第二个国产全功能GPU,名为“MT-春晓”

张建中也是将它作为打头阵的产品发布。

据了解,春晓集成了220亿个晶体管,内置4096MUSA架构通用计算核心以及128张量计算核心,可以支持FP32、FP16和INT8等计算精度。

其它重点参数如下:

  • GPU核心频率:1.8GHz

  • FP32计算能力:14.4 TFLOPS

  • INT8计算能力:57.6 TOPS

  • 显存宽带:448GB/s

  • 显存类型:GDDR6

张健中在现场还提及,春晓解锁了一项“全球第一”:

因为它是业内唯一支持PCIe Gen5接口的GPU。

(许多厂商已经达成共识,PCIe Gen5将会是未来消费级以及企业级存储设备的重点发展方向。)

那么与半年前摩尔线程所发布的“苏堤”GPU相比,二者又有何区别?

张建中表示在摩尔线程GPU四大引擎方面,春晓做到了全面升级:

  • 现代图形渲染引擎性能最高提升3-5倍

  • AI计算加速引擎性能最高提升4倍

  • 智能多媒体引擎性能最高提升4倍

  • 物理仿真引擎性能最高提升2.5倍

至于为什么摩尔线程要在半年时间就将自家GPU推陈出新,这个问题我们请教了下张健中:

我们第一个全功能GPU苏堤,实际上属于中低端处理器,在GPU行业中可以满足国内国产化应用的需求。

但对于大部分主流用户,他们还是期待更高性能的GPU,因此我们快速发布了春晓,去满足高端的游戏玩家,满足更多用户对图形和计算的需要。

如此一来,我们的产品就能够覆盖高中低端的所有用户。

而提到了游戏,张建中基于春晓GPU,便发布了另一款“国内第一”的产品。

国内首款游戏显卡

其实摩尔线程在半年前基于苏堤也发布过显卡产品MTT S60

但这张显卡的“用武之地”似乎更多面向的是产业,也就是B端。

而这次基于春晓打造的这张显卡MTT S80,则是能让更多大众摸得着的那种了——国内首款游戏显卡

在现场,张建中还用了一个比较有意思的词来形容它:“国潮”

从性能方面来看,其拥有的4096个可编程MUSA核心,在1.8GHz的主频下,能够提供14.4TFLOPS的单精度浮点算力。

与春晓相似的,MTT S80也是业内首款配备PCIe Gen5接口的显卡产品:

配合16GB GDDR6大容量高速显存,再辅以8K超高清与1080P 360Hz高刷新率显示输出能力,能为游戏玩家带来很好的体验。

似乎“光说不练”并不是摩尔线程发布会的风格,跟上次一样,张建中同样是在现场直接上效果。

例如它已经在Windows环境中适配了《暗黑破坏神3》,而这款游戏对于显卡性能要求还是较高的那种。

而有了MTT S80的加持,即便全程是在4K高清画质的情况下,FPS也能保持在60左右(FPS越高画面越流畅)

除此之外,张建中还展示了赛车游戏爱好者钟爱的《极品飞车》,在MTT S80下的效果,可以说是相当的丝滑了:

据了解,目前MTT S80已经在Windows驱动内置了MUSA DirectX Driver模块,并完成了对数十款主流游戏的适配。

更重要的是,张建中说这款显卡将会在双十一当日限量开售

那么到手后的实际效果如何、价格香不香,也是可以期待一下了。

新款全功能服务器GPU产品

在服务器方面的产品,摩尔线程这次也有更新——MTT S3000

同样的,它也是基于MUSA架构、春晓GPU,算力可以覆盖图形渲染、视频处理、深度学习的完整MUSA软件栈。

支持的场景包括AI推理和训练、云游戏、云渲染、视频云、数字孪生、数字内容创作等。

从性能上来看,MTT S3000包含了4096个MUSA流处理核心及128个专用张量计算核心,晶体管规模达到220亿。

其运行频率为1.9GHz,显存位宽256bit;搭配32GB GDDR6显存,带宽为448GB/s;可以支持FP32、FP16、INT8等多种计算精度,其中FP32算力可达15.2TFLOPS。

在张建中看来,生态协作对于AI应用的推进至关重要

因此,MTT S3000还兼容了PyTorch、TensorFlow、百度飞桨(PaddlePaddle)、计图(Jittor)等多种主流深度学习框架,并实现了对Transformer、CNN、RNN等数十类AI模型的加速。

而且MTT S3000可以说是做到了“与时俱进”,最近大火的AI作画:Disco Diffusion、Stable Diffusion也是同样能够hold住。

不仅仅是硬件的更新

而除了上述的硬件产品之外,纵观正常发布会,“软硬件结合”也是摩尔线程的一大特点。

这一点其实也不难理解,在我们与张建中交流的过程中,他也道出了缘由:

软件生态是推动GPU计算普及的关键。

GPU的研发体系是非常复杂的,有了硬件才能去开发软件,软件在硬件上跑起来了之后,还需要做更多优化;优化之后又会发现架构存在缺陷,反过来又得优化硬件。

硬件、软件是互相迭代、不停提升的一个过程。

为此,摩尔线程这次以MUSA架构为核心,摩尔线程发布了完备的MUSA软件栈

其目的就是服务广大的开发者和终端用户。

除此之外,摩尔线程在GPU云原生、元宇宙、AIGC方面均有相应的新动作。

One More Thing

还是聚焦在张建中这次的outfit:

这个皮夹克,嗯,着实有点意思。

「AIGC系列直播 - 应用落地与商业化」直播报名

技术热潮之外,AIGC如何实际落地?又如何长期商业变现?

11月3-4日晚7点到8点,量子位智库联手国内头部AIGC企业及投资机构,为你解答,扫码预约~


点这里关注我

推荐帖子

ccs如何安装SIMPLELINK_MSP432_SDK
使用ccs打开msp432的程序,build之后提示错误Buildfilegenerationerroroccurred..Product'com.ti.SIMPLELINK_MSP432_SDK'v1.30.0.40isnotcurrentlyinstalledandnocompatibleversionisavailable.Pleaseinstallthisproductoracompatibleversion.然后我从ti官网下载了IMPL
无垠星空 微控制器 MCU
最新的发明设计——电子裁判手表
南非世界杯上屡次发生的裁判误判事件已经让裁判群体成为了众矢之的,既然科技如此发达,何不利用它来提升足球比赛的裁判水平呢?如此一来,场上除了一名主裁判和两名助理裁判之外,科技裁判也可以有了用武之地。只要摄像头检测到球员的犯规现象,场外的科技裁判就可以将讯号发送到主裁判的手表上,告诉主裁判如何做出正确的判罚,让足球比赛变得更加公正。最新的发明设计——电子裁判手表哇相当及时啊回复楼主xyh_521的帖子应该再弄个鹰眼手表,防止误判,及时看回放,呵呵带gps还要好用,全球
xyh_521 创意市集
振荡电路的设计与应用
《振荡电路的设计与应用》是实用电子电路设计丛书之一。《振荡电路的设计与应用》主要介绍振荡电路的设计与应用,内容包括基本振荡电路、RC方波振荡电路的设计、RC正弦波振荡电路的设计、高频LC振荡电路的设计、陶瓷与晶体振荡电路的设计,以及函数发生器的设计、电压控制振荡电路的设计、PLL频率合成器的设计、数字频率合成器的设计,等等。https://download.eeworld.com.cn/detail/%E5%A2%A8%E8%89%B2%E6%97%A0%E5%A2%A8/60662
arui1999 下载中心专版
论坛里有天喻信息或北京支付通的朋友吗
武汉天喻信息http://www.whty.com.cn/北京海科融通支付服务股份有限公司论坛里有天喻信息或北京支付通的朋友吗不知道帮顶
lidonglei1 综合技术交流
求助!!!
AD6.9中,怎么删除自己画的元件库和封装库里的元件呢?求高人指点啊求助!!!在工程管理下拉菜单中找libraries,,删除某个元件,进入点击删除qwqwqw2088发表于2014-5-2018:22在工程管理下拉菜单中找libraries,,删除某个元件,进入点击删除 您看,我要删除的是这个库里边没有具体命名的那些,就是删不了qwqwqw2088发表于2014-5-2018:22在工程管理下拉菜单中找libraries,,删除某个
小桥流水0201 PCB设计
封装中的界面热应力分析
1引言微电子器件封装中往往都要使用多种不同热膨胀系数的材料,由于材料间的热失配及制造和使用过程中的温度变化,使得各层材料及界面都将承受不同的热应力。层间界面热应力和端部处的热应力集中常常造成封装结构的脱层破坏,从而导致封装结构的失效。封装的热应力分析是对封装工艺和结构进行可靠性评价的基本要求,因而预测在封装和使用过程中产生的热应力有着重要的意义。文章研究了在多芯片组件封装中金刚石基板与硅芯片之间的热匹配问题,分析了金刚石与硅芯片之间的界面热应力分布。2三维有限元模型文章建立了三
fengzhuang PCB设计

最新有关QbitAI量子位的文章

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: TI培训

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2021 EEWORLD.com.cn, Inc. All rights reserved