摩尔线程展现国产GPU“芯”速度:从架构到芯片到解决方案
最新更新时间:2022-04-03
阅读数:
成立仅1年半,国产GPU厂商摩尔线程便推出了第一款多功能GPU产品,并发布了多个解决方案。深刻演绎了国产GPU的“芯”速度。不同于业界对互联网计算的认识,摩尔线程提出用“元计算”来赋能下一代互联网,在摩尔线程看来,全功能GPU是将是元计算的算力基础设施。
底层架构在先,芯片在后
针对元计算,摩尔线程从底层架构开始做起,发布了MUSA统一系统架构,它包括统一的编程模型、软件运行库、驱动程序框架、指令集架构和芯片架构。摩尔线程希望通过一个架构就能适配多个操作系统,不至于因操作系统的不同而生成多个驱动,MUSA架构设计的目的就是减少软件重复劳动。它可广泛应用在PC、工作站、服务器、云计算、物联网、车载等各个领域。
摩尔线程张建中在接受半导体行业观察等媒体的采访中指出,元计算不光能满足今天的需要,也是能够满足未来应用需要的场景才可以去长期的投入,所以我们才从底层架构开始,研发出第一款MUSA架构。在架构层面,摩尔线程又有独到的见解,摩尔线程认为,图形是任何计算的基础,没有图形计算很多应用是没有根基的,如果研发的其他功能不全,在用户使用的时候可能还需要去购买一些其他的GPU产品,那就会变成用户的投资重复浪费。
MUSA架构研发在先,芯片在后。搭建好架构之后,摩尔线程基于MUSA架构发布了第一代多功能GPU芯片——“苏堤”。该芯片内置四大引擎:现代图形渲染引擎、智能多媒体引擎、Al计算加速引擎、科学计算与物理仿真引擎。这是第一款面向元计算的多功能GPU,也是摩尔线程700多人,历经18个月交出的第一份答卷。
具体来看,内置现代图形渲染引擎可以实现全局光照、时空抗锯齿、物理渲染、软阴影、反射、体积光等功能;智能多媒体引擎支持4K/8K的编解码;AI计算加速引擎包括AI训练和推理引擎,支持主流的AI网络模型等。
值得一提的是,摩尔线程独立设计研发的下一代多平台GPU物理仿真系统AlphaCore,能够对物理世界中复杂的固体、柔性体、流体等效果进行超高精度的物理仿真处理。基于AlphaCore,摩尔线程还开发了一些列工具,如生物仿生计算工具Bionics、气体流体仿真工具Catalyst以及布料毛发制作工具VeraFiber。通过运算模拟,让布料、毛发和数字角色软体肌肉组织的物理交互效果达到电影级别般真实。对比Houdini Vellum 的软体毛发布料和PyroFX 的烟火流体, AlphaCore 均能达到 5~10倍的性能提升。
同时,AlphaCore能最大程度的兼容CUDA、Vulkan、DirectX等Runtime API 环境,及Houdini,Unreal,Unity和D5游戏引擎和设计软件,对游戏、动画、建筑等实际应用场景达到了广泛的覆盖。
摩尔线程张建中告诉记者,能在这么短的时间做出这样的成果,主要有两大因素:一是要有一支真刀实枪做过这些全功能GPU的队伍,从架构设计到芯片设计、物理设计、封装设计、流片,再进行封装测试,最后做成板卡,需要各个环节的人才储备,每个环节都不能有短板;二是在软件上的打磨和重视,这其中不仅仅是公司内部团队的经验,还有业界不同操作系统用户、CPU、整机以及应用端的合作伙伴的大力支持,这也使得我们的研发速度比想象的要快得多。
张建中还补充到,产品迭代如果只是靠芯片本身迭代是有限的,我们希望让更多的算力来自于我们架构的改进跟产品的迭代。当下大型的GPU公司都是靠软件生态驱动公司业务的发展,摩尔线程也不例外,希望能通过全功能的软件操作系统为行业提供统一的架构,让软件可以适配所有的CPU、驱动操作系统和应用场景,让更多的用户能够应用起来。
桌面级显卡 MTT S60:2048个MUSA核
基于MUSA统一系统架构GPU苏堤,摩尔线程推出了第一代桌面级显卡MTT S60。它采用12nm制程,包含2048个MUSA核心,单精度算力最高可达6TFlops;配置8GB低功耗LPDDR4x显存,由于支持多种纹理压缩算法,显存带宽的利用率也得以显著提高;支持8K/4K 画面显示;支持AV1/H.264/H.265 8K编解码。
MTT S60显卡能广泛支持多个平台生态系统,如英特尔、AMD、飞腾、龙芯、兆芯、海光等各类CPU平台,还支持Win10、麒麟、统信及多种Linux操作系统。MTT S60具有丰富的图像APi接口,支持DirectX、Vulkan、OpenGL和OpenGL ES等众多图形API接口,可满足GIS、BIM、设计、主流游戏、原生Android、三维渲染等应用对图形性能的需求。
基于全栈功能GPU的通用计算能力,MTT S60显卡能够加速DBNet、CRNN、Yolo、Restnet50/101等广泛的AI模型推理计算,支持OCR、图像处理和视频增强等多种复杂人工智能场景。因此,MTT S60显卡能够释放强大的AI能力,加速普及PC级AI应用。
除此之外,MTT S60显卡还为用户提供了一站式的图形化管理控制中心。借助该工具,用户不仅可监控GPU运行状态并进行相关的2D/3D图像输出设定,更可提供无需人工干预的显卡驱动更新等功能,使显卡能够在不同应用环境中获得持续的优化和兼容性改善。
MTT S60显卡的图形性能在电子竞技游戏中也大放异彩。不仅能在Win10操作系统、1080P以及最高画质环境下,提供《英雄联盟》的流畅体验;还可在国产Linux操作系统环境下,完成《反恐精英:全球攻势》、《刀塔2》等多款热门游戏的流畅运行。
MTT S60目前已拢获了不少早期客户的认可和好评。MTT S60是首款支持中望3D软件的GPU,智能加速工业软件的发展。为D5重塑了建筑表现工作流。MTT S60助力太极图形,加速物理与图形并行计算,让图形计算普及每个人。MTT S60实现了对广联达多种BIM解决方案的完整适配。
总体来看,MTT S60图形+AI的特点实现了科技与艺术的完美结合,或将成为当今桌面级显卡市场中值得关注的全新选择。
在芯片行业,生态的重要性早已不言而喻。对GPU行业来说,更是如此,英伟达之所以能够独霸GPU市场,很大的因素在于其强大的生态系统。对此,摩尔线程发起并携手一众行业合作伙伴共建中国的“完美体验系统联盟(PES联盟)”,如下图所示,已有多家国内不同行业的企业加入此联盟。通过在产品规划、研发乃至生产上的协同合作,生态伙伴能够整合资源、分享技术,为终端用户提供更完美的体验。
面向数据中心的MTT S2000:4096 MUSA核
基于MUSA架构GPU芯片苏堤,摩尔线程还推出了面向数据中心级多功能GPU产品MTT S2000。MTT S2000采用12nm制程,使用4096个MUSA核心。MTT S2000采用被动散热、单槽设计,这也满足数据中心高密度GPU配置方式。最大配置32GB显存,单精度算力最高可达到12TFlops,支持H.264、H.265、AV1多路高清视频编解码,以及广泛的AI模型算法加速,支持PyTorch、Tensorflow、PaddlePaddle等主流深度学习框架。
MTT S2000还支持OpenGL、OpenGL ES、DirectX、Vulkan等图形API;通过FFMPEG和VA-API/DXVA等兼容支持音视频处理生态;并通过OpenCL及Vulkan满足AI和科学计算的程序兼容。
MTT S2000支持 x86和Arm架构CPU以及主流Linux操作系统发行版,服务器合作伙伴包括浪潮、新华三、联想、清华同方、长城超云、思腾合力等OEM。
为提升MUSA架构产品在实际生产环境中的表现,摩尔线程还为MTT S2000系列产品推出了针对硬件架构进行专门优化的统一编程模型、运行库、驱动等软件工具,可方便开发人员完成应用的移植和适配,充分调用MTT S2000的硬件资源和算力。
目前MTT S2000已为包括云桌面、安卓云游戏、音视频云处理、云端Unreal/Unity应用渲染和AI推理计算在内的多种应用场景中为用户带来实际受益。MTT S2000帮助蔚领时代以更低延时、更低功耗、更高性价比引领云游戏畅快体验;支持声网Agora的实时互动RTE技术;帮助一流科技支持异构分布式计算。
性能强大、使用广泛的MTT S2000的面市,或将打破长久以来的固化格局,为当下数据中心GPU市场带来一个全新的选择。
元计算解決方案
在摩尔线程看来,除了GPU之外,解决方案也很重要。因此,摩尔线程还发布了多个云计算解决方案,包括数字能源、数字农业、数字城市、数字生命,助力“十四五”数宇经济。
在数字能源方面,摩尔线程与国家电网共同推进 “电力行业人工智能”及“工业元宇宙电力场景”应用;在数字农业方面,基于摩尔线程GPU底层多功能算力构建农业基地数字孪生模型,全面实现标准化智慧化管理,为产品加工的全流程保驾护航;在数字城市方面,摩尔线程全功能GPU正在推动数据中心从云计算中心向“元”计算中心转型,驱动数字经济的发展,实现物理世界数字化和数字世界物理化;此外,摩尔线程还在助力数字生命的科学探索,摩尔线程GPU多核并行架构可以加速软件蛋白质重构过程,助力医学病理和结构生物学的研究。
DIGITALME数字人解决方案也是摩尔线程的一项重大发布。通过视觉深度学习技术及TTS语音生成技术,摩尔线程构建了以单张图片、少量音频实时生成数字人的低成本、轻量化解决方案。摩尔线程数字人目前拥有表情学习、才艺模仿、给定文本自然状态讲解等功能。
结语
“此次系列新品的发布,是公司发展的重大里程碑,更是我们研发实力、生态凝聚力和创新执行力的集中体现。”张建中指出。在当下这个国产替代的大环境之下,GPU芯片初创企业没有捷径可走,只有找准自己的发力方向,踏实肯干,真正做出满足客户需求且性价比高的产品才是硬道理。而摩尔线程的策略就是集中精力做好全功能GPU,聚焦研发实力,把核心业务做好,为数字经济加速提供强劲动力。
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第2999内容,欢迎关注。
推荐阅读
半导体行业观察
『半导体第一垂直媒体』
实时 专业 原创 深度
识别二维码,回复下方关键词,阅读更多
晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装
回复 投稿,看《如何成为“半导体行业观察”的一员 》
回复 搜索,还能轻松找到其他你感兴趣的文章!