摩尔线程推出全新多功能服务器GPU产品 MTT S3000,构建元计算新引擎

发布者:EEWorld资讯最新更新时间:2022-11-03 来源: EEWORLD关键字:摩尔线程  GPU 手机看文章 扫描二维码
随时随地手机看文章

2022年11月3日,北京——摩尔线程2022秋季发布会在北京中关村国家自主创新示范区成功举办。发布会上,摩尔线程宣布了全新的多功能GPU产品和MUSA软件栈等多项创新成果,充分展示了摩尔线程“软硬结合”的综合实力。其中,面向服务器的多功能GPU产品MTT S3000基于MUSA架构打造,能够支持DirectX、OpenGL、OpenGL ES、Vulkan、OpenCL等主流图形和计算接口,兼容CUDA,可为AI推理和训练、云游戏、云渲染、视频云、数字孪生、数字内容创作等场景提供通用智能算力支持,旨在为数据中心、智算中心和元计算中心的建设构建坚实算力基础,助力元宇宙多元应用创新和落地。

image.png

算力升级,助力元计算加速


MTT S3000搭载了摩尔线程全新的第二颗多功能GPU芯片“春晓”,包含了4096个MUSA流处理核心及128个专用张量计算核心,晶体管规模达到220亿,运行频率为1.9GHz,显存位宽256bit;搭配32GB GDDR6显存;支持FP32、FP16、INT8等多种计算精度,其中FP32算力可达15.2TFLOPS。


MTT S3000率先采用了PCIe 5.0接口,是目前GPU行业中首款支持PCIe 5.0标准的产品。PCIe 5.0所提供的高带宽不仅能提升GPU与CPU的通讯效率,更能在“多卡”部署时提供更大的核间通讯带宽,提升GPU集群的整体运算效率和性能。


MTT S3000内置MUSA智能多媒体引擎2.0和硬件虚拟化功能,能够从多个维度增强显卡的应用范围和用户的应用体验。同时,MTT S3000还提供了两组DP 1.4a显示输出接口,由此增加的显示输出能力将进一步拓展MTT S3000的业务适应性。

image.png

训推一体,为AI计算铺平道路


从数据中心向智算中心和元计算中心演进是行业算力需求发展的主流趋势,人工智能和元宇宙应用负载对GPU算力的强烈需求是推动这一演进趋势的关键力量。专为提升智能算力而设计的摩尔线程MTT S3000,在与之配套的MUSA软硬件计算平台的加持下,AI应用性能相比 “苏堤”可实现平均4倍提升。


MTT S3000及其配套软硬件产品,实现从算法模型到应用部署的全流程覆盖,能够为AI用户提供友好丰富的一揽子解决方案。在算法层面,摩尔线程不仅可以支持用户的自定义算法模型,同时也提供丰富的预训练模型库,赋能广大AI开发者,提升开发效率;在应用解决方案层面,摩尔线程可提供数字人、数字客服、内容生成等行业解决方案,服务金融保险、教育、医疗等相关的行业用户。


深度学习训练方面,MTT S3000兼具易用性、扩展性和兼容性等多维优势。基于MUSA软件栈,MTT S3000可实现现有算法的全面支持;能够支持包含单机单卡、单机多卡、多机多卡在内的多种训练模式。不仅如此,MTT S3000还兼容PyTorch、TensorFlow、百度飞桨(PaddlePaddle)、计图(Jittor)等多种主流深度学习框架,并实现了对Transformer、CNN、RNN等数十类AI模型的优化。


在深度学习推理方面,MTT S3000支持视觉、语音、自然语音理解及多模态等多个领域主流AI模型。摩尔线程还对MUSA软件栈持续进行深度性能优化,并推出自研AI推理引擎TensorX,利用任务并发、自适应算法寻优、访存优化、算子优化等技术,大幅提升推理性能。MTT S3000可满足生物医疗、金融保险等特别强调高精度推理的行业需求,并提供极致性能。


同时,借助摩尔线程开发的CUDA ON MUSA兼容方案,用户可以将CUDA上开发的代码无缝迁移到MTT S3000。


云原生GPU,算力调用更灵活高效


GPU是当前数据中心需要的关键算力,云原生技术应用在云计算、云桌面、云游戏等领域也越来越普遍。为此,摩尔线程发布一系列基于摩尔线程创新性MT Mesh 2.0的GPU云原生方案。


MT Mesh 2.0可以根据云端中心应用负载,自动化分配GPU计算和显存资源,实现GPU算力弹性伸缩。既可以将一张GPU随意切分给多个容器或虚机,也可以支持一个容器或者虚机调度多个GPU。

image.png

弹性容器化GPU (sGPU):基于Kubernetes生态,使用MT Mesh 2.0实现灵活和有效调配容器化GPU资源。


弹性虚拟化GPU(vGPU):使用MT Mesh 2.0,率先于行业开创了资源弹性切分技术,无需重启即可动态调配和修改GPU虚拟化资源,实现算力按需调用、动态伸缩、用完释放;引入全新的“时空切分”特性,支持硬件虚拟化(SR-IOV),安全物理分割,最高支持32路虚拟化,支持Windows云桌面GPU虚拟化,以及统信和麒麟操作系统GPU直通。


安卓容器云加速技术ACX:使用GPU安卓容器透传技术和渲染编码一体化技术,可以加速安卓云手机解决方案,减少应用延迟,增加并发路数。通过原生支持OpenGL ES、OpenGL渲染框架,和ETC、ETC2等安卓游戏材质压缩算法硬件加速,可以提供更佳的安卓云游戏渲染效果和兼容特性。


视频云,助力高清视频应用和处理


MTT S3000具备强大的视频处理能力,集成了摩尔线程第二代智能多媒体引擎(MT Smart Media Engine 2.0),可以加速云端的多种音视频应用,如视频AI分析、视频会议、云游戏、云桌面和实时互动等,最高能够支持8K超高清HDR视频实时处理。


MTT S3000支持包括FFmpeg和GStreamer在内的主流音视频框架,以及不同操作系统下的通用视频加速API。摩尔线程将多功能GPU中的智能多媒体引擎与图形引擎、AI计算引擎等结合,提供丰富的SDK开发套件,大幅降低CPU负载与数据拷贝,方便开发者轻松调用,为视频云场景所需的超高清转码、智能内容生成、AI画质增强、老片修复、数字孪生、数字人等方案提供可靠支持。


软硬结合,构筑元宇宙应用基石


发布会现场,摩尔线程还发布了专为元宇宙应用构建的MTVERSE元宇宙平台及众多软硬件产品,包括基于MTT S3000打造的MCCX元计算一体机等。

image.png

MTVERSE以摩尔线程MUSA GPU集群为算力基础,为用户提供计算基础架构及服务,包括大数据、AI训练与推理、图形渲染和物理仿真三大平台,提供从硬件集群、软件基础架构到SDK工具链的全栈式解决方案,涵盖元宇宙中的人、场景和内容等多个核心要素。而上层的海量SDK工具则能帮助开发者和应用程序方便地调用这些能力,实现数字人、文献理解、语音识别、视觉识别、自然语义理解、对话交互、物理仿真、AIGC内容生成等一系列功能,进一步简化应用和解决方案的开发难度,缩短开发周期。


元宇宙将引领未来全球数字经济的发展,目前仍处在早期阶段,但随着众多商业巨头入局,中国各地政府也先后出台相关政策支持,前景无限广阔。展望未来,元宇宙必定是以图形和AI计算为核心基石的集成式应用,物理引擎、渲染引擎和AI技术的发展,很大程度上决定了元宇宙的应用演进步伐。摩尔线程将继续保持高速的GPU产品迭代创新模式,持续完善软硬件能力,通过广泛的生态合作,助推元宇宙应用创新,最终服务数字经济高质量发展。


关键字:摩尔线程  GPU 引用地址:摩尔线程推出全新多功能服务器GPU产品 MTT S3000,构建元计算新引擎

上一篇:中国首张国潮游戏显卡问世!摩尔线程MTT S80双11京东限量开售!
下一篇:摩尔线程重磅发布全新多功能GPU及软硬件产品,构建以MUSA为核心的全栈能力

推荐阅读最新更新时间:2024-10-12 12:27

英特尔2017表现稳健 预料GPU、数据中心、IoT是明年重心
英特尔(Intel) 2017年获利表现稳健,加上除了原本的个人电脑(PC)市场以外又积极拓展数据中心(data center)市场,今年股价成长达23%。专家认为2018年于英特尔而言将是转变的时刻,或许不会是最丰收的一年,但乐观预期至少能达到和2017年一样的成长表现。   据The Motley Fool报导,英特尔是全球最大GPU制造商,主要归功于在低阶整合式图形解决方案市场的高市占。至于高端独立型GPU(discrete GPU)市场则由NVIDIA与超微的扩充卡(Add-in-Board;AIB)主导。   近来英特尔与超微结盟,在最新x86芯片组中使用超微的Radeon图形处理器,更成立新的核心与视觉运算部门(Cor
[半导体设计/制造]
NVIDIA黄仁勋:GPU加速运算成为延展摩尔定律主要模式
在此次GTC Taiwan中,NVIDIA执行长黄仁勋期未来10年内,每年对于运算需求的规模将成长100倍,同时预期在摩尔定律逐渐衰减之下,全球前50大超级电脑的GPU运算量将在未来5年内成长15倍率,同时以GPU加速运算的方式将成为延展摩尔定律的主要模式。 黄仁勋在GTC Taiwan再次强调过去NVIDIA创造CUDA运算模式所带动加速效益,同时说明未来借由GPU加速运算的模式将会持续扩大,预期在2028年全球运算需求将等同1000万组Volta架构GPU所推动效能,若以传统通过多组CPU堆叠构成超级电脑等级运算能力,将会占据大规模空间及高额电力花费,若以GPU替换的话,则可节省更多空间与电力损耗,同时带来更高加速效果。
[手机便携]
苹果A17 Pro GPU功耗高:实测能耗比不如高通骁龙8 Gen2
9月19日消息,苹果iPhone 15系列评测今晚正式解禁,大家最关心的就是iPhone 15 Pro系列搭载的A17 Pro芯片性能表现究竟如何。 博主小白测评实测,在1080P曼哈顿3.1离屏测试场景下,苹果A17 Pro是204fps,功耗是9.8W。对手高通骁龙8 Gen2在相同场景下实测220fps,功耗是7.5。毫无疑问,苹果A17 Pro GPU能耗比不及骁龙8 Gen2。 在《王者荣耀》极致60帧模式下,苹果A17 Pro实测功耗是3.0W,相比安卓阵营的骁龙8 Gen2和天玑9200+,也没有什么优势。 博主数码闲聊站指出,下个月发布的高通骁龙8 Gen3在GPU方面的能效表现将会碾压苹果A17 Pro
[手机便携]
挖矿热意外“立功” 英伟达看好GPU需求至年底
太平洋时间26日,全球GPU龙头英伟达发布2021年第一季度财报,“超预期”成为高频词的同时,持续已久的GPU供需紧张状况何时缓解,成为业内关注的焦点。 宅经济外 挖矿热意外为“超预期”贡献动能 数据显示,截至5月2日,公司收入创下56.6亿美元的纪录,较去年同期增长84%,较上一季度增长13%,超过此前预期的54.1亿美元;净利润报23.13亿美元,同比增长107%。 同时,季度GAAP摊薄每股收益创下3.03美元纪录,较去年同期增长106%,较上一季度增长31%。季度非GAAP摊薄每股收益为3.66美元,较去年同期增长103%,较上一季度增长18%,均超过市场预期。 图源:英伟达财报 创始人兼首席执行官黄仁勋将超过预期
[手机便携]
挖矿热意外“立功” 英伟达看好<font color='red'>GPU</font>需求至年底
NVIDIA GPU Cloud扩展,可供采用NVIDIA桌面级GPUAI研究人员使用
NVIDIA(纳斯达克代码: NVDA )今日宣布将 NVIDIA GPU Cloud (NGC)支持扩展至 NVIDIA TITAN ,使数十万采用桌面级GPU的AI研究人员能够利用NGC的强大功能。 NVIDIA还公布了NGC的功能扩展,包括针对NGC容器注册新增的软件和其他主要更新,为研究人员提供了更广泛、更强大的工具,有助于其开展AI和高性能计算研发。 采用基于NVIDIA® Pascal™架构 的TITAN GPU的客户可即刻 注册 免费NGC帐户,获得针对GPU优化的深度学习与HPC软件和工具目录的全面访问权限。其他可支持的计算平台还包括 NVIDIA DGX-1 ™、 DGX Station 以及 Amazo
[嵌入式]
凌华展示新品x86工业用智慧相机
凌华科技(ADLINK Technology)宣布参展「2014台北国际自动化产业展」,会中主打机器视觉 x86 工业用智慧型相机,同时发表自动化控制与物联网新品,以及展示高速高解析视觉检测、雷射切割与涂胶应用与机台振动检测等。 凌华科技将在现场动态实机展示高速高解析视觉检测机台、采用 Euresys CoaXPress 影像撷取卡打造的高速与长距离线性扫描,以及透过高阶 DSP 运动控制卡完成雷射切割与涂胶应用,与藉由搭载时频分析软体的动态讯号分析模组,建构高精密度振动量测系统,来达成设备机台的动平衡检测及校正。 在今年的自动化产业展中,凌华科技主推机器视觉新品─ x86 工业用智慧相机 NEON-1040 ,为首款可兼
[嵌入式]
ARM与GPU构建百亿亿次超级计算机畅想
在过去的SC11大会上,我们已经看到多个与ARM服务器相关的产品,例如ARM芯片新贵Calxeda宣布其能耗为5瓦的EnergyCore ARM芯片,以及该公司与x86服务器巨头HP的合作伙伴关系。ARM架构表现已经越来越突出,但其痛苦而缓慢的64位改造进展预计将于2014年完成。 即便是与最为节省能耗的x86芯片相比,ARM处理器所使用的功率还要小得多,因此众多学者专家们一致认为ARM处理器是解决大规模网络服务基础设施问题的最终答案。但是,当谈及企业和高性能计算(HPC)处理琐事时,ARM并没有轻易地来承担。32位版本的系统无法处理足够的内存,所以ARM芯片及其指令集在服务器应用上缺乏与主流x86处理器一较长短的底气。
[单片机]
CPC亮相ODCC,携手英伟达为GPU提供液体冷却技术以加速 AI 计算
明尼苏达州阿登希尔斯 – 2024年9月2日 – CPC (Colder Products Company)将于2024年9月3-4日在北京国际会议中心参加一年一度的开放数据中心大会。随着人工智能(AI)、大数据、物联网等技术的快速发展,算力已成为推动生产力发展的核心驱动力。 CPC宣布已加入英伟达 (NVIDIA) 技术生态系统。CPC 将与生态系统内的合作伙伴携手,为 AI 工厂和数据中心提供关键组件。 CPC 总裁 Janel Wittmayer 表示:“要在执行计算密集型任务期间保持温度敏感产品的完整性,CPC 的连接器至关重要。我们的专用连接器采用创新技术,能够轻松可靠地将 AI 系统中的液冷 NVIDIA G
[工业控制]
CPC亮相ODCC,携手英伟达为<font color='red'>GPU</font>提供液体冷却技术以加速 AI 计算
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved