Graphcore公布首次MLPerf提交结果,AI性能稳居领先地位

发布者:EE小广播最新更新时间:2021-07-01 来源: EEWORLD关键字:Graphcore  AI 手机看文章 扫描二维码
随时随地手机看文章

Graphcore公布首次MLPerf提交结果,AI性能稳居领先地位


2021年7月1日,北京——今天Graphcore(拟未科技)正式公布其参与的首次MLPerf™提交结果,Graphcore产品表现优异,AI性能稳居领先地位。MLPerf是AI行业最受认可的比较基准测试。此次测试结果显示,在GraphcoreIPU-POD64上,BERT的训练时间只有9分多钟,ResNet-50的训练时间为14.5分钟,AI性能已达超级计算机级别。


MLPerf还对比了市面上的Graphcore系统与NVIDIA的最新产品,结果证实Graphcore在“每美元性能”(Performance-Per-Dollar)指标上稳居领先地位。对客户而言,这项重要的第三方测试确认了Graphcore系统不仅具有新一代AI的优异性能,同时在目前的广泛应用中也表现得更出色。


MLPerf基准测试


对于第一次MLPerf(训练版本1.0)提交,Graphcore选择聚焦在关键图像分类和自然语言处理的应用基准测试类别。MLPerf图像分类基准使用流行的ResNet-50版本1.5模型,在ImageNet数据集上训练,以达到适用于所有提交情况的准确率。对于自然语言处理,使用了BERT-Large模型和选取的一个代表性片段。该片段大约占总训练计算工作负载的10%,并使用维基百科数据集进行训练。Graphcore决定提交使用ResNet-50和BERT的图像分类和自然语言处理,在很大程度上是由客户和潜在客户驱动的,因为这是他们最常用的一些应用和模型。此次在MLPerf测试中的强劲表现,进一步证明了Graphcore系统完全可以满足当今的AI计算要求。


参与测试的两个Graphcore系统,IPU-POD16和IPU-POD64,均已在生产中交付给客户。


价格实惠、结构紧凑的5U IPU-POD16系统适用于刚开始构建IPU AI计算能力的企业客户。它由4个1U的IPU-M2000和1个双CPU服务器(dual-CPU server)组成,可以提供4 PetaFLOPS的AI处理能力。

纵向扩展的IPU-POD64包含16个IPU-M2000和数量灵活的服务器。Graphcore系统实现了服务器和AI加速器的解耦,因此客户可以根据工作负载指定CPU与IPU的比率。例如,和自然语言处理相比,计算机视觉任务通常对服务器的需求更高。对于MLPerf,IPU-POD64在BERT的提交中使用了1台服务器,在ResNet-50的提交中使用了4台服务器。每台服务器均由2个AMD EPYC™ CPU驱动。


MLPerf测试包含开放分区和封闭分区两个提交分区。封闭分区严格要求提交者使用完全相同的模型实施和优化器方法,包括定义超参数状态和训练时期。开放分区保证和封闭分区完全相同的模型准确性和质量,但支持更灵活的模型实施以促进创新。因此,该分区支持更快的模型实现,更加适应不同的处理器功能和优化器方法。对于像Graphcore IPU这样的创新架构,开放分区更能体现出产品的优异性能,但Graphcore还是选择在开放和封闭分区都进行了提交。


测试结果体现了Graphcore系统的优异性能,即使在具有限制规格的开箱即用的封闭分区上也是如此。更令人瞩目的是开放分区结果,Graphcore能够在其中优化部署,以充分利用IPU和系统功能。这更贴近真实应用,支持客户可以不断提升其系统性能。


 image.png


“每美元性能”指标


MLPerf被称为比较基准,实际上进行直接比较可能很复杂。从相对简单的硅片到有着昂贵存储的复杂堆栈式芯片,如今的处理器和系统架构可谓千差万别。从“每美元性能”角度来看,往往最能够说明问题。


Graphcore的IPU-POD16是一个5U的系统,标价149,995美元。如前所述,它由4个IPU-M2000加速器以及行业标准主机服务器构成。每个IPU-M2000由4个IPU处理器构成。MLPerf中使用的NVIDIA DGX-A100 640GB是一个6U机盒,标价约为300,000美元(基于市场情报和公布的经销商定价),有8个DGX A100芯片。IPU-POD16的价格是它的一半。在这个系统中,IPU-M2000的价格和一个DGX A100 80GB的价格是一样的,或者在更细的层次上,一个IPU的价格是它的四分之一。


在MLPerf比较分析中,Graphcore采用了严格监管的封闭分区的结果,并针对系统价格对其进行了归一化。对于ResNet-50和BERT,很明显Graphcore系统提供了比NVIDIA产品更好的每美元性能。在IPU-POD16上进行ResNet-50训练的情况下,Graphcore的每美元性能是NVIDIA的1.6倍。在BERT上,Graphcore的每美元性能是NVIDIA的1.3倍。Graphcore系统的经济性可以更好地帮助客户实现其AI计算目标,同时,由于IPU专为AI构建的架构特点,Graphcore系统还可以解锁下一代模型和技术。


Graphcore高级副总裁兼中国区总经理卢涛表示:“首次提交MLPerf就获得如此出色的成绩,我们感到非常自豪。此次测试还会带给Graphcore客户更多价值,因为我们在准备阶段所做的所有改进和优化都会反馈到Graphcore软件栈中。全球范围内的Graphcore用户都会从MLPerf测试中受益匪浅,不仅局限于BERT和ResNet-50模型。我们将继续参与包括训练和推理在内的MLPerf测试,为追求更优性能、更大规模和添加更多模型,贡献Graphcore的所有智慧和力量。”


关键字:Graphcore  AI 引用地址:Graphcore公布首次MLPerf提交结果,AI性能稳居领先地位

上一篇:e络盟推出全新在线技术资源中心
下一篇:芯和半导体携手罗德与施瓦茨成功举办战略合作签约仪式

推荐阅读最新更新时间:2024-11-12 22:05

机器人工作太单一怎么破?解读机器学习的未来
在刚刚结束的CC AI 上,今日头条科学家李磊同我们分享了一些他对机器学习未来发展方向的一些思考,以及在此基础上讨论了一下我们还要做些什么才能向通用型AI再靠近一点的问题。今日头条最初是一家新闻聚合平台,但素有应用AI来解决问题的传统。最近今日头条也做出了自己的新闻 机器人 ,在里约奥运期间自动完成了大量的报道。而李磊作为有着多年机器学习、 人工智能 和深度学习领域研究经验的科学家。在这个问题上也有着自己的看法。     李磊在演讲中说,要弄清楚我们离通用机器人还有多远,首先要弄明白三个方面:一是人工智能是什么?二是现在我们能做到什么程度?在搞清楚这两个问题后我们才能去研究第三个方面:我们的局限在哪里?我们的挑战在哪里
[嵌入式]
首届中国以色列物联网与人工智能论坛成功举办
由上海市杨浦区人民政府和张江高新区管委会主办, 耀途资本 和同和文化承办,超体文化和招商银行上海分行协办的“首届中国以色列 物联网 与 人工智能 论坛”在上海市杨浦区成功举行。本次论坛邀请到上海市杨浦区、上海市张江高新区管委会、以色列驻上海领事馆,招商银行上海分行等机构领导出席。 多家中以两国的行业龙头企业以及十余家耀途资本投资的中以两国代表性技术创业公司参会并做主题演讲和圆桌分享,包括来自的以色列BondIT, Mantis Vision,  Mobileye ,ironSource和Frameless,国内的万得资讯,复星集团, Roadstar .ai,Kavout,畅圣科技,智齿科技,大有科技,云像科技,炬佑智能和微云前景
[嵌入式]
研华加入深圳市人工智能行业协会
2017年6月30日,深圳市人工智能行业协会成立大会暨AI高端领袖会在深顺利召开。超100家会员企业到场见证。研华科技嵌入式事业群客户经理谭亮锋先生代表研华作为会员单位出席现场。 图:右二为研华科技嵌入式事业群客户经理谭亮锋 人工智能研究已走过60多年,起起伏伏,历经2次发展浪潮。在云计算服务、大数据和深度学习等技术的助推下,人工智能正迎来第三次发展浪潮,将对传统行业产生颠覆性影响,推动多个领域变革和跨域式发展。而在这一时机下,深圳市人工智能行业协会经过半年筹备,正式成立了。 深圳市人工智能行业协会,是在深圳市民政局正式申请注册登记的行业组织,协会围绕基础技术及行业应用,涵盖人工智能各个发展领域。中兴通讯股份有限
[工业控制]
研华加入深圳市<font color='red'>人工智能</font>行业协会
处理器/软件框架双管齐下 IBM携手群环共筑台湾AI生态系
因应人工智能(AI)快速发展,并完善台湾AI生态系,IBM宣布与群环科技扩大合作,PowerAI深度学习平台框架,提供AI解决方案的仿真测试,加速深度学习框架与神经网络训练时间 ;而IBM也于日前发布新一代POWER9处理器,提升AI运算效能,期待在PowerAI深度学习平台框架及POWER9的助力下,提升企业AI竞争力。 台湾IBM硬件系统事业部总经理李正屹表示,在AI浪潮下,有许多企业积极思考转型方向及IT部署策略,IBM积极从硬件加速上层应用之发展,与群环科技扩大合作,力推PowerAI深度学习架构等认知解决方案 ;同时IBM也持续在大型主机、服务器及储存领域的服务中注入AI动能,像是推出POWER9及相关数据流的储存与管理
[半导体设计/制造]
未来已来,2018新经济时代下风口中的视频监控
在2017年的AI热潮下,视频监控进入了看得懂的时代,我们把这个时代称之为“新技术时代”。2017年已经成为历史,总结得失是年终总结必须做的工作,不同人有不同的看法,大体来说只有你知道的和你不知道的两类信息。笔者最大的感受就两个:一是新疆安防市场爆发,粗略估计市场份额超过全国的六分之一,而且新疆所使用的一些视频监控设备和技术并不比其他省市差,间接带动了国内安防市场的发展;二是万万没有想到深圳安博会1天来了13万人(总数超30万,2015年是13万),AI引爆了整个安博会。   从业安防17年,突然觉得不了解视频监控这个行业了,发现曾经那么熟悉的安防市场看起来越来越模糊,不过我还是试着去推测一下2018
[安防电子]
因为人工智能,智能交通变了
智能交通系统(Intelligent Transportation System,简称ITS)是未来交通系统的发展方向,它是将先进的信息技术、数据通讯传输技术、电子传感技术、控制技术及计算机技术等有效地集成运用于整个地面交通管理系统而建立的一种在大范围内、全方位发挥作用的,实时、准确、高效的综合交通运输管理系统。下面就随汽车电子小编一起来了解一下相关内容吧。 因为人工智能,智能交通变了 在迅猛的城市化发展中,交通是发展的命脉,关于出行,日常生活中我们所能感受到的交通的发展已经发生了巨大的变化,无论是出行方式的多样性、便捷度、舒适度还是安全性都得到了全方位的提升,但也同时出现道路拥堵、停车困难、交通事故频繁发生等问题。政策的
[汽车电子]
因为<font color='red'>人工智能</font>,智能交通变了
机器人和人工智能在软件测试行业竟如此重要
在移动应用程序大行其道的今天,我们也看到 机器人 技术和 人工智能 的应用,特别是在 软件测试 中。我们有足够的理由去开发机器人和人工智能应用,利用它们提高成本,节省时间。   机器人研究领域有据可依的历史并不算长,但是由于机器人和人工智能在软件测试中的应用日益增多,这些数据正在迅速增多,相关的规范也会快速形成。就软件测试中的机器学习而言,机器人的训练速度比人类更快,他们可以成为软件开发方面的专家。机器人和人工智能在测试的范围、工作量、调试充分性、连续测试等方面影响着软件测试和开发。   在软件测试行业中机器人和人工智能到底承担着什么重任 1.测试范围和工作负载 软件测试中的一个常见问题是,随着一个项目的建立,测试的参数会上升,从
[嵌入式]
研究团队开发可进行AI计算的超低功耗神经形态硬件 有望用于自动驾驶
据外媒报道,首尔国立大学工学院(Seoul National University College of Engineering)宣布,由材料科学与工程系Ho Won Jang教授领导的研究团队开发出能够以超低功耗进行人工智能(AI)计算的神经形态硬件。这项研究解决了现有智能半导体材料和器件的基本问题,同时展示阵列级技术的潜力。 (图片来源:首尔国立大学) 目前,在物联网(IoT)、用户数据分析、生成式AI、大语言模型(LLM)和自动驾驶等领域,处理大数据使用的并行计算需要消耗大量电力。然而,用于并行计算的传统硅基CMOS半导体计算存在能耗高、内存和处理器速度较慢,以及高密度过程物理限制等问题。尽管AI对日常生活产生了积
[汽车电子]
研究团队开发可进行<font color='red'>AI</font>计算的超低功耗神经形态硬件 有望用于自动驾驶
小广播
最新物联网文章
换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved