Graphcore公布最新MLPerf训练结果:AI性能再刷新高

发布者:EE小广播最新更新时间:2021-12-02 来源: EEWORLD关键字:Graphcore  MLPerf  训练  AI  自然语言处理  NLP 手机看文章 扫描二维码
随时随地手机看文章

2021年12月2日,北京—— 今日,Graphcore(拟未)正式公布其参与MLPerf测试的最新结果。结果显示,与首次提交的MLPerf训练结果相比,对于ResNet-50模型,Graphcore通过软件优化,在IPU-POD16上实现了24%的性能提升,在IPU-POD64上实现了41%的性能提升;对于自然语言处理(NLP)模型BERT来说,在IPU-POD16上实现了5%的性能提升,在IPU-POD64上实现了12%的性能提升。此次MLPerf测试结果证明了Graphcore的IPU系统越来越强大、高效,软件日益成熟且更快、更易使用。


MLPerf还对比了市面上的Graphcore与NVIDIA的产品,通过在GPU占据优势的模型ResNet-50上进行测试,结果表明Graphcore的IPU-POD16在计算机视觉模型ResNet-50方面的表现优于NVIDIA的DGX A100。在DGX A100上训练ResNet-50需要29.1分钟,而IPU-POD16仅耗时28.3分钟,这是自Graphcore首次提交以来仅通过软件实现的性能提升。其中,IPU-POD16对ResNet-50的软件驱动性能提高了24%,在IPU-POD64上对ResNet-50的软件驱动性能提升甚至更高,达到41%,对于Graphcore具有里程碑式的意义。


image.png


Graphcore最近发布的IPU-POD128和IPU-POD256横向扩展系统也得出了结果,与上一轮MLPerf训练相比,Graphcore的IPU-POD16的BERT性能提高了5%,IPU-POD64的BERT性能提高了12%。


  • 对于Graphcore较大的旗舰系统,在IPU-POD128上训练ResNet-50的时间为5.67分钟,在IPU-POD256上为3.79分钟。


  • 对于自然语言处理(NLP)模型BERT,Graphcore在开放和封闭类别分别提交了IPU-POD16、IPU-POD64和IPU-POD128的结果,在新的IPU-POD128上的训练时间为5.78分钟。


MLPerf的封闭分区严格要求提交者使用完全相同的模型实施和优化器方法,其中包括定义超参数状态和训练时期。开放分区旨在通过在模型实施中提供更大的灵活性来促进创新,同时确保达到与封闭分区完全相同的模型准确性和质量。通过在开放分区展示BERT训练的结果,Graphcore能够让客户了解产品在实际运行中的性能,从而让他们更倾向于使用此类优化。


image.png


新模型在大规模系统上的巨大优势


MLPerf及其组织机构MLCommons作为第三方验证机构,在帮助客户独立评估人工智能计算系统的能力和不同公司提供的软件栈的成熟度方面发挥着重要作用。当然,客户继续在生产中使用ResNet和BERT等模型的同时,也在探索创新的新模型,并期待Graphcore更大的旗舰系统实现大规模机器智能。例如,在Graphcore的旗舰产品IPU-POD256上,创新的计算机视觉EfficientNet-B4仅用1.8小时便可完成训练,尽管这并非Graphcore本次向MLPerf提交的内容,但在实际应用中的确有更强的性能优势。


image.png


此外,在绝对吞吐量性能以及扩展到更大的IPU-POD系统方面,Graphcore在MLPerf之外的一系列模型中也得到了一系列令人印象深刻的结果,包括用于自然语言处理的GPT类模型和用于计算机视觉的ViT(Transformer视觉模型)。


image.png


通过设计实现大规模高效


在本轮或任何一轮MLPerf原始数据中,每个制造商系统相关的主机处理器数量都十分惊人,一些参与者甚至指定要求每两个人工智能处理器配有一个CPU。而Graphcore的主机处理器与IPU的比率始终是最低的。与其他产品不同,IPU仅使用主机服务器进行数据移动,无需主机服务器在运行时分派代码。因此,IPU系统需要的主机服务器更少,从而实现了更灵活、更高效的横向扩展系统。


对于BERT-Large这一类自然语言处理模型,IPU-POD64只需要一个双CPU的主机服务器。ResNet-50需要更多的主机处理器来支持图像预处理,因此Graphcore为每个IPU-POD64指定了四个双核服务器。1比8的比例仍然低于其他所有MLPerf参与者。事实上,在本轮MLPerf 1.1训练中,Graphcore为BERT提供了最快的单服务器训练时间结果,为10.6分钟。


Graphcore大中华区总裁兼全球首席营收官卢涛表示:“自2021年初首次提交MLPerf测试以来,Graphcore取得了巨大进步,这与Graphcore不懈创新的企业精神是分不开的。无论是设计系统、选择架构之初,还是至少每三个月推出一次重大软件更新,都是Graphcore创新精神的体现。同时,Graphcore不懈创新的热情也感染和吸引了众多软硬件合作伙伴——从Hugging Face和PyTorch Lightning到VMware和Docker Hub,它们都积极支持Graphcore不断创新,以助力AI开发者在易于使用的系统上获得绝佳的人工智能计算性能。”


关键字:Graphcore  MLPerf  训练  AI  自然语言处理  NLP 引用地址:Graphcore公布最新MLPerf训练结果:AI性能再刷新高

上一篇:LeapMind发布超低功耗AI推理加速器IP“Efficiera v2版本”
下一篇:云服务、OEM 借助 NVIDIA AI 让 AI 训练更上层楼

推荐阅读最新更新时间:2024-11-01 22:06

中星微组建成立“AI芯片公司”,第二代AI芯片即将发布
  寒武纪A轮融资1亿美元、地平线A+轮融资近亿美金、商汤科技B轮融资4.1亿美元、旷视科技C轮融资4.6亿美元……下面就随网络通信小编一起来了解一下相关内容吧。   在过去的2017年,“人工智能”成为了科技圈和资本圈最热的词,而明星 AI  创业公司也成为了资本盛宴的主角。不过,相比这些高调的初创公司,经历过产业“概念”兴衰的很多传统芯片在 AI  领域布局更显低调与务实。   近日,集微网在年终走访中发现,早在2016年6月就宣布,发布中国首款人工智能处理器的 中星微 正在发生新的变化。不仅在2017年年底由张韵东带领下的团队推出的“嵌入式神经网络处理器SoC芯片的研发与应用”项目获得了“北京科技进步奖”,公司还组建成立了
[网络通信]
安川首钢:AI加持,工业机器人开启智能化时代
安川电机是全球工业机器人“四大家族”之一,仅这一名头就让人深深感受到它背后深厚的技术底蕴;在中国,安川首钢则是它的承载和执行。 同时,安川首钢也是国内首家专业从事工业机器人制造和销售的公司,见证了我国工业机器人产业在过去20多年里的飞速发展历程,其也在这一过程中深深地扎根于我国的汽车、3C、白色家电、物流、食品加工等行业,尤其在以汽车零部件应用系统的集成上,安川首钢长期处于国内领先地位。 图片来源:OFweek维科网 那么,相比同行,安川首钢的优势是什么? 安川首钢技术中心研发科研发工程师郭超从技术角度分析称:“范围广、速度快这是安川新型YRC1000系列机器人最为明显的优势,我们的产品在汽车行业得到了广泛应用,满足弧焊、点焊、
[机器人]
AI机器人细分领域再延伸助推物业管理行业创新发展
随着人工智能、5G、大数据等技术的迭代升级,人工智能产业发生了质和量的飞跃,并上升至国家战略,根据《新一代人工智能发展规划》,到2025年,人工智能核心产业规模将超过4000亿元。作为人工智能产业皇冠上的明珠,机器人产业也迎来了发展机遇期,后疫情时代,机器人产业更是实现了弯道超车,提前进入快车道,机器人产品在商超、医院、公寓等生活场景的身影日益密集。 出席活动嘉宾合影(企业供图,下同) 在中国共产党迎来100周年之际,机器人继续走进党建,助力党建建设创新发展。4月30日,由广州市物业管理行业协会主办的“学党史 悟思想 办实事 开新局、我为群众办实事,物业协会进社区系列活动--物业及党建机器人‘组团’进社区”活动在广州滨江文化广场
[机器人]
高通即将发布AI专用移动芯片
针对市场AI大潮,高通开发了所谓的神经处理引擎。这是一个软件开发工具包(SDK),可帮助开发人员优化其应用程序,以在高通骁龙Snapdragon 600和800系列处理器上运行AI应用程序。这意味着,如果用户正在构建使用AI(例如图像识别)的应用程序,则可以集成高通的SDK,并且在具有兼容处理器的手机上运行速度更快。 高通公司一年前首次宣布推出神经处理引擎,作为Zeroth平台的一部分。从去年9月起,它一直在与几个合作伙伴一起开发SDK,而今天它宣布开放这个SDK,供所有人使用。 该公司表示,首款整合其SDK的公司之一是Facebook,目前正在使用它来加速其移动应用程序中的增强型现实过滤器。高通公司说,通过使用神经处理引擎,Fa
[手机便携]
英特尔人工智能 解决实际的问题
2018年4月10日至12日,北京——近日,以“应用人工智能”为主题,英特尔与O’Reilly联合主办的中国人工智能大会在京举行,英特尔在会上分享了人工智能实际应用方面的技术和最新创新成果,全方位展示了人工智能全栈解决方案,分享了如何利用英特尔人工智能产品和技术深入挖掘不同行业数据价值,解决实际问题,加速人工智能产业落地的洞察和实践经验。  “英特尔正在不断推动技术和产品创新,以简化和加速人工智能的部署与发展。”英特尔人工智能事业部副总裁、人工智能实验室和软件总经理Arjun Bansal表示:“英特尔拥有业内广泛的人工智能产品组合,持续加大技术研究投资和人才培育,通过与生态产业合作伙伴携手,让人工智能加速在医疗、零售、能源、
[半导体设计/制造]
李开复坚定看好的人工智能 周鸿祎却说存在泡沫
时至今日,智能浪潮扑面而来, 出现了太多的新英雄和失败者,行业内普遍弥漫着兴奋与迷惘的情绪。前方是触手可及的新世界,智能主义必将大行其道,但路到底应该怎么走?先分享几个我对于人工智能 产业的观察。 首先,人工智能产业有泡沫成分。 2016 年我专门跑到西雅图和硅谷去拜访了一些公司,感觉美国现在整个人工智能会成为下一个产业的泡沫,今天出来做一个公司,如果不说自己是用深度学习、人工智能,都不好意思出来混,就像前两年,如果不说自己是O2O,都不好意思去融资一样。 第二,纯粹的人工智能是没有商业模式的。人工智能一定要跟一个领域、一个产业相结合。例如,推出 AlphaGo的DeepMind,是谷歌收购的一家英国公司,下围棋只是他们体现人工智
[嵌入式]
中国AI突进:企业估值比美国贵四倍 应届博士年薪50万
  “Python人才缺口30万,薪资高到没朋友”、“真正0基础入学,90天入门到高薪”,伴随 人工智能 的火热, 人工智能 短期培训班也风生水起,动辄两三万的培训费用,咨询报名者络绎不绝,而其中高薪成为最诱人的广告语,这些机构网站无一例外将薪资放在最显眼的位置。下面就随网络通信小编一起来了解一下相关内容吧。   在过去的一年因为 人工智能 行业急速爆发,巨大的人才缺口将行业人才薪酬推至令人咂舌的水平,抢夺人才背后如何留取和管理人才也成为新的挑战。    从应届生到技术大牛   “人工智能领域应届博士年薪在50万左右,硕士从25万到35万,这一薪资水平相当于2~3年工作经验的普通岗位工程师的薪资。”人工智能企业“流利说”联合创
[网络通信]
你会乘坐人工智能飞行员所操控的航班吗?
不久前,我参加了在德国慕尼黑举行的 “2023年欧洲航空航天技术周” 会议,其间听取了许多关于航空电子行业挑战、法规和技术趋势的主题演讲和讨论。特别值得注意的是,被多次提及的主题之一是人工智能(AI)在航空航天系统中的应用,既包括地面系统也包括航空电子系统。航空航天领域在人工智能应用之路上迈出的每一步都十分谨慎,而我则经常思考这样一个问题——我自己愿意搭乘一架由人工智能飞行员而不是人类飞行员来操控的航班吗? 虽然我们许多人在短期内还不太可能面临这样的决择,但从中长期来看,这一天似乎必定会到来。而且,这是一个应该严肃思考的问题——因为加拿大和日本都已经在ICAO(国际民用航空组织)已于2022年举行的一次会议上提交了报告,应用远
[工业控制]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved