2021年12月12日,中国上海—— 今天,在2021 Wave Summit+上百度深度学习平台飞桨正式发布在Graphcore IPU上实现训练和推理全流程支持的开源代码库,飞桨模型库如Bert、ERNIE等也正逐步在IPU上实现支持。自此,百度飞桨的开发者可以在IPU这一专为机器智能从零设计的创新架构上进行AI模型加速,而IPU的全球用户也可以使用百度飞桨框架探索深度学习。对Graphcore而言,此举将极大地扩展IPU的中文社区,中文生态系统进一步繁荣。
百度飞桨是中国领先的产业级深度学习平台,目前累计开发者数量超过406万,服务企业数量15.7万家,创建了超过47.6万个模型,为中国AI社区的繁荣做出巨大贡献。Graphcore是飞桨硬件生态圈的初始成员之一,作为飞桨的重要硬件合作伙伴,Graphcore将通过云端和数据中心的IPU技术助力飞桨开发者实现AI模型的大幅加速,同时为使用飞桨的企业提供基于IPU的产品方案,帮助飞桨的企业级客户提升数据中心效率。通过大幅提升模型的性能和运行速度,缩短研发周期,加快AI模型落地应用,同时降低计算成本。
目前Graphcore IPU支持通过飞桨完成大规模的模型训练任务,也支持通过飞桨推理库执行高性能的推理任务。双方团队通过在16个IPU组成的IPU-POD16上做数据并行与模型并行,并在Bert-Base模型上进行了精读和吞吐量验证,取得了良好的性能效果。结果证明,运行在IPU硬件上的百度飞桨解决方案,在目前主流的AI训练任务和前沿AI创新模型任务上,可以取得很好的加速效果。IPU良好的系统扩展性使得用户可以根据任务需求灵活进行性能扩展。
百度飞桨产品团队负责人赵乔表示:“Graphcore是百度飞桨一直以来的好朋友和重要伙伴,非常高兴宣布百度飞桨在Graphcore IPU上完成训练和推理的支持,这是我们飞桨硬件生态一次重要的升级。百度飞桨模型库中的模型如Bert在IPU上实现了很好的训练和推理性能。同时,Graphcore的深度学习引擎PopART具有的良好可用性,也支持飞桨在IPU上的适配变得简易。我们将和Graphcore深化合作,将飞桨模型库更多的模型迁移到IPU上,共同打造基于飞桨和IPU的世界级AI解决方案,赋能AI开发者和企业。”
随着Graphcore在中国不断深耕,其中文IPU社区和生态系统在不断扩大。此次引入百度飞桨深度学习平台,除了是其软件Poplar SDK的重要扩充,也为Graphcore客户,尤其是中国客户的工具箱中多放入一件重要工具。通过对百度飞桨的支持,Graphcore支持其客户能够在更多框架上进行探索,IPU硬件架构的潜能优势将得以进一步释放。
Graphcore中国工程总负责人、AI算法科学家金琛表示:“IPU对百度飞桨的支持,是Graphcore Poplar SDK的重要升级,也是IPU生态系统的一次重大更新。百度飞桨是中文AI社区的翘楚,通过与百度飞桨合作,我们希望能够扩大IPU中文社区,让更多中国的开发者能够打破传统硬件的桎梏,在IPU上进行创新突破,帮助他们解决棘手的深度学习难题。”
Graphcore中国工程总负责人、AI算法科学家金琛在2021 Wave Summit+上介绍IPU上的百度飞桨
百度飞桨和Graphcore IPU精神的相通之处,就是开源精神,将权力交给AI开发人员,使他们能够自由地进行创新。Graphcore制造硬件和开发软件都遵循这一宗旨。百度飞桨在IPU上相关的代码和模型代码资源已经在Graphcore GitHub和百度飞桨GitHub开源,在双方的GitHub以及Graphcore的官网开发者页面也附上了详细的教程。同时,使用了飞桨的Bert-Base也已经在Graphcore的Model Garden里开源,广大开发者可以前往双方的资源池进行探索、调取和使用。
关键字:百度飞桨 训练 推理 AI算法 IPU
引用地址:
百度飞桨在Graphcore IPU上实现训练与推理全面支持
推荐阅读最新更新时间:2024-11-12 11:37
AI芯片算法加持 智能社会未来已来
据报道,中国第一场 AI 芯片 产业峰会GTIC 2018上,来自学术界、 芯片 、安防、智能汽车以及无人驾驶等领域的众多专业人士汇聚一堂,为高涨的 AI 芯片 行情再添一把火。下面就随网络通信小编一起来了解一下修改版内容吧。 而在两周前,2018年世界移动通信大会(MWC2018)在西班牙巴塞罗那举行,人工智能替代手机成为当仁不让的主角,Arm、高通、联发科等都在推各自支持人工智能的 AI 芯片或者平台架构,吹响了2018年AI芯片井喷式爆发的号角。同时,算法的整合与优化也成为展示重点,各个芯片厂商都在展台上展示合作伙伴的算法用例,并且多家芯片巨头都将诸如虹软公司(ArcSoft)的算法作为AI芯片平台的用例,不难看出
[网络通信]
失明者的福音:眼睛修复芯片能训练大脑恢复视觉
目前,科学家正在研究一种新型的修复技术,或许将帮助众多失明者恢复视力。这项技术被称为“仿生眼睛”,能感知视觉信号并将信号传递到大脑。 B行为设备植入之前的大脑扫描图像,C行为设备植入之后的图像。可以看到,在患者学会识别一些异常光刺激(如明亮闪光)的时候,会引起大脑活动增强。 北京时间11月28日消息,据估计,全世界大约有4000万失明者,其中许多人都经历了多年缓慢而累积的视力退化,最终失明。目前,科学家正在研究一种新型的修复技术,或许将帮助众多失明者恢复视力。这项技术被称为“仿生眼”,能感知视觉信号并将信号传递到大脑。通过一定的训练,患者的大脑就能重新学会看到物体。 意大利比萨大学的研究者主持了这项研究,他们希
[医疗电子]
在富岳超算上训练大模型,日本联合研究团队发布 Fugaku-LLM
5 月 11 日消息,由多方企业和机构组成的日本联合研究团队昨日发布了 Fugaku-LLM 大模型。该模型的最大特色就是其是在 Arm 架构超算“富岳”上训练的。 Fugaku-LLM 模型的开发于 2023 年 5 月启动,初期参与方包括富岳超算所有者富士通、东京工业大学、日本东北大学和日本理化学研究所(理研)。 而在 2023 年 8 月,另外三家合作方 —— 名古屋大学、CyberAgent(也是游戏企业 Cygames 的母公司)和 HPC-AI 领域创企 Kotoba Technologies 也加入了该模型研发计划。 在昨日发布的新闻稿中,研究团队表示其充分挖掘了富岳超算的性能,将矩阵乘法的计算速度提高了 6 倍,通
[网络通信]
AI边缘推理与数据中心的差别在哪儿
翻译自——EEtimes 虽然推理加速器最初用于数据中心,但它们已经迅速发展到应用程序的边缘推理,如自动驾驶和医学成像。通过这种转变,客户发现,同样的加速器,在数据中心处理图像很顺利,但移到边缘推断方面却显得糟糕。其实原因很简单:一个处理数据池,而另一个处理的是数据流。 当你在batch = 1时进行批处理时,池子里待处理的batch就会很多。在数据中心,客户通常是数据的处理池,比如被标记的照片。其目标是用最少的资源和功耗以及最佳的延迟来处理尽可能多的照片。 另一方面,边缘推断应用程序需要处理数据流。我们通常的相机每秒拍摄30帧,每帧通常是200万像素。通常情况下,每幅图像需要33毫秒,每秒大约30帧。当你有一个图像从
[嵌入式]
多核技术与迈来芯开发出全新人脸识别AI算法模块 使用ToF摄像头
据外媒报道,美国算法与并行计算方案提供商多核技术公司(MulticoreWare)与迈来芯(Melexis)合作开发AI算法,通过使用迈来芯EVK75027 ToF传感器开发出人脸识别算法模块,例如人脸检测、人脸识别、睡意/分心检测和反欺骗检测。 (图片来源:MulticoreWare) 通过使用距离图像来标记精确的面部关键点,多核技术公司增强了内部数据注释工具。通过使用这些信息,该公司创建出一个自定义的带注释的数据集,并用于训练神经网络以进行人脸识别。该系统能够在不同照明设置下准确可靠地运行。 此次合作表明,AI使用ToF摄像头可在大量车内应用领域(例如驾驶员身份验证、睡意检测、驾驶员注意力等)表现出稳健性能。
[汽车电子]
华为公开“训练智能体方法与装置”专利:可提高协作效果
华为技术有限公司 8 月 3 日公开了“训练智能体的方法和装置”专利,公开号 CN113206786A。 企查查专利摘要显示,该申请提供了一种训练智能体的方法,包括: 获取第一智能体的环境信息和第二智能体的环境信息; 根据所述第一智能体的环境信息和所述第二智能体的环境信息生成第一信息; 利用所述第一信息训练所述第一智能体,使得所述第一智能体输出个体认知信息和邻域认知信息,其中,所述第一智能体的邻域认知信息与所述第二智能体的邻域认知信息具有一致性。 IT之家了解到,由于目标智能体的邻域认知信息与邻域智能体的邻域认知信息相同或相近,因此,基于目标智能体的邻域认知信息训练得到的目标智能体提高了目标智能体对邻域
[手机便携]
微软最新的翻译系统是利用深层神经网络人工智能训练技术翻译文本
图:双猴发布会现场测试全语通NI中英翻译 国产翻译机品牌正在步入国际前列,机器翻译的准确率正在赶上真人翻译,虽然在专业领域洽谈商务还需要真人翻译支撑,但长远看机器翻译终将会替代真人翻译。 3月30日,深圳双猴科技有限(以下简称:双猴科技)在深圳中洲万豪酒店发布4款三代翻译机:“全语通MINI”、“全语通PRO”、“全语通BIZ”、“魔脑伴旅”。 双猴科技第三代翻译机搭载的是微软翻译系统,据称微软的翻译系统是利用深层人工智能()训练技术翻译文本,可以将中文新闻的句子翻译成英文,准确率与真人不相上下。 微软表示,它通过来自各种在线报纸约2000条语句样本对这一系统进行了反复,并将测试结果与人类译者的翻译进行了比
[机器人]
AI研究:如何让机器学习算法解释自己的决策?
神经网络的预测能力推动了最近的人工智能热潮,但很难解释他们是如何做出决定的。一项旨在揭示语言处理网络内部工作原理的新技术,只是为揭示这些“黑匣子”而做出的最新努力。下面就随网络通信小编一起来了解一下相关内容吧。 我们发现神经网络如此神秘,这可能并不奇怪,因为它们基本上是基于人类大脑而建立的,我们也在努力破译这些神经网络。他们学习的模型并不像传统的计算机程序那样整齐地存储在数据库中,而是由成千上万的虚拟神经元之间的连接组成。 这些连接不是由人类程序员设定的,相反,神经网络本质上是通过在大量数据中寻找模式来进行编程。因此,虽然你可以测试一个神经网络在照片中检测到猫的效果,但要判断出它们的存在与否,你很难辨明它们的视觉模式
[网络通信]