不仅是CPU或者GPU,企业级人工智能需要更全面的方法

发布者:SereneSunset最新更新时间:2018-05-29 关键字:人工智能 手机看文章 扫描二维码
随时随地手机看文章

 image.png

本文作者:Naveen Rao

英特尔公司全球副总裁兼人工智能产品事业部总经理

 

在5月23日旧金山举行的英特尔人工智能开发者大会上,我们介绍了有关英特尔人工智能产品组合与英特尔Nervana™神经网络处理器的最新情况。这是令人兴奋的一周,英特尔人工智能开发者大会汇集了人工智能领域的顶尖人才。我们意识到,英特尔需要与整个行业进行协作,包括开发者、学术界、软件生态系统等等,来释放人工智能的全部潜力。因此,我很兴奋能够与众多业内人士同台。这包括与我们共同参与演示、研究和实践培训的开发者,也包括来自谷歌*、AWS*、微软*、Novartis*、C3 IoT*的诸多支持者。正是这种广泛的合作帮助我们一起赋能人工智能社区,为加快人工智能领域的技术创新和进步提供所需的硬件和软件支持。


image.png

Naveen Rao发表演讲


在加速向人工智能驱动的未来计算过渡之时,我们需要提供全面的企业级解决方案。这意味着我们的解决方案要提供最广泛的计算能力,并且能够支持从毫瓦级到千瓦级的多种架构。企业级的人工智能还意味着支持和扩展行业已经投资开发的工具、开放式框架和基础架构,以便更好地让研究人员在不同的人工智能工作负载中执行任务。例如人工智能开发者越来越倾向于直接针对开源框架进行编程,而不是针对具体的产品软件平台,这样有助于更快速、更高效的开发。我们在大会上发布的消息涉及所有这些领域,并公布了几家新增的合作伙伴,这都将帮助开发者和我们的客户更快速地从人工智能中受益。


针对多样化的人工智能工作负载而扩展的英特尔人工智能产品组合


英特尔近期的一项调查显示,在我们的美国企业客户中,50%以上都正在转向采用基于英特尔®至强®处理器的现有的云解决方案来满足其对人工智能的初步需求。这其实肯定了英特尔的做法 - 通过提供包括英特尔®至强®处理器、英特尔® Nervana™和英特尔® Movidius™技术以及英特尔® FPGAs在内的广泛的企业级产品,来满足人工智能工作负载的独特要求。


我们今天讨论的一个重要内容是对英特尔至强可扩展处理器的优化。与前一代相比,这些优化大幅提升了训练和推理性能,有利于更多公司充分利用现有基础设施,在迈向人工智能初始阶段的过程中降低总体成本。最新的英特尔Nervana神经网络处理器(NNP)系列也有更新消息分享:英特尔Nervana神经网络处理器有着清晰的设计目标,即实现高计算利用率,以及通过芯片间互联支持真正的模型并行化。行业谈论了很多有关理论峰值性能或TOP/s数字的话题;但现实是,除非架构设计上内存子系统能够支撑这些计算单元的充分利用,否则很多计算是毫无意义的。此外,业内发表的很多性能数据采用了很大的方形矩阵,但这在真实的神经网络中通常是不存在的。


英特尔致力于为神经网络开发一个平衡的架构,其中也包括在低延迟状态下实现芯片间高带宽。我们的神经网络处理器系列上进行的初步性能基准测试显示,利用率和互联方面都取得了极具竞争力的测试结果。具体细节包括:


使用A(1536, 2048)和B(2048, 1536)矩阵大小的矩阵-矩阵乘法(GEMM)运算,在单芯片上实现了高于96.4%的计算利用率1。这意味着在单芯片上实现大约38 TOP/s的实际(非理论)性能1。针对A(6144, 2048)和B(2048, 1536)矩阵大小,支持模型并行训练的多芯片分布式GEMM运算实现了近乎线性的扩展和96.2%的扩展效率2,让多个神经网络处理器能够连接到一起,并打破其它架构面临的内存限制。


在延迟低于790纳秒的情况下,我们测量到了达到89.4%理论带宽的单向芯片间传输效率3,并把它用于2.4Tb/s的高带宽、低延迟互联。


这一切是在总功率低于210瓦的单芯片中实现的,而这只是英特尔Nervana神经网络处理器原型产品(Lake Crest)。该产品的主要目标是从我们的早期合作伙伴那里收集反馈。


我们正在开发第一个商用神经网络处理器产品英特尔Nervana NNP-L1000(Spring Crest),计划在2019年发布。与第一代Lake Crest产品相比,我们预计英特尔Nervana NNP-L1000将实现3-4倍的训练性能。英特尔Nervana NNP-L1000还将支持bfloat16,这是业内广泛采用的针对神经网络的一种数值型数据格式。未来,英特尔将在人工智能产品线上扩大对bfloat16的支持,包括英特尔至强处理器和英特尔FPGA。这是整个全面战略中的一部分,旨在把领先的人工智能训练能力引入到我们的芯片产品组合中。


面向真实世界的人工智能


我们产品的广度让各种规模的机构能够轻松地通过英特尔来开启自己的人工智能之旅。例如,英特尔正在与Novartis合作,使用深度神经网络来加速高内涵筛选——这是早期药品研发的关键元素。双方的合作把训练图片分析模型的时间从11个小时缩短到了31分钟——改善了20多倍4。为了让客户更快速地开发人工智能和物联网应用,英特尔和C3 IoT宣布针对优化的AI硬软件解决方案进行合作 – 一个基于Intel AI技术的C3 IoT AI应用。此外,我们还正在把TensorFlow*、MXNet*、Paddle Paddle*、CNTK*和ONNX*等深度学习框架集成在nGraph之上,后者是一个框架中立的深度神经网络(DNN)模型编译器。我们已经宣布,英特尔人工智能实验室开源了面向Python*的自然语言处理库,帮助研究人员开始自己的自然语言处理算法工作。


计算的未来依赖于我们联合提供企业级解决方案的能力,通过这些解决方案企业可以充分发挥人工智能的潜力。我们迫切地希望可以与社区以及客户一起开发和部署这项变革性技术,并期待在人工智能开发者大会上拥有更精彩的体验。


关键字:人工智能 引用地址:不仅是CPU或者GPU,企业级人工智能需要更全面的方法

上一篇:IPC增发IPC-2221B Gerber附连板生成器用附连测试板
下一篇:Synopsys推出ASIL D等级嵌入式视觉处理器IP

推荐阅读最新更新时间:2024-05-03 02:55

意法半导体新品发布:推出耐高温、支持AI的汽车惯性测量单元
意法半导体(STMicroelectronics,ST)于11月30日宣布,推出一款名为ASM330LHHXG1的新型汽车用惯性测量单元(IMU)。该产品采用了传感器内AI和增强型低功耗操作,能在125°C的温度范围内稳定工作,即使在恶劣环境下也能保持可靠性。 这款新型汽车IMU包含一个3轴加速计和3轴陀螺仪,两个传感器运行时的电流消耗低于800μA,这有助于降低系统的功耗预算,使其可以在始终感知的应用中使用。传感器内部的AI通过使用内置的机器学习核心(MLC)和有限状态机(FSM),能够减轻主机处理器的负担,实现低延迟、节能的事件检测和分类。 ASM330LHHXG1智能传感器的另一个优点是其扩展的温度范围。这使得它可以
[汽车电子]
意法半导体新品发布:推出耐高温、支持<font color='red'>AI</font>的汽车惯性测量单元
人工智能与大数据的关系和影响
  和大数据是当今最火热的两个,二者之间有着密不可分的关系。   人工是指计算机人类智能的能力,包括理解语言、学习、推理、计算、感知和规划等。   而人工智能是一种基于计算机科学的技术,旨在模拟人类的智能行为和思维方式。   而大数据则是指规模巨大、难以处理的数据集合。   大数据是指由各种数据来源产生的大量数据   这些数据来源包括、移动设备、社交媒体、搜索引擎、交易系统等。这些数据的规模非常庞大,通常需要用到先进的数据处理技术和才能进行有效的分析和利用。   人工智能和大数据是密不可分的。大数据提供了足够的数据让,从而使人工智能更加聪明、精确和准确。同时,人工智能也能够为大数
[机器人]
马文·明斯基,将一生奉献给了人工智能事业
“智能问题看起来深不见底,我想这是值得我奉献一生的领域。” 在70年的人工智能浪潮中,马文·明斯基(Marvin Minsky)是一个如雷贯耳的名字,与机器学习、神经网络、虚拟现实、框架理论等热门名词紧紧联系在一起。他是定义和发展“人工智能”的先驱者之一,也是人工智能领域的首位图灵奖获得者,被尊称为“人工智能之父”。他的学术贡献璀璨夺目,横跨人工智能、机器人、图形与显微镜技术、数学、认知心理学等多个学科领域。 探究智能的狂热 1927年,Marvin Minsky出生于美国纽约的一个犹太家庭。他从小在私立学校接受教育,高中毕业后遵循犹太传统应征入伍,在二战末期经历了两年海军生涯。退伍后,他在哈佛大学主修数学,同时选
[嵌入式]
马文·明斯基,将一生奉献给了<font color='red'>人工智能</font>事业
LG电子将转向 重点发力人工智能与机器人业务
    LG电子首席执行官乔晟金(Jo Seong-jin)表示,LG作为韩国消费电子行业的巨头,今年之内将改变方向,加强人工智能和机器人业务的发展,这也是未来公司业绩增长策略的一部分。 LG 参加了2018 年德国柏林国际消费电子展(IFA),乔晟金8月31日在电子展上表示,公司计划聘请大批工程师,给发展人工智能和机器人业务提供更好的技术基础。 乔晟金反复声明,机器人和人工智能是未来的趋势,公司要突破目前的领域,引领商界。他说:“世界正要迎来人工智能的时代,顺应潮流十分重要。” 乔晟金谈到机器人业务方面,公司会把重点放在家用机器人、公用机器和工业机器上,也要在研发可穿戴器械设备领域领先。公司还在电子展上推出了CLOi Sui
[手机便携]
云端、物联网、AI等技术助力,智能家居市场望明显增长
上周台湾建筑大厂远雄建设开记者会,介绍该公司旗下的智能二代宅,透过云端、 物联网 、 AI 等技术的整合,擘划出未来居家生活的新面貌,从远雄的相关动作与国外近年来的家电连网进展,可以看出智能住宅这个老议题已再次加温, 尤其是在如Amazon这类型语音智能助理的带动下,近期可望有明显成长。   说智能住宅是老议题一点都不为过,早在10几年前,包括Intel等科技大厂就曾经推动过数字家庭,其诉求是将家中的PC、音响、电视等影音设备串流,不过当时只有科技产业一头热,大型家电业者多持观望态度,后来不了了之, 在数字家庭息声不久后,换工业计算机业者喊出智能住宅,与之前数字家庭不同,智能住宅主要以控制技术为主,应用的设备是家中灯光、窗帘
[嵌入式]
人工智能和机器人结合 打造10000美元的性爱机器人
  美国性爱娃娃制造商RealDoll正将人工智能()和机器人结合起来,开发出一款可以定制性格,和人进行情感交流的性爱机器人。   新产品有好几个部分,都将在今明两年推出。首先是 AI ,预计将于 4 月 15 日推出;接着是“机器人头”系统,将于年底发布;而虚拟现实平台则要等到明年。   价格自然也不菲,光是这个机器人头售价就高达 10000 美元。而除了智能的部分,身体也非常逼真。   每个仿真硅胶“RealDoll”性爱机器人都拥有灵活的骨骼,从开始生产到最终成品出炉大约需要耗费 80 小时,不仅如此,这款性爱机器人还可以定制生殖器和更换面孔。   在加州圣马科斯厄比斯创意( Abyss CreaTIon)
[机器人]
NVIDIA Omniverse让AI训练变得更加简单易用
Rendered. 将 NVIDIA Omniverse Replat 集成到其合成数据生成平台,使 AI 训练变得更加简单易用。 Rendered.ai 正在通过其合成数据生成(G)平台即服务(PaaS)为、数据科学家等人员简化 AI 训练。 训练 AI 模型需要大量高质量、多样化且无偏向的数据集。在对 AI 的需求日益增加的情况下,获得这些数据的难度很大且成本高昂。 Rendered.ai 平台即服务的解决方法是,生成符合现实的合成数据(从 3D 中创建的数据)来训练计算机视觉模型。 Rendered.ai 创始人兼首席执行官 Nathan Kundtz 表示:“真实世
[机器人]
英特尔自研AI工具,将耗时数周的芯片设计周期缩短至几个小时
增强型人工智能为Meteor Lake处理器的设计提速,并将在未来的客户端处理器家族中得到应用。 Olena Zhu博士,英特尔客户端计算事业部高级首席工程师及人工智能解决方案架构师 (来源:英特尔公司) 数十年来,我们需要将科学与艺术相结合,以决定将热敏传感器置于英特尔客户端处理器的何处。 电路设计师会参考历史数据,来确定将热感应器放置在现代笔记本电脑的中央处理器(CPU)的哪个位置。他们还会依靠经验判断热点容易出现的区域。这个复杂的流程可能需要耗费6周时间进行测试,包括模拟工作负载,优化传感器位置,然后重新开始整个步骤。 如今,得益于英特尔工程师内部研发的一种新的增强智能工具,系统级芯片的设计师无需再等6周
[半导体设计/制造]
英特尔自研<font color='red'>AI</font>工具,将耗时数周的芯片设计周期缩短至几个小时
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
随便看看
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved