英特尔人工智能——专为实际应用打造的工具

发布者:HeavenlyClouds最新更新时间:2018-11-01 关键字:人工智能  英特尔 手机看文章 扫描二维码
随时随地手机看文章

如今人工智能 (AI) 的发展迎来了令人振奋的时刻。曾经只有具备深厚专业知识积累的公司才有可能使用人工智能,但短短几年后,随着软件工具、生态系统和硬件开发的日趋成熟,越来越多的公司开始应用人工智能,英特尔的众多客户通过人工智能技术在各种行业案例中取得了变革性的成功。同时我们也发现,并不存在某个单一的“最佳”硬件能够运行各种各样的人工智能应用。因为人工智能的形式是多种多样的,不同的应用也决定了从数据中心到边缘再到设备所需的硬件能力都会有所差别,因此我们需要更加多样化的硬件产品组合来满足不同的需求。英特尔人工智能产品能够满足多种多样的人工智能应用需求,在各种应用场景中都将为英特尔客户带来最高的回报。


从擅长对大量非结构化语音和文本数据进行训练和推理的英特尔®至强®可扩展处理器,到为实时推理提供出色吞吐量和低延迟的英特尔® FPGA,再到为摄像头提供超低功耗推理的英特尔® Movidius™视觉处理单元 (VPU),以及即将推出的英特尔® Nervana™神经网络处理器(英特尔® Nervana™ NNP),无论数据是存在于设备还是边缘,是数据中心还是在云上,英特尔提供了一个深度硅芯片基础,来实现数据中心的创新。除了硬件平台,英特尔在软件上也在进行大量投资,让不同的产品组合之间可以转换功能,从而不受限制地将人工智能带到各种应用程序中去。例如nGraph™这样的开源项目,降低了在不同硬件平台对不同深度学习框架(TensorFlow*、MXNet*、PyTorch*等)进行优化的难度,使得开发人员可以向其客户提供最佳的体验。

 

采用英特尔®至强®可扩展处理器进行高级深度学习训练


挑战:通过自动分析显微镜图像中数千个不同的个体特性发现新的治疗方法,这些图像尺寸远大于传统深度学习数据集中的图像尺寸

解决方案:利用基于英特尔至强可扩展处理器平台的大内存容量和高性能计算能力


高内涵筛选是药物研发的重要工具,这是一项极具挑战且极耗时的工作,需要从图像中提取数千个预定义特性。在英特尔以数据为中心创新峰会上,我们谈到了诺华正在与英特尔合作,利用深度学习技术来加快细胞培养显微镜图像的分析,以研究各种治疗方法的效果。由于使用了完整的显微镜图像,本评估中的图像尺寸比普通深度学习基准中使用的图像尺寸大得多,是ImageNet* 数据集中图像尺寸的26倍以上。


image.png


由于训练模型中的参数数量多,所用图像的尺寸大、数量多,便对计算和内存能力提出了更高的要求。研究团队使用了英特尔至强可扩展处理器、英特尔® Omni-Path架构和TensorFlow v1.7.0搭建的系统进行训练,把训练时间节省了20倍。英特尔®硬件可支持卓越的内存容量,支持每秒处理120多张3.9兆像素的图像。


正如案例所示,CPU架构更能满足很多现实情况中的深度学习应用需求,基于英特尔至强可扩展处理器的平台性能通过持续地投资也在不断增强。自平台推出以来,其针对流行框架的训练速度提升了1.4倍以上,而INT8推理速度则提升了近5.4倍。随着新一代英特尔至强可扩展处理器的推出,推理速度更有望提升至11倍。未来对英特尔®傲腾™ 数据中心持久内存的平台支持,还将扩展CPU附近的内存容量,以支持对更大数据集的训练。在创新峰会上,我们还宣布推出英特尔®DL Boost,这是一套旨在加快人工智能深度学习速度的处理器技术。Cascade Lake还将采用矢量神经网络指令集(VNNI),以前需要采用三条指令,而现在只需要一条指令即可实现。Cooper Lake是继Cascade Lake之后的又一款英特尔至强可扩展处理器,将整合英特尔®DL Boost功能(Bfloat16)以提升人工智能/深度学习训练性能。


正如英特尔® 精选解决方案,我们致力于简化客户对英特尔至强处理器的全栈部署。Apache Spark*上针对BigDL的全新英特尔® 精选解决方案配置是我们与阿里巴巴、亚马逊、中国电信、微软和Telefonica等行业领先企业合作的成果,这也是我们从数百次部署BigDL中获得的重要经验,旨在提供配置让客户能够在现有数据湖快速部署人工智能功能。该解决方案涵盖硬件和软件组件,是我们第一个面向人工智能的英特尔® 精选解决方案。

 

采用英特尔® FPGA进行实时深度学习推理


挑战:开发可灵活扩展的实时深度学习平台,可跨多个微软用例

解决方案:利用英特尔® Arria® FPGA的微软Project Brainwave*硬件架构

微软Project Brainwave是一个深度学习加速平台,它是基于自适应、节能、高通量的英特尔FPGA构建的。由于其经济性和极低延迟等特点,Project Brainwave能够实现实时推理。在不断发展的人工智能环境中,FPGA能够重新编程以获得最高性能,是搜索、语音识别、视频分析等很多深度学习应用中的重要工具。


微软最近推出由Project Brainwave提供支持的Azure机器学习加速硬件。这项服务让开发人员和数据科学家能够在Azure和边缘计算中运行实时模型,应用领域涵盖制造业、零售业和医疗保健等。


微软还将Project Brainwave应用于新的必应*搜索功能,以缩短搜索时间并让搜索结果更加智能化。必应通过机器学习和阅读理解能快速提供智能化答案,帮助用户更快地找到想要的答案,而不是提供链接列表让用户去手动检查答案。英特尔FPGA能让必应将模型的延迟缩短到10倍以上,同时将模型尺寸增加10 倍。

 

采用英特尔® Movidius™ Myriad™ 视觉处理单元,在边缘端实现视觉智能

挑战:自动捕捉和管理家人、朋友和宠物的动态照片,在边缘设备完成视觉处理

解决方案:搭载英特尔® Movidius™ Myriad™ 2视觉处理单元 (VPU)的Google Clips*无线智能相机

借助英特尔Movidius低功耗、高性能的VPU,谷歌实现了对Google Clips相机的构想。使用英特尔Movidius Myriad 2 VPU,可以直接在相机上实时运行高级机器学习算法,这可以帮助谷歌完善相机功能,降低功耗,并支持离线使用。

英特尔Movidius VPU的目标应用包括嵌入式深度神经网络、姿态估计、3D深度感测和手势/眼睛跟踪等。随着“相机互联网”的爆炸式增长,英特尔Movidius VPU为创新应用带来了多种功能。此外在设备上直接进行人工智能处理也更符合隐私和安全保护的规范。上述设备以及未来的英特尔Movidius VPU将继续为视频分析、机器人和增强现实等应用领域带来价值。

 

采用英特尔® Nervana™ 神经网络处理器进行新一代训练和推理


挑战:利用全新构建的架构打破当前的系统瓶颈,支持新一代突破性深度学习解决方案

解决方案:即将上市的英特尔Nervana神经网络处理器


随着人工智能的发展,模型的复杂度不断增加,对内存的需求也越来越大。深度学习的进一步发展需要解决内存限制的问题,而当前的解决方案无法利用所有可用的计算,数据科学家和研究人员逐渐意识到我们需要专用的芯片来支持深度学习训练和推理。英特尔Nervana神经网络处理器提供了一种全新的解决方案,它专门为支持深度学习设计和构建,目的是为了解决内存的问题。


英特尔Nervana NNP首先考虑内存,它采用了大量高带宽内存和SRAM,更靠近实际进行计算的位置,也就是说芯片上能够存储更多的模型参数,可以有效节省功耗并提升性能。英特尔Nervana NNP支持大多数深度学习基元,同时让核心硬件组件尽可能高效的工作,确保其他应用(例如图形)不会从深度学习应用中占用内存。此外,英特尔 Nervana NNP的高速片内和片外互连支持大规模双向数据传输,能够在多个机箱之间连接多个处理器,可以作为一个更大的高效芯片来容纳更大的模型,从而获得更加深入的洞察。

英特尔与Lake Crest软件开发工具(SDV)方面的主要客户合作进行NNP 开发、测试和反馈。在推出第一款商用Nervana NNP时,以上功能都能够实现。随着人工智能领域的进一步发展,我迫不及待地想从这些突破性芯片中看到英特尔客户的创新和更多见解。

 

简化异构部署和加速人工智能创新的软件

框架和库对于推动人工智能的发展至关重要,硬件需要同软件结合来发挥最大的效用。英特尔致力于通过普遍适用的多架构解决方案,将所有人工智能都集成到一个软件集合下。比如开源nGraph编译器等项目是非常重要的,因为我们无需把时间浪费在重新发明工具上。

我们认为,英特尔有责任优化软件,提供工具,让硬件发挥最佳性能,并简化模型开发和现实部署之间的流程。利用英特尔开源性能库,可以从深度学习的直接优化中获得更多洞察;深度学习编译器nGraph已经开源,能够跨多个框架和架构运行训练和推理;使用OpenVINO™可以快速优化预训练模型,并将视频神经网络部署到各种硬件上;BigDL 是运行在Apache Spark和Hadoop*集群上的分布式深度学习库,通过BigDL 可以处理大量数据。

 

针对数据时代提供优化的客户解决方案

英特尔正在帮助客户更好地处理每天生成的大量数据并从中获得价值。我们致力于提供全面的硬件和工具组合,实现人工智能愿景。在实际应用中,人工智能的复杂性要求我们将正确的硬件和软件结合起来从而实现成功部署。英特尔拥有业内熟知的全栈实力技术生态系统,提供不同功能工具,推动人工智能的发展。


关键字:人工智能  英特尔 引用地址:英特尔人工智能——专为实际应用打造的工具

上一篇:布局人工智能,格芯全资子公司Avera Semi正式成立
下一篇:罗姆:用半导体技术引领物联网时代向前

推荐阅读最新更新时间:2024-03-30 23:55

AMD聘英特尔前高管格斯塔森为首席产品架构师
北京时间8月29日早间消息,AMD今天宣布,古斯塔夫森定律的发明者约翰·格斯塔森(John Gustafson)已经加盟AMD,出任图形业务部门高级研究员兼首席产品架构师。   在这个岗位上,格斯塔森将为AMD图形业务部门建立技术远景,为AMD Radeon和AMD FirePro产品系列推动技术路线图和平台的发展,同时还将负责新技术的规划和业务目标的执行工作。格斯塔森的办公地点将设在桑尼韦尔,他将帮助AMD在内部和外部宣传公司在图形业务领域中所占据的领导地位。   格斯塔森拥有35年的计算行业从业经验,他在加盟AMD以前供职于英特尔(微博),曾负责领导后者的eXtreme Technologies实验室,处理有关节能计
[手机便携]
新型手掌识别技术面世 结构丰富且更安全
如今,随着人工智能领域的发展,生物识别技术正迎来全面爆发。除了传统的指纹识别,近年来人脸识别、虹膜识别、语音识别等都应用迅速,而现在,新型掌纹识别也正式面世。   根据外媒TechCrunch的报道,两位前LeapMotion员工认为他们已经解决了密码和身份管理的长期问题。这两位前LeapMotion员工成立了一家RedrockBiometrics公司,该公司的技术正在向世界上大量的身份识别技术、PIN码、密码和语音识别技术宣战。新的识别技术结合了现成的硬件和专有软件,以识别掌纹来验证用户身份。   RedrockBiometrics公司董事长LennyKontsevich表示,该公司看到
[安防电子]
英特尔第二代10nm芯片Ice Lake露出踪影,更高缓存和性能?
集微网消息,近日英特尔去年六月宣布已设计完成的Ice Lake芯片出现在了跑分平台Geekbench上。由于并不是最后的成品,所以从成绩来看得分并不高,单核跑分为4151,多核得分为7945。         这款双核四线程芯片搭载了DDR4 SODIMM内存,基频为2.6Ghz,一级指令缓存容量依然是每核心32KB,一级数据缓存则从每核心32KB增加到每核心48KB,二级缓存每核心512KB更是翻了一番。三级缓存则没有变化,在这款双核心上仍是共享式4MB。         尽管英特尔曾表示自己的10nm在工艺上远超友商台积电和三星的7nm,但实际拿出的基于Cannon Lake的 Core i3-8121U连核显都
[手机便携]
纳微公布人工智能数据中心电源技术路线图,预计12个月功率密度提升三倍
专注于氮化镓(GaN)功率IC和碳化硅(SiC)技术的纳微半导体(Navitas Semiconductor)日前公布了最新的人工智能数据中心技术路线图。 该公司表示,正在考虑将功率密度提高 3 倍,以支持预计未来 12-18 个月人工智能功率需求的类似指数增长。 传统 CPU 通常仅需要 300W,而数据中心交流/直流电源通常可提供相当于 10 个 CPU,也就是3kW的功率。 然而,像 NVIDIA 的“Grace Hopper”H100 这样的高性能 AI 处理器功耗已经到了700W,下一代“Blackwell”B100 和 B200 芯片预计到明年将增加到 1000W 或更高。 为了满足这种指数级的功率增长
[电源管理]
多家汽车制造商参与百度Apollo计划:自动驾驶的路还很长
即使AI被浇了冷水,但是在智能驾驶、自动驾驶领域,几乎所有车企都在ALL IN。 7月3日,在百度2019年度AI开发者大会上,百度创始人、董事长兼首席执行官李彦宏在发表百度自动驾驶Apollo计划的演讲时被当众“泼冷水”,随后被网友戏称为“宏颜获水”的话题登上了当日的微博热搜榜。对此,百度官方回应,有人给AI泼冷水,AI前进的道路上会有各种各样想象不到的事情发生,但我们前行的决心不会改变。 Apollo已有156家合作伙伴 在这场泼水闹剧背后,百度自动驾驶Apollo计划也再次受到了关注,有关自动驾驶级别的话题也再次吸引了汽车行业的目光,几年前关于究竟是在L3级别上循序渐进还是直接跨越到L4级别的争论也有了答案。根据李彦
[嵌入式]
基于UDP协议的ARM、X86平台之间的通讯方案
  0 引言   随着人工智能的应用,ARM产品已经遍布到各个领域:工业控制、无线通讯领域、消费类电子产品、成像和安全产品,包括现在流行的数码相机和打印机中绝大部分采用ARM技术,手机中的32位SIM智能卡也采用了ARM技术。除此以外,ARM微处理器及技术还应用到许多不同的领域,并会在将来取得更加广泛的应用,因此,ARM与其它平台之间通讯就显得尤为重要。   1.UDP协议本质   UDP协议是英文User Datagram Protocol的缩写,即用户数据报协议,主要用来支持那些需要在计算机之间传输数据的网络应用。包括网络视频会议系统在内的众多客户/服务器模式的网络应用都需要使用UDP协议。UDP协议从问世至今已经被使用
[单片机]
人工智能的普及,未来三年内将迫使1.2人重新接受职训
根据 IBM 的一项研究发现,未来三年因人工智能普及,将会有 1.2 亿劳工将重新接受职训。 人工智能 (AI)发展迅速,根据IBM研究,未来三年,全球12大经济体将有最多1.2亿名劳工,可能得因AI及自动化大量普及而重新接受职训。 IBM商业价值研究院(IBM Institute for Business Value) 6日在最新发布的研究中并指出,在接受访问的执行长(CEO)当中,仅41%表示他们拥有适当的人才、 技能及资源来执行企业的营运策略。 这份调查访问全球48个国家中、超过5,670位执行长。 研究显示,透过职训来弥补劳工技能差距的时间,短短四年内就增加了10倍以上。 2014年企业平均只需进行三天的训练即
[嵌入式]
人工智能玩具或侵犯儿童隐私 安全性遭多国质疑
据外媒报道,法国信息与自由全国委员会警告,近年流行与孩子互动的人工智能玩具安全性不足,可能不利儿童的隐私。   据报道,该委员会针对i-Que机器人和凯拉娃娃(Cayla)两款智慧玩具,要求业者加强安全,以免有心人借此搜集孩子和周边环境的个人信息,例如声音、孩子与玩具对话的内容等。   经过测试,法国信息与自由全国委员会发现,有心人在距离玩具9米远处,就可用手机与玩具联机,即使人在建筑物外面,也可听见或录下孩子与玩具的对话,甚至其他在房子里的声音。 资料图片:凯拉娃娃(Cayla)。 法国《费加洛报》举出联机玩具可造成的危害,例如2015年,有人通过联机玩具取得数百万名父母及儿童的个人资料,包括孩子的照片;今年也发生过联机
[安防电子]
小广播
添点儿料...
无论热点新闻、行业分析、技术干货……
最新物联网文章
换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved