下一波人工智能将更加强大

2020-05-27来源: EEWORLD关键字:人工智能  RNN

翻译自——nextplatform

 

 

人工智能是一个涵盖图像识别、自然语言处理(NLP)和机器人等多方面维度的广泛领域。AI也在以一种有时看似疯狂的速度发展,因此很难跟上正在发生的一切。

 

不出所料,许多组织转向他们的IT供应商合作伙伴,帮助他们开发和部署AI解决方案,以最好地满足他们的需求。大卫·埃里森是联想公司的高级人工智能数据科学家,他的职责包括使用先进的人工智能技术为客户组织提供解决方案,同时在内部支持联想全球数据中心集团的整体人工智能战略。

 

联想已投入商业运营的项目包括利用卷积神经网络从图像中提取特征,并将其归类为缺陷,以检测工厂的制造缺陷。联想还为一家赛车公司开发了一套计算机视觉系统,以决定是否应该让特定的汽车进入维修站进行维修。

 

埃利森表示,今年和不久的将来,人工智能的主要趋势包括基于计算机视觉的应用程序、用于训练人工智能模型的数据生成和数据标记算法的开发,以及基于转换模型的自然语言处理的快速进展。

 

联想对人工智能近期主要趋势有如下展望:

 

计算机视觉

 

在计算机视觉方面,开发人员和研究人员现在开始探索将这种能力与人工智能的其他一些领域相结合的实用方法,比如机器人技术或自动应用图像字幕等应用的自然语言处理。据埃里森介绍,这部分是因为计算机视觉的一些基本问题已经被证明很难解决,研究人员正在寻找新的方法来解决这些问题,而不是简单地推动研究领域向前发展。

 

埃里森:“我认为我们在解决一些核心的计算机视觉任务时遇到了问题,比如3D投影,当你看到一张图片,一栋建筑的二维图像,人类的大脑可以将其推断成三维形状,但机器很难做到这一点。”在这方面已经有很多研究,但这是一个尚未解决的核心问题,我认为人们会感到沮丧,会尝试一些新东西,或者尝试将它与其他领域相结合,找到更好的用途。”

 

埃里森认为,这就是为什么机器人技术是目前最广泛研究的人工智能领域之一,因为它为人们提供了一个明确的目标。他列举的例子包括使人工智能能够使用视觉感应在其周围的空间中安全移动——无论是制造工厂的机械臂,还是使用人工智能导航到目的地的自动车辆。

 

训练数据

 

熟悉人工智能的人会知道,成功训练一个模型的关键因素之一是数据,这需要大量的数据。事实上,它所训练的数据越多,就越能更好地交付你所寻求的结果。据埃里森不是,计算机视觉目前很困难,因为用于训练模型的数据集没有包含足够多的样本。例如,吉布森三维空间数据库(Gibson Database of 3D Spaces)是一个广泛使用的数据集,用于训练模型在室内空间中导航,它包括572栋完整的建筑,共1447层。虽然令人印象深刻,但这不太可能是一个人工智能系统在现实世界中可能遇到的全面集合。

 

当物体的方向与计算机视觉模型所训练的方向不同时,也会出现类似的问题。在被广泛用于人工智能训练的ImageNet数据集中,埃里森:“一把椅子只是一张椅子的照片,面对着镜头。如果你把椅子翻过来,电脑视觉应用程序突然就认不出它了。”

 

这个缺点是一个名为ObjectNet的新数据集的灵感来源,它以不同的配置显示日常项目,例如椅子翻转或倒置。这个训练集被用来解决计算机视觉的一些缺点,例如不能识别方向不正常或部分模糊的物体。

 

但是为人工智能训练获取足够大和多样化的数据集的问题仍然存在,这导致了埃里森发现的另一个主要趋势,即首先使用人工智能来生成数据集。

 

自我监督和综合数据

 

数据集需要大量的人工数据标签,因此越来越多的研究项目现在都集中在自我监督算法上,它可以获取已经收集到的数据,并让计算机自动给数据贴上标签。

 

埃里森解释:“一个典型的例子就是一个具有计算机视觉应用和接近传感器机器人。计算机视觉能够比接近传感器看得更远。但是当机器人向前移动时,出现在计算机视觉中的东西最终会以物体的形式出现在近距离传感器中。”根据传感器的数据,回溯到物体第一次被发现的时间,然后对其进行标记。

 

人工智能系统一旦部署就不太可能遇到这样的问题,因此可能无法在训练数据集中表示出来,这是开发人员面临的另一个挑战。然而,如果这些边缘情况代表了真实场景,那么就需要考虑这些情况,以确保AI模型正确地处理它们。

 

“关键的例子是自动驾驶。在你的数据集中有多少次在昏暗的暴风雪中开车上山?你的数据集中不会有很多这样的情况,所以他们本质上必须做模拟数据。”

 

换句话说,边缘案例是通过使用合成数据来处理的,合成数据是使用各种方法来创建的,例如生成模型。但这也产生了一个问题,即数据科学家或开发人员如何才能确保这些合成数据准确地反映出人工智能在现实生活中会遇到什么情况。

 

“这很关键,”埃里森承认,但到目前为止的解决方案只是生成更多的数据,并希望这将用足够的合成数据填充那些用例。同时也也使用了神经网络自动编码器或更复杂的生成对抗网络(GANs)等方法,其中一个网络创建合成数据,另一个网络用于判断候选数据的质量。

 

埃里森:“所以这是一种自我训练,来模拟出足够现实的案例。你同时训练两个神经网络,一个生成这些例子,一个判断这些例子,你希望最终得到一些更现实的东西。”

 

GANs已经被用于生成数据的一个很好的例子就是“深度伪造”技术,这种技术已经被用于创建逼真的人脸,或者改变视频,使视频中的人看起来像是在单独的音轨中说话。据埃里森介绍,这表明了这类模型已经达到的比较复杂程度。

 

自然语言处理

 

尽管如此,基于转换的深度学习模式是过去几年在自然语言处理领域的成功案例之一,埃里森相信这些模式将继续占据主导地位。这是因为它们已经发展到能够识别句子之间的依赖关系和连接,而在早期的模型中使用的循环神经网络(RNN)[1]本质上是连续的,并且往往会丢失单词的上下文。

 

“一个带有隐藏的多头传感器的转换器,会添加规范层和前馈层,但它没有所有的反馈机制,而这些反馈机制会减慢处理速度,所以他们能够看到更大的区域。”

 

按照埃里森的说法,这对模型解释含义的能力有影响,而RNN在多个句子中识别同一个实体时存在问题。一个算法很难做出这两个句子之间的飞跃,递归神经网络在这方面存在问题。

 

这种架构使得变压器(transformers)在许多最近开发的NLP模型中扮演了重要的角色,例如谷歌的BERT和OpenAI的GPS -2,以及Facebook的RoBERTa和微软的MT-DNN,它们在NLP任务中显示出了巨大的潜力,例如文档分类、情感分析、问题回答和句子相似性。

 

延伸阅读——我们现在的位置——充满了弱人工智能的世界

 

现在的弱人工智能系统并不吓人。最糟糕的情况,无非是代码没写好,程序出故障,造成了单独的灾难,比如造成停电、核电站故障、金融市场崩盘等等。

 

超人工智能确实会比人类思考的快很多,但是真正的差别其实是在智能的质量而不是速度上。用人类来做比喻,人类之所以比猩猩智能很多,真正的差别并不是思考的速度,而是人类的大脑有一些独特而复杂的认知模块,这些模块让我们能够进行复杂的语言呈现、长期规划、或者抽象思考等等,而猩猩的脑子是做不来这些的。就算你把猩猩的脑子加速几千倍,它还是没有办法在人类的层次思考的,它依然不知道怎样用特定的工具来搭建精巧的模型——人类的很多认知能力是猩猩永远比不上的,你给猩猩再多的时间也不行。

 

 

就像在首届的世界智能大会上阿里巴巴团体董事局主席马云宣布演讲,讨论了人类与与人工智能的关系~以及人类和将来的关系。英语科班出生的马云关于人工智能~大数据等新词汇的翻译进行抨击,比方说人工智能,是人们把本人看得太高了,由于人类在智能上基本比不上机器的;大数据的翻译会给人形成误会的,以为大数据就是“数据量大”,而马云看来大数据就是海量的数据加上大计算的。

 

 

“人就应当是人,机器应当是机器”,马云以为在人工智能社会万物应当领有像人一样去学习的能力~而不是说像人一样的。这个是源于人类对人工智能缺少清楚的定义的。 关于将来的智能世界来说在马云看来咱们还只是婴幼儿的,关于人工智能的理解十分的幼稚。“人工智能应当去处理人处理不了的问题,了解人不能了解的东西”,所以他仍然保持此前他关于AlphaGo的意见,人类跟AlphaGo在围棋的较量就是一个悲剧的。而在100年之后人类甚至会因而以为惭愧的。

 

人工智能能够代替的工作绝大多数是重复性极强的工作,当人工智能帮助人类去做这些重复枯燥的工作之后,这些人可以去做更有价值的事情,促进人类的整体进步。

 

 

 

 


[1] 递归神经网络(RNN)是两种人工神经网络的总称。一种是时间递归神经网络(recurrent neural network),另一种是结构递归神经网络(recursive neural network)。时间递归神经网络的神经元间连接构成有向图,而结构递归神经网络利用相似的神经网络结构递归构造更为复杂的深度网络。两者训练的算法不同,但属于同一算法变体(百度百科)。本节我们重点介绍时间递归神经网络,下面提到RNN特指时间递归神经网络。


关键字:人工智能  RNN 编辑:muyan 引用地址:http://news.eeworld.com.cn/IoT/ic498422.html 本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:新思科技发布《2020年开源安全和风险分析》报告
下一篇:欧盟拟设7500亿欧元经济复苏基金:提高5G、人工智能等竞争

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

讯飞智能学习机来了,后浪们准备好了吗?
2020 年,对于全国人民来说都是新的挑战伴随着新的风口。前不久,后浪刚刚被推到时代舞台的前面,紧接着,一股携带浓厚气息的摆摊风潮也席卷互联网,眼看着各行各业都能在摆摊业各司其职,一向行事低调的讯飞智能学习机希望这次能够拥有姓名!你问实力吗?科大讯飞是国内知名科技大厂,被评选为“全球 50 大最聪明的公司”,在人工智能领域是行业佼佼者。科大讯飞智慧教育,历经 16 年,已在全国 31 个省级行政区域 35000 所学校进行了应用实践,服务过亿师生。讯飞智能学习机就是一款人工智能技术和教学大数据有效结合的智能学习提分产品。它围绕考试场景设计 1+5+2 高分模型,运用一套科学有效已验证的智慧学习方法来帮助孩子高效快速提升成绩。你问
发表于 2020-06-06
讯飞智能学习机来了,后浪们准备好了吗?
地平线蝉联最佳汽车解决方案奖,车规级征程2获专业认可
边缘人工智能与视觉联盟 (Edge AI and Vision Alliance) 公布了 2020 年度最佳视觉产品奖,地平线征程 2 车规级 AI 芯片荣膺“最佳汽车解决方案”。这是继地平线 Matrix 自动驾驶计算平台于 2019 年斩获该奖项之后,地平线再次获得该国际行业联盟的专业认可。 地平线征程 2 车规级 AI 芯片荣膺“最佳汽车解决方案” 边缘人工智能与视觉联盟,前身为嵌入式视觉联盟 (Embedded Vision Alliance),成立于 2011 年,是由 100 多家领先公司组成的国际性行业联盟,致力于计算机视觉和边缘 AI 技术的创新和落地应用。同“最佳汽车解决方案
发表于 2020-06-06
地平线蝉联最佳汽车解决方案奖,车规级征程2获专业认可
旷世中止港股上市消息不实,是否因遭国际贸易制裁拖慢?
近日有多个消息称,多个接近旷视高层的人士表示,旷视中止了港股上市进程,接下来公司将进一步讨论在港股或者 A 股上市的可能性。 对此,旷视科技表示,科创板支持和鼓励“硬科技”企业上市,是中国科技企业发展的好机遇,旷视正在积极考虑。同时,中止港股上市消息不属实。  去年 8 月 25 日,旷视科技于在香港提交了上市申请。随后,旷视科技遭遇了国际贸易和采购方面变数,该公司在港交所寻求上市许可时,被要求提供更多信息。 旷视香港 IPO 之路传出受阻消息。到了今年 1 月 6 日,中国人工智能企业旷视科技申请在香港证券交易所上市已获批准,融资 5 亿美元的 IPO 计划重新回到正轨。对于上市过程中
发表于 2020-06-03
旷世中止港股上市消息不实,是否因遭国际贸易制裁拖慢?
汽车安全系统新动向 主动安全人工智能化
林肯航海家配置相当丰富,全新12.3英寸全数字仪表盘更清晰的画面与数字显示,搭配丰富的个性化设置。按键式换挡将日常驾驶操控化繁为简。独家搭载哈曼旗下顶级音响品牌Revel 锐威音响系统,为你带来美妙的听觉盛宴。22向电动调节高级舒享座椅配备Active MoTIon按摩功能,同时自带加热与通风。由著名苏格兰皮革生产商Bridge of Weir度身定制,顶级牛皮、法式缝线以及天然实木的完美组合,带来超乎期待的豪华质感。整车静音方面由于优秀的空气动力学设计,大幅降低风噪。前后车窗采用声学夹层玻璃,以及丰富的隔音材质,带来绝佳的路噪抑制和隔绝。双排气口和油箱内隔音层设计,进一步降低噪音。ANC主动降噪系统得加入,可以智能感应行车过程中
发表于 2020-06-02
汽车安全系统新动向 主动安全人工智能化
Switchtec PCIe系列交换机为云人工智能和ML架构提供更大灵活性
Microchip Technology Inc.(美国微芯科技公司)今日宣布其Switchtec™ PAX网络互联Gen 4 PCIe交换机系列现已投产,可支持云、数据中心和超大规模计算,以促进人工智能(AI)和机器学习(ML)的发展。与传统的外设组件互连标准(PCIe)交换机相比,该系列支持更强扩展性、更低延迟和更高性能的复杂结构拓扑。 Microchip的Switchtec PAX PCIe系列交换机为需要多主机共享访问单根I/O虚拟化(SR-IOV)、非易失性存储器(NVMe)、固态硬盘(SSD)、图形处理器(GPU)和其他PCIe终端的系统提供了一个交钥匙网络互联解决方案,并缩短上市时间。 
发表于 2020-05-28
欧盟拟设7500亿欧元经济复苏基金:提高5G、人工智能等竞争
和媒体。但是提议中并未在这方面给出具体投资数字。 其他领域也将获得更多资金,包括人工智能、网络安全、安全通讯、数据和云基础设施、超级计算机、量子和区块链。 欧委会强调说,计划通过一项数据法,以期充分利用欧盟在工业、环境、卫生、交通和公共管理领域的数据财富。 欧委会对数千家欧洲公司使用的大型网上平台发出警告说,拟于2020年底版本的被称为《数字服务法案》(Digital Services Act)的新数据法将设置明确的条文。 “法案将为网上客户提供更有力的安全保障,防止平台滥用市场权力,让小型企业享有平等的机会,确保公平的市场环境,”欧委会说。 提议的网络安全战略将在未来几个月
发表于 2020-05-28
换一换 更多 相关热搜器件
电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2020 EEWORLD.com.cn, Inc. All rights reserved