注意力机制想要觉醒AI,需分几步?

发布者:考古专家最新更新时间:2020-05-08 来源: eefocus关键字:AI  机器学习  注意力 手机看文章 扫描二维码
随时随地手机看文章

一场疫情,让所有线下会议按下了暂停键,AI 也不例外。

 

但一年一度的“顶会”却不能不开,于是在 4 月 26 日,ICLR 2020(国际表征学习大会)就采取虚拟会议的形式,让所有网友得以共襄盛举。

 

值得一提的是,本次 ICLR 大会接受了 2594 篇论文中的 687 篇,吸引了来自近 90 个国家的 5600 多名参与者,比 2019 年的 2700 人翻了一倍还多。不过,受疫情影响,这次大会也没有评选最佳论文。

 

既然如此,有没有出现什么新鲜事物,值得我们思索和探究的呢?

 

那就不得不提到图灵奖获得者、蒙特利尔学习算法研究所主任 Yoshua Bengio,在其特邀报告中着重强调的“AI 觉醒”。

 

此前我们科普过,通用人工智能有多么遥远。怎么短短几年功夫,人工智能就要觉醒了?这就不得不从被 Bengio 视作机器学习大杀器的注意力机制说起了。

 

将意识注入机器:注意力机制再添重任

 

 

脑极体的资深读者应该对注意力机制并不陌生。在图像处理、语音识别、自然语言处理等机器学习任务中,近两年来都会引入注意力模型。

 

这么受业界欢迎,它的特点自然很突出:

 

一是可以让神经网络学会只关注特定的部分,大幅度提升任务的效果与效率,在神经机器翻译、预训练语言模型、图像识别等任务中都表现出了前所未有的成效。2015 年 Bahdanau 等人提出注意力机制之后,就被 ICLR 录用,如今它的各种变式已经成为机器翻译算法的“标配”。

 

二是降低机器学习的成本,同时增加可解释性。大家都知道深度学习神经网络的模型训练,往往依靠大规模的数据集,不仅数据获取成本很高,训练的算力、时间也不菲,而注意力机制的“选择性”,能够直接为训练提质增效,并且还能为序列数据建立了权值和映射,从而让输入和输出能够联系起来,避免了算法的“黑箱性”。

 

既然注意力机制并不是什么新鲜事物,为什么 Bengio 特意在其报告《与意识相关的深度学习先验》中,将注意力机制奉为圭臬,甚至成了 AI 的希望?

 

 

简单来说,Bengio 认为注意力机制能够帮助机器学习模型获得“有意识”的推理。

 

此前,诸多算法创新(如自监督学习、元学习、多任务学习、迁移学习等)都是在帮助机器学习获得“无意识”,也就是与人类直觉、习惯、先验经验等类似的能力。

 

有了这种能力,AI 可以很快地执行一些直觉型的任务,让人感到非常智能。比如当 AI 被训练学会了一些隐性知识以后,能够将这些知识内化,在遇到新事物时不需要重新训练,就能够很快适应。举个例子,当 AI 记住路况之后,它能够自如地跟乘客聊天,同时也不耽误自己随时响应交通状况、安全驾驶。这是不是已经超越许多人类驾驶员了呢?

 

 

但如果是在一个全新的道路上开车,如果有人在耳边吵闹,就会打断人类司机的思路,使对方无法集中精力处理。这时候就要用到前面提到的“有意识的”系统,来将一些新的概念,在新的情况下与不熟悉的东西联系起来。

 

就像《西部世界》的科学顾问、神经学家大卫·伊格尔曼(David Eagleman)所说,意识,是一种突破程序设定的连接。

 

当机器可以超越设定开始自行推理和思考,适应甚至推断出外界变化发生的原因,这不就是 Deloris(《西部世界》女主角)们觉醒的时刻吗?

 

从这个角度讲,“有意识”的推理能力,正是深度学习变强大所需要的。

 

从超越人到模仿人,AI 的回归之路

 

 

既然“操纵”意识这么带感,学者们又是如何为之努力的?过去数年间,注意力机制已经发生了不小的发展和进步。

 

从时间上看,注意力机制的能力开始为 AI 所用,要追溯到 2014 年谷歌团队在一个 RNN 卷积神经网络模型上用它来进行图像分类。但真正爆发,主要还是由于其在 NLP 机器翻译任务中证明了自己。

 

2017 年,谷歌机器翻译团队发表的《Attention is all you need》中,提出了一种新颖的基于注意力的机器翻译架构,大量使用自注意力(self-attention)机制来学习文本表征,成为当年最具影响力的论文之一。

 

随后,它开始被广泛应用在基于 RNN/CNN 等神经网络模型的 NLP 任务中,也延伸出了不少变式,比如基于输入项的柔性注意力(Item-wise Soft Attention)、基于输入项的硬性注意力(Item-wise Hard Attention)、基于位置的柔性注意力(Location-wise Soft Attention)等等,核心指导思想都差不多,就是在神经网络的隐藏层,增加注意力机制的加权。

 

但需要注意的是,注意力机制依然存在不少问题:

 

比如,注意力机制与其说是一种技术,不如说是一种指导思想。通过模拟人类阅读、听说中的注意力行为,来为不同输入数据分配不同的权重。想要去的比较理想的效果,依然需要大量的数据投入训练。

 

可以说,注意力机制在神经机器翻译(NMT)任务上的优秀表现,依然建立在有大量高质量语料的前提下。一旦面对比较极端的情况,比如某些语言几乎没有任何双语语料,那再强的注意力机制也得抓瞎。

 

 

再比如,注意力机制达到“有意识”推理的前提,是具备理解隐性知识的能力,也就是那些难以用语言、文字、图表进行表述说明,不经过逻辑推理、而是借由感官、直觉、领悟获得的能力。

 

这对人类来说是“小菜一碟”,但想要将其嵌入到深度学习算法里面,却并不是一件简单的事。DeepMind 就曾开发出一个交互式网络,试图教会智能体像婴儿一样迅速了解到某些对象的属性和关系。交互式网络的预测结果要比一般神经网络精确得多,但距离模拟人类直觉迅速反馈,还为时尚早。而且,机器必须犯上成千上万次的错误,才能做出和人类一样的正确操作。

 

换句话说,Bengio 眼中的“注意力机制”,其实是升级版的“注意力 3.0”,距离“机器觉醒”还早着呢。

 

机器觉醒,光靠 Attention 单打独斗还不行

 

 

上述问题不仅阻拦了注意力机制的“封神之路”,也是阻挡人工智能发挥更高价值的障碍。

 

接下来向何处去,或许正如注意力机制被引入 RNN 一样,继续主动引入其他领域的算法和模型,会带来不可知的神奇效果。

 

而从 ICLR 2020 的技术趋势来看,也有不少算法开始被用来,与注意力机制一起解决诸如直觉、泛化等机器能力的重要问题。

 

比如元学习。在今年的入选论文中,谷歌有 5 篇是专门研究元学习。

 

简单来说,元学习就是要让智能体利用以往的知识经验“学会如何学习”(Learning to learn),然后更高效地完成新任务。

 

具备这种能力,自然也就能够解决训练数据不足、系统通用性低等问题,帮助 AI 不断丰富和修正自身的知识网络。具备了这一能力,获得了人类常识的 AI 才有希望到达“有意识”的推理。

最后,也有必要大开脑洞,试想一下如果“有意识”的推理实现,AI 真的觉醒了,又会为人类带来什么呢?

 

猜想一,AI 的服务能力会显而易见的提升,在实践中不断学习处理复杂的工作将不再是难事,想象中的智能家政机器人、智能女友 / 男友,都不再是问题。

 

猜想二,AI 可以像人类一样推理,同时拥有了情感,那么自然可以缔结自己的社会关系,届时为什么整个社会还需要如我这样的普通人,咱也不知道。

 

幸好,今天无论是注意力机制,还是人工智能本身,想要复刻人类的脑力还需要更长的时间,以及更多的耐心。更值得欣慰的是,在疫情“黑天鹅”的席卷之下,AI 依然带领全球产业者连接、思考、探寻未来的藏宝图,这或许就是技术最令人沉迷之处。

关键字:AI  机器学习  注意力 引用地址:注意力机制想要觉醒AI,需分几步?

上一篇:中芯国际申报全球最大8英寸IC生产线,月产能可达15万片
下一篇:大昌华嘉结合LDS和Formulaction合作拓展稳定性分析技术

推荐阅读最新更新时间:2024-10-22 11:28

注意力机制想要觉醒AI,需分几步?
一场疫情,让所有线下会议按下了暂停键,AI 也不例外。 但一年一度的“顶会”却不能不开,于是在 4 月 26 日,ICLR 2020(国际表征学习大会)就采取虚拟会议的形式,让所有网友得以共襄盛举。 值得一提的是,本次 ICLR 大会接受了 2594 篇论文中的 687 篇,吸引了来自近 90 个国家的 5600 多名参与者,比 2019 年的 2700 人翻了一倍还多。不过,受疫情影响,这次大会也没有评选最佳论文。 既然如此,有没有出现什么新鲜事物,值得我们思索和探究的呢? 那就不得不提到图灵奖获得者、蒙特利尔学习算法研究所主任 Yoshua Bengio,在其特邀报告中着重强调的“AI 觉醒”。 此前我们
[嵌入式]
<font color='red'>注意力</font>机制想要觉醒<font color='red'>AI</font>,需分几步?
Yandex.Taxi利用人工智能技术 监控司机注意力水平/识别司机身份
据外媒报道,迄今为止,Yandex已经成立了二十多年,被称为俄罗斯版谷歌、亚马逊和Spotify,主要原因在于该家总部位于莫斯科的科技巨头涉足了在线搜索、音乐流媒体、电子邮件、地图、导航、视频等多个领域的业务。2011年,该公司推出了移动打车服务Yandex.Taxi,又成为了“俄罗斯版优步”(Uber of Russia)。2017年,Yandex.Taxi与优步合并了俄罗斯业务,新成立了一家合资企业,瞄准了东欧市场。 现在,除了欧洲、中东和非洲的少数几个市场外,Yandex.Taxi主要在独联体(CIS)内的几个国家开展业务。该公司的发展轨迹与优步类似,目前也提供了送餐服务。2018年,作为有限试点的一部分,Yand
[汽车电子]
Yandex.Taxi利用<font color='red'>人工智能</font>技术 监控司机<font color='red'>注意力</font>水平/识别司机身份
JFrog 助力开发者实现安全AI之旅,与 DataBricks 的 MLflow 集成实现无缝机器学习生命周期
全新 JFrog Artifactory 集成为开发人员和数据科学家提供开源软件解决方案,可简化并安全加速 ML 模型开发 2024年5月7日 —— 流式软件公司、JFrog 软件供应链平台的缔造者JFrog (纳斯达克股票代码:FROG)近期宣布实现JFrog Artifactory和Databricks开发的开源软件平台MLflow的全新机器学习(ML)生命周期集成 。继今年早些时候发布与 Qwak 和 Amazon SageMaker 的原生集成后,JFrog 扩展了其通用AI解决方案,为企业提供以 Artifactory 作为模型注册中心的单一记录系统。这项全新集成让 JFrog 用户在简化的端到端 DevSecOp
[嵌入式]
Ekkono边缘机器学习简化了在英飞凌AURIX™ TC3x和TC4x上为汽车应用部署AI的过程
【2024年3月25日,德国慕尼黑和瑞典瓦尔贝格讯】不同汽车的独特性给汽车零部件供应商和OEM厂商等带来了挑战,因为每辆车的驾驶方式、驾驶地点、驾驶者、设计、用途以及道路和交通状况都是独一无二的。为保证每辆汽车都能正常运行并达到出色运行状态,需要掌握并管理汽车及其状况。 英飞凌科技股份公司 AURIX™ 微控制器(MCU)系列所提供的先进实时计算硬件适用于安全关键型汽车应用中的嵌入式AI等用例 。为了充分利用这些强大的功能,英飞凌生态系统合作伙伴Ekkono Solutions推出了一款简单易用且快速有效的软件开发套件(SDK)为基于AURIX™ TC3x和TC4x的嵌入式系统创建AI算法。 英飞凌AURIX™ TC4x
[汽车电子]
Ekkono边缘<font color='red'>机器学习</font>简化了在英飞凌AURIX™ TC3x和TC4x上为汽车应用部署<font color='red'>AI</font>的过程
英飞凌旗下边缘人工智能企业Imagimob推出Ready Models, 可快速将机器学习模型投入生产
【2024年2月5日,德国慕尼黑讯】 秉承为智能设备上市提供更佳、更快方法的使命,英飞凌科技股份公司旗下的边缘人工智能公司Imagimob推出IMAGIMOB Ready Models 。这套完整的机器学习(ML)解决方案可确保为边缘智能设备提供稳健、高性能和可量产的AI应用方案。Ready Models可快速部署到PSoC™ 6 等现有微控制器(MCU)这类半导体硬件上,而用户无需投入模型开发所需的成本、时间和专业知识。 Imagimob客户服务负责人Sam Al-Attiyah表示:“在目前的边缘AI领域,能够为任何一种解决方案提供现成模型的公司屈指可数。Ready Models建立在我们八年专业知识的基础之上,并在不同环
[工业控制]
英飞凌旗下边缘<font color='red'>人工智能</font>企业Imagimob推出Ready Models, 可快速将<font color='red'>机器学习</font>模型投入生产
适应快速变化的业务需求,人工智能/机器学习将为 DevOps 注入全新活力
眼下,人工智能(AI)和机器学习(ML)等赛道被热议,已经成为了习惯。事实上,在DevOps领域,与之相关的话题更是备受瞩目。随着科技不断演进,这三个领域的融合对于企业的数字化转型和多层次的创新发挥着越来越重要的作用。基于这一庞大的市场规模的增长源于基于云的技术和自动化工具的广泛应用,JFrog便立志要推进DevOps在具体业务中的实践。本文将探讨, 在未来短期之内,由于AI和ML等技术的采用,企业会更加灵活地构建、部署和管理应用,从而提高整体业务敏捷性的趋势。 AI和ML的崛起为DevOps注入了全新的活力。通过AI和ML的引入,企业能够更加智能地进行运维和决策,从而优化工作流程、降低错误率,并实现更高效的自动化。这一趋势
[工业控制]
人工智能机器学习应用代码示例解析
()和(Machine Learning)的迅猛发展已经在多个领域引发了深刻的变革和创新。机器学习作为人工智能的重要支撑技术,已经在许多实际应用中取得了显著成就。 本文将介绍人工智能在机器学习中的八大应用领域,并通过适当的代码示例加深理解。 1. 自然语言处理(NLP) 自然语言处理是人工中的重要领域之一,涉及计算机与人类自然语言的交互。NLP技术可以实现、文本分析、情感分析等任务,为智能客服、聊天、语音助手等提供支持。 下面是一个简单的NLP代码示例,展示如何使用的NLTK库进行文本分词:     impt nltk from nltk.tokeniz
[机器人]
ST机器学习解决方案助力车企探索汽车AI可能性
意法半导体的首款车规机器学习解决方案SL-AIAID012401V1由AEKD-AICAR1 评估套件、AI 人工智能插件和AutoDevKit 车规开发板组成,能够识别驻车、正常路况、崎岖道路、车轮侧滑或突然转向四种汽车状态。这是一个难得的机会,可以通过测试和开发汽车人工智能应用,以确定该技术是否适合这个市场。事实上,许多车企还在探索在行业现阶段,机器学习对他们是否有意义。从头开始创建算法需要投入大量的人力和资金。把评估解决方案导入我们的 AutoDevKit 平台,可以让开发人员更轻松地探索车规人工智能的可行性。 将机器学习引入汽车的挑战 寻找正确的应用 汽车状态识别系统的整体架构 虽然机器学习的热度在消
[工业控制]
ST<font color='red'>机器学习</font>解决方案助力车企探索汽车<font color='red'>AI</font>可能性
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved