下一代AI是怎样的?神经网络迷雾难题何解

2020-10-10来源: eefocus关键字:计算机视觉  3D视觉算法  AI  3D导航  深度学习  AI智能机器人

看到“双节”期间中国有 5.5 亿人出行的新闻,我不由得虎躯一震。想到了人会多,但没想到会这么多!看来大家都充满了探索欲,希望在难得的假期去往自己熟悉或未知的地方。

 

就算你选择了“家里蹲”,也一定会通过网上冲浪、阅读游戏等方式,来探索自己的内心世界。

 

探索是人类的本能,从婴儿时期开始,好奇心就驱动着我们去探索并理解自己所在的世界, AI 的成长则离不开对人类的观察与模仿,其中,就包括探索的能力。

 

这种能力被算法掌握之后,出现了阿尔法狗打败人类棋圣,也出现了 OpenAIFive——在电子游戏领域完虐人类玩家。不过即便如此,人类的探索能力依然令最高级的 AI 都望尘莫及。

 

比如婴儿可以从爬行和探索中学会认知三维空间,而一些计算机视觉还总被曝出被平面照片所欺骗过去的新闻,上马更高性能的 3D 视觉算法则需要耗费巨大的算力资源,从这个角度看,人脑无疑在效果和效率上都碾压了 AI。

 

 

那么,能不能引入儿童的学习能力,来实现更聪明的 AI 呢?这个猜测,就像是“把爱因斯坦的大脑给我我也能拿诺贝尔奖”一样,是一个有点铁憨憨,又有点重要的问题。

 

5 岁小孩碾压 AI,“玩”就够了

大家不妨在假期做一个生活观察,看看小孩子们是如何探索世界的?

 

如果一个玩具看起来有很多玩法,但他们不知道哪一个是正确的,小孩子们会进行假设驱动的探索,如果“假设”失败了,他们就会转向新的玩具。

 

有研究显示,一个 11 个月大的婴儿,在看到许多违反物理定律的现象时,会忍不住对其进行更多的探索,甚至会做出一些违规行为来实践自己的假设。

 

比如看到一辆漂浮在空中的汽车,有点颠覆以往的认知了,你会怎么做?婴儿会选择将玩具砰地扔到桌子上,想知道这种“不合常理”的情况是怎么出现的(所以阻止熊孩子弄坏你手办的唯一办法,就是根本不要让他们看到它们)。

 

 

这种“不见黄河心不死”式的自由探索,有时会令家长和大人们不堪其扰,但抽象化的“假设”能够让人类做出大量预测,想象出许多新的可能性,不仅是一种极为有意义的学习方式,更是人类创造力的由来。

 

不过就像小王子觉得枯燥的大人们看不到“蟒蛇肚子里的大象”一样,令人遗憾的是,这种探索能力是幼儿的专长,大部分情况下只存在在 5 岁以前,这也让他们成为宇宙中最好的学习者。

 

 

既然儿童行为如此有参考意义,科学家们自然也想得到。事实上,儿童发展学对 AI 的进展起到了重要的方向牵引作用。

 

科学家们曾将好奇心引入神经网络,打造了深度增强学习,通过奖励反馈来鼓励智能体(agent)主动探索和理解环境,更新模型参数。这让 AI 能够自主获得技能,在电子游戏等需要通用智能的复杂场景中能够做出自己的决策,而不是人类预先通过庞大的标注数据集给定答案。

 

其他类型的儿童行为亦有价值。前面提到的“不见黄河心不死”的探索,就被化作深度优先搜索策略,DeepMind 和加州大学伯克利分校的研究人员,开发了一个 3D 导航和解谜环境。智能体(agent)沿着特定路径进行探索,如果遇到死胡同,那就回去找到下一条没有探索过的道路,继续前进。

 

 

听起来是不是很像小孩子走迷宫的游戏?这能让智能体接触到各种各样的经验,在信息较少的环境中工作;减少对数据量的依存,改变目前算力资源紧张的局面,让许多小数据、少样本的领域(如金融、医疗)也能实现智能化。

 

将儿童探索行为应用于 AI,一切都能变得更好,理想层面上确实如此,但现实总喜欢跟科学家们开玩笑,也算是给人类保留了一个“杀手锏”吧。

 

AI 能力暴涨的当下,人类为什么还能稳坐智慧王座?

需要注意的是,这些类似儿童探索的策略,通常更多被用在训练期间提高代理人的经验值,而不是在决策时支持快速学习和探索。用人话说就是“懂得了许多道理,却不一定能过好这一生”,因为一到关键选择时刻就会掉链子。

 

就拿前面提到的深度优先搜索(DFS)来说,科学家们发现,如果让孩子们自由探索,那么他们与智能体按 DFS 做出的行动有 90%的相似,而以目标为导向(找到橡皮糖)来探索的话,有 96%的路线都是相似的。但不同的是,探索越多的孩子,最后能花费更少的时间完成任务,智能体却相反。

 

 

如果智能体发现一个地方很有趣(能得到奖励),就会一直重新访问该区域,直到它终于终于终于觉得那里不再有趣了,这会导致其概括性不佳(无法形成最佳策略)。

 

其中的差别就在于,孩子不是被动地孤立学习或由目标驱动,而是在不断实验和收集信息,将自己的认知和经验与获得的信息结合起来,编织出一个丰富的世界模型。而即使最复杂的机器探索方法,也只能为特定的目标服务,一时半会还无法完美匹配这个充满了各种“意外”的真实世界。

 

为什么有了一定的探索能力,AI 智能体的表现还是不尽如人意呢?

 

首当其冲就是实验室与现实环境的巨大不同。

 

深度强化学习过去都是“机上谈兵”,不是跟人类在二维游戏里 PK,就是数字网格里下棋,而儿童的探索则是发生在信息丰富的三维现实世界之中,许多潜在因素很难被应用到实验中。

 

这也是为什么,当今最强大的 AI 智能机器人也达不到一个仅小学毕业的优秀人类服务员的工作能力,能像他们一样快速适应环境、完成各种复杂任务。

 

 

此外,儿童的发展心理学研究很难在 AI 产业链中形成“闭环”。要真正激发 AI 生长出服务现实的能力,不仅要构建出具有更强探索能力的智能体,还要继续学习人类的认知能力,推进人工智能自身的理论创新和软硬件升级(比如搭建三维训练环境),这一系列链式突破,才能最终将技术构想转化为现实生产力。“大力出奇迹”的深度学习,其高光时刻就是这么来的。

 

沿着这个方向,我们可以进一步了解,怎样才能弥合智能体与人类之间的差距。

 

下一代 AI,逐渐浮出迷雾的真实未来

在过去的数年里,深度学习做到了传统算法所无法企及的进度,催生了大量的工业界应用,但其实,现在的深度学习还是很傻——举个例子,大部分人都可以通过几十个小时的学习学会开小汽车,而完全自动的 L5 级无人汽车至今还是个遥远的梦。

 

图灵奖得主 Geoffrey Hinton 就一直非常渴望找到一种新的实现深度网络的方法,认为目前(最广泛的反向传播算法)根本不是大脑的工作机制。

 

另一位图灵奖得主 Yann Lecun,就认为在某些游戏中,需要大量增加模型训练时间才能达到或超过专业人类玩家的水平。

 

通过儿童的学习模式,发现当前最优秀的 AI 也比不上 5 岁小孩的智力,或许我们可以回答“下一代 AI 应该是什么样”,这个神经网络最重要的未解难题之一。

 

至少要有两重升级:

1. 有意识。目前公认文字表达能力最高、模型最为庞大的 GPT-3 也曾被专家吐槽是“无脑作业”,其实并不真正理解自己写出的句子。而具有自主探索、决策、推理能力的 AI,可以理解自己周围的环境,才是真正的人工智能。

 

2. 能效比。为什么即使存在缺陷,依然没有妨碍深度学习带领 AI 进来发展热潮呢?核心原因就在于深度神经网络大幅度降低了全社会处理、挖掘、应用大数据的成本。相对人脑而言,现有的计算硬件功耗都很高,不断提升 AI 性价比,是避免再次陷入寒冬的唯一方法,也在呼唤更高级的算法。

 

 

这两个基本难题,只能交给科学家和工程师们在针尖上做大文章了。对于我们普通人来说,保有一颗如儿童般对世界的好奇心,触碰充满各种信息的大自然,由此得来的系统认知与思维能力,或许才是机器永远无法企及,且弥足珍贵的。

关键字:计算机视觉  3D视觉算法  AI  3D导航  深度学习  AI智能机器人 编辑:什么鱼 引用地址:http://news.eeworld.com.cn/qrs/ic512486.html

上一篇:英特尔历时10年的Fab 42工厂全面运营,极大缓解10nm芯片产能
下一篇:全球工业机器人销售下降12%,中国市场何以实现逆势增长?

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

AI智力水平不足1岁婴儿,人机交互是否真的可行?
;另一方面,这些算法对噪声比较敏感。因此,林倞认为,即便对于被广泛研究和应用的感知层的智能,尤其是计算机视觉,目前系统还有很大的局限性,一是成本问题,二是稳定性、鲁棒性并没有达到或真正超越人的水平。 其次,林倞认为,视觉跟语言的大部分理解是依靠想象和推测的,并不是依靠大数据的感知,因而 AI 系统自下而上的感知智能和自上而下的认知智能不可分割,必须统一在一个计算过程中。 最后,大量实验表明,目前 AI 的智力水平不足 12 个月大的婴儿,无法推测他人意图,缺乏可解释性。这引出林倞的第三个观点,认知人工智能必须要理解人的意图,懂因果,可解释。 基于这些情况,林倞介绍
发表于 2020-08-27
AI智力水平不足1岁婴儿,人机交互是否真的可行?
详解华为人工智能的星辰大海
生态和人才培养、解决方案增强、内部效率提升五大方向,以此打造无所不及的 AI,构建万物互联的智能世界。 华为计算机视觉基础研究以数据高效和能耗高效为核心,覆盖从 2D 视觉到 3D 视觉的技术和应用,主要包含底层视觉、语义理解、三维视觉、数据生成、视觉计算、视觉多模态等方面。在此方向上,华为将基础研究进一步聚焦到数据、模型和知识三大挑战: 1、数据上,如何从海量的数据中挖掘有用的信息。田奇以生成数据训练和不同模态数据对齐这两个应用场景为例,介绍了华为如何使用知识蒸馏与自动数据扩增结合的方法让 AI 模型高效地挖掘数据中的有用信息。 2、模型上,怎样设计高效的视觉模型。田奇认为在深度学习年代,视觉模型主要包含
发表于 2020-08-24
详解华为人工智能的星辰大海
新项目开发AI视觉系统 可用于自动驾驶
据外媒报道,加州大学河滨分校的Amit Roy-Chowdhury教授领导的团队收到来自美国国防部高级研究计划局(DARPA)近100万美元的拨款,用于研究计算机视觉系统对抗性攻击。该项目是DARPA AI探索项目(AI Explorations)中全机器视觉干扰(Total Machine Vision Disruption)项目的一部分,研究结果将在自动驾驶汽车、监控和国防领域得到广泛应用。团队成员包括加州大学河滨分校的研究人员Srikanth Krishnamurthy、Chengyu Song、Salman Asif,以及施乐(Xerox)旗下研发公司PARC。(图片来源:加州大学河滨分校)当人们看到某个物体时
发表于 2020-08-04
新项目开发AI<font color='red'>视觉</font>系统 可用于自动驾驶
机器视觉应用中需要面对的三大层面难题
机器视觉是计算机视觉的一个分支,工业自动化领域中的视觉控制或视觉应用,主要指的是通过前端光学摄像头,从采集到的数字化图像中提取相关信息,进行分析处理之后,用于对生产线流程或质量的控制,以代替重复性人工操作。目前,机器视觉在工厂生产环节中的实际应用包括:对生产工件的完整性质量检测、识别、分类、零件位置及方向、尺寸测量、读码识别追溯、表面/色差检测、自动化流水线作业等等。可以说,机器视觉为流水产线、自动化设备安装上了一双“眼睛”,能够提供全天候、高一致性、高可靠性的检测结果,增添了工厂生产的智能化水平,因而也成为了迈向智能制造的一项重要技术。根据有关机构的统计数据显示,在2019年,全球用于工业自动化领域的机器视觉技术的市场规模达
发表于 2020-07-24
机器<font color='red'>视觉</font>应用中需要面对的三大层面难题
地平线蝉联最佳汽车解决方案奖,车规级征程2获专业认可
边缘人工智能与视觉联盟 (Edge AI and Vision Alliance) 公布了 2020 年度最佳视觉产品奖,地平线征程 2 车规级 AI 芯片荣膺“最佳汽车解决方案”。这是继地平线 Matrix 自动驾驶计算平台于 2019 年斩获该奖项之后,地平线再次获得该国际行业联盟的专业认可。 地平线征程 2 车规级 AI 芯片荣膺“最佳汽车解决方案” 边缘人工智能与视觉联盟,前身为嵌入式视觉联盟 (Embedded Vision Alliance),成立于 2011 年,是由 100 多家领先公司组成的国际性行业联盟,致力于计算机视觉和边缘 AI 技术的创新和落地应用。同“最佳汽车解决方案
发表于 2020-06-06
地平线蝉联最佳汽车解决方案奖,车规级征程2获专业认可
AIS Cayman将成桦汉全资子公司,布局AIoT
透过子公司投资 1.62 亿元新台币,取得 AIS Cayman 60%股权,桦汉获得 AIS Cayman 的工业物联网开放平台运算解决方案,以及人机界面(HMI)显示器等产品技术,进一步拓展北美市场。 2018 年 6 月桦汉透过 AIS Cayman 并购超恩,除了拓展工业嵌入式计算机产品线外,进一步取得「机器视觉」技术,布局影像分析监控、轨道交通、工自动化,以及 AMR/AGV 等应用领域。 2020 年桦汉进一步强化机器视觉领域,宣布推出机器视觉系统解决方案,深化 Intel、NVIDIA 合作,提供开发与运算平台,整合软件与硬件为一个系统,加速产品上市时间与节省成本,产品涵盖 AI 
发表于 2020-12-21
AIS Cayman将成桦汉全资子公司,布局AIoT
小广播
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2021 EEWORLD.com.cn, Inc. All rights reserved