深度学习“瓶颈”已至，计算机视觉如何突破困局？-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

近期，计算机视觉奠基者之一，霍金的弟子，约翰霍普金斯大学教授Alan Yuille提出“深度学习在计算机视觉领域的瓶颈已至。”

从人工智能的发展过程看，深度学习是继专家系统之后人工智能应用的又一重要研究领域，也是人工智能和神经计算的核心研究课题之一。Alan Yuille认为，现在做AI不提神经网络，成果都很难发表了，这不是一个好势头。如果人们只追求神经网络的潮流，抛弃所有老方法，也不去想如何应对深度网络的局限性，那么这个领域可能很难有更好的发展。

深度学习确实是一个让人向往的技术，这无可辩驳。其实，神经网络这个概念自上个世纪60年代就已经出现了，只是因为最近在大数据、计算机性能上面出现的飞跃，使得它真正变得有用起来，由此也衍生出来一门叫做“深度学习”的专业，当前国内涉及计算机视觉领域中，越来越多的人工智能公司或者研究机构投身到“深度学习”的浪潮中了，国内诞生了如旷视科技、商汤科技、极链科技Video++、依图科技等优秀的初创AI企业。旨在将复杂的神经网络架构应用在数据建模上，最终带来前所未有的准确性。

现在的技术开发成果也确实让人印象深刻。计算机现在可以辨识图片和视频里的东西都是什么，可以将语音转化成为文字，其效率已经超过了人力范畴。Google也将GoogleTranslate服务中添加了神经网络，现在的机器学习在翻译水平上已经逐步逼近人工翻译。现实中的一些应用也让人大开眼界，就比如说计算机可以预测农田作物产量，其准确性比美国农业部还高。机器还能更加精准的诊断癌症，其准确度也比从医多年的老医师还要高。

美国国防部高级研究计划局的一名负责人John Lauchbury形容如今人工智能领域内存在着三股浪潮：

第一股浪潮：知识库，或是类似于IBM所开发的“深蓝”和Waston专家系统。

第二股浪潮：数据学习，包括了机器学习和深度学习。

第三股浪潮：情境适应，其中涉及通过利用少量数据，在现实生活中构建出一个可靠的，解释型的模型。

从这三股浪潮中，可以发现目前深度学习算法的研究工作进展不错。

但深度学习的成果是建立在极其苛刻的前提条件之上。

不管是“监督学习”，亦或者是“强化学习”，它们都需要大量的数据进行支撑，而且在提前计划上面表现的非常差，只能做某些最简单直接的模式辨认工作。

相比之下，人就能够从极少数的例子上学到有价值的信息，并且善于在时间跨度很长的计划，在针对某个情境上有能力自己建造一个抽象模型，并利用这样的模型来做站在最高处的归纳总结。

以自动驾驶汽车为例，如果你是采用的“监督学习路径”，那么你需要从汽车驾驶的情境中提取海量的数据，而且还要以明确标示出来的“动作标签”进行分类挑拣，比如“停止”“行驶”等。再接下来，你还需要训练一个神经网络，使得它能够从眼下的情景和所与之相对应的行动之间构建因果联系。

如果你是采用的“强化学习路径”，那么你应该给算法一个目标，让它能够独立地判断当下最优解是什么，电脑在不同的情境之下，为了实现避免撞车的这个动作，它估计要宕机上几千次。虽然现在已经有了比较大的进展，一些神经网络可以从数据层面，在相当大的样本数量上给出一个惊人的成果，但是它们如果单独拿出一个出来，还是不可靠的，所犯的错误也是人一辈子都不可能犯的。

数据质量的不稳定性带来的是不可靠、不准确，以及不公平。同样，输出的结果，还得取决于输入的数据质量如何。神经网络中如果输入的数据是不准确的，不完整的，那么结果也会错的离谱，有些时候会造成巨大的损失。不要小看这样的风险，错误的输出可能会造成极大的危害，以GAN为例，有一些不轨之徒可以以一种人类肉眼无法识别的方式篡改图片，让机器错误的辨识图片。篡改的图片和最初的图片在我们看来可能是一致的，但是无人驾驶汽车中，汽车就会受到威胁。

深度学习依然存在瓶颈，但目前它要发挥的作用所需要的前置条件太过苛刻，输入数据对其最终的结果有着决定性的影响。如果要真正达到理想中的人工智能，这些瓶颈还有待于人们的进一步突破。

关键字：深度学习瓶颈计算机视觉引用地址：深度学习“瓶颈”已至，计算机视觉如何突破困局？

上一篇：AI已成必需品机器人记者正在崛起
下一篇：英特尔为机器人定做追踪摄像头

推荐阅读最新更新时间：2024-05-03 03:27

科技巨头纷纷研发新电池技术瓶颈突破在即？

电池!电池!在处理器速度越来越快、内存容量越来越大、屏幕分辨率越来越高的今天，电池技术似乎还在上个世纪原地踏步。　　这个“拖后腿的队友”不但拉低了整个系统的性能和想象空间，还让其他元件被迫为其作出妥协……无论是一线的开发人员还是终端的消费者，对“龟速”的电池技术的忍耐已经到了忍无可忍的地步。　　日前，“忍不住”了的谷歌、苹果、特斯拉等科技巨头纷纷传出加入新型电池技术研发队伍的消息。有专家称，在这一热潮推动下，电池技术瓶颈的突破或许就在不远处。　　谷歌：专人专项攻难关欲领时代潮流　　美国《华尔街日报》日前援引消息灵通人士的消息指出，谷歌内部有一个专门团队，正在致力于一种新型电池技术的开发，该技术可用

[嵌入式]

中国希望在人工智能(AI)领域领军全球，有哪些因素阻碍？

中国希望在人工智能(AI)领域领军全球，且AI研究质量已取得令人印象深刻的飞跃。但观察人士警告说，有几个因素或将阻碍中国的AI计划，包括缺乏对用于开发支撑该领域的理论的贡献，以及中国企业不愿对实现根本性突破所需的研究进行投资。西安交大人工智能与机器人研究所所长郑南宁院士表示，中国已在计算机视觉、语音识别和自然语言处理等领域拥有一批世界一流企业，但仍在打造核心技术工具方面落后于人。例如，美国学者和企业开发的一些深度学习平台，用以设计、建造和训练一系列能使计算机更像人脑工作的算法。这些平台已在世界各地的产业和学界得到广泛应用。尽管百度等开发的开源平台正被用于快速开发AI产品，但中国在硬件方面仍落后于人。世界上大多数由AI“赋能”

[嵌入式]

如何通过PaddleHub快速实现计算机视觉任务

1 计算机视觉 1.1 计算机视觉概述计算机视觉（Computer Vision）又称机器视觉（Machine Vision），是一门让机器学会如何去“看”的学科，是深度学习技术的一个重要应用领域，被广泛应用到安防、工业质检和自动驾驶等场景。具体的说，就是让机器去识别摄像机拍摄的图片或视频中的物体，检测出物体所在的位置，并对目标物体进行跟踪，从而理解并描述出图片或视频里的场景和故事，以此来模拟人脑视觉系统。因此，计算机视觉也通常被叫做机器视觉，其目的是建立能够从图像或者视频中“感知”信息的人工系统。计算机视觉的发展历程要从生物视觉讲起。对于生物视觉的起源，目前学术界尚没有形成定论。有研究者认为最早的生物视觉形成于距今约7亿

[嵌入式]

如何通过PaddleHub快速实现<font color='red'>计算机视觉</font>任务

PND发展遇瓶颈两顽疾不改恐遭行业洗牌

　　随着汽车保有量的增加，汽车消费品业逐渐受到车主的青睐。俗话说有需求才会有动力，作为汽车消费品的领头羊， GPS 导航的技术革新也是风起云涌，越来越人性化。但是世界上没有绝对完美的东西，消费者提到GPS还总是不可避免有些畏惧感，那么主流GPS都有哪些令人不爽之处呢？下面我就为您一一道来。　　近日，记者走访了位于北京四环边上的西郊雅森汽车用品城，就GPS导航产品目前存在的问题以及还有哪些方面值得改进做了简单的调查，总体来说，不管是经销商、代理商还是广大的车主都提出了各种各样的建议，甚至有的车主虽然早早购买到了GPS导航，但直到今天也玩不转。另外通过慧聪网举办的品牌巡展北京站，也有很多代理商和经销商反映相关问题。反

[汽车电子]

服务机器人或迎来发展新时期，小觅智能如何突破技术瓶颈？

广州白云机场引入智能机器人用于导引乘客，阿里发布“太空梭”机器人用于医院投放药品，日本运营机器人酒店，随着越来越多的服务机器人逐渐进入我们的视野，不由想象，服务型机器人在未来将扮演一个什么样的角色？整体市场环境分析一.全球整体市场快速增长，服务机器人迎来发展黄金时代《 2017 中国机器人产业发展报告》指出，当前，全球机器人市场规模持续扩大，工业、特种机器人市场增速稳定，服务机器人增速突出。预计 2018 年，全球机器人市场规模将达到 298.2 亿美元， 2013-2018 年的平均增长率约为 15.1%。其中，工业机器人 168.2 亿美元，服务机器人 92.5 亿美元，特种机器人 37.5 亿美元。二.新一

[机器人]

关键零部件标准缺失成国产机器人高端化新瓶颈

随着国家对机器人研发、生产的重视，该行业在国内呈现出爆发的趋势，我国已连续多年稳居全球机器人生产和销售第一。然而，《工人日报》记者日前采访发现，在这一过程中，一些关键零部件标准的缺失，阻碍了国产机器人的高端化。对此，常熟长城轴承有限公司董事长朱克明有着深刻体会。该企业很多年前就开始生产轴承，主要为各个主机厂商生产轴承等配件产品。轴承虽小，但是在机械领域又无比重要，属于关键零部件。同时，轴承在机器人领域也非常重要，尤其在最关键的机器人减速器部件中，轴承是关键，它甚至能决定减速器的标准。不过，有业内人士表示，目前国内该领域所有的中高端轴承90%都为外国产品所占领。我国在这一领域也在积极寻求突破，在相关部门专项资金支持下，目前从技术

[机器人]

深度学习“瓶颈”已至，计算机视觉如何突破困局？

近期，计算机视觉奠基者之一，霍金的弟子，约翰霍普金斯大学教授Alan Yuille提出“深度学习在计算机视觉领域的瓶颈已至。” 从人工智能的发展过程看，深度学习是继专家系统之后人工智能应用的又一重要研究领域，也是人工智能和神经计算的核心研究课题之一。Alan Yuille认为，现在做AI不提神经网络，成果都很难发表了，这不是一个好势头。如果人们只追求神经网络的潮流，抛弃所有老方法，也不去想如何应对深度网络的局限性，那么这个领域可能很难有更好的发展。深度学习确实是一个让人向往的技术，这无可辩驳。其实，神经网络这个概念自上个世纪60年代就已经出现了，只是因为最近在大数据、计算机性能上面出现的飞跃，使得它真正变得有用起来，由此也衍生

[机器人]

中国联通王光全谈5G光模块：加大研发支撑力度突破规模成本瓶颈

　　5月10日消息，在昨日举行的2018年 5G 承载产业发展研讨会”上，中国联通网络技术研究院网络技术研究部主任王光全表示，无论是哪种 5G 承载标准与技术，最终都离不开光模块的支持，长距离、低成本、高速率的光模块是实现 5G 低成本广覆盖的关键要素。下面就随网络通信小编一起来了解一下相关内容吧。　　5G承载的三大场景需求　　从应用场景来看，5G光模块可以分为前传、中传、回传三单场景。　　从前传角度来看，需要支持25G高速接口，超低时延以及业务和速率、波长的自适应，另外还需要低功耗，最重要的还是低成本，因为前传的端口需求量非常庞大，如果没有低成本，适应不了网络建设的需要。　　从中传角度来看，运营商需要考虑其可

[网络通信]

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■2024 瑞萨电子MCU/MPU工业技术研讨会——深圳、上海站，火热报名中

■罗姆有奖直播 | 重点解析双极型晶体管的实用选型方法和使用方法

■STM32N6终于要发布了，ST首款带有NPU的MCU到底怎么样，欢迎小伙们来STM32全球线上峰会寻找答案！

■免费下载 | 安森美电动汽车充电白皮书，看碳化硅如何缓解“里程焦虑”！