为什么深度学习仍未取代传统的计算机视觉技术?

发布者:upsilon30最新更新时间:2018-04-02 来源: eefocus关键字:深度学习  计算机视觉  大数据 手机看文章 扫描二维码
随时随地手机看文章

深度学习只是一种计算机视觉工具,而不是包治百病的良药,不要因为流行就一味地使用它。传统的计算机视觉技术仍然可以大显身手,了解它们可以为你省去很多的时间和烦恼;并且掌握传统计算机视觉确实可以让你在深度学习方面做得更好。这是因为你可以更好地理解深度学习的内部状况,并可执行预处理步骤改善深度学习结果。

 

本文的灵感同样来自论坛中的一个常见问题:

 

深度学习已经取代了传统的计算机视觉吗?

 

或是换种说法:

 

既然深度学习看起来如此有效,是否还有必要学习传统的计算机视觉技术?

 

这个问题很好。深度学习确实给计算机视觉和人工智能领域带来了革命性的突破。许多曾经看似困难的问题,现在机器可以比解决的比人类还好。图像分类就是最好的印证。确实,如从前所述,深度学习有责任将计算机视觉纳入行业版图。

 

但深度学习仍然只是计算机视觉的一个工具,且显然不是解决所有问题的灵丹妙药。因此,本文会对此进行详细阐述。也就是说,我将说明传统的计算机视觉技术为何仍十分有用,值得我们继续学习并传授下去。

 

本文分为以下几个部分/论点:

 

深度学习需要大数据

 

深度学习有时会做过了头

 

传统计算机视觉将会提升你的深度学习水平

 

进入正文之前,我认为有必要详细解释一下什么是「传统计算机视觉」,什么是深度学习,及其革命性。

 

背景知识

在深度学习出现以前,如果你有一项诸如图像分类的工作,你会进行一步叫做「特征提取」的处理。所谓「特征」就是图像中「有趣的」、描述性的、或是提供信息的小部分。你会应用我在本文中称之为的「传统计算机视觉技术」的组合来寻找这些特征,包括边缘检测、角点检测、对象检测等等。

 

在使用这些与特征提取和图像分类相关的技术时,会从一类对象(例如:椅子、马等等)的图像中提取出尽可能多的特征,并将其视为这类对象的「定义」(称作「词袋」)。接下来你要在其它图像中搜索这些「定义」。如果在另一个图像中存在着词袋中相当一部分的特征,那么这个图像就被归为包含那个特定对象(如椅子、马等等)的分类。

 

这种图像分类的特征提取方法的难点在于你必须在每张图像中选择寻找哪些特征。随着你试图区分的类别数目开始增长,比如说超过 10 或 20,这就会变得非常麻烦甚至难以实现。你要寻找角点?边缘?还是纹理信息?不同类别的对象最好要用不同种类型的特征来描述。如果你选择使用很多的特征,你就不得不处理海量的参数,而且还需要自己来微调。

 

深度学习引入了「端到端学习」这一概念,(简而言之)让机器在每个特定类别的对象中学习寻找特征,即最具描述性、最突出的特征。换句话说,让神经网络去发现各种类型图像中的潜在模式。

 

因此,借助端到端学习,你不再需要手动决定采用哪种传统机器视觉技术来描述特征。机器为你做好了这一切。《连线》杂志如此写道:

 

举例来说,如果你想教会一个 [深度] 神经网络识别一只猫,你不必告诉它去寻找胡须、耳朵、毛或是眼睛。你只需展示给它成千上万的猫的图像,它自然会解决这一问题。如果它总是会将狐狸误认为是猫,你也不用重写代码。你只需对它继续进行训练。

 

下图描述了特征提取(使用传统计算机视觉)和端到端学习之间的这种区别:

 

 

以上就是背景介绍。现在接着讨论为什么传统计算机视觉仍然必不可少,而且学习它仍大有裨益。

 

深度学习需要大量数据

首先,深度学习需要数据,许许多多的数据。前文提到过的著名图像分类模型的训练都基于庞大的数据集。排名前三的训练数据集分别是:

 

ImageNet——150 万图像,1000 个对象分类/类别;

 

COCO——250 万图像,91 个对象分类;

 

PASCAL VOC——50 万图像,20 个对象分类。

 

但是一个训练不良的模型在你的训练数据之外很可能表现糟糕,因为机器并没有对于问题的洞察力,也就不能在没看到数据的情况下进行概括归纳。而且对你来说查看训练模型内部并进行手动调整又太过困难,因为一个深度学习模型内部拥有数以百万计的参数——每个参数在训练期间都会被调整。某种程度上说,一个深度学习模型就是一个黑箱。

 

传统的计算机视觉完全透明,允许你更好地评估判断你的解决方案是否在训练环境之外依然有效。你对问题的深入见解可以放进你的算法之中。并且如果任何地方出现故障,你也可以更轻易地弄清楚什么需要调整,在哪里调整。

 

深度学习有时做过了头

这大概是我最喜欢的支持研究传统计算机视觉技术的理由。

 

训练一个深度神经网络需要很长的时间。你需要专门的硬件(例如高性能 GPU)训练最新、最先进的图像分类模型。你想在自己还不错的笔记本上训练?去度个一周的假吧,等你回来的时候训练很可能仍未完成。

 

此外,如果你的训练模型表现不佳呢?你不得不返回原点,用不同的训练参数重做全部工作。这一过程可能会重复数百次。

 

但有时候所有这些完全没必要。因为传统计算机视觉技术可以比深度学习更有效率地解决问题,而且使用的代码更少。例如,我曾经参与的一个项目是检查每个通过传送带的罐子里是否有一个红勺子。现在你可以通过前文叙述的旷日持久的过程来训练一个深度神经网络去检测勺子,或者你也可以写一个简单的以红色为阈值的算法(将任何带有一定范围红色的像素都标记为白色,所有其它的像素标记为黑色),然后计算有多少白色的像素。简简单单,一个小时就可以搞定!

 

掌握传统的计算机视觉技术可能会为你节省大量的时间并减少不必要的烦恼。

 

传统计算机视觉会提升你的深度学习技巧

 

理解传统的计算机视觉实际上能帮你在深度学习上做得更好。

 

举例来说,计算机视觉领域最为普遍使用的神经网络是卷积神经网络。但什么是卷积?卷积事实上是一种被广泛使用的图像处理技术(比如,索贝尔边缘检测)。了解这一点可以帮助你理解神经网络内部究竟发生了什么,从而进行设计和微调以更好地解决你的问题。

 

还有一件事叫做预处理。你输入给模型的数据往往要经过这种处理,以便为接下来的训练做准备。这些预处理步骤主要是通过传统的计算机视觉技术完成的。例如,如果你没有足够的训练数据,你可以进行一个叫做数据增强的处理。数据增强是指对你训练数据集中的图像进行随机的旋转、移动、裁剪等,从而创造出「新」图像。通过执行这些计算机视觉操作,可以极大地增加你的训练数据量。

 

结论

本文阐述了为什么深度学习还没有取代传统计算机视觉技术,以及后者仍值得学习和传授。首先,本文将目光放在了深度学习往往需要大量数据才能表现良好这一问题上。有时并不具备大量数据,而传统计算机视觉在这种情况下可作为一种替代方案。第二,深度学习针对特定的任务偶尔会做过头。在这些任务中,标准的计算机视觉比起深度学习可以更为高效地解决问题,并且使用更少的代码。第三,掌握传统计算机视觉确实可以让你在深度学习方面做得更好。这是因为你可以更好地理解深度学习的内部状况,并可执行预处理步骤改善深度学习结果。

 

总而言之,深度学习只是一种计算机视觉的工具,而不是包治百病的良药。不要因为流行就一味地使用它。传统的计算机视觉技术仍然可以大显身手,了解它们可以为你省去很多的时间和烦恼。


关键字:深度学习  计算机视觉  大数据 引用地址:为什么深度学习仍未取代传统的计算机视觉技术?

上一篇:科技大佬谈人工智能的突破方向
下一篇:3D打印盛极而衰,数字印刷才是未来?

推荐阅读最新更新时间:2024-05-03 02:41

ZAO开局不利,怎样才能让技术被正确的使用?
刷屏的ZAO,也许就是那只正在振动翅膀的蝴蝶。 核 心 要 点 ▪ ZAO应用的技术难度并不大,没有能力进阶的提升。    ▪ 合成视频触达了许多人的心理底线:当视频也可以被伪造,还有什么可以甄别真实?    ▪ 为了提高人脸识别的安全性,研究者们已经做出了诸多尝试和努力。    ▪ 除了人脸识别之外,还有多种生物识别技术可供进行个人身份鉴定。    经过一个周末的集中爆发,换脸软件ZAO的热度终于有所降温。它应用的技术并不新鲜,却让人脸合成视频第一次离普通用户这么近。    广被诟病的用户协议、合成视频存在的安全问题使得ZAO深陷舆论漩涡——从爆红到质疑缠身,只用了不到24小时。    但是,对ZAO的担忧与抵制并不能解决
[嵌入式]
ZAO开局不利,怎样才能让技术被正确的使用?
这些区块链技术,将是未来国内外焦点
区块链技术作为当前国内外的焦点技术之一,可能会对未来技术创新和产业变革产生重要影响,在物联网中将会有广阔的发展空间。本文介绍了区块链技术发展的基本情况,探讨了区块链技术在物联网中应用的主要方向,并在此基础上分析了区块链技术在物联网应用中面临的挑战。 物联网作为新一代信息通信技术高度集成和综合应用的典范,正在与经济社会深度融合,深刻改变生产活动、社会管理、公共服务。随着物联网技术在各行业中的普及和不断深化,人类社会正进入“万物互联”的新时代,可穿戴设备、智能家电、自动驾驶汽车、智能机器人等数以百亿计的新设备将接入网络,也使得物联网成为当今全球技术创新最活跃、应用空间最广阔的领域之一。云计算、大数据、新一代移动通信技术与智能感知、
[嵌入式]
智能家居电能传感器,应大数据而生
所谓电能传感器(Electric Energy Sensor),是指可以测量电器的功率、电流、电压、电量等参数,对电特性进行感知的模块,可以监测电器的真实运行状态。随着智能家居的发展,电能传感器会发展为一种标准品嵌入到智能家电中,后续还会具备电器状态指示、自我学习等功能。 那么,该如何理解电能传感器之于智能家居与大数据的重要性呢? 一、从智能家居的发展历程说起 随着各云平台的发布(如云栖大会上发布的阿里云)和五中全会上将大数据上升为国家战略,这些迹象都表明大数据技术(DT)时代即将到来,各大企业都在摩拳擦掌,要在DT时代成为弄潮者。智能家居是应物联网而生的庞大应用场合,随着大数据的发展,物联网系统需要各种各样的数据来支持智能家居
[工业控制]
智能家居电能传感器,应<font color='red'>大数据</font>而生
避免雾霾红色预警再发生 大数据治堵是关键
     12月7日晚,北京市空气重污染应急指挥部发布空气重污染红色预警。这是北京市自2013年《北京市空气重污染应急预案》通过以来,首次启动最高等级预警,12月10日17时,改预警解除。在雾霾红色预警过去之后,我们仍不可放松,对此次发生红色雾霾预警的现象,也给我们留下深刻思考,那么如何才能避免类似事情再次发生?     治霾不要空喊口号,先从治堵开始     交通拥堵是国内很多大城市的通病,然而当雾霾日益爆表之后,关注点只停留在表象,有点跑偏了,实际上最根本还是“拥堵”带来的问题。开篇提到,近期环保部抓到了机动车这个“真凶”,但是也离不开“拥堵”这个“帮凶”。     对此,中国环境科学领域的权威专家、清华大学环境学
[安防电子]
物联网感测组件技术概述
在物联网的感测层中,负责了前端资料搜集与撷取,无论是RFID、电压、电流、温度等环境传感器,或是结合能量采集和电源管理的压电开关、热电产生器、热电堆等环境传感器等,物联网的物物相连,唯有靠这些感测组件来建构物联网的眼耳鼻口,才能完成大数据的云端数据库的实时搜集、撷取、运算、分析与数据智能化…下面就随网络通信小编一起来了解一下相关内容吧。 无线传感器技术与日俱进 环境传感器最早可追朔到美军在越战时期,因为越南的茂密的丛林加上多雨的地理环境,使得卫星与侦查机的情资搜集成效不彰,因此美军透过运输机将许多振动感测装置空投到战区,以侦察装甲车与部队所造成的地面震动,进而提早预警并切断越共的补给。 前述的军事应用之外,还可以用来做环境
[网络通信]
欧比特更名为“珠海欧比特宇航科技股份有限公司”
欧比特 对外发布公告称,公司名称由“珠海欧比特控制工程股份有限公司”变更为“珠海欧比特宇航科技股份有限公司”,近日完成了上述工商变更登记手续,并取得广东省珠海市工商行政管理局换发的《营业执照》。   珠海欧比特宇航科技股份有限公司于 2017 年 7 月 28日召开的第四届董事会第二次会议、2017 年 8 月 31 日召开的 2017 年第三次临时股东大会,审议通过了《关于变更公司名称的议案》,同意将公司注册名称由“珠海欧比特控制工程股份有限公司”变更为“珠海欧比特宇航科技股份有限公司”,英文名由“Zhuhai Orbita Control Engineering Co.,Ltd”变更为“Zhuhai OrbitaAerospa
[嵌入式]
智能制造业的大数据分析
过去几年,应用材料公司在探索半导体制造业的大数据分析方法上一直走在业界前列。除了赞助美国、亚洲和欧洲先进制程控制(APC)大会 等重要的相关技术会议,应用材料公司在此方面的工作还体现在《IEEE 半导体制造会刊》(IEEE Transactions in Semiconductor Manufacturing) 等同行评审期刊上发表的相关论文。公司在瑞士曼迪匹艾(MDPI)的开放期刊 Processes 上发表的一篇此类文章,获得了 2016 年和 2017 年度“最佳论文奖” 。该文探讨了半导体制造业大数据分析的发展趋势和机遇,并提供了相应的路线图,阐述了如何采用分析技术为缺陷检测到预防式维护等一系列应用提供支持。本文对这篇论文
[嵌入式]
智能制造业的<font color='red'>大数据</font>分析
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
随便看看
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved