自动驾驶传感器那点事之摄像头深度学习视觉技术-电子工程世界

引言

摄像头传统视觉技术在算法上相对容易实现，因此已被现有大部分车厂用于辅助驾驶功能。但是随着自动驾驶技术的发展，基于深度学习的算法开始兴起，本期小编就来说说深度视觉算法相关技术方面的资料，让我们一起来学习一下吧。

01、深度学习概述

深度学习(DL,Deep Learning)是一类模式分析方法的统称，属于机器学习(ML,MachineLearning)领域中一个新的研究方向。深度学习通过学习样本数据的内在规律和表示层次，能够让机器像人一样具有分析、学习能力，可识别文字、图像和声音等数据，从而实现人工智能(AI,Artificial Intelligence)。

图为：（人工智能、机器学习、深度学习）关系图

02、深度学习意义

很多小伙伴们可能了解汽车想要实现自动驾驶，感知、决策与控制这三大系统是缺一不可的。其中，感知被我们放在了首位，因为车辆首先需要实时了解自车与现实世界三维变化的关系，即精准了解自车与周围人、车、障碍物及道路要素等位置关系和变化。深度学习算法有效提升了摄像头、激光雷达等传感器的“智能”水平，这很大程度上也决定了自动驾驶汽车在复杂路况上的可靠度，因此深度学习的应用便成为了关键所在。另外汽车的感知传感器虽然有多种，但是摄像头是唯一一个通过图像可以感知现实世界的传感器，通过深度学习可以快速提升图像的识别能力，让我们的行驶更加安全。

03、摄像头传统视觉算法与深度学习算法区别

有看过小编上期写的关于摄像头传统视觉算法的小伙伴们就要问了，既然传统摄像头视觉算法已经可以使用，为什么还要研究深度学习算法呢？

因为传统视觉算法有着自身的一些瓶颈，无论单目摄像头还是多目摄像头，传统视觉算法都是基于人为特征提取得到样本特征库去识别计算。当自动驾驶车辆行驶过程中如发现特征库没有该样本或特征库样本不准确，都会导致传统视觉算法无法识别，另外传统视觉算法还有在复杂场景下分割不佳等情况。因此，基于人为特征提取的传统视觉算法具有性能瓶颈，无法完全满足自动驾驶的目标检测。

图片来源：论文《DeepLearning vs. Traditional Computer Vision》

而摄像头深度学习视觉算法的特征提取优势是基于神经网络算法，它模拟人的神经网络，可将自动驾驶上摄像头输入的图像（甚至激光雷达的点云）等信息进行语义分割，有效解决了传统视觉算法对复杂的实际场景分割或样本特征库不佳的情况，让图像分类、语义分割、目标检测和同步定位与地图构建（SLAM）等任务上获得更高的准确度。

接下来为了便于大家理解，小编先讲讲深度学习的神经网络是什么？它是如何帮助摄像头完成图像识别等视觉计算的。它比传统摄像头的视觉算法又好在哪里？

04、深度学习之神经网络

深度学习大家看字面就很容易发现它是由“深度”+“学习”来完成的。“深度”就是模仿大脑的神经元之间传递处理信息的模式，其模型结构包括输入层（inputlayer），隐藏层（Hiddenlayer）和输出层（outputlayer），其中输入层和输出层一般只有1层，而隐藏层（或中间层）它往往有5层、6层，甚至更多层，多层隐层（中间层）节点被称为深度学习里的“深度”；“学习”就是进行“特征学习”（featurelearning）或“表示学习”（representationlearning），也就是说，通过逐层特征变换，将样本在原空间的特征表示变换到一个新特征空间，利用大数据来学习和调优，建立起适量的神经元计算节点和多层运算层次结构，尽可能的逼近现实的关联关系，从而使特征分类或预测更容易。

图为：神经网络结构示意图

上面的内容太抽象了，简单来讲神经网络有三层：

输入：输入层每个神经元对应一个变量特征，输入层的神经元相当于装有数字的容器

输出：输出层，回归问题为一个神经元，分类问题为多个神经元

参数：网络中所有的参数，即中间层（或隐藏层）神经元的权重和偏置，每一个神经元代表该层神经网络学习到的特征

这里大家只需要记住神经网络不管规模的大小，都是由一个一个单神经元网络堆叠起来的。

不好理解也没有关系，下面小编举个例子来说明一下吧。

假设我们要买房子，那么买房子我们所能承受的最终成交价格就是输出层；

输入层可能会有很多原始特征（即购房因素，如房屋面积，房间个数，附近学校个数，学校教育质量，公共交通，停车位）；

中间层（或隐藏层）的神经元就是我们可以学习到的特征，如家庭人数，教育质量，出行

我们搜集的输入特征数据越多，就能得到一个更为精细的神经网络。而且随着输入层的原始特征神经元个数的增多，中间层就能从原始特征中学到足够多的、更为细致的不同含义组合特征，比如房屋面积和房间数量能表示容纳家庭人数，学校数量和学校质量表示教育质量。通过每个神经元对应的特征分类、统计和计算，最终得到我们想要输出层“房价”。

那么对于摄像头的深度学习来说，输入层为摄像头获取的图像，图像对于摄像头深度学习算法来说可以看成是一堆数据流，那么这些数据流还可以分成更多原始特征，如图像各像素点的稀疏和密集、语义和几何信息，还包括颜色、明暗、灰度等；中间层将这些输入层的原始特征信息分类计算后，可识别出图像中包含的物体有哪些（如车道线、障碍物、人、车、红绿灯等），最终输出与自动驾驶车有关的物体的实时距离、大小、形状、红绿灯颜色等要素，帮助自动驾驶车辆完成实时感知周围环境识别、测距等功能。

图为：四维图新-摄像头视觉识别样例

图为：四维图新-地下车库建图和实时重定位系统

以上我们可以看出，基于神经网络的摄像头视觉深度学习算法比基于人为特征提取的传统摄像头视觉算法要好用的多。因此目前主流的摄像头视觉算法，都会使用深度学习去解决自动驾驶车对于图像分类、图像分割，对象检测、多目标跟踪、语义分割、可行驶区域、目标检测和同步定位与地图构建（SLAM）、场景分析等任务的准确率、识别率及图像处理速度等，深度学习视觉算法也让自动驾驶车快速量产落地成为可能。

05、摄像头深度学习算法

自动驾驶摄像头传感器所使用的深度学习视觉算法常用的有以下三种：

(1)基于卷积运算的神经网络系统，即卷积神经网络（CNN，ConvolutionalNeural Network）。在图像识别中应用广泛。

(2)基于多层神经元的自编码神经网络，包括自编码（Autoencoder）以及近年来受到广泛关注的稀疏编码（SparseCoding）。

(3)以多层自编码神经网络的方式进行预训练，进而结合鉴别信息进一步优化神经网络权值的深度置信网络(DBN，DeepBelief Networks)。

图为：深度学习一般流程

06、深度学习是一个黑箱

虽然讲了这么多，究竟基于神经网络的深度学习算法是如何获得输入输出的，其实上面的案例和算法分类也只是帮助我们去简单理解深度学习的神经网络，事实上深度学习是一个“黑箱”。“黑箱”意味着深度学习的中间过程不可知，深度学习产生的结果不可控。实际上程序员们编程后的神经网络到底是如何学习，程序员们也不知道，只知道最终输出结果是利用“万能近似定理”（Universal approximation theorem）尽可能准确的拟合出输入数据和输出结果间的关系。

所以，很多时候深度学习能很好的完成学习识别等任务，可是我们并不知道它学习到了什么，也不知道它为什么做出了特定的选择。知其然而不知其所以然，这可以看作是深度学习的常态，也是深度学习工作中的一大挑战。尽管如此，深度学习还是很好用滴！

当然，深度学习算法不仅仅可以用于自动驾驶摄像头方面的视觉感知，还可以用于语音识别、交通、医疗、生物信息等领域。

这里顺带说一句，作为四维图新而言，摄像头不仅是四维图新自动驾驶解决方案里的重要传感器，也是四维图新高精度地图采集的主要工具。而且在高精度地图采集和制图标注过程中，不仅为四维图新自动驾驶深度学习提供了海量的标注数据，还建立了四维图新自动驾驶各类场景仿真库，让四维图新基于深度学习的自动驾驶算法获得的结果更为准确、高效。

四维图新通过高精度地图采集车上搭载的高清摄像头、激光雷达等传感器，将采集到的数据加以处理，并通过高度的自动化平台进行绘制，从而为自动驾驶车感知、定位、规划、决策等模块提供重要支持。

目前四维图新高精度地图已经覆盖国内32万+公里高速公路以及10000+公里城市道路。

在自动驾驶仿真方面，依托大规模数据资源，形成参数化的场景模板，并具备静态场景生成与动态场景制作的场景库构建能力，为自动驾驶提供完备的仿真云平台能力和商用分析平台能力。

图为：四维图新-高速道路HD Map

图为：四维图新-城市道路HD Map

图为：四维图新-自动驾驶仿真标准场景库

结语：

相信通过这几期的车载摄像头以及相应视觉算法的介绍，让大家对摄像头视觉传感器有了一定的了解。众所周知，摄像头虽然可以实现很多功能，但是在逆光、光线昏暗和摄像头遮挡等某些特定环境下，摄像头的使用效果也会大打折扣，因此我们需要汽车其他传感器的冗余及各传感器数据融合计算来保障我们的自动驾驶车更加安全。而我们四维图新一直在致力于成为更值得客户信赖的智能出行科技公司，也希望我们的自动驾驶相关产品为小伙伴们带来更加安全、放心、舒心的自动驾驶体验。

关键字：摄像头人工智能深度学习激光雷达引用地址：自动驾驶传感器那点事之摄像头深度学习视觉技术

上一篇：上汽集团自研燃料电池系统技术性能已可比肩全球领先水平
下一篇：电动汽车哪家强？看懂这些半导体厂商的方案，你就明白了

推荐阅读最新更新时间：2024-11-08 23:03

亚马逊有危机感？ Echo将会升级配置狙击HomePod

就像10年前初代iPhone所做的一样，苹果刚刚推出的HomePod又把智能音箱的身价拉到了349美元，远远超出以亚马逊Echo为代表的主流智能音箱设备。不过亚马逊并不想像10年前那些过于安分守己结果被苹果一棍打死的传统手机厂商一样迟钝，他们最近也在谋划着将自己的智能音箱也升级到能够与苹果HomePod匹敌的高端领域。　　亚马逊放在首位的升级是苹果在发布会上一直强调的音质表现，而且就少许HomePod体验者的反馈来看，苹果智能音箱用七枚高音扬声器加一块4英寸振膜式低音单元，确实已经把音质表现做到了可以匹敌Sonos这类专业音箱的级别，而亚马逊的单个高频扬声器加一个低音扬声器的配置相比起来就要逊色不少，所以在升级后，Echo也同

[手机便携]

大联大友尚集团推出基于onsemi产品的车载以太网摄像头方案

2022年6月14日，致力于亚太地区市场的领先半导体元器件分销商--- 大联大控股宣布，其旗下友尚推出基于安森美（onsemi）AP0200AT+AR0147AT芯片的车载以太网摄像头方案。图示1-大联大友尚基于onsemi产品的车载以太网摄像头方案的展示板图近年来，随着车辆智能化、网联化的需求愈演愈烈，汽车产品的形态正从传统的“功能汽车”向“智能汽车”转变。与此同时，越来越多的摄像头被嵌入到汽车中，以保障驾驶安全。然而随着车载摄像头的数量增加，车内的数据交互量也呈现几何级增长。为了保证车内系统间通信的实时性与准确性，车载以太网作为一种高速通信技术被广泛应用。顺应此趋势，大联大友尚基于onsemi AP0200A

[汽车电子]

大联大友尚集团推出基于onsemi产品的车载以太网<font color='red'>摄像头</font>方案

三星申请双摄像头专利兼具广角和远距镜头

美国专利商标局公布的文件显示，三星2016年3月提交一份专利申请文件，该专利与双摄像头有关，三星可能会将双摄像头系统安装到未来设备中。虽然专利文件是3月提交的，但是直到最近才曝光。根据描述，三星准备为设备安装两个摄像头，一个是广角镜头，一个是远距镜头。远距镜头可以缩放拍摄对象，处理器根据对象的动作进行分析，做出决定使用当中的一个摄像头捕捉主图像。如果对象的速度比先前认定的速度快，处理器就会优先使用广角镜头，如果对象的速度比预定速度慢，就会用远距镜头拍摄主图像。文件还描述说，两个摄像头的图像可能都会显示在设备屏幕上，主图像全屏显示，子图像以画中画形式显示。三星的双摄像头系统还可以用来拍摄视频，它集成了处理器，可以自动切换主

[家用电子]

前台积电董事长张忠谋：将来很多工作被人工智能取代

前台积电董事长张忠谋以外部委员身分出席台湾地区行政院科技会报，他大力赞赏政府积极发展人工智能（AI）的政策，但也示警，未来五到十年内，会有很多工作机会被人工智能取代，政府有必要找智库进行整体性的影响评估。张忠谋说，将来很多工作被人工智能取代后，未来只有5%-10%掌握科技的人薪水变非常高，其他九成的人薪水会变很低。有关社会面与经济面即将面临问题，张忠谋建议政府要找智库进行整体性的通盘研究与建议，相关的专家也不要只找科技领域的，也要请社会面、经济面的专家共同协助。对此建议，赖揆表示认同，并承诺会做安排。科技会报昨日也增聘两名外部委员，分别是广达电脑董事长林百里、益安生医董事长张有德，任期从今年5月20日开始

[嵌入式]

Z世代已到来，UDE2021打造全球首个面向C端的消费电子展

过去，科技引领人们从蛮荒走向文明。今天，科技要你提前感受未来生活。2021 年 7 月 30 日 -8 月 1 日，由工业和信息化部电子信息司、中国电子视像行业协会指导，上海舜联会展有限公司主办的“UDE2021 国际消费电子及未来生活博览会”，即将登陆上海新国际博览中心，这是一个让年轻人深入最新科技潮流的大聚会。 UDE2021 国际消费电子及未来生活博览会 No.1 与年轻消费者深度互动中国拥有世界上最庞大的 Z 世代人群(95 后 00 后)，人数已达 1.49 亿，Z 世代占据整体消费力的 40%，正成为当下的消费担当。企鹅智库发布的《Z 世代消费力白皮书》显示：Z 世代消费群体逐渐成为消费市场的主力军，

[嵌入式]

不只会下棋，AlphaGo人工智能开始操刀做手术？

横扫围棋界后，人工智能企业 DeepMind 近日又在学术期刊《Nature Medcine》发表一项研究。“这项研究或将改变重度眼疾的治疗方式。” DeepMind官网自信地写道。这篇题为《可在临床上用于视网膜疾病诊断和转诊的深度学习》的论文称，系统能诊断包括糖尿病眼病、黄斑病变等50多种眼科疾病，准确度超过专家，并且可推荐相应的诊疗措施。 DeepMind 已经成为 AI 领域的明星，其将机器学习和系统神经科学的前沿技术相结合，建立强大的通用学习算法，其开发的 AlphaGo 打败了世界最顶尖的围棋手。此前有外媒报道，DeepMind 欲将其算法应用到医疗保健行业，包括计划在 5年内使用机器学习处理英国国家医

[嵌入式]

海信拟投入研发嵌入式AI处理器

集微网消息，据台湾电子时报报道，在上海国际物联网(IoT)大会上，海信信芯公司总经理钟声表示，海信正在围绕智能电视、智能家庭、智能交通产业，做相应的产品研发。未来要做出性价比较高、电视交互互动及辅助驾驶网络的相关产品。钟声指出，智能边缘化趋势明显，所谓的边缘化就是进入生活贴近人的交互应用。比如在家庭、汽车应用领域，低延时带来好的用户体验，通过边缘计算，信息并不上传云端，使用户隐私获得保证，同时也降低云端运算的压力。他认为，要达到自然的人机交互，能够达到所谓的“心有灵犀”境界，就是“智能”。其中智能语音助理无处不在，掌握了家庭、汽车、穿戴式设备控制与入口。入口，就是所有系统厂家争夺之处，谁掌握了入口，就掌握了市场。而智能语音互动

[手机便携]

大联大诠鼎集团推出基于联咏科技和思特威产品的AOV摄像头方案

2024年10月22日，致力于亚太地区市场的国际领先半导体元器件分销商---大联大控股宣布，其旗下诠鼎推出基于联咏科技（NOVATEK）NT98568 SoC芯片和思特威（SmartSens）SC450AI图像传感器的AOV摄像头方案。图示1-大联大诠鼎基于联咏科技和思特威产品的AOV摄像头方案的展示板图随着安全需求的不断提升和产品的持续升级，高清画质、低功耗和智能化成为视频监控产品发展的核心趋势。在这一浪潮中，AOV（Always on Video）作为低功耗视频监控技术的代表，逐渐走入人们的视野。其能够在各种复杂光线条件下提供低功耗与高质量的监控功能，满足消费者对于监控效果的高要求。由大联大诠鼎基于联

[传感器]

大联大诠鼎集团推出基于联咏科技和思特威产品的AOV<font color='red'>摄像头</font>方案

热门资源推荐
热门放大器推荐

小广播