浅析多相机SLAM系统及其在自动驾驶中的应用

发布者:Chunjie2022最新更新时间:2023-08-01 来源: elecfans关键字:自动驾驶 手机看文章 扫描二维码
随时随地手机看文章

导读

视觉传感器体积小重量轻、价格相对低廉,同时能够提供丰富的信息供定位、感知等算法模块使用,因此在机器人和自动驾驶系统中的得到了广泛应用。作为视觉定位系统的重要组成部分,基于视觉传感器的同时定位和建图算法(SLAM)应用广泛,在学术界和工业界都得到了很多关注。具体来说,在自动驾驶系统中,视觉SLAM可以在地图不可靠、GPS不稳定情况下(例如城区辅助驾驶)提供可靠的位姿估计和周围环境信息。同时,相对于激光雷达等传感器,相机价格较低,配合视觉定位和感知算法,可以以低成本实现智能驾驶功能。


但是,视觉SLAM系统经常被人诟病的一点是鲁棒性。基于视觉的位姿估计的基本原理是追踪匹配图像中明显的视觉特征,因此过曝、弱纹理、运动模糊等问题一直是视觉SLAM系统实际应用中的痛点。在研究和工程实践中,多传感融合、相机参数控制等手段都可以用来提高视觉SLAM系统的鲁棒性;另一方面,目前的自动驾驶系统往往都配备了多个相机形成环视视觉系统,而合理利用多相机系统可以很大程度上提升SLAM系统的性能,因此本文将着重介绍在多相机SLAM系统的原理、和一般单目/双目系统的区别及其在自动驾驶系统中的应用。


一、从单相机到多相机的拓展

自2004年视觉里程计技术被正式提出以来,视觉SLAM技术经过长期发展,其基础理论已经相对完善(如立体几何、非线性优化和滤波等)。在工程实践方面,研究者也总结出一套相对通用的系统框架:粗略来说,视觉SLAM系统通常被划分为前端和后端,其中前端负责建立不同时刻图像之间的匹配关系并进行局部估计,保证系统的实时位姿输出,后端则负责在相对大范围内进行优化,保证系统的精度和全局地图一致性。从具体系统实现上来说,大部分工作都是针对单目或者双目相机进行的,因此我们最熟悉的一些技术实践不可避免是针对这两种相机配置进行设计的。


将单目/双目SLAM系统拓展到多相机SLAM系统时,前端-后端的系统框架一般可以沿用,但是需要对原有针对单目/双目的具体算法模块进行改进,使其适用于多相机配置,下面以MultiCol-SLAM为例进行说明。MultiCol-SLAM基于ORB-SLAM设计了多相机SLAM,在基础数据结构上将关键帧Keyframe的概念拓展到Multi-Keyframe(MKF),即不同相机在同一时刻观测的集合:

f40a61fe-ec2e-11ed-90ce-dac502259ad0.png

MultiCol-SLAM中的多相机

因此这里我们关注的不再是某个相机的位姿,而是图中body-frame的位姿,多个相机的观测都可以为估计body-frame的位姿服务。其他算法模块也需要针对MKF进行适配,首先需要通过非线性优化求解位姿的模块(例如Tracking中相对局部地图的定位、局部Bundle Adjustment)需要将body-frame的位姿作为求解变量并更改相应的cost,其次,一些常用的位姿求解器需要替换为支持多相机的版本,例如在重定位中使用Generalized P3P和PnP算法替代EPnP求解位姿初值。

f418d694-ec2e-11ed-90ce-dac502259ad0.png

从单相机绝对位姿估计(左)到多相机绝对位姿估计(右),其中f代表视觉观测。图取自OpenGV文档。


从MultiCol-SLAM的例子可以看出,将适用于单目/双目的SLAM系统拓展到多目整体来看是比较自然的:需要估计的位姿不再和相机绑定而是通过外参关联到多个相机,相应的算法模块也都可以比较容易地拓展到多相机系统。更一般地,从SLAM理论基础的角度来说,非线性优化和滤波的理论和工具相当灵活,可以方便地根据多相机配置进行适配,同时,针对多相机的几何视觉研究也相对成熟,常见的位姿求解问题基本都可以找到相应的工具。


但是,如果我们不仅仅满足于让多相机SLAM系统“跑起来”,而是想要实现一个鲁棒、泛用的多相机SLAM系统,就需要进一步考虑各个模块中引入多相机所带来的额外问题,而这些问题往往会对系统的整体性能有明显影响。下面对多目SLAM系统中的几个难点进行说明。


二、多相机SLAM中的难点

初始化

视觉SLAM初始化的目的是建立初始的3D点地图用于后续跟踪,直接影响SLAM系统的精度指标。对于单目和双目系统,分别通过5点法/planar homography和双目三角化进行初始化已经成为事实上的标准方法。但是,对于多目相机,由于相机的配置不确定,一套通用的初始化方法应当如何设计仍不明确。显然,相机的具体配置,尤其是相机之间是否有overlap,决定了合适的初始化流程。MultiCol-SLAM对多相机组中的每个相机都计算相对位姿、从中选择质量最好的一组得到粗略的3D点,再将这些3D点投影到其他相机中并利用所有观测进行联合优化,这种方法只适用于相机之间有overlap的情况。也有一些工作尝试通过分析相机之间的overlap情况来决定初始化的策略,可以对不同的多相机配置实现一定程度上的自适应,但是整体来说,通用鲁棒的多目相机初始化仍是一个开放的问题。


在线外参估计

和多传感融合算法一样,多相机SLAM算法也需要精确的相机间外参才能正常工作。离线标定虽然可以得到十分精确的结果,但是在系统运行过程中由于碰撞、震动等不可避免会出现外参的变化,尤其是对自动驾驶汽车来说,由于相机之间距离较大,外参甚至可能随着车体运动、负载状况的不同发生变化,因此系统在正常运行环境中(不依赖标定设备)对相机外参进行标定的能力比较重要,学界对此也有很多研究工作。一类工作是利用多个相机(单目或者双目组合)单独运行SLAM/SfM算法,再对不同相机的地图进行匹配融合,最后再通过联合优化得到外参;另一类工作是利用SLAM本身已有的非线性滤波或优化求解过程,将外参作为额外待估参数加入求解器进行估计,可以实时估计外参变化(激励充分时),例如有的提出一种MSCKF框架下的多相机、多IMU视觉惯性里程计,实现了对相机和IMU外参的在线估计;而针对自动驾驶平台上的多相机系统,也有人将相机之间的外参加入视觉SLAM的局部BA中进行估计。


原理上来说,上述方法和构建一般的状态估计问题差异不大,但是相较于离线标定问题,在线标定受限于系统的运行状况,需要额外注意当前数据是否足以准确估计外参(即系统是否有足够的激励,相应待估参数是否可观)。相关地,也有工作从数据的角度出发,自动选择信息量更大的数据对多相机外参进行估计。


特征选择

多个相机带来更多的观测数据,理论上来说总能带来更好的定位建图结果,但是也带来了更大的计算量。因此实际中经常需要面对的问题是,如何对丢弃一定的观测以减小计算量,同时对定位精度有较小的影响?启发式的方法可以起到一定的效果(例如视觉SLAM中经常用到的特征在图像上平均分布的技巧),但是往往不是最优的。因此一些研究工作提出了基于信息论的方法,粗略来说,是以一种数学上更严格的方法衡量丢弃观测后对系统的影响,例如利用Hessian矩阵的信息度量对多个相机中的特征进行选择,或者通过对特征分布的合理假设,简化Hessian矩阵的计算和多个相机的特征选择问题。本质上来说,特征选择是一种在尽量不影响求解结果的约束下,通过更改问题结构减小计算量的方法,这一方向的研究工作仍处于SLAM后端优化的研究前沿。


HUIXI TECH

三、多相机SLAM在自动驾驶中的应用

自动驾驶平台上的多个相机往往覆盖车身周围360°的视角,能够利用全方向的视觉信息,因此如果能够充分利用这些相机,多相机视觉SLAM系统可以实现不同外部条件下鲁棒准确的位姿估计。在论文“Towards Robust Visual Odometry with a Multi-Camera System”中,作者设计了一种基于光度一致性的多目视觉SLAM系统,在配备有前、后、左、右四组双目相机的平台上进行测试,结果表明,如果能够利用全部四组双目相机,系统可以在不同光照条件下(白天、夜晚)稳定地工作,并保持较高的位姿估计精度。“ROVO: Robust Omnidirectional Visual Odometry for Wide-baseline Wide-FOV Camera Systems”一文则针对包含4个鱼眼相机的环视系统设计了基于特征点的视觉SLAM系统,实验结果表明在多相机SLAM系统中加入在线外参估计对系统性能有明显提升。

f43f245c-ec2e-11ed-90ce-dac502259ad0.png

H. Seok and J. Lim, IROS 2018中的传感器配置和SLAM效果

在自动驾驶平台上应用多相机SLAM系统同时也需要考虑自动驾驶汽车的特性。例如,自动驾驶汽车的运动自由度有限,并存在大量速度变化不大情况,这对某些参数的在线标定有一定影响,这一点在结合IMU搭建SLAM系统的时候需要尤其注意。另一方面,也可以利用车辆特有的性质减小状态估计的难度,例如通过离线实验识别出相机外参变化的可能模式(由具体相机安装方式决定),随后在在线外参标定中将这些模式作为约束,提高了在线标定的效率和精度,又如车道线作为结构性很强的特征,可以作为外参在线标定的重要线索。


自动驾驶平台上的感知系统往往也充分利用了多相机系统,可以提供丰富的语义信息,例如车道线和分割结果等,这些信息和传统视觉特征互为补充,可以作为多相机SLAM系统的重要输入。例如有的利用IPM图上提取的车道线信息构建地下车库的地图,为自动泊车提供定位功能,或者利用环视相机生成BEV视角下的分割结果,直接将该结果作为SLAM系统的输入,实现相邻帧的位姿估计和回环检测等功能。另外,特斯拉在AI Day 2022上也提到,在FSD中集成了多目视觉-惯性-轮速里程计,利用了神经网络输出的多种结果(特征、全景分割、地面等),实现了100Hz、漂移率在1%左右的位姿估计,该里程计输出的位姿和3D结构为下游自标注系统提供了输入。

f46bc91c-ec2e-11ed-90ce-dac502259ad0.png

Tesla AI Day 2022展示的多目视觉惯性里程计


四、总结

在视觉SLAM系统中引入多相机可以有效提高系统的鲁棒性和精度,具体到自动驾驶汽车,环视相机系统可以利用全方向的视觉信息,为视觉SLAM系统提供了很好的传感器配置。从具体算法来说,虽然视觉SLAM的理论基础相对成熟,但是实现一套效果优秀的多相机SLAM系统仍需要解决若干痛点,例如外参自标定、如何平衡计算量和精度等,这里既有工程上的挑战,也有待研究的问题。另外,自动驾驶汽车感知系统提供的语义信息可以作为多相机视觉SLAM系统的重要输入,如何将神经网络输入的语义信息和传统的非线性优化滤波有效结合(例如如何衡量语义输出的几何不确定度)仍是一个开放的问题。


关键字:自动驾驶 引用地址:浅析多相机SLAM系统及其在自动驾驶中的应用

上一篇:一文解析汽车电动机内部工作原理
下一篇:电动助力转向系统EPS主流芯片有哪些呢?

推荐阅读最新更新时间:2024-11-12 22:10

雷诺发布自动驾驶战略:个人车辆聚焦L2和L2+
据外媒报道,5月15日,雷诺集团正式发布自动驾驶战略,未来将基于个人车辆和公共交通的差异化需求,实现自动驾驶技术的最佳应用。 在个人车辆方面,雷诺集团专注于L2和L2+级别的驾驶辅助系统,具体功能包括情景巡航控制、车道保持辅助以及即将推出的自动超车技术等。 雷诺集团认为,这些系统在市场上处于领先水平,能有效提升驾驶的安全性和舒适性。但在使用这些系统时,驾驶员仍然需要负责车辆驾驶。 在公共交通领域,雷诺集团预计在未来几年内,市场对自动驾驶迷你巴士的需求将达到数千辆。未来,雷诺集团将推出一个基于全新雷诺Master的机器人化电动迷你巴士平台,该平台能够整合来自EasyMile、Milla和文远知行等专业合作伙伴提供的自动化
[汽车电子]
雷诺发布<font color='red'>自动驾驶</font>战略:个人车辆聚焦L2和L2+
自动驾驶第一股交出Q3成绩单,图森未来的卡车故事讲到哪?
自动驾驶故事的主旋律依旧是投入,这在“全球自动驾驶第一股”图森未来11月3日美股盘后发布的2021Q3财报中又一次得到了印证。 过去几个月里,图森未来的第二次无人驾驶实测让市场看到了它在过去一年多时间里的技术积累与进步,这给下一季度的进一步测试打下基础。不过,暂时无法大规模落地的商业化、前途不明的造车之路等等,都给这家专注自动驾驶技术的年轻公司出了不少难题。而纵观自动驾驶行业,或许不少参与者也面临相似的问题。 AFN推动营收增长,研发投入扩大仍是亏损主因 进入美股财报季,中概股陆陆续续发布新一季度财报。 从Q3财报来看,图森未来的一些核心数据还是实现较稳定增长。比如在营收方面实现了179万美元的季度收入,同比增长近三倍,环比增
[机器人]
博世预发布HWP系统 实现130km/h高速路段自动驾驶
10月18日,博世预发布“高速公路驾驶员HWP(highway pilot)”系统,这套系统具备了L3级别自动驾驶功能,能让自动驾驶系统接管时速130km以内的高速路段自动驾驶。 据悉,该套系统由博世中国团队自主研发,目前还处于demo阶段,博世的demo car搭载了Level 3的自动驾驶系统,其最亮眼的功能莫过于TJP(Traffic Jam Pilot),在高速公路上遇到交通拥堵情况,速度低于60km/h时,可以启动车辆的自动驾驶功能,驾驶员可以短暂的将车辆控制权交给系统来掌控,双手可完全脱离方向盘。 但遇到特殊情况,例如前方有大雾或恶劣雨雪天气,车辆无法处理的时候,系统会给驾驶员引导,让驾驶员在10秒之后接
[汽车电子]
福特将投资14.5亿,促进在电动车和自动驾驶汽车领域的发展
福特汽车为进一步巩固其在卡车和 SUV 市场的领导地位,宣布计划向密歇根东南部的两座生产工厂投资超过 14.5 亿美元,并增加 3,000 份就业岗位。此举也将促进其在电动车和自动驾驶汽车领域的发展。 据悉,总部位于密歇根州迪尔伯恩的汽车制造商表示,约有 7.5 亿美元将直接用于位于韦恩的密歇根装配厂,福特表示,未来三年将在该地区增加 2700 个工作岗位。此外,福特表示,将在迪尔伯恩的卡车工厂投资 7 亿美元。将增加三百个新职位。 福特伟恩工厂自动驾驶汽车部门、Bronco 和 Ranger 修装中心的员工从 2021 年起将完成福特首批自动驾驶汽车的生产工作,包括为车辆安装独一无二的自动驾驶技术和特制的内饰。该
[嵌入式]
福特将投资14.5亿,促进在电动车和<font color='red'>自动驾驶</font>汽车领域的发展
还在危言耸听?一文看懂汽车芯片的前世与今生
在华为事件之后,谈芯片色变是当下中国各行各业的普遍现象。这种对芯片的焦虑,其根本还是因为中国半导体技术的长期落后。正所谓「落后就要挨打」,本国的技术不行,就时刻要防范着是不是会被外国「卡脖子」。 眼下,这种对芯片的焦虑开始从手机蔓延到汽车行业。 近期,一则关于「芯片断供导致部分车企停产」的消息在汽车圈里沸腾,「上汽大众 12 月 4 日停产,一汽大众月初停产……」,国内车市的销量扛把子的南北大众被牵涉其中,让话题更多了些热度。 芯片,这个看似「高大上」似乎只会搭载于精密设备上的硬件,当下居然和「四个轮子,一个沙发」的汽车扯上了关系。一场危机,让很多行外人开始关注汽车芯片,可你真的了解什么是汽车芯片吗? 首先
[汽车电子]
还在危言耸听?一文看懂汽车芯片的前世与今生
人工智能在全球共获得660亿美元融资,进了哪些公司腰包?
亚马逊的Alexa智能音箱,蚂蚁金服的芝麻信用分,富士康的“熄灯工厂”,Zume Pizza的披萨制作机器人,以及全球汽车厂商和科技巨头竞相研发的自动驾驶汽车……那些已经实现的,和即将到来的林林种种,都在昭示着我们正在进入人工智能的新时代。 作为面向未来的基础产业、打开各产业智能化大门的钥匙,人工智能理所当然地成为近年来最炙手可热的投资领域:据统计,自2013年二季度到2019年二季度,全球超过3600家人工智能创业公司,通过近7000起融资,共获得660亿美元融资。 那么,这些资金到底流向了哪些行业?人工智能在这些行业主要应用于哪些环节?哪些领域受到资本的最多关注?跨产业应用又产生了哪些新的机会?通过CB Insi
[嵌入式]
人工智能在全球共获得660亿美元融资,进了哪些公司腰包?
从ADAS迈向全自动驾驶所需的关键技术
自动驾驶技术在人工智能和汽车行业的飞速发展下逐渐成为业界焦点。根据相关机构预测2019年仅在中国智能驾驶市场规模就将突破千亿元,达到1137亿元。2022年中国智能驾驶市场规模将突破200亿元,并预测在2023年中国智能驾驶市场规模将增长至2415亿元左右。这其中技术中摄像头和传感器使未来的自动驾驶系统拥有几乎与人类一样的视觉和感知能力。感知检测系统(例如RADAR和LIDAR)是自动驾驶车辆的眼睛,能够采集环境信息并识别物体和危险状况。智能导航检测系统基于惯性测量单元(IMU)和创新陀螺仪技术,即使在难以接近的区域也能确定车辆的位置。 雷达、激光雷达、惯性MEMS/IMU、摄像头和超声传感器等不同子系统组合,为成功实现自动驾
[汽车电子]
从ADAS迈向全<font color='red'>自动驾驶</font>所需的关键技术
自动驾驶离不开传感器
随着自动驾驶等前沿科技领域发展加速,传感器的重要性和普及率也获得了持续提升。面对传感器在未来愈发广阔的蓝海“诱惑”,国内企业亟需加强各领域合作,并积极引进高端人才、完善培养体系,以获得突破性的创新研发能力,赢得全球竞争优势。 近期以来,谷歌母公司Alphabet旗下的自动驾驶企业Waymo频频展开无人驾驶汽车的测试,以验证车辆搭载的传感器性能,以及赋予的新功能。   Waymo多方位测试无人驾驶汽车传感器彰显未来重要性 据外媒报道,数月前,Waymo在一场极端的暴风雪天气中,将其无人驾驶汽车带到了塔霍湖地区,以测试在极寒天气中的性能。而近日,Waymo又开始测试无人驾驶汽车的耐高温性能。 Waymo无人驾驶汽车携带着最新传感器,
[嵌入式]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
随便看看

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved