端到端自动驾驶到底是什么?

发布者:zukeq2009最新更新时间:2023-09-21 来源: elecfans关键字:端到端  自动驾驶 手机看文章 扫描二维码
随时随地手机看文章

01

端到端自动驾驶到底是什么?

经典的自动驾驶系统有着相对统一的系统架构:

探测(detection)

跟踪(tracking)

静态环境建图(mapping)

高精地图定位

目标物轨迹预测

本车轨迹规划

运动控制

几乎所有的自动驾驶系统都离不开这些子系统,在常规的技术开发中,这些模块分别由不同的团队分担,各自负责自己模块的结果输出。

这样的好处是,每一个子系统都能够有足够好的可解释性,在开发时能够独立优化。

与此同时,为了保证整体自动驾驶的性能,每一个模块都需要保证给出稳定的表现。

所以事实上在一个 Bug 出现时,需要巨大的 Triage 团队对 Bug 进行分析,然后将具体的 Bug 来源分配给责任团队。

据说在 Waymo,甚至有超过 200 人的团队,对 Bug 进行分析和责任分配。

那找 Bug 来源和 Bug 优化的任务就不能自动化吗?

当然可以, 如果我们能将各个模块用可微分的方式连接起来。类似于传统深度学习,出现误差时,深度自动回传进行权重更新。

某种程度上,这就是端到端自动驾驶的概念。


02

理想化的端到端自动驾驶

事实上,从自动驾驶开始发展,就一直伴随一个看似幼稚但是非常复杂的疑问:

为什么我们不能开发一个系统,输入时是传感器信号(摄像头,激光雷达),输出是控制指令(转向,刹车,加速)?

这个问题,实际上,业界也一直有人在探讨,甚至于国内 2018 年还有一家公司给出了这样计划:

其方案

输入为视觉信号,输出为 Steering,Brake,Accelerate,而真值为真实人类司机的上述动作。

输入输出都有了,真值数据也有了,接下来就是塞进看不太懂的胶囊神经网络里进行全局优化训练,最后就能给出结果。

这个方案好在没有吸引到什么大手笔投资,很快就销声匿迹了。

不过这两天,大模型出来之后,我甚至也看到了一模一样的计划,只不过网络换成了大模型。


03

为什么完全端到端目前不可行?

神经网络的黑盒效应让完全端到端自动驾驶无法找到正确优化方向。

本质上又回到了最初的问题,模块解耦让多模块单独优化成为可能,让每一个模块拥有独立的可解释性。

而如果变成一个巨大的神经网络模块,这种基于统计学的神经网络是无法保证在正确的道路上持续优化的,因为无法保证对未见过的物体的鲁棒性,也无法对某一个具体的 Bug 进行定向改进。

可能会有人会问,那语言大模型表现可以迁移吗?

泛化性的迁移是可行的, 根据 Google 的研究结果,他们基于语言大模型的抓取机器人,已经可以做到对没有见过的物体有直接的泛化能力,例如他们要求从未见过乌龟的机器人抓取一只乌龟,任务能够被很好地完成。

因为很好地使用了大语言模型的泛化能力,但是这件事情在自动驾驶上,尚未得到验证。

但是如何对一个具体的 Bug 进行改进?

假设出现了一次误刹,经典的自动驾驶技术栈会分析:

刹车指令的来源,是前方动态障碍物,还是静态物体?

或者是规划模块的速度规划出现问题?

或者是控制模块在输出正确的情况下,控制指令出现了问题?

根据这些然后再进行定向优化。

但是,完全端到端,就失去了这种定向优化的能力,甚至都无法知道,具体应该提供哪种数据进行定向优化。

而理想在上周提到的红绿灯意图网络(TIN)也同样是一个视觉输入到转向意图的整体设计创新,令人印象深刻。

但是对于具体如何应用到量产中我其实并不乐观,一个这样的网络硬件部署难度和实际效用的收益比尚且不论,而优化过程是一个更加大的命题。

如果答案是加上所有的量产数据,显然不能说服工程界,期待之后有更加深入的介绍。

当然,Elon Musk 在上个月的 Twitter 中,画了一个巨大的视觉到控制指令的饼,但是我也绝不认为他们正在研究的模型内部是一个完全黑盒的网络。


04

工程派的端到端自动驾驶 UniAD

整体自动优化,可解释性我统统都要

为了解决整体优化问题,UniAD 使用了一个巨大的 Transformer 网络,但是为了保证每个模块有足够的可解释性并能够被独立优化,这个网络被分割成多个共享 BEV 特征的 Transformer 网络。

首次将跟踪、建图、轨迹预测、占据栅格预测统一到一起,并且使用不依赖高精地图的 Planner 作为一个最终的目标输出,同时使用 Plan 结果作为整体训练的 loss 来源。

也就是说,UniAD 并没有完全抛弃原有的自动驾驶技术栈,而是改变了子模块连接的方式,传统可能是靠规则和显式连接,例如先从检测网络拿到目标物体的位置和速度,再喂给下一个模块。

这种规则和显式连接的方式无法完成梯度传播(神经网络的自我迭代方式),只能靠人工优化。

但是 UniAD 共享了 BEV 特征,将子模块用神经网络的方式连接起来。这样就保证了整体网络的一致性,能够完成梯度的前向传播,也就有了自动优化的能力。

整体流程

c3ac737c-14f0-11ee-962d-dac502259ad0.jpg

从流程上看,首先将环视的图片以 Transformer 映射到 BEV 空间供后续模块使用。

TrackFormer 根据 BEV 信息进行推理,融合了检测和跟踪任务,输出为目标检测和跟踪的信息;

MapFormer 根据 BEV 信息给出实时地图构建结果;

之后 Motion Former 将 TrackerFormer 的结果和 MapFormer 的结果和 BEV 结果进行融合,最后得出周围物体整体轨迹和预测。

这些信息会作为 OccFormer 的输入,再次与 BEV 特征融合作为占据栅格网络预测的输入。Planner 的目标是防止本车与占据栅格碰撞,作为整个大模块的最终输出。

前景

面对一个巨大的,并且分模块的任务,训练过程一定是非常不稳定的。

文章中提到,根据他们的经验,他们会先训练 6 次 Percecption(Track 和 Map )部分,再训练 20 次整体,最后得到比较好的结果。

这种训练方式也是得益于整体设计的相对解耦,感知模块可以被单独训练。能够在获得一个相对已经稳定的感知结果的基础上,进行后续模块的训练,同时也对感知模块进行优化。

这种设计为工业界使用提供了一定的便利,多个模块之间的输出可以被单独 debug,也能被统一优化。

而在工业界相对比较多的本车 Plan 相关数据也为整个网络的训练提供了保证。

UniAD 的输出到了Planning 就截止了,确实因为后面控制的内容就不属于计算机视觉领域了,并且其实控制模块用 Learning 的方式其实并没有的得到承认 期待一些公司的部署结果。


写在最后

关于自动驾驶的未来,各个模块之间的界限越来越模糊,与此同时,配套的开发工具链也需要从模块解耦转换到模块融合。

有意思的是,恰逢其时,来自 Waabi 创始人,著名研究学者 Raquel 的一篇文章 CVPR Highlight UniSim 也非常值得一读。

使用 NeRF 相关技术,统一了场景编辑、Camera 仿真、Lidar 仿真、交通仿真多个任务。

这篇文章为高效端到端的仿真训练提供了可能性。

c3c038a8-14f0-11ee-962d-dac502259ad0.jpg

虽然从算法创新的角度看,太阳底下没有什么新鲜事,UniAD 是 Tranformer 的工程化创新,UniSim 是 NeRF 的工程化创新。

但是自动驾驶本身就是一个工程问题,工程化和快速迭代的能力会越来越重要。

学术界已经有了非常明显的转变,国内工业界某些公司却似乎还在每天宣传自家算法的巨大创新。

甚至在这次 Best Paper 发布之后, 知乎上很多人诟病 UniAD 算法不够创新。

可是自动驾驶作为一个巨大的工程问题,为了创新而创新是无法带来真正量产可用的系统的。

这种反差倒也是一件非常有意思的事情。


关键字:端到端  自动驾驶 引用地址:端到端自动驾驶到底是什么?

上一篇:您的汽车电池组是否有故障的危险?
下一篇:共同打造碳化硅在新能源汽车的应用!

推荐阅读最新更新时间:2024-11-13 16:26

谷歌自动驾驶汽车重大进展 可实时识别上百物体
    网易科技讯 4月29日消息,据国外媒体报道,谷歌周一表示,其自动驾驶汽车技术的测试工作已取得重大进展。截至目前,谷歌自动驾驶汽车已完成70万英里的驾驶测试,其中不仅包括了无交通灯的高速公路驾驶测试,还包括了大量地面情况更为复杂的郊区街道驾驶测试。 “我们仍然有大量问题尚待解决,譬如让自动驾驶汽车在山景城(谷歌总部大楼所在地)完成更多的街区驾驶后,再前往另外一个城市进行下一阶段的测试。不过两年前严重困扰我们的大量街区驾驶路况问题,自动驾驶汽车现在已经能自行处理了。”谷歌无人驾驶汽车技术项目开发总监克里斯·厄姆森(Chris Urmson)表示。 谷歌今日还放出一段YouTube视频来展示公司自动驾驶汽车技术的进展成效。目
[手机便携]
十年前开始 自动驾驶车已行驶400万英里
  十年前以及科技公司开始路测 自动驾驶 技术,至今他们的自动驾驶汽车已经在到路上行驶了400万英里(约644万公里)。该公司就是谷歌,他是率先开启自动驾驶技术的科技公司之一。           这400万英里是Waymo所有测试车队完成的,其中包含最初的 无人驾驶 车和最新的无人驾驶时ChryslerPacifica小型货车。另外在Waymo部门没有独立时,测试里程就已经到了200万英里,在2016年12月Waymo从Google独立后无人驾驶车队增加了100台测试车辆。   笔者观点:自动驾驶车辆确实需要大量的实验来进行验证,尤其是在公共道路上,这样车辆的验证更加贴近真实就越会更快的应用到现实。这400万英里是一个并
[嵌入式]
如何迎接迎接车载图像处理的新挑战
ADAS及自动驾驶的视觉感知竞争正在进入纵深阶段,这其中,高像素摄像头已经成为趋势,而关乎图像处理质量的ISP已经成为竞争高地。 ISP的存在感越来越强,不只是在手机上,汽车市场的需求也已经明确释放。 ICV Tank数据显示,2021年全球单车平均配置摄像头数量为2.3颗,相比2020年的1.3颗大幅提高;预计到2026年,全球单车平均配置摄像头数量将达3.8颗。全球汽车前装摄像头总量将从2021年的1.65亿颗增长至2026年的3.7亿颗,年复合增长率达16%。 早期的车载摄像头常用于行车记录、倒车影像、泊车环视等。随着车载摄像头在汽车领域的广泛应用,如今逐步延伸到智能座舱内行为识别、ADAS辅助驾驶等。受益于车载摄像
[嵌入式]
11亿美元!Bosch德国建厂重磅押注自动驾驶传感器
全球最大的汽车零部件制造商Bosch(博世)准备在德国东部城市Drasden(德累斯顿,德意志联邦萨克森州首府)投资11亿美元(约10亿欧元)建造一座新的芯片制造工厂。这将成为博世历史上总额最大的一笔投资。 这座新的工厂落成以后,预计将为自动驾驶汽车应用的传感器制造芯片,并将带来约700个新的工作岗位。去年,博世曾经和著名汽车制造商Daimler(戴姆勒)联合宣布,将在2020年开始销售自动驾驶汽车。 MEMS传感器、摄像头、雷达传感器、LiDAR传感器以及激光扫描器等先进的 智能传感器 是自动驾驶汽车开发的关键使能者。自2013年以来,博世一直在为MEMS信号处理开发特种电路。这座新投资的工厂预计将负责大规模制造这些特种电路。
[汽车电子]
特斯拉应对外销售,打破英伟达自动驾驶芯片垄断
comma.ai 公司 CEO 乔治·霍茨(George Hotz)认为,特斯拉应该对外销售其自动驾驶芯片,与另外一家芯片制造商英伟达形成竞争。 此前有报道称,comma.ai 的目标是要成为特斯拉在自动驾驶领域的对手,就像安卓之于苹果 iOS 一样。为了开发技术,这家初创企业非常依赖英伟达公司开发的超强计算芯片。 图源:新浪 直到不久前,特斯拉也处于类似的境地,不得不使用英伟达的芯片,但是随后这家电动汽车制造商开发了自己的全自动驾驶芯片,也被称为 HW 3.0 自动驾驶计算机。 霍茨在年少时,就凭借其黑客技术一举成名,但是之后他成为了一名备受尊敬的程序员,并创立了 comma.ai 公司,旨在解决自动驾驶问题,同时在
[嵌入式]
特斯拉应对外销售,打破英伟达<font color='red'>自动驾驶</font>芯片垄断
瞄准自动驾驶未来市场,韩国拟投500亿美元大力发展自动驾驶
10 月 15 日讯,韩国意图用自动驾驶来提振经济。 韩国政府周二公布计划,未来几年加速采用电动汽车、自动驾驶汽车,甚至飞行汽车,以帮助提振低迷的经济。 韩国总统文在寅在一次讲话中表示,韩国企业将在未来十年投入 60 万亿韩元(约 500 亿美元),用于开发未来的交通运输工具。他说,政府将花费 2.2 万亿韩元来帮助发展相关技术,为诸如自动驾驶汽车之类的产品所需要的基础设施奠定基础。他说,预计全自动驾驶汽车的商业化将在 2027 年实现,较原来计划的提前三年。 文在寅还预计到 2030 年,电动和氢燃料汽车将占韩国汽车销售的 33%,而 2019 年仅有 2.6%左右。 为促进这些汽车的销售,政府将考虑向购车者提供补贴,并在 20
[机器人]
这辆自驾车充满黑科技,用手机发个定位它就会自动去找你!
大家好,这里每天为你更新全球最新科技,了解全球的黑科技,喜欢的话就请关注哦~ 全球 说到自驾车大家首先想到的一定是特斯拉,但是特斯拉的出现,也带动了不少其他车企对汽车的研发,今天小编要给大家介绍的就是这辆汽车。这辆汽车是由瑞士的一家公司设计而成的。 全球 这款车有专门的APP,你可以通过专门的APP来对它进行预约,选择地点和时间,然后就可以选择相应的车型付款就可以了,之后它就会到达指定的时间和地点,然后你就可以用APP一键上车,上车后还会对人脸进行身份验证。 全球 这辆车有两种驾驶模式,一种是手动驾驶,一种是自动驾驶,如果你需要和旁边的人聊天的时候,你就可以一键选择自动驾驶模式。这辆车的内部也比较新颖,就像一个后花园一样,车
[汽车电子]
预见2020|从自动驾驶新趋势看普及前景
2020年的汽车产业继续在复苏道路上艰难前行,一方面车企通过裁员减薪等方式降低成本,另一方面紧追“新四化”浪潮大力投入新技术研发。开年的新冠肺炎疫情,虽然让行业出师不利,但长期来看无法阻挡汽车四化升级的趋势。而且在疫情的影响下,可能会大幅激发自动配送、自动驾驶产品的需求。 在错综复杂的形势下,未来自动驾驶技术在国内汽车行业的产业热点地位会发生哪些变化?汽车之家推出《预见2020》系列话题内容,借由资深行业人士的视角,了解2020年汽车产业的种种可能性。本期我们将基于政策、消费者及国内车企动向三方面,分析自动驾驶发展趋势变化。 60秒快速了解核心论点: ●政策上,作为国家战略的智能网联汽车顶层设计方向不动摇;汽车
[汽车电子]
预见2020|从<font color='red'>自动驾驶</font>新趋势看普及前景
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved