随着特斯拉FSD迟迟无法在中国市场正式落地,“不造车”的华为似乎已经在国内接过了智能驾驶话题流量的接力棒。为价格战愈演愈烈的中国汽车行业,注入了一股高科技的“诗与远方”。
11月初,华为常务董事余承东与小鹏汽车CEO何小鹏在社交媒体上的一场隔空对话,让AEB自动紧急制动系统再度引发广泛关注,话题出圈。
11月26日,华为车BU拆分独立,成立新公司的消息正式官宣。新公司将引入长安汽车及关联公司投资,股比不超过40%。相关报道称,华为还正与一汽、东风等多家投资方进行沟通洽谈,新公司估值或将高达2500亿元人民币。
11月28日,华为智选车(现已更名“鸿蒙智行”)首款纯电轿车智界S7(配置小鹏G6(配置G9(配置|询价)及P7i Max版车型在上海、深圳、广州,P5系列在上海高精地图覆盖区域开放点到点城市NGP(智能导航辅助驾驶);而在高精地图无法覆盖的区域,开放具备跨线绕行,识别红绿灯并直行通过路口能力的LCC增强版。按照小鹏官方计划,2023年城区NGP将在年底扩增至50城,2024年扩增至200城,力争做到城区领航辅助驾驶“全国都能用”。
4月份,华为正式发布了ADS2.0版本,并宣布城市NCA已经在深圳、上海、广州等地区落地。华为原计划是2023年四季度将城区NCA覆盖到45个城市。最新的进展是,华为将这一目标猛增至今年12月“全国都能开”。
6月份,理想汽车向早鸟用户推送了首个不依赖高精地图的城市NOA。9月份,理想汽车面向早鸟用户开始推送通勤NOA的内测版本,通勤NOA将首先覆盖包括北上广深在内的10座城市。
7月份,蔚来在北京、上海等城市主要城区环线道路开放NOP+智能辅助系统,并宣布后续采取“按路线开放”的形式逐步落地城区智能驾驶。
除此之外,长城旗下的毫末智行、上汽智己与创新企业Momenta的合作,也纷纷公布了相关“智驾开城”的计划。
要能够实现城区领航辅助,行业普遍选择激光雷达/BEV感知/Transformer模型算法的“重感知、轻地图”技术路径:
自蔚来ET7首度将激光雷达作为高阶智驾的“标签”引入行业以来,激光雷达+摄像头的多传感器融合感知方案成为国内研发的主流方向之一。虽然激光雷达存在成本较高的问题,但已被证明面对城区复杂交通环境有更稳定的感知表现。目前已经搭载城区领航辅助的车型,如小鹏G6 Max、阿维塔11等车型,均实现了激光雷达上车。
虽然激光雷达稳定准确,但其稀疏的点云感知信息还无法完全满足智能驾驶迭代升级的需求。因此,国内厂商仿效特斯拉FSD,引入BEV感知+Transformer模型+Occupancy network占据栅格技术。前者基于摄像头感知周边环境,生成鸟瞰图,融合不同传感器输入的数据信息,实现在空间、时间维度的对齐。后者则负责处理和学习这些感知信息,基于深度学习来锻炼智驾的整体能力。
“轻地图”则更多地是在强调对上述技术的应用,在高精地图无法覆盖的区域,基于系统自身感知和学习能力,在车端进行“自主建图”,处理城区复杂的交通环境。
从新势力厂商目前已经透露的信息来看,虽然各家厂商对自家智驾技术的术语名称令人眼花缭乱,实际上都没能跳出上述技术范畴:
· 小鹏:打造全场景智能驾驶架构XBrain
在小鹏汽车2023年1024科技日上,小鹏汽车提出了面向全场景智能驾驶的终极架构XBrain。
根据小鹏官方表述,XBrain=XNet 2.0+XPlanner+More。
XNet 2.0是具备时空理解能力的感知系统,融合了动态BEV、静态BEV、占据网络。让小鹏XNGP智驾系统可以深度学习各种大型和异型路口,让横纵向感知范围提升200%, 感知类型增加11种,包括新增清扫车、无人摩托车、无人自行车等。
XPlanner是基于神经网络的规划与控制,拥有长时序、多对象、强推理的特点,持续以模型和数据来驱动系统迭代,依据周边环境信息及时变通,生成最优运动轨迹,让系统实现“拟人化”的博弈能力。
· 理想汽车“无图”城区NOA三件套:BEV+Transformer+Occupancy
在理想汽车5月的家庭科技日上,对城市NOA的算法也提到了相同的技术概念:静态BEV网络、动态BEV网络、Occupancy网络,并通过NeRF技术增强Occupancy网络还原的精度和细节,实现对物理世界的完整还原。
静态BEV可以实时感知并构建道路结构,相当于一边开车一边动态地做地图,解决了高精地图数据实时性的问题,同时感知特征也更符合自动驾驶的需求。
动态BEV克服了传统视觉不好解决的遮挡和跨相机问题,当车辆穿越多颗摄像头时,可以精准地识别其位置、速度。即使视野被遮挡,仍能通过“脑补”对周围环境进行稳定感知,思维判断方式与人类相似。
对于通用障碍物的识别,理想通过Occupancy网络处理。Occupancy可以构建与现实世界完全对应的虚拟世界,识别真实环境中存在的不属于道路和交通参与者的物体,比如:路上的垃圾桶、临时的施工牌等。
将上述三种技术的感知结果汇总到预测模型,就可以实时输出对周围所有交通参与者未来几秒内的行动轨迹预测,该预测结果会动态调整,为后面的决策规划提供更准确的信息。
· 蔚来:按路线开通、路线共享、汇线成网
相比其他大力宣传智驾“开城”目标的友商,蔚来在9月底开始在蔚来APP征集用户的“领航路线心愿单”,后续将根据运营计划和道路情况,逐步为用户开通心愿路线城区NOA功能。
基于蔚来今年的创新科技日透露的信息,这套逐步“泛化”的系统之下,底层逻辑与另外两家新势力厂商类似:
通过基于BEV感知+Transformer模型的蔚来NAD Lane 2.0网络结构来处理城区更复杂的静态拓扑环境。
通过数据驱动,基于时空交互 Transformer 多模态注意力网络打造一个云端大模型,不断提升车辆感知性能。
决策层面,基于时空交互的Transformer多模态注意力网络做场景的筛选,使系统在城区复杂交通场景下,找到更合适的路径和驾驶决策,实现“类人驾驶”。
因此,国内主机厂与研发机构对于接下来城区智能驾驶的研发路径是趋于一致的:
感知方案上,采用激光雷达感知+摄像头视觉感知融合方案。以BEV视觉感知为主,激光雷达感知作为“补盲”,提升系统整体的安全与稳定性。
在系统算法层面,逐步从传统L2系统的“人工规则”驱动向AI人工智能自主决策转变,基于Transformer模型,让智驾系统通过神经网络与机器学习“学习开车”,而非按照“固定规则开车”。通过这种方式,一方面能够让系统能够适配更加复杂的城区交通环境,另一方面也能逐步弱化高精地图的限制,从“轻地图”逐步走向“无地图”。
在这条技术路径,背后暗藏着数据量和数据处理能力的比拼:数据量的积累、数据学习质量的好坏,将直接影响系统的能力。因此各大厂商均在纷纷加强自身的数据闭环体系的建设,为系统性能的升级迭代做好准备。
这也是为什么厂商宣布的“开城计划”都是逐步开放,以及在不少已经宣布“开城”的城市,有用户吐槽称“开一条路也是开,很多地方都难以使用”的原因——即使现在功能上已经“支持”,但智驾系统在城区场景中的性能表现还远远达不到用户的期待。
于是,对于用户来说,与其关注厂商宣布的“开城”数量,不如更关注接下来还会有哪些特殊场景中会有相对实用的智能功能落地。
更多特殊场景的挖掘
技术路径已经相对明晰,但高阶智驾系统从“能用”到“好用”,显然还有很长的距离。过于激进的计划,最终还得认清现实的研发逻辑。
以理想汽车为例,在今年4月的上海车展上,官方就已经宣布,今年将在100城落地城市NOA。到8月的成都车展,理想将宣传口径由“城市NOA”更改为“通勤NOA”——只是在限定的路径下实现NOA领航辅助,相比泛化要求更高的完整城区NOA降低了一个维度。
即使是难度更低的通勤NOA,理想也未能向全部车主开放,而是向专门招募的“早鸟用户”开放。最近的消息则是李想通过微博正式道歉:年底城市NOA覆盖100座城市的计划已经难以实现,最新的计划是12月覆盖全国高速和环线及100个城市——李想微博中没有明确指出的是,这其中不少高速及环线路段很可能还是存在高精地图支持的路段。
因此,对于用户而言,期待“大而全”的全域城区领航辅助完全落地恐怕还尚需时日,“少而精”的特定场景下的高阶智驾功能或许更值得期待。
例如,华为在智界S7发布会上展示的机械车位泊车辅助,应该会对上海等城市这种“难例场景”较多城市的用户更有帮助。而蔚来为车主推出的高速服务区领航换电功能,则有望解决服务区换电站“难找”的痛点,提升蔚来车主的整体出行体验。
高阶智能驾驶,注定是一条需要重投入、长周期的赛道。依然以华为为例,去年7月,余承东在中国汽车蓝皮书论坛上谈到,华为车BU业务1年需要花掉十几亿美元,直接投入7000人,间接投入超过1万人,其中70%研发人员都在研发智能辅助驾驶。
那么,如此高昂的投入之下,如何才能形成健康的商业模式?智能驾驶的iPhone4时刻何时能否到来?这一切,都还有待时间来给人们以答案。