如果画饼要负法律责任,那中国汽车行业将诞生多个法制咖。
2023年,小鹏立下Flag智驾开城50座;理想宣布开城110座;蔚来的目标是其NOP+完成25万公里城区领航路线验证,开放6万公里路线里程,遍布200座城市;华为立誓要在年内实现城区NCA全国都能开。
最终只有小鹏超额完成目标;理想的结局是AD Max 3.0开通了110座城市的城区道路,但并未做到“覆盖全城”;蔚来优先打通了难度更低的县级市;而华为延期到今年才兑现了诺言。
眼看着消费者的胃还没来得及消化去年“智驾进城”的饼,今年车企又画了块“端到端智驾上车”的饼。
年前,蔚小理三家头部新势力先后公布了端到端智驾上车的时间表。
1月30日,何小鹏宣布小鹏的端到端模型会在今年全面上车。
紧接着理想又宣布端到端智驾新模型将在今年上半年上线,争取做到全国都能开。为了顺利推进这一目标,理想正在大力招聘业内智驾人才。
蔚来也在2月宣布,将在今年上半年上线基于端到端的主动安全功能,据称,“如果能顺利推进,蔚来将是中国最快量产端到端功能的公司。为此,蔚来几十人的团队已经研发了将近半年的时间。”
这几家新势力原先采用的都是模块化架构,之所以在今年宣布改用端到端架构,很大程度上是看到了端到端架构的性能上限,预感到它将成为行业趋势。
去年8月,世界上首个基于神经网络的端到端自动驾驶系统FSD V12问世,算是第一次实现了真正意义上的“由 AI 来开车”。在FSD V12的首秀视频里,马斯克驾驶着特斯拉行驶在在一条号称从未跑过的线路上,全程只接管了一次,体现了端到端架构的潜力。
而目前行业已量产的智能驾驶,绝大多数采用的是模块化架构。这种架构下,智能驾驶被拆分为感知、规划等一个个典型任务,后由专门的AI模型或模块分别处理这些任务。
这意味着,一个智驾系统里包含了多个模型,车企要投入大量人力、财力分别对不同模型进行训练、优化、迭代。而且随着模型进化,参数量提高,所需的研发人员和研发投入将有增无减。
但再多的投入也难以消除模块化架构生来自带的Bug。
在模块化架构中,下一级模块的输入参数通常是上一级模块的输出结果,一旦前一级模块出现误差,误差便会在信息传递时被逐级放大。除此之外,不同模块间的信息交互、接口制定等往往难以顺畅地实现,这就好比在团队协作过程中,团队成员间多少总会存在沟通上的障碍。
拥有神经网络模型Transformer的端到端架构则能够很好地解决这个Bug。这种架构下,由于感知到的信息是被送到类似人脑的神经网络中枢进行处理,后直接生成驾驶指令,因而只需一个模块便可实现上述多个模块的功能,车企省下了一笔研发投入的同时,智驾系统的流程更简洁,系统做出的决策更拟人化,整车的智驾水平也将大幅提升。
但端到端架构也有难以逾越的壁垒,它对数据、算力、芯片都提出了较高的要求。
特斯拉之所以能在端到端技术上走在行业前列,依托的是全球数百万的特斯拉汽车保有量,那些每天在路上行驶的特斯拉汽车向马斯克的端到端模型投喂了海量数据。据特斯拉方面公布的消息,为保证模型性能的稳定,特斯拉采用了近1000w视频序列数据。但对其他车企而言,它们很难采集到这么多数据样本,即使采集到了,为这些数据做标注也要耗费巨大的时间、金钱、人力成本。
此外怎么训练出一个可靠的模型也是个问题。抛开如何工程化这个问题不谈,要在千万级视频数据中训练一个大模型,需要的是天量算力。特斯拉的端到端能落地,是因为它有自研的超级计算机Dojo,专用来训练自动驾驶汽车人工智能模型。据其官方数据显示,每个Dojo都集成了120个训练模块,内置3000个D1芯片,拥有超过100万个训练节点,算力达到1.1EFLOP。
不理解这些参数的概念不要紧,我们只需要通过摩根士丹利估计,Dojo会让特斯拉的市值增加近6000亿美元(相当于彼时特斯拉市值的76%)这一点便可知道,Dojo的算力有多强大。但并不是每家车企都有个Dojo。
当然,国内车企可以通过与云服务大厂共建云计算中心,来应对算力的掣肘,比如小鹏与阿里云在乌兰察布共建了600PFLOPS超算。
但即便如此,车企还需要考虑的是,算法被训练出来后怎么部署。在车端,要想让算法能进行实时推理,芯片的算力也需足够强大,但目前的主流芯片还达不到这个要求,况且它们也根本不是专为Transformer打造的,和Transformer间的适配度自然不会太高。
既然硬件一时跟不上,车企就得把复杂的算法尽可能压缩,这又是一个挑战。
既然在技术落地面前还横亘着这么多障碍,头部几家新势力何以这么着急公布端到端智驾上车时间?
比起它们真的已积淀了过硬的技术储备,个人更愿意相信,这是头部几家新势力的营销噱头,先把狠话放出来,在用户心中立下“技术咖”的人设,再慢慢搞研发,即使研发进展不及预期,大不了说一句:“很抱歉,我们失言了。”反正画饼不用负法律责任。
最后提一嘴,按目前的趋势来看,一旦端到端技术成熟,理想在智驾上或将拥有更鲜明的优势。更高的保有量、全系标配的智驾硬件方案、免费的智驾产品,这些都将转化为理想在数据上的优势。而端到端机构要想表现出比模块化架构更优越的性能,关键一步正是通过海量的数据喂养,令其经历“涌现”的过程。