如何看待纯视觉的的自动驾驶解决方案

发布者:EnchantingEyes最新更新时间:2023-09-12 来源: elecfans关键字:算法 手机看文章 扫描二维码
随时随地手机看文章

谈纯视觉,绕不过的就是特斯拉。   先说第⼀点:纯视觉这这条路真的⾮常难⾛。   「纯视觉这条路不好⾛」   参考特斯拉。也是在不断地找⽅法,让其纯视觉算法变得更好。 去年特斯拉AI Day 上,特斯拉着重强调了⾃⼰的BEV ⽹络(更多⽤于静态物体的识别)。

86703ca6-a87a-11ed-bfe3-dac502259ad0.png

但是今年,特斯拉基本上没有太多去提BEV 相关内容,⽽是⼜新推出占⽤神经⽹络(the occupancy network),直接通过摄像头来构建真实世界三维模型。

86a7ca68-a87a-11ed-bfe3-dac502259ad0.png

同时,增加了对动态物体以及运动状态可能发⽣变化的物体的识别,⽐如这个公交:

86bfcfd2-a87a-11ed-bfe3-dac502259ad0.png

 

86dee7aa-a87a-11ed-bfe3-dac502259ad0.png

 

86fd844e-a87a-11ed-bfe3-dac502259ad0.png

此外,特斯拉还准备引⼊更多新的神经网络,⽐如NeRF((Neural Radiance Fields) 神经辐射场,提升重建三维场景的能⼒。

871ef9b2-a87a-11ed-bfe3-dac502259ad0.png

  举特斯拉的例⼦其实是为了说明:「纯视觉这条路并没有那么好⾛,技术路线可能随时会发⽣调整。」   就好像现在BEV ⽹络被占⽤⽹络替代⼀样,后续很有可能还会被新的⽹络模型所替代。   「纯视觉⽅案能⼒上限:逼近L3」   特斯拉FSD 基本上代表了纯视觉的最⾼⽔平,这⼀点⼤家不否认吧。   ⽽从能⼒实现层⾯,在海外,就说美国本⼟吧,「现在特斯拉FSD Beta 能⼒已经⽆限逼近L3。」   不管是城市、⾼速,亦或者是没有⻋道线的乡村⼟路,特斯拉FSD 都能去开上⼀开。   特斯拉的⽜逼之处就在于使⽤普通的导航地图,就能实现类似⾼精地图的能⼒。 不过,特斯拉⽬前在两⽅⾯去继续钻研:「能⼒和体验。」   「能力」   能⼒层⾯,⾏⻋「这⼀块差不多实现七七⼋⼋」,仍在啃⼀些⻓尾场景的硬⻣头,⽐如说这种路边随处停着的⼀台⻋,⽆法分辨这台⻋的状态(动态or 静态):

86dee7aa-a87a-11ed-bfe3-dac502259ad0.png

  「在拿掉超声波传感器之后,特斯拉纯视觉正式向泊⻋域开进」,将会解决此前此前特斯拉泊⻋⽅⾯的问题(⽐如⽆法识别空⻋位、泊⻋识别率和泊⼊成功率等)。   「体验」   体验层⾯,特斯拉引⼊打分机制,提升FSD 使⽤舒适度:

86fd844e-a87a-11ed-bfe3-dac502259ad0.png

  「纯视觉领域的玩家」   其实,不仅仅是特斯拉,还有好⼏个玩家都在纯视觉领域摸索。   ⽐如Mobileye。这位也是纯视觉领域的⼤拿。   EyeQ 系列芯⽚在⾏业⾥出货量很多,很⼤⼚商都在采⽤EyeQ 芯⽚来提供视觉感知,⽐如早期的特斯拉、蔚来、理想,都和Mobileye 有很深的合作。   接下来说Mobileye 在纯视觉领域的进展。   Mobileye 开发了两套⾃动驾驶系统:纯视觉:摄像头⼦系统Mobileye SuperVision和雷达/ 激光雷达⼦系统,两台系统独⽴运⾏,互为补充。   不同于特斯拉,Mobileye 会⽤到众包⾼精地图。   摄像头⼦系统Mobileye SuperVision,也就是纯视觉这套,已经在国内新实⼒⻋企极氪上量产,能⼒差不多是L2+ 的样⼦:  

878f0db0-a87a-11ed-bfe3-dac502259ad0.png

  但是由于没能解决地图问题,很多能⼒⽐如领航辅助都⽆法解锁。   今年9⽉,Mobileye 宣布与吉利控股集团进⼀步扩⼤业务合作:极氪还将在两款新⻋型上搭载Mobileye SuperVision,并与Mobileye 共同开发基于激光雷达的新功能。   基于环视视觉打造的系统预计将于今年年底通过OTA 更新实现全部功能释放。  

87b573ce-a87a-11ed-bfe3-dac502259ad0.png

  虽然国内Mobileye SuperVision能⼒看着很差,但它真正的实⼒不容⼩觑(要不然吉利也不会扩⼤和它的合作)。   和特斯拉⼀样,Mobileye SuperVision也要看它在海外的能⼒。今年8⽉,Mobileye 完成了为期数天的洲际公路之旅,对其下⼀代Mobileye SuperVision开展了测试,基于现有REM 的⾼精地图,⽤4 天⾏驶近2000 公⾥,穿越南欧和中欧6 国。   「翻译⼀下就是,Mobyeye 这套纯视觉解决⽅案适⽤性⾮常强,只要有REM 众包地图,不管是在哪个国家或者地区,都能很快应⽤起来。」   ⽬前,关于下⼀代Mobileye SuperVision,我们能够得到的信息是: 1、采⽤两块EyeQ6HEyeQ6H 芯⽚(⽬前极氪⽤的那套还是EyeQ5芯⽚); 2、能⼒⽅⾯,可实现可脱⼿/ 眼睛需注视的L2++ 系统。  

「纯视觉路线的前景」

还是那句话,我们不知道⾃动驾驶的最终哪条路能⾛通。我们分为三种情况来看:

1、只有纯视觉这条路⾛得通

2、纯视觉和激光雷达路线都可以⾛通 3、只有激光雷达路线⾛得通   「1、只有纯视觉这条路⾛得通」   但是如果只有这条路真的⾛通了,那么特斯拉⼜将成为开创者。   就像现在她在电动⻋领域创造的辉煌⼀样,作为头⽺,可以吃到最⼤最多的红利。   ⽽且,纯视觉路线成本很低,毕竟摄像头也没多少钱。随着⻋辆⼤规模交付,规模效应之下,成本会更低。   也不⽤说那么远,现在特斯拉拿掉毫⽶波雷达和超声波传感器,根据⻋拆解团队Munro Live 公开的分析报告显示,「这样操作特斯拉平均每辆⻋节省114 美元,约合⼈⺠币817 元。」   这都是实打实的好处。   「2、纯视觉和激光雷达路线都可以⾛通」   这就很意思了。   如果激光雷达路线也能跑通,但是各项成本算下来,似乎纯视觉成本还是要更便宜⼀点……     「3、只有激光雷达路线⾛得通」   如果到这个时候,我想各种传感器价格应该被打下来了。   如果真到这个时候,激光雷达和毫⽶波雷达⼀样便宜,我想特斯拉也⼀样会⽤。   虽然特斯拉⼀直专精在纯视觉,但是特斯拉也在研究各种可能性,⽐如4D 毫⽶波雷达等等。   所以,即便是调转研究⽅向,那么,特斯拉依然能够⾮常快的调整过来,并占据领先优势。   所以,最后,提⼀个建议,虽然激光雷达、4Dh 毫⽶波雷达的出现和应⽤,⼤幅度提升了⾃动驾驶感知能⼒,但是「我还是希望各家⻋企能够始终重视计算机视觉感知的研发,毕竟,任何传感器都无法替代摄像头的作⽤,同时也能在未来自动驾驶技术竞争中,取得领先地位。」


关键字:算法 引用地址:如何看待纯视觉的的自动驾驶解决方案

上一篇:一文详解自动驾驶车辆的系统架构:感知系统和决策系统
下一篇:整车控制网络系统CAN总线特性分析

推荐阅读最新更新时间:2024-11-09 23:31

自动驾驶重要性:驾驶时会走神
近日,来自美国运输部和国家公路交通安全管理局的一批研究人员,对驾驶过程中驾驶者注意力转移的情况进行实验研究,结果得出人们驾驶时有70%的时间在神游,关注点并不在驾驶车辆上。   据了解,实验中,研究人员利用对驾驶者在驾驶过程中量化脑电流的检测来实现对这一过程的检测和研究。其中,志愿者需要与电生理监测系统保持连接以检测大脑中电位活动的变化,所以实验无法实现在实际道路上进行检测,故而研究是在模拟状况下进行的。 实验环境模拟的是在周一到周五通勤的情况,受试者在监视器下,跳入到模拟的驾驶座上,以几乎恒定的速度沿着一条有些无聊的道路,全程大约20分钟。为了模拟早晚的状况,在两次测试之间,研究人员让受试者通过做一份试卷来模拟工作时紧张而活跃
[嵌入式]
自动驾驶“开全图”外挂?小鹏和高德CP局
前几日,高德地图举办第三代车载导航发布会,并公布小鹏汽车成为首家搭载高德第三代车载导航的车企。 之所以这则信息引起了我的注意,是因为电哥不久前刚刚体验了小鹏NGP Beta,独一份的全新交互给我留下了深刻的印象;搭配上新一代车载导航,能够动态计算车道以及路况变化,提供更多维度的信息。 ▽P7中“SR自动驾驶环境模拟显示 这也是首次将信息娱乐和自动驾驶两个分割的域进行打通,不仅仅是导航精进为车道级,自动驾驶系统的感知、分析、决策过程也通过可视化的方式传递给了驾驶者,丰富的道路信息会提前告知于驾驶者,无论是是技术层面还是驾驶层面,都带来了全新的体验。 ▽基于激光点生成的高精地图 为什么首先落地的是小鹏?
[汽车电子]
<font color='red'>自动驾驶</font><font color='red'>的</font>“开全图”外挂?小鹏和高德<font color='red'>的</font>CP局
依图科技:人工智能算法性能四年提升10万倍
“四年前,人们见证了人工智能的人脸识别能力超过了人类。但是很多人没有看到的是,这四年里,人工智能的识别能力仍在指数级增长,算法精度又提升了10万倍。” 3月23日,在北京钓鱼台国宾馆举行的中国发展高层论坛上,依图科技联合创始人兼首席执行官朱珑分享人工智能的观点时表示,“以中国为代表的亚洲科技创新正在崛起,这一观点有一重要客观依据,那就是科学创新的人才正在大量向中国转移。” 中国发展高层论坛是由国务院发展研究中心指导、中国发展研究基金会主办。来自世界500强企业负责人、国际组织负责人、著名的经济专家和学者,就中国的扩大开放、国内外重大经济议题等话题展开深度讨论。作为中国国家战略的人工智能,已成为推动经济增长的新引擎,在论坛上受到了与
[机器人]
异步电机速度估计-直接计算法
异步电机矢量控制系统中,转速的闭环控制必不可少,其是保证控制稳定性和控制性能的保证。矢量控制从其获取速度的不同方法来分,可以分为有速度传感器和无速度传感器两大类。一般早期的异步电机矢量控制常采用光电码盘等速度传感器来进行转速的直接检测,并反馈被测电机的转速信号。 但额外的速度传感器不仅会增加系统的成本,其次如果传感器安装不当也易影响测速精度,而且传感器的安装还会使电机轴向上体积增大,给电机的日常维护带来一定困难,并且速度传感器还会降低电机的机械鲁棒性,在高温、高湿环境下传感器精度也会受到影响.基于这些不足,为了克服上述问题人们开始研究无速度传感器矢量控制方法。 本文着眼于无速度传感器矢量控制系统的研究,重点在于讲解异步电机
[嵌入式]
异步电机速度估计-直接计<font color='red'>算法</font>
自动驾驶福音 激光雷达技术新进展
日前,在洛杉矶汽车展上,沃尔沃和Luminar宣布了围绕其激光雷达感知技术的新进展,这对于自动驾驶的安全性可能产生重大影响。 众所周知,“姿态估计”是计算机视觉技术的重点方向,它试图理解移动物体中不同点的位置,比如人的胳膊和腿。 通过检测行人和识别人体特征点,自动驾驶系统需要理解行人姿势和行为意图,同时也可准确估计行人与汽车的距离。 在此之前,摄像头视觉技术一直在攻克这一难关。在今年大陆集团发布的第五代车规级摄像头MFC500系列,就可以识别人体的四肢、背包、五官,人体在摄像头的镜头下,变成了移动的分段条形物体,通过软件识别算法,依此可以判别出行人的姿态,包括但不限于行、坐、卧、立等状态,以及判断出大人还是小孩。 另外根
[汽车电子]
<font color='red'>自动驾驶</font><font color='red'>的</font>福音 激光雷达技术<font color='red'>的</font>新进展
由硅谷领导自动驾驶创新
一个产业面临革命时,确实可以改变一个产业中厂商的命运。这在汽车产业从传统汽车转变至自动驾驶车或联网车中,可以看得出来。 根据路透社的调查,由于许多新创公司都看好自动驾驶车的未来,因此到目前为止,全球至少有240多家新创企业涉足这一领域,其中,高达75家是来自于硅谷,比例占据第一位。 根据律师事务所Foley & Lardner针对高科技与汽车公司主管的一份调查显示(每位被调查者可以勾选三个区域),硅谷成为他们最为看好发现联网车与自动驾驶车的领导区域(70%),其次才是拥有三大传统汽车厂商的底特律(46%),至于拥有福斯、奔驰与BMW的德国则居于第三位(38%),拥有丰田、本田、Nissan等大厂的日本更是被抛到第四名(
[网络通信]
日产研发出由大脑控制汽车技术:将让自动驾驶变得更加舒适
据外媒报道,日产汽车公司正在研发一种能够读取人类大脑信息的汽车,该技术将能让高性能汽车的反应变得更加灵敏、让自动驾驶汽车变得更加轻松。这项技术叫Brian-to-Vehicle(大脑到汽车,以下简称B2V),由日产智能移动实验室研发。 B2V通过脑电波监测头套追踪穿戴者的大脑活动,然后再将信息传输给日产的自动驾驶系统进而让系统推断出穿戴者的驾驶意图。据悉,日产计划在下周的CES上展示这项技术。 日产非常直接地指出,B2V并不会读心术,比如它无法想出驾驶者想要去的目的地。这项技术实际上注重的是车上乘客的情绪,然而根据他们当下的情绪调整自动驾驶体验,打个比方,当系统发现驾驶者身体不适,它就会提供一个更加平稳的驾
[汽车电子]
禾多科技视觉感知算法在德州仪器芯片上完成部署,离量产更进一步
近日,自动驾驶初创公司禾多科技宣布其研发的视觉感知系统在基于德州仪器(TI)TDA4VM芯片的嵌入式平台上完成部署。从部署结果来看,禾多科技的视觉感知算法系统已较为成熟,且方案可满足车规级要求,实现了对市场主流产品线的支持,在自动驾驶量产之路又迈出了重要的一步。 对于自动驾驶系统而言,软硬结合十分重要,会直接影响算力的释放和算法的发挥,并最终影响到系统的表现。而软件算法在车规级芯片上的部署也一直是自动驾驶行业的一项难点。 作为自动驾驶技术的重要基础,对环境的感知能力是众多企业关注的重点。禾多科技采用量产车规级别的多传感器融合方案,需要有强大的视觉感知算法,才能更高效地处理多种传感器采集的海量数据。此前,禾多科技自主研
[汽车电子]
禾多科技<font color='red'>视觉</font>感知<font color='red'>算法</font>在德州仪器芯片上完成部署,离量产更进一步

推荐帖子

LCD1602忙碌状态检测
请问LCD忙碌状态是什么意思啊?有必要要检测忙碌状态吗?看到了这样一条程序bitlcd_busy(){bitresult;rs=0;//数据、命令选择端1为数据rw=1;//读、写选择端1为读ep=1;//使能控制_nop_()_nop_();_nop_();_nop_();result=bit(P0&0x80);//LCD的D0-D7中,D7=1为忙碌,0为空闲//result是检测那里的
haimao 嵌入式系统
cyclone2 FPGA 开发板转让
cyclone2FPGA开发板转让啥价格??跟帖咨询,价格如何 这个价格,相当的。。。这是变相的销售广告!请注意,你已经被EEWORLD论坛列重点关注的对象了。哈哈
wenhuawu FPGA/CPLD
Altera Technology Roadshow 研讨会开幕在即,速来围观,注册有机会赢iPad mini
2014年AlteraTechnologyRoadshow研讨会主要介紹Altera领先业界的最新第十代FPGA与SoC,说明如何协助设计人员达到下一代的产品目标。参加Roadshow研讨会,不仅可以学习关于汽车、广播、军事、通讯与工业的解决方案,注册还有机会赢iPadmini哦~感兴趣的话点击此处了解详情。\0\0\0eeworldpostqqAlteraTechnologyRoadshow 研讨会开幕在即,速来围观,注册有机会赢iPadmin
EEWORLD社区 FPGA/CPLD
使用基于图形的物理综合加快FPGA设计时序收敛
传统的综合技术越来越不能满足当今采用90纳米及以下工艺节点实现的非常大且复杂的FPGA设计的需求了。问题是传统的FPGA综合引擎是基于源自ASIC的方法,如底层规划、区域内优化(IPO,In-placeOptimization)以及具有物理意识的综合(physically-awaresynthesis)等。然而,这些从ASIC得来的综合算法并不适用于FPGA的常规架构和预定义的布线资源。最终的结果是,所有的三种传统FPGA综合方法需要在前端综合与下游
eeleader FPGA/CPLD
关于内存改变的问题
“利用栈,将程序中定义的数据逆序存放”我编写程序如下:assumecs:pro6_2pro6_2segment;需要逆序存储的数据dw0123H,0456H,0789H,0abch,0defh,0fedh,0cbah,0987h;程序执行的入口start:movbx,0000Hmovax,csmovss,axmovds,axmovsp,000EHm
hy6383 嵌入式系统
两根485线究竟支持多少通信协议?
关于RS485RS-485是一种标准通讯接口,RS(RecommendedStandard)推荐标准的意思,485是标识号。使用485通信,一般只需要两根线,A,B或者+,-两根线。这属于一种差分信号电平通信。总线的接线方式,广泛应用于数据采集和工业控制,它的主要优点之一是它允许将多个RS485设备放在同一条总线上,可以方便地实现多点数据传输和控制。在不使用中继器的情况下,也可以实现较长的通信距离。下面是常见的支持RS485的物理接头。RS485通信特性
2020da 工控电子
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved