据外媒报道,在自动驾驶领域,特斯拉可谓独树一帜。该公司致力于研发计算机视觉和人工神经元网络技术,旨在解决与自动驾驶车辆相关的挑战。
尽管丰田、谷歌、优步、福特和通用汽车都致力于采用激光雷达技术,但特斯拉却总是高调地宣称,激光雷达永远也不会成为解决问题的途径。
特斯拉首席执行官——埃隆·马斯克有句名言:“(采用)激光雷达是徒劳的,任何依赖激光雷达的公司都注定要失败。”
那么,准确地说,激光雷达的瑕疵和计算机视觉最大的优势是什么呢?
阿基琉斯之踵——激光雷达的致命弱点
即使将测距精确到毫米级,激光雷达的表现也极为高效。然而,在面对移动的物体时,该技术的表现就没那么高效了。
据特斯拉人工智能部门的资深总监——安德烈·卡帕西(AndrejKarpathy)透露,激光雷达无法区分塑料袋和路面上减速带,这会造成安全隐患:在驶向减速带时,车辆需要减速,然后才能轻松通过该塑料减速带(避免颠簸)。
此外,直到目前为止,激光雷达技术的产品成本依然极为昂贵,这就产生了一个问题:若一款车型同时搭载多个激光雷达,那么该车型的成本效益就低了。
尽管存在诸多瑕疵,但激光雷达相关的最大挑战源自于3D高清地图——后者是一项不可或缺的重要技术,若无3D高清地图的配合,自动驾驶无从谈起。
这类地图创建的3D街景视图(建模)同样是自动驾驶及其安全性所需的技术,且只能与谷歌持续更新的3D高清地图协同使用。
然而,哪怕是绘制一厘米的街景图,也需要消耗大量资源,且从金钱角度看,该任务的花费不菲。这表明,搭载激光雷达的车辆只能在已绘有地图的限定区域内行驶,这就极大地限制了自动驾驶车辆出行的覆盖范围。
特斯拉的非传统技术路径
特斯拉是全球最大的电动车制造商,其采用的技术路径也与其他竞争对手截然不同。该公司希望赋予车辆“视觉”能力,使车辆能够像人类那般完成驾驶操控。
与竞争对手不同,特斯拉并未采用激光雷达。相反,该公司致力于研发先进驾驶员辅助系统(AdvancedDriver Assistance System,ADAS)或半自动驾驶系统(semi-auto pilot),该系统与摄像头与雷达整合系统协同使用。(最近,特斯拉车辆在升级系统后可使用纯摄像头系统。)
摄像头与雷达的整合能够为算法提供所需的录入数据,从而创建车辆周边的地图,其采用计算机视觉及基于人工智能的算法来做驾驶决策,几乎像逆向工程设计的人类视觉。
特斯拉采用8个摄像头+雷达的矩阵套件,从而实现自动驾驶、自动泊车、车道居中控制、自适应巡航控制及便道等功能。
特斯拉车辆的车载软件则基于深度学习算法,其尝试在函数中研发高等神经元网络,起到与人类视觉系统相类似的作用,这就需要从车辆的周边环境采集纯视频输入。
然后,这类神经元网络就会对道路、路标、行人、减速带、障碍物及其他车辆的视频输入加以分析。
纯计算机视觉所面临的主要争议在于:在没有激光雷达和雷达设备的辅助下,我们无法确定神经元网络能否精准地测距并完成深度预测。
为解决该问题,特斯拉一直在训练其神经元网络,为其输入从全球特斯拉车辆所采集来的视频数据集。在自动算法及人工监督的辅助下,完成对上述视频的标识工作。
安德烈在2021年计算机视觉与模式识别国际会议(ComputerVision and Pattern Recognition Conference 2021)上对上述内容进行了详细阐述。他向观众透露,在算法培训所用数据集的开发过程中,其团队识别了200余种触发器,暗示目标物探测仍需调整。
这类触发器将造成探测结果之间出现不一致。为此,特斯拉不得不再花了四个月时间,修复每一个触发器。特斯拉还采用了超级计算机来训练深度学习建模并实现优化调节。
特斯拉的首要目的是研发一款类似于人类视觉系统的自主计算机通用性视觉系统及一套可全面发挥Autopilot车载系统性能的算法。
如今,特斯拉只是将此视为监督式学习的一个问题。公司已经提升了卷积神经元网络的性能,期望未来的车辆能够基于计算机视觉技术来完成操控及车辆的运行。
从另一方面讲,激光雷达技术所取得的进展也并不令人兴奋。除了持续滑落的售价外,激光雷达在地图绘制方面所取得的进展并不大,更遑论还有其他瑕疵。
因此,就让我们怀着激动的心情拭目以待——看看特斯拉的技术路径能否在未来取得出色表现?届时再看看激光雷达能否在通过自我技术革新来消除其短板?
上一篇:AI DAY解读 — 特斯拉 Autopilot的视觉架构
下一篇:BlackBerry携手诺博科技打造智能座舱域控制器
推荐阅读最新更新时间:2024-11-16 23:08
推荐帖子
- PADS_器件封装制作过程
- 自从2008年注册eeworld已经5个年头了。期间,在论坛上下载了很多东西。但是由于个人原因,从中汲取的知识很少。后来有幸,做了PCB部分的版主,但我自己感觉给论坛出力很少。近来由于公司工作较为繁多,所以很少登陆eeworld。但是一有时间就会登陆eeworld。总想给论坛出点力,自己最近学了一下PADS,所以想写一个入门教程,献给eeworld。也献给需要的朋友。PADS_器件封装制作过程由于一边写一边上传,所以需要的朋友请稍等啊http:
- heningbo PCB设计
- 出了清单后有没有专业人士的预测试题呢(控制类)?
- 本帖最后由paulhyde于2014-9-1509:42编辑出清单之后大体方向应该有吧,专业人士预测点具体的题吧,控制类,可以是偏小车方向,也可以是控制类的其他的。出了清单后有没有专业人士的预测试题呢(控制类)?
- 党_1113 电子竞赛
- F28M35H52C1 Control card JTAG仿真
- 请问可以用STM32仿真这个开发板吗?在底座那个JTAG接口处,请问在CCS中newtargetconfiguration中应该选择哪个connection。F28M35H52C1ControlcardJTAG仿真不行。不行的。。
- 风欺云涌 微控制器 MCU
- 请教WinCE下的视频捕获问题
- 打算在WinCE下做一个视频捕获和回放的应用程序,用directshow实现。但查了一下MSDN,发现WinCE不支持directshow的ICaptureGraghBuilder接口,也就是说没法在CE下枚举采集设备,这样的话无法直接用directshow提供的接口进行视频采集,但是视频文件回放部分支持的很好,这部分我已经实现。请教达人:用directshow来做WinCE下的视频捕获可行么?具体是怎样的思路啊?如果不行,还能利用什么方法来实现CE下的视频捕获啊?摄像头驱动有,源码也有。
- snowking WindowsCE
- MPLAB8.83自带的HI-TECH picc 编译器
- 请指导MPLAB8.83自带的HI-TECHpicc编译器每个头文件里都没有宏定义配置字括号里的信息,怎么回事?MPLAB8.83自带的HI-TECHpicc编译器你没破解成功吧?
- expoed Microchip MCU
- 【2024 DigiKey创意大赛】+基于大语言模型的智能家居平台+大语言模型学习分享
- ##大语言模型介绍大语言模型(LargeLanguageModel,LLM),也称大型语言模型,是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。在实际生活或者项目中融入大语言模型,可以进一步提高智能性以及项目的可拓展性,能够实现许多新功能。而需要在实际项目中部署使用大模型服务,一般可以通过FunctionCall等技术结合使用,
- SeasonMay DigiKey得捷技术专区
- MC33164 低压检测微处理器复位的典型应用电路
- NCV33161双负欠压检测器典型应用电路
- LT3436 的典型应用 - 3A、800kHz 升压型开关稳压器
- NCP301HSN18T1 1.8V 电压检测器的典型应用,用于具有附加迟滞的微处理器复位电路
- 使用 Semtech 的 SC338 的参考设计
- AD9238BSTZ-40EB,用于 AD9238、2 通道、10 位、40 MSPS 模数转换器的评估板
- LT1317CS8 单节锂离子电池至 4V/70mA、-4V/10mA 的典型应用电路
- LT1370 演示板、6A 开关 2.7V 至 12V 输入、5V 或 12V 输出
- 基于STEF05和STEF12电子保险丝的5 V和12 V电源线保护
- 离线语音小灯小风扇
- 非常见问题解答第223期:如何在没有软启动方程的情况下测量和确定软启动时序?
- 兆易创新GD25/55全系列车规级SPI NOR Flash荣获ISO 26262 ASIL D功能安全认证证书
- 新型IsoVu™ 隔离电流探头:为电流测量带来全新维度
- 英飞凌推出简化电机控制开发的ModusToolbox™电机套件
- 意法半导体IO-Link执行器电路板为工业监控和设备厂商带来一站式参考设计
- Melexis采用无磁芯技术缩小电流感测装置尺寸
- 千丘智能侍淳博:用数字疗法,点亮“孤独症”儿童的光
- 数药智能冯尚:ADHD数字疗法正为儿童“多动症”提供更有效便捷服务
- Vicor高性能电源模块助力低空航空电子设备和 EVTOL的发展
- 创实技术electronica 2024首秀:加速国内分销商海外拓展之路