Waymo如何进行3D物体检测?

发布者:innovator8最新更新时间:2022-04-12 来源: Astroys关键字:Waymo  3D物体  自动驾驶 手机看文章 扫描二维码
随时随地手机看文章

自动驾驶汽车(AV)是如何观看外部世界的?

 

 

你可能听说过LiDAR或其他奇怪的摄像头。但它们是如何工作的,它们如何能看到这个世界,与人类相比,它们到底看到了什么?如果我们想让AV上路,了解它们的工作原理是至关重要的,尤其是如果你在政府工作参与到制定法规,或作为被服务的对象。

 

我们通过Tesla AI DAY了解过特斯拉的车辆是如何工作的,但它们与传统的AV不同。特斯拉只使用摄像头来了解世界,而大多数其它公司,如Waymo,使用普通摄像头和3D LiDAR。这些LiDAR相当简单易懂,它们不会像普通摄像头那样产生图像,而是产生3D点云。LiDAR测量物体之间的距离,计算它们投射到物体上的脉冲激光的飞行时间。

 

 

 

这样一来,它们就会产生很少的数据点,这些数据点都是有价值的、准确的距离信息,正如你在这里看到的。这些数据点被称为点云,它只是意味着我们看到的只是在相应位置上的许多点,创造了某种世界的3D模型。

 

 

在这里,你可以看到右边的LiDAR并不是那么精确地了解它所看到的东西,但它只用了很少的信息便获得了解深信息,这对于有效地实时计算数据是完美的。

 

这种最小的数据量和高空间精度是完美的,因为加上RGB图像,如左图所示,我们既有准确的距离信息,又有单独使用LiDAR数据所缺乏的准确物体信息,特别是远处的物体或人。这就是为什么Waymo和其它AV公司使用这两种传感器。

 

尽管如此,我们如何才能有效地结合这些信息,并让车辆理解这些信息?而车辆最终看到的是什么?只有那些点吗?这对在道路上行驶来说足够了吗?我们将通过Waymo和Google Research的新研究论文来研究这个问题,该论文名为“4D-Net: Learning Multi-Modal Alignment for 3D and Image Inputs in Time”。

 

这篇论文总结到,“我们提出了4D-Net,它学会了如何结合3D点云和RGB摄像头图像,以便在自动驾驶中广泛地应用3D物体检测。”

 

 

这就是我们所说的3D物体检测。这也是汽车最终会看到的东西。这是一个非常准确的车辆周围世界的表现,所有物体都出现并被精确识别。

 

这看起来很酷。但更有趣的是,他们是如何得到这个结果的?

 

他们使用LiDAR数据(PCiT,Point Clouds in Time)和普通摄像头(或这里称为RGB视频)制作了这个视图。这些都是四维输入,就像我们人类看待和理解世界一样。这四个维度来自拍摄的视频,因此车辆可以访问过去的帧帮助理解上下文和对象,以猜测未来的行为,就像我们一样,创造了第四维度。其他三个是我们所熟悉的3D空间。

 

 

我们把这项任务称为场景理解,它在计算机视觉中得到了广泛的研究,并随着该领域和机器学习算法的最新进展而取得了许多进步。在AV中,它也是至关重要的,我们希望对场景有一个近乎完美的理解。

 

如果我们回到上面看到的网络,你可以看到这两个网络总是通过连接互相“交谈”。这主要是因为当我们拍摄图像时,在镜头中有不同距离和不同比例的物体。

 

 

你面前的车看起来会比远处的车大得多,但你仍然需要考虑这两方面。

 

就像我们一样,当我们看到远处的人,感觉是自己的朋友,但等走近了确定后才会喊他的名字,对于这种远处的物体,车辆会缺乏细节。

 

为了解决这个问题,我们将从网络的不同层次中提取和分享信息。在整个网络中共享信息是一个强大的解决方案,因为神经网络使用固定大小的小检测器来压缩图像,我们越深入到网络。

 

 

意味着早期的层将能够检测到小物体,且只能检测到大物体的边缘或部分。更深的层将失去小物体,但能够非常精确地检测大物体。

 

这种方法的主要挑战是通过这些连接将这两种不同类型的信息结合起来,LiDAR 3D空间数据和更常规的RGB帧。如前所述,在所有的网络步骤中使用这两种信息,是更好地理解整个场景的最好方法。

 

但我们如何才能将两个不同的信息流合并起来,并有效地利用时间维度?这两个分支之间的数据转换是网络在训练过程中以一种有监督的方式学习的,其过程与self-attention机制类似,试图重新创建世界的真实模型。但是为了促进这种数据转换,他们使用了一个叫做PointPillars的模型,它采用点云并给出一个二维的表示。

 

 

你可以把它看作是点云的伪图像,正如他们所说的那样,创造出某种程度上代表点云的常规图像,其属性与我们在其他分支中的RGB图像相同。像素不是RGB的颜色,而是简单地代表物体的深度和位置(x,y,z)坐标。这个伪图像也确实非常稀疏,这意味着这种表示的信息只在重要物体周围密集,而且很可能对模型有用。关于时间,我们只是在输入图像中设置了第四维来跟踪帧。

 

 

我们看到的这两个分支是卷积神经网络,它们对图像进行编码,然后对这些编码信息进行解码,重新创建我们在这里看到的3D表示。因此,这两个分支都使用了非常相似的编码器,彼此共享信息,并使用解码器重建世界的3D模型。

 

这就是Waymo车辆如何看世界的,通过我们在上图右边看到的这些世界的3D模型。它可以在164ms内处理32个点云和16个RGB帧,产生比其他方法更好的结果。这看起来可能没什么,所以我们可以把它与次好的方法进行比较,后者的精确度较低,需要300ms,处理时间几乎是两倍。

 

[参考文章]Combine Lidar and Cameras for 3D object detection - Waymo


关键字:Waymo  3D物体  自动驾驶 引用地址:Waymo如何进行3D物体检测?

上一篇:富迪科技推出面向车载语音应用的仿真测试平台CVIP
下一篇:福特申请汽车逆行检测系统专利

推荐阅读最新更新时间:2024-11-17 07:13

高通完胜?英特尔将裁员1.2万创十年新高
  近日,外媒称英特尔将会在今年进行10年以来最大规模的裁员,而此次裁员范围将涉及到其全球的1.2万名员工,这相当于裁掉英特尔11%的员工。下面就随汽车电子小编一起来了解一下相关内容吧。   英特尔凭借在PC芯片领域内不可撼动的地位,与微软结成winter联盟,成为世上最赚钱的公司。随着PC时代的结束,移动互联网的到来,世界PC销量持续下滑,英特尔优势不再。   以 高通 为代表的ARM结构芯片迅速崛起,尽管英特尔也曾进入移动芯片领域,推出Atom处理器和调制解调器芯片,但由于成本高居不下以及补贴政策的失利,英特尔最终放弃移动业务。 高通完胜?英特尔将裁员1.2万创十年新高   英特尔放弃移动芯片业务之后, 高通 彻底成
[汽车电子]
国产汽车,疯抢芯片
随着消费和工业市场接连下滑,汽车成为是近一年最大的风口。最近一段时间,汽车厂商动作不断,而芯片则是共同的关键词。这些厂商哪些动作值得关注?本文进行了盘点。 付斌|作者 电子工程世界(ID:EEworldbbs)|出品 理想:连签两家 最近一个月,理想连续与两家芯片巨头就电源与传感芯片达成长期供货协议。 2023年12月22日,理想汽车与意法半导体(ST) 签署了一项碳化硅(SiC)长期供货协议。按照协议, 意法半导体将为理想汽车提供碳化硅MOSFET,支持理想汽车进军高压纯电动车市场的战略部署。理想汽车即将推出的800V高压纯电平台将在电驱逆变器中采用意法半导体的第三代1200V SiC MOSFET先进技
[汽车电子]
国产汽车,疯抢芯片
百度发布“Apollo计划”阿波罗计划是什么而自动驾驶又是什
    eeworld网午间报道:中国,全球最大的汽车生产和销售市场。全球269个汽车品牌,中国品牌就占了61家,超过总数的五分之一。   人工智能时代的到来,把全世界的科技巨头和汽车厂商推向了研发自动驾驶技术的浪潮中。百度也有幸以一家中国公司的身份加入了“冲浪”队伍。   这不,百度今日发布一项名为“Apollo”的自动驾驶平台开放计划,将向汽车行业及自动驾驶领域的合作伙伴提供一个“开放、完整、安全”的软件平台,帮助他们结合车辆和硬件系统,快速搭建一套属于自己的完整的自动驾驶系统。   Apollo计划:   “Apollo计划”是什么?   我们将向汽车行业及自动驾驶领域的合作伙伴提供一个开放、完整、安全的软件平台,帮助他们结
[汽车电子]
叉车也能做到无人驾驶?Seegrid助力自动驾驶复杂方案
无人驾驶叉车(也称为自动叉车或机器人叉车)已经超越了新颖性阶段,越来越多地应用于物料存储和运输中,以补充或替代人工操作叉车。 据外媒报道,美国 Seegrid 筹集了 2500 万美元股权融资,由 G2VP 投资,G2VP 的联合创始人 David Mount 将加入公司的董事会。该轮融资后,公司的估值达到数亿美元。公司将利用这笔资金加快原定于 2021 年和 2022 年推出的新产品,并招聘更多的专业人才,促进公司增长。 Seegrid 是一家基于视觉的工业自动驾驶公司,成立于 2003 年,总部位于美国匹兹堡,由 Hans Moravec 和 Scott Friedman 联合创立,旨在降低制造工厂、物流运输和
[嵌入式]
叉车也能做到无人驾驶?Seegrid助力<font color='red'>自动驾驶</font>复杂方案
强强联手:英特尔宣布与上汽集团合作研发自动驾驶技术
  据外媒报道, 英特尔 今天在CES展上宣布与中国上汽集团以及中国领先的数字地图公司四维图新合作,整合并实现Mobileye道路经验管理系统(Road Experience Management,REM)数据的本地化。 英特尔 在中国的汽车及 自动驾驶 业务取得的了很大的进展。下面就随汽车单子小编一起来了解一下相关内容吧。   本次合作为 英特尔 进入中国市场新增了一个关键的途径,对于那些希望运营 自动驾驶 汽车及研发 自动驾驶 技术的汽车制造商而言,中国市场是一个“庞然大物”。英特尔及Mobileye此次与中国企业达成合作,将为其开发此特定市场并实现其本地化打开一扇门,但要想在中国这个全球增长最快的汽车市场建立此业务,还有很长
[汽车电子]
中国自动驾驶领先苹果,考验英伟达
中国电动汽车厂商蔚来和智能手机厂商小米在年底发布了挑战 NVIDIA 和苹果的新产品。这标志着中国在发展自己的半导体技术、消除对进口依赖方面的努力又取得了进展。 12 月 23 日,蔚来发布了首款 自动驾驶 芯片,据称该芯片优于目前使用的 NVIDIA Drive Orin 芯片。神玑 NX9031 SoC 将用于该公司的新款 ET9 行政轿车,该车也在 2023 年 NIO Day 上亮相。 ET9 是一款长轴距四门豪华电动汽车,售价约为 80 万元人民币,按当前汇率计算为 113,000 美元。ET9 现在可以在中国下订单,但预计要到 2025 年第一季度才会开始交付。 中国首款 5nm 制程汽车芯片 NX9031
[汽车电子]
北京市首个T5级别自动驾驶封闭测试场正式开放运营
模拟高速路行驶场景,模拟机动车和非机动车混行的隧道场景,模拟雨天、大雾等极端天气场景……本市 自动驾驶 车辆有了更高级别“考场”。继国家智能汽车与智慧交通(京冀)示范区海淀基地后,国家智能汽车与智慧交通(京冀)示范区亦庄基地(以下简称亦庄基地)近期通过相关部门审批,封闭测试场正式对外开放运营。该测试场是本市首个T1— T5级 别测试场,可供测试车辆在更复杂的交通场景中进行测试评估,进而申请更高级别的 自动驾驶 道路测试试验牌照。 首个 T5级 别“考场”开测 记者来到位于南海子公园西侧的亦庄基地看到,多部 自动驾驶 车辆正排队检测,等待进入封闭测试场。“这些车辆有的已经在海淀测试场获得T3级别道路测试牌照,这次来是进行更高级别
[汽车电子]
Google 自动驾驶汽车安全行驶超三十万英里
      日前 Google 宣布其测试中的自动驾驶汽车已经安全无事故行驶了超过 30 万英里。       Google 强调这样的安全行驶是在“大量各不相同的交通环境”下取得的。       这样的测试结果对于 Google无人驾驶汽车项目来说具有重大的意义:三十万英里的行驶里程已经超过了大部分普通轿车的生命周期。       不过 Google 同时表示他们还需要再接再厉进行更多的测试,在汽车正式上市之前还要继续测试更多的路况,跑更长的里程,以及添加更多的车型,比如雷克萨斯RX450h 混合动力车。 
[嵌入式]
小广播
最新汽车电子文章
换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved