真正的天网:英伟达推出首个跨摄像头汽车跟踪数据集

发布者:美丽的1号最新更新时间:2019-03-27 来源: 头条关键字:图像识别  光网络  自动驾驶 手机看文章 扫描二维码
随时随地手机看文章

城市利用交通摄像头作为全市范围内的传感器来优化交通流量和管理交通事故潜力巨大。但现有技术缺乏大范围跟踪车辆的能力,这些车辆跨越多个摄像机,分布在不同的十字路口,天气条件也各不相同。

要克服这一难题,必须解决三个截然不同但又密切相关的研究问题:1)单摄像头内目标的检测和跟踪,即多目标单摄像头(MTSC)跟踪;2)跨多摄像头目标重识别,即 ReID;3)跨摄像头网络对目标进行检测和跟踪,即多目标跨摄像头跟踪(MTMC tracking)。MTMC 跟踪可以看作是相机内部 MTSC 跟踪与基于图像的 ReID 的结合,连接相机之间的目标轨迹。

如图 1 所示,多目标跨摄像头跟踪包含三大组成部分:基于图片的再识别、单摄像头内的多目标跟踪以及摄像头之间的时空分析。

CVPR 2019 准满分论文:英伟达推出首个跨摄像头汽车跟踪数据集

图 1:多目标跨摄像头跟踪

相比于最近发展火热的行人再识别,车辆再识别主要面临两大挑战:一是类内部的高变化性(因为不同视角的车辆变化比人更大),二是类之间的高相似性(因为不同汽车厂商生产的车辆模型很相近)。目前已有的车辆再识别数据集(北邮的 VeRi-776、北大的 VehicleID 以及同样来自北大的 PKU-VD)都没有提供原始视频和相机校正信息,所以无法用它们开展基于视频的跨摄像头车辆跟踪研究。

本文作者提出的「流动之城」数据集包含高清的同步视频,涵盖最多的路口(10)和最大数量的摄像头(40),收集于一个中等规模的美国城市,场景也很多样,包括了住宅区和高速公路等等。本文的主要贡献有以下三点:

  1. 在现有数据集中,本数据集有最大的空间跨度和摄像头/路口数量,包括多样的城市场景和交通流量,为城市规模的解决方案提供了最佳平台。

  2. 「流动之城」也是第一个支持(基于视频的)跨摄像头多目标车辆跟踪的数据集,提供了原始视频、相机分布及相机校正信息,将打开一个全新研究领域的大门。

  3. 分析了各种最先进算法在该数据集上的表现,比较了各种视觉和时空分析结合的算法,证明该数据集比现有其他数据集更具挑战性。

CVPR 2019 准满分论文:英伟达推出首个跨摄像头汽车跟踪数据集

图 2:摄像头空间分布示意图。红色箭头表示摄像头的位置和方向

论文:CityFlow: A City-Scale Benchmark for Multi-Target Multi-Camera Vehicle Tracking and Re-Identification

CVPR 2019 准满分论文:英伟达推出首个跨摄像头汽车跟踪数据集


论文链接:https://arxiv.org/abs/1903.09254

摘要:使用交通摄像头作为传感器的城市交通优化需要更强大的多目标跨摄像头跟踪支持。这篇论文介绍了 CityFlow(流动之城),是一个城市规模的交通摄像头数据集,包括了从 10 个路口提取的 40 个摄像头收集到的超过 3 个小时的同步高清视频,两个同步摄像头间的最长距离是 2.5 千米。据我们所知,从空间跨度和摄像头/视频数量来看,「流动之城」是目前都市环境中最大规模的数据集。该数据集包含超过 20 万个目标框,并且涵盖了多样的场景、视角、车辆模型和城市车流状况。

我们提供了相机分布和校正信息来辅助时空分析。此外,我们也提供这个数据集的子集用作基于图像的车辆再识别。我们进行了大量的实验分析,测试了各种各样的跨摄像头多目标跟踪、单摄像头多目标跟踪、目标检测和再识别的基准/最先进算法,并分析了不同的网络结构、损失函数、时空模型和它们的结合。

该数据集和线上评估服务器都已经在 2019 年的 AI 城市大赛发布(https://www.aicitychallenge.org/),研究者可以在服务器上测试自己的最新算法技术。我们期待这个数据集能促进该领域的研究,提升现今算法的效果,并优化现实世界的交通管理。为保护隐私,数据集中的所有车牌及人脸都进行过遮挡处理。

「流动之城」与相关基准的对比

CVPR 2019 准满分论文:英伟达推出首个跨摄像头汽车跟踪数据集

表 1:现有的目标再识别数据集的总结

可以看出,「流动之城」是目前唯一支持跨摄像头基于车辆跟踪的数据集,而且拥有目前最多的相机数量,有超过 20 万个目标框,并提供原始视频、相机分布和多视角分析。

「流动之城」基准数据集

整个数据集包括 5 个不同场景和 40 个摄像头,视频总长度大概 3 小时 15 分钟,标注了 666 辆车的跨摄像头轨迹。以下是这些场景的总结(部分场景摄像头有重合)。

CVPR 2019 准满分论文:英伟达推出首个跨摄像头汽车跟踪数据集


下图是车辆颜色及车型的分布情况。

CVPR 2019 准满分论文:英伟达推出首个跨摄像头汽车跟踪数据集


以下是跟踪标注结果的示例。研究者首先采用目前先进的目标检测和单摄像头跟踪方法得到粗略的目标轨迹,并手动修复轨迹中的错误,在此基础上进行跨摄像头间的信息标注。

CVPR 2019 准满分论文:英伟达推出首个跨摄像头汽车跟踪数据集


同时,他们用谷歌地图的三维信息和图像上的二维投影结果进行匹配和优化,获得了较准确的单应性矩阵,提供给参赛队伍进行三维时空分析。

CVPR 2019 准满分论文:英伟达推出首个跨摄像头汽车跟踪数据集


他们的实验分析分为三大部分:基于图片的车辆再识别、单摄像头多目标跟踪和有时空分析结合的跨摄像头跟踪。

首先是再识别的部分,研究者比较了去年 AI 城市大赛上的获奖方法、行人再识别的目前最优方法(整理于伦敦大学玛丽女王学院的 deep-person-reid 项目)还有车辆再识别的最优方法(来自英伟达内部,刚被 IJCNN 录用)。下面是这几种方法的 CMC 曲线比较(包围面积越大效果越好),可以看到行人再识别和车辆再识别的方法在该数据集上不相伯仲,但是这些方法整体的精确度还是很低的,Rank-1 的命中率只有 50% 左右,相比较下目前 VeRi 数据集上同样方法能拿到 90% 以上的 Rank-1 命中率,这说明该数据集的挑战还是很大的。

CVPR 2019 准满分论文:英伟达推出首个跨摄像头汽车跟踪数据集


下面是这几种方法的排名结果对比,可以看到相机的视角非常多样,也带来了更大的难度。

CVPR 2019 准满分论文:英伟达推出首个跨摄像头汽车跟踪数据集


下表对比了目前比较先进的单摄像头跟踪算法及目标检测方法的结合。其中 DS 代表德国科布伦茨-兰道大学的 Deep SORT,TC 是去年 AI 城市大赛上的获奖方法,MO 是目前 MOTChallenge(多目标跟踪大赛)的三维跟踪数据集上的领先方法 MOANA。目标检测部分比较了 YOLO、SSD 和 Faster R-CNN。目前最好的结果来自于 TC 和 SSD 的结合。

CVPR 2019 准满分论文:英伟达推出首个跨摄像头汽车跟踪数据集


最后,下表加入了时空分析的比较,对比跨摄像头多目标跟踪的最终结果。其中 PROVID 是 VeRi 数据集作者的方法。2WGMMF 是作者实验室之前提出的方法,用高斯分布来学习摄像头之间的时空关系。最后 FVS 还是作者去年 AI 城市大赛上获奖方法的一部分,用手动来设定跨摄像头间的高斯分布,所以也更加准确一些。

CVPR 2019 准满分论文:英伟达推出首个跨摄像头汽车跟踪数据集


作者简介

本文的第一作者汤政是华盛顿大学(西雅图)电子计算机工程学院的博士生,预计今年 6 月毕业。作者目前在英伟达实习,毕业后将入职亚马逊,加入无人商店「购」项目。该论文是其在英伟达实习期间的成果。

汤政在 2017 年及 2018 年两度带领自己实验室的团队参加英伟达主办的 AI 城市大赛,他们的队伍连续两届成为该项赛事冠军,击败了包括加州大学伯克利分校、伊利诺伊大学厄巴纳-香槟分校、马里兰大学帕克分校、北京邮电大学、国立台湾大学等在内的全球近 40 支队伍,其中第二届赛事是 CVPR 2018 的 workshop。因为团队的出色表现,汤政受邀进入英伟达实习,负责协助筹办第三届 AI 城市大赛(同样是今年 CVPR 2019 的 workshop)并准备基准数据集,也就是本文介绍到的「流动之城」数据集。

今年的 AI 城市大赛共有三个分赛:跨摄像头多目标车辆跟踪、基于图片的车辆再识别以及交通异常检测。目前已经有全球超过 200 支参赛队伍报名(合计超过 700 名参赛者),是前两年比赛总和的四倍之多。英伟达会在今年加州长滩的 CVPR 会议上公布获奖队伍和颁发奖品(一台 Quadro GV100、三台 Titan RTX 和两台 Jetson AGX Xavier)。目前比赛仍然接受参赛队伍报名和 workshop 投稿,比赛截止时间是 5 月 10 日。另外,论文的其他作者包括英伟达 AI 城市项目的 CTO - Milind Naphade、英伟达研究院的 GAN 领域专家 - 劉洺堉、同样来自英伟达研究院的杨晓东(今年有三篇 CVPR oral 中稿)、英伟达雷蒙德分公司的首席研究员 - Stan Birchfield、汤政的导师黄正能教授等。


关键字:图像识别  光网络  自动驾驶 引用地址:真正的天网:英伟达推出首个跨摄像头汽车跟踪数据集

上一篇:英伟达成为自动驾驶“最强大脑”也是偶然中的必然
下一篇:特斯拉和Waymo,做自动驾驶有什么不同?

推荐阅读最新更新时间:2024-07-25 20:25

智能汽车:自动谈不上自虐更贴切?
自动驾驶目前啥水平? NHTSA分级: 美国高速公路安全局(简称NHTSA)根据自动化的程度将自动驾驶技术分为了5个等级,分别为0~4级。 0级 此等级车辆不具备自动化功能;驾驶人须全时间完全独力操作车辆的各种主要控制功能,包括刹车、方向盘、油门与动力。 代表车型:目前市场上所有车型的低配版都是不具备自动化功能的,也就是说连定速巡航功能都不带的车型。 1级 具备1种以上自动化控制功能的车辆,包括电子车身稳定控制、预充电刹车(pre-chargedbrakes),也就是车辆会自动在刹车时提供协助,让驾驶人在紧急情况时能重新取得车辆的控制权,或者是将车辆更快刹停。 代表车型:例如大众ESP、本田VSA、丰田VS
[嵌入式]
均联智行携手黑芝麻智能,布局自动驾驶域控智能方案
8月12日,宁波均联智行科技股份有限公司(下称“均联智行”)和黑芝麻智能科技(上海)有限公司(下称“黑芝麻智能”)签署了战略合作协议。双方将依托各自优势资源,在自动驾驶计算芯片、前瞻技术联合预研及智能汽车平台化等业务领域展开深度合作,重点围绕自动驾驶域控制器的开发与定制,成立联合预研团队,共克技术难点,协同发展,建立起可持续发展的战略合作伙伴关系,共同打造未来全新的出行体验生态。 黑芝麻智能产品副总裁丁丁(左)与均联智行战略及新业务副总裁(右)陆海涛现场签约 在国家政策、技术等多重因素的驱动下,智能网联汽车技术和产业体系逐步健全完善,汽车智能网联化的应用落地成为竞争焦点。正是借助当前大力发展自主研发中国品牌技术的契机,均联
[汽车电子]
均联智行携手黑芝麻智能,布局<font color='red'>自动驾驶</font>域控智能方案
苹果使用“置信”算法 使自动驾驶汽车传感系统选择性地处
目前生产自动驾驶汽车系统通常依赖大量的数据处理过程。安装在汽车上的 传感器 阵列收集的数据,能够提供完整的道路视图。但是理解这些数据,以及确定可能需要更多注意的物体和道路变化,需要昂贵的计算费用。 解决这个问题的一种方法是增强汽车自动驾驶系统的处理能力。但由于硬件需求和能耗增加,导致费用昂贵。另一种方法是使驱动系统在用尽资源时具有选择性,有目的在某些区域使用更少的循环周期,并将剩余的用于更重要的元素。 据外媒报道,近期,美国专利商标局(US patent and Trademark Office)公布了苹果公司的“深度感知传感器数据处理”(Depth perception sensor data processing)的专利
[传感器]
苹果使用“置信”算法 使<font color='red'>自动驾驶</font>汽车传感系统选择性地处
丰田出资4亿美元用于自动驾驶领域开发
丰田发布消息,确定要向中国初创企业小马智行出资约 4 亿美元,在整个汽车产业欧洲、美国的企业不断在收缩调整的时候,丰田这个不声不响的,一个是在 CES 上宣布造城(弄出了一个未来生活的实验室),一个是不断在自动驾驶、出行服务方面不断提升。这个事其实可以看出来现在逆周期不是做产能扩展,逆周期是做低估值的技术层面的收购和投资,以应对未来的需求。 图 1 丰田有钱的底气是源自于在全球汽车市场下行周期中的表现 01 小马智行的投资 丰田和小马智行是在去年的 8 月宣布在自动驾驶领域展开合作。传统整车企业由于开发体制和人员的限制,在合作中丰田还是很认可小马智行的技术(这也是客观说明中国在这块领域里面
[嵌入式]
丰田出资4亿美元用于<font color='red'>自动驾驶</font>领域开发
从2012第二季度过后,全球光网络设备开支正在下降
墨尔本,2012年8月30日-根据Ovum的报告。 2012年第二季全球光网络(ON)设备支出有所下降,尽管与2011年第二季度相比在亚太增长6%和南美和中美洲(SCA)增长19%。鉴于2012年上半年的表现,在第四季度想要非常大的超越2011年的增长将是不可能发生的。 在Ovum新的报告中提出,市场继续辜负大家的期望,一些供应商正在利用比别人更好的增长口袋。 Ovum的资深网络基础设施电信分析师- Dana Cooperson说:“2012年第二季的初步分析提供了更多的关注的原因。全球开支在第一季度下降了8%,比2011年第二季度为38亿美元。这是继去年同期相比,同比下降了一段。全球股市的下跌,主要是由于消费疲软于北美(NA
[网络通信]
自动驾驶让喝酒和开车不再冲突
据报道,第四届 世界互联网大会 于2017年12月3日—5日在浙江省乌镇举行。 百度 创始人、董事长兼CEO 李彦宏 在人工智能分论坛上发表演讲。   “不久前我们公布了AI音箱,有人说漂亮的不像百度的产品,但AI的对话能力,像百度”,李彦宏以调侃式的语气开场。他称,AI正在改变各行各业,包括对B端生态的改变更加明显。     李彦宏称,例如生鲜行业,通过AI技术,这一行业的利润可提升近20%,损毁率可降低30%。此外,通过AI技术还可鉴别生鲜质量等。     李彦宏在台上发表演讲李彦宏在台上发表演讲   众所周知,百度在 自动驾驶 领域做得更加深入。     “昨天喝酒时,朋友给我提了个建议。你们应该做广告,大家坐在车里
[嵌入式]
瑞萨电子推出一体式ADAS全景环视解决方案套件
2016年11月8日,日本东京讯—— 全球领先的半导体解决方案供应商瑞萨电子株式会社(TSE:6723)今日宣布推出一款全新一体式先进驾驶员辅助系统(ADAS)全景环视解决方案套件。2015年10月8日,瑞萨电子推出第一代ADAS全景环视套件,并取得成功。在此基础上升级迭代的第二代ADAS可视解决方案套件,最多可搭载8个摄像头,同时实现了新一代电子后视镜(注1)、驾驶员监测和全景环视系统。     瑞萨电子ADAS全景环视解决方案套件   视觉应用被视为实现自动驾驶进程中下一项重要的舒适与安全功能。此外,它已成为自动驾驶和ADAS应用的标准,可实现传感器融合技术。此技术结合并处理从车载摄像头和雷达收集的信息,以识别汽车周围的环
[汽车电子]
光学传感芯片最新进展,有利机器人、自动驾驶等领域发展
光学传感芯片是一种集成光谱传感器的芯片,其工作原理主要基于光学传感技术。它能够测量光线的不同波长,并通过电子技术将这些波长的光线转换为数字信号,从而实现光谱数据的测量和处理。 光学传感芯片应用及市场 光学传感芯片广泛应用于多个领域,如光电测量,用于精确测量光线的各种参数,包括强度、波长等;光电控制,在自动控制系统中,光学传感芯片可以作为感知元件,实现对光线的自动控制和调节;光电通信,在光通信系统中,光学传感芯片用于接收和转换光信号,实现信息的传输和交换。 还可以在智能手机、电视等消费电子产品,用于颜色测量、光学成像等功能,提升产品的性能和用户体验。在安防、智能家居等领域,用于环境光监测、自动控制等功能,提高安全性和便利性。 近年来
[嵌入式]
小广播
最新汽车电子文章
换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved