InterHub 数据集

概述

驾驶交互是自动驾驶研究中最复杂且关键的领域,现有自然驾驶数据集中密集交互事件稀少且定义不统一,限制了对复杂场景的探索。为解决这一问题,提出InterHub数据集,这是一个集合了 Waymo、Lyft、nuPlan 和 INTERACTION 四个自然驾驶数据集,通过挖掘其中交互事件形成的密集型驾驶交互数据集。通过统一的数据接口和形式化方法,InterHub 实现了交互场景的高密度覆盖和量化分析。实验表明,InterHub 在轨迹预测和规划任务中提供了更具挑战性的测试场景,可显著揭示现有算法在高交互场景中的性能局限。此外,我们还提供了一个用户友好的工具包,允许InterHub扩展应用到其他公共或私人数据。作为首个面向密集驾驶交互的综合数据集,InterHub 为推动自动驾驶交互研究提供了强大的工具和数据支持。

ArXiv:https://arxiv.org/abs/2411.18302

项目链接:https://github.com/zxc-tju/InterHub

动机与挑战

驾驶交互是自动驾驶研究中最复杂且关键的领域,现有自然驾驶数据集中密集交互事件稀少且定义不统一,限制了对复杂场景的探索。为解决这一问题,提出InterHub数据集,这是一个集合了 Waymo、Lyft、nuPlan 和 INTERACTION 四个自然驾驶数据集,通过挖掘其中交互事件形成的密集型驾驶交互数据集。通过统一的数据接口和形式化方法,InterHub 实现了交互场景的高密度覆盖和量化分析。实验表明,InterHub 在轨迹预测和规划任务中提供了更具挑战性的测试场景,可显著揭示现有算法在高交互场景中的性能局限。此外,我们还提供了一个用户友好的工具包,允许InterHub扩展应用到其他公共或私人数据。作为首个面向密集驾驶交互的综合数据集,InterHub 为推动自动驾驶交互研究提供了强大的工具和数据支持。

突破:InterHub

为解决上述问题,本研究开发了 InterHub 数据集,通过整合多个公共自然驾驶数据集并提取交互事件,提供了一个统一、全面的交互数据基础。具体来说,论文的主要贡献包括:

  1. 构建统一的高密度驾驶交互数据集:从多个被广泛采用的公共自然驾驶数据集中提取密集的驾驶交互事件,统一、分析并分类数据,为驾驶交互研究提供了一个用户友好的数据基础——InterHub。
  2. 提出定量化且易于理解的驾驶交互定义:采用形式化方法,明确且量化地定义了驾驶交互事件,并提供开源工具包,支持跨学科的交互描述以及用户端的多主体交互事件提取。
  3. 验证高挑战性交互场景的价值:通过实验展示了 InterHub 中高交互强度场景的挑战性,这些场景对验证自动驾驶关键任务(如轨迹预测和运动规划)的性能具有重要意义。

图 1展示了整体研究内容,基于NVIDIA开发的 trajdata 工具包,将多源驾驶记录标准化为统一格式。通过形式化的方法,提取多主体交互事件,并构建高密度交互数据集。对数据集交互特征进行分析,并提供场景交互特征语义标签,最后在自动驾驶相关的关键任务中进行应用。

技术点基于形式化的交互事件识别方法

该方法旨在解决驾驶交互事件类型多样且分布稀疏的问题,通过形式化方法描述并量化驾驶交互事件,以提高识别的精确性和一致性。

驾驶交互被定义为至少两个道路使用者因空间和时间上的潜在冲突而相互影响的情境,包含以下三要素:

  • 交互实体数量:至少涉及两个以上的参与者。
  • 时空冲突:实体在未来可能占据相同的空间区域。
  • 相互影响:参与者会采取行动避免碰撞,导致相互行为的改变。

这一语义描述构建了一个可读的交互场景,传达了“交互的核心在于为化解潜在冲突所付出的努力”的主旨。为了兼顾语义的可读性和数学的精确性,我们将这种语义描述转化为定量表达。图 2展示了其主要思想。通过计算解决潜在冲突所需的最小绝对加速度或减速度总和(MSAA),衡量交互强度。MSAA 的值越大,表明潜在冲突对交互参与者的影响越强。

基于上述量化方法进行驾驶交互场景的形式化定义(图 3)。更具体的内容请参考原文。

数据结构

下图展示了InterHub数据集整体信息流。数据集提供以下三类信息:

  • 索引:场景 ID、参与主体 ID、交互开始与结束时间;
  • 交互指标:交互强度(MSAA)、后侵入时间(PET)等;
  • 场景特征:路径关系(如平行、交叉等)和优先级信息。

通过关键信息,从原始场景中索引、定位交互事件片段,可以获取标准化的轨迹和地图信息。

相关案例:交互场景案例

图 5展示了InterHub中一个驾驶交互事件关键帧及交互强度的变化过程。

相关案例:数据统计与交互特性分析

从 Waymo、Lyft、nuPlan 和 INTERACTION 数据集中共提取得到 65,399 条交互事件,显著高于单一数据集。以下是关键统计信息:

  • 交互强度:平均强度为 1.76 m/s²;
  • 交互时长:大多数交互持续时间集中在 0.25-3.5 秒;
  • 参与主体:多主体交互事件平均涉及 3.2 辆车,最高达到 7 辆。

从多个角度对不同数据集的驾驶交互特性进行分析,得到以下结果:

  • 交互场景稀疏:有效交互事件的比例较低,双主体交互场景约占 3%,多主体交互场景仅占 1%,这一稀疏性在所有数据集中一致存在。
  • 交互参与主体:nuPlan 和 INTERACTION 数据集的多主体交互复杂性较高;而 Waymo 和 Lyft 数据集的复杂性较低,最多涉及 5 辆车。
  • 交互持续时间:大部分有效交互事件持续25 到 3.5 秒,平均时长约 0.6 秒。nuPlan 数据集的交互时长较短,而 INTERACTION 数据集的交互时长因数据片段限制更短。
  • 交互强度:大多数交互强度集中在3 m/s² 以下,在 Waymo 数据集中强交互场景更多。
  • 安全性评估:利用后侵入时间(PET)评估交互安全性,尽管未做额外安全筛选,数据中仍捕捉到危险但非交互场景,表明 InterHub 可为自动驾驶技术的验证提供关键支持。

相关案例:自动驾驶关键任务

通过在轨迹预测、运动规划两个关键任务方面的应用,证明了所提出的密集交互数据集在推动自动驾驶技术评估和发展方面的潜力。实验显示,现有的轨迹预测与规划模型在高密度交互场景中的性能显著下降:

  • 轨迹预测任务:如 UQnet 和 MTR 在 InterHub 数据集上的最小平均偏差(minADE)较原数据集分别增加 34.65% 和 22.67%。
  • 运动规划任务:基于2023年至2024年举行的OnSite自动驾驶算法挑战赛,我们评估了排行榜前十的规划算法在超过700个交互场景中的平均表现得分。结果表明,随着交互强度增加,算法的平均性能评分显著下降,验证了 InterHub 提供更具挑战性测试场景的能力。

总结与展望

自然驾驶数据集是与自动驾驶汽车相关实证研究的重要基础资源,在自动驾驶技术的最新进展中发挥了关键作用。本研究聚焦于自然驾驶数据中特定但高度相关的子集——交互驾驶场景。InterHub 框架提供了一种形式化方法,用于识别和量化驾驶交互,并形成了一个高密度驾驶交互事件数据集。此外,本研究还提供了用于数据提取、检索、可视化以及跨数据集应用的工具包,从而促进了对交互分析的整体性研究发展。

解决任何问题的关键第一步是对问题进行精准识别。本数据集旨在通过以下途径弥补自动驾驶研究中的现有空白:

  • 易于跨数据集使用:InterHub框架提供了标准化工具,提升数据的可重复性,方便不同数据集间的对比分析,推动自动驾驶交互研究的普适性与可靠性。
  • 自动驾驶任务中的交互挑战:高风险驾驶场景稀缺,挖掘这些场景对测试自动驾驶系统至关重要,验证在高度交互条件下的自动驾驶有助于解决稀有但关键的“长尾”挑战。
  • 数据集潜在误用:INTERACTION数据集规模有限,而较大的数据集如WOMD能提供更多稀疏的交互数据,InterHub工具包帮助研究人员结合密集与稀疏数据进行深入分析。
  • 未来数据集发展的建议:自动驾驶视角的数据对自动驾驶与人类驾驶交互研究有丰富价值,但缺乏纯人际交互场景限制研究,地图格式不一致性是跨数据集研究障碍,统一地图格式可提升研究效率。
  • 从驾驶自动化到未来交通系统:InterHub为推动交通管理提供新机遇,支持研究AV与混合交通系统的整合及影响,理解AV特有交互对交通生态系统的未来至关重要。