OnSiteVRU 数据集

背景

随着城市化进程加速和交通需求增长,混合交通流(包括机动车、自动驾驶车辆、行人、自行车等)的复杂性显著增加,弱势道路使用者(VRU,如行人、自行车骑行者)的安全问题日益突出。自动驾驶车辆需在复杂环境中快速、准确地识别和响应VRU行为,但现有测试方法和数据集在VRU行为的多样性和动态性覆盖方面存在不足,导致自动驾驶系统在实际应用中难以有效保障VRU安全。因此,开发更具代表性、多样性和高精度的VRU轨迹数据集至关重要,但面临数据采集成本高、行为标注复杂等挑战。城市道路混合交通流在交叉口、机非共享路段及城中村等场景中表现出高度复杂性和动态性。VRU行为的随机性、路径选择的多样性以及与机动车的频繁交互,使得交通流特征更加复杂,增加了交通冲突率和碰撞风险。高分辨率轨迹数据能够提供全面且准确的微观行为信息,对VRU行为的精细刻画是交通流理论研究的关键,也为智慧城市和智慧交通的数字化转型提供了重要基础。然而,现有数据集在VRU相关场景的覆盖、数据质量和多样性方面仍存在不足,需进一步明确交叉口共享空间混合交通流轨迹相关研究进展,特别是针对VRU行为的研究需求。

数据介绍

OnSiteVRU数据集包含多个交叉口和路段场景,涵盖了不同类型的交通参与者。数据集中的交叉口包括仙霞路-剑河路、长阳路-隆昌路、墨玉路-昌吉东路和河间路-宁武路,每个交叉口的数据包括机动车、电动自行车和人力自行车的轨迹,共计约17429条轨迹。路段部分包括曹杨路和安远路,其中曹杨路为标线隔离路段,数据时长为50分钟,包含1256条数据;安远路为双向两车道无隔离路段,数据时长为1小时40分钟。城中村数据集则采集自上海嘉定区和苏州平江区。OnSiteVRU数据集旨在为交通、车辆等专业领域的研究人员提供关于混合交通环境中VRU行为的研究支持。

完整数据获取链接:https://www.kaggle.com/datasets/zcyan2/mixed-traffic-trajectory-dataset-in-from-shanghai

数据格式

排行榜

基于OnSiteVRU数据集设立了VRU轨迹预测排行榜,旨在为轨迹预测模型提供一个统一的评估平台,并填补相关领域的空白。该排行榜的发布,能够深入了解当前模型在相同任务场景下的表现,并推动相关研究的持续发展。

OnSiteVRU轨迹预测排行榜共提供五个数据集,包括All_data、Intersection、JH_total、LC_total和MY_total。其中,All_data包含所有数据,涵盖交叉口和路段的场景;Intersection包含四个交叉口场景,其余数据为单独的交叉口。每个场景包括5个观测步长和6个预测步长,共计11个步长,时间频率为0.48秒。参赛者可使用任意训练数据进行模型训练,并在特定测试数据上进行测试。提交时需遵循命名规则,提交相应数据集的测试结果。请注意,测试时必须确保测试样本的顺序保持不变(数据未添加标签,直接用于算法训练)。了解更多排行榜相关信息,请访问链接:OnSiteVRU轨迹预测排行榜

结论与展望

OnSiteVRU 相比传统开源数据集具有显著优势:其 VRU 密度和比率更高,场景覆盖更广,能更全面反映混合交通流中 VRU 的行为特征;数据精度达 0.04 秒,提供丰富的微观行为信息,为精细化交通流建模和风险分析奠定基础;同时,数据集兼具俯拍视角的自然驾驶数据和车载视角的实时动态检测数据,满足交通流建模、轨迹预测及自动驾驶虚拟测试等多样化需求。此外,数据涵盖信号灯、干扰物、实时地图等环境信息,能更全面还原交互事件。当前,团队正测量更高精度地图信息,并计划开发 T 字路口等更多场景,以提升数据集多样性和实用性。未来,OnSiteVRU 将持续扩展场景覆盖和数据维度,为混合交通流研究和自动驾驶技术发展提供更强支撑。