当前位置: X-MOL 学术Transp. Res. Part C Emerg. Technol. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Intelligent vehicle pedestrian light (IVPL): A deep reinforcement learning approach for traffic signal control
Transportation Research Part C: Emerging Technologies ( IF 8.3 ) Pub Date : 2023-03-01 , DOI: 10.1016/j.trc.2022.103991
Mobin Yazdani , Majid Sarvi , Saeed Asadi Bagloee , Neema Nassir , Jeff Price , Hossein Parineh

Deep reinforcement learning (RL) has been widely studied in traffic signal control. Despite the promising results that indicate the superiority of deep RL in terms of the quality of solution and optimality over fixed time signal control, the real-world multi-modal traffic flows, especially pedestrians, are not properly considered nor sufficiently investigated. This study presents a novel deep RL-based adaptive traffic signal model to control the vehicles and pedestrian flows by allocating an equitable green time to each, aiming at minimizing “total user delays” as opposed to “total vehicle delays” dominantly being used in the literature. Our proposed intelligent vehicle pedestrian light (IVPL) method can perform in the absence or presence of pedestrians, especially when there is jaywalking at the intersection, interrupting vehicle flows. To this end, an extended reward function is designed to capture delays due to vehicle-to-vehicle, vehicle-to-pedestrian, and pedestrian-to-pedestrian interactions, as well as red-light delays for vehicles and pedestrians. To evaluate the performance of IVPL, a microsimulation model of an intersection in city of Melbourne is used as a case-study. The real traffic signal parameters of an existing operation system (SCATS) are employed, and the simulation is calibrated using video-based camera data and loop detectors data collected at intersection. The experimental results demonstrate the superiority of the proposed model over fully actuated traffic signal, not only in terms of the quality of optimal solution, but also considering the fact that the proposed model can minimize the “total user delays”.



中文翻译:

智能车辆行人灯 (IVPL):一种用于交通信号控制的深度强化学习方法

深度强化学习 (RL) 在交通信号控制中得到了广泛研究。尽管有希望的结果表明深度强化学习在解决方案质量和最优性方面优于固定时间信号控制,但现实世界的多模态交通流,尤其是行人,并未得到适当考虑或充分研究。本研究提出了一种新颖的基于深度强化学习的自适应交通信号模型,通过为每个车辆和行人分配公平的绿灯时间来控制车辆和行人流量,旨在最大限度地减少“总用户延迟”而不是主要用于交通的“总车辆延迟”文学。我们提出的智能车辆行人灯 (IVPL) 方法可以在行人不在或在场的情况下执行,尤其是在十字路口有人乱穿马路、中断车流的情况下。为此,设计了一个扩展的奖励函数来捕获由于车辆与车辆、车辆与行人和行人与行人的交互造成的延误,以及车辆和行人的红灯延误。为了评估 IVPL 的性能,我们使用墨尔本市十字路口的微观仿真模型作为案例研究。采用现有操作系统 (SCATS) 的真实交通信号参数,并使用基于视频的摄像机数据和在交叉路口收集的环路检测器数据对仿真进行校准。实验结果证明了所提出的模型优于完全驱动的交通信号,不仅在最优解的质量方面,而且考虑到所提出的模型可以最小化“总用户延迟”这一事实。扩展的奖励功能旨在捕获由于车辆与车辆、车辆与行人和行人与行人的交互以及车辆和行人的红灯延误造成的延误。为了评估 IVPL 的性能,我们使用墨尔本市十字路口的微观仿真模型作为案例研究。采用现有操作系统 (SCATS) 的真实交通信号参数,并使用基于视频的摄像机数据和在交叉路口收集的环路检测器数据对仿真进行校准。实验结果证明了所提出的模型优于完全驱动的交通信号,不仅在最优解的质量方面,而且考虑到所提出的模型可以最小化“总用户延迟”这一事实。扩展的奖励功能旨在捕获由于车辆与车辆、车辆与行人和行人与行人的交互以及车辆和行人的红灯延误造成的延误。为了评估 IVPL 的性能,我们使用墨尔本市十字路口的微观仿真模型作为案例研究。采用现有操作系统 (SCATS) 的真实交通信号参数,并使用基于视频的摄像机数据和在交叉路口收集的环路检测器数据对仿真进行校准。实验结果证明了所提出的模型优于完全驱动的交通信号,不仅在最优解的质量方面,而且考虑到所提出的模型可以最小化“总用户延迟”这一事实。和行人与行人的互动,以及车辆和行人的红灯延误。为了评估 IVPL 的性能,我们使用墨尔本市十字路口的微观仿真模型作为案例研究。采用现有操作系统 (SCATS) 的真实交通信号参数,并使用基于视频的摄像机数据和在交叉路口收集的环路检测器数据对仿真进行校准。实验结果证明了所提出的模型优于完全驱动的交通信号,不仅在最优解的质量方面,而且考虑到所提出的模型可以最小化“总用户延迟”这一事实。和行人与行人的互动,以及车辆和行人的红灯延误。为了评估 IVPL 的性能,我们使用墨尔本市十字路口的微观仿真模型作为案例研究。采用现有操作系统 (SCATS) 的真实交通信号参数,并使用基于视频的摄像机数据和在交叉路口收集的环路检测器数据对仿真进行校准。实验结果证明了所提出的模型优于完全驱动的交通信号,不仅在最优解的质量方面,而且考虑到所提出的模型可以最小化“总用户延迟”这一事实。墨尔本市十字路口的微观模拟模型被用作案例研究。采用现有操作系统 (SCATS) 的真实交通信号参数,并使用基于视频的摄像机数据和在交叉路口收集的环路检测器数据对仿真进行校准。实验结果证明了所提出的模型优于完全驱动的交通信号,不仅在最优解的质量方面,而且考虑到所提出的模型可以最小化“总用户延迟”这一事实。墨尔本市十字路口的微观模拟模型被用作案例研究。采用现有操作系统 (SCATS) 的真实交通信号参数,并使用基于视频的摄像机数据和在交叉路口收集的环路检测器数据对仿真进行校准。实验结果证明了所提出的模型优于完全驱动的交通信号,不仅在最优解的质量方面,而且考虑到所提出的模型可以最小化“总用户延迟”这一事实。

更新日期:2023-03-02
down
wechat
bug