Reinforcement learning traffic signal control method based on environment model
编号:164 访问权限:仅限参会人 更新:2022-09-09 09:49:35 浏览:118次 张贴报告

报告开始:暂无开始时间(Asia/Shanghai)

报告时间:暂无持续时间

所在会场:[暂无会议] [暂无会议段]

暂无文件

摘要
为优化交叉口信号控制,解决传统强化学习由于交通流的随机特性导致的维度过大和学习空间爆炸的问题,提出了一种基于环境适应性的交通信号自适应控制方法,以提高交叉口信号的自适应控制能力。强化学习。学习空间和计算速度。其中,马尔可夫决策过程建模的强化学习模型用于提高强化学习模型对随机交通环境的适应性。本文对传统模型进行改进,采用车辆平均的最小似然作为最优策略,建立最大似然概率模型。环境模型通过动态规划计算价值函数,并找到交叉口信号相位绿灯时间的最优解,从而最终实现交叉口的自适应控制。最后,通过MATLAB和VISSIM仿真软件对上述方法进行仿真,验证控制方法的可行性。
关键词
CICTP
报告人
Hao Sun
Nanjing University of Science and Technology

稿件作者
Hao Sun Nanjing University of Science and Technology
发表评论
验证码 看不清楚,更换一张
全部评论
重要日期
  • 会议日期

    12月17日

    2021

    12月20日

    2021

  • 12月16日 2021

    报告提交截止日期

  • 12月24日 2021

    注册截止日期

主办单位
Chinese Overseas Transportation Association
Chang'an University
联系方式
移动端
在手机上打开
小程序
打开微信小程序
客服
扫码或点此咨询