190 / 2025-07-05 07:52:00
基于强化学习的空中障碍自主规避策略研究
威胁规避;深度强化学习;神经网络;自主规避;PPO
终稿
弥济时 / 西北大学
倪文伟 / 西北大学
周志清 / 西北工业大学
彭盛霖 / 西北大学
熊小睿 / 西北大学
在飞行器规避过程中,飞行员需要同时监控飞机状态和威胁态势,但由于时间压力和信息处理的复杂性,人类飞行员往往难以快速解析飞行器的飞行轨迹,从而限制了及时反应的能力。针对这一问题,本研究提出采用基于深度强化学习(Deep Reinforcement Learning, DRL)训练一种自主规避策略,在检测到威胁目标时自动接管平台控制权。具体而言,本研究基于近端策略优化 (Proximal Policy Optimization, PPO)算法对智能体进行训练,使得神经网络策略能够基于运动学分析有效对抗典型飞行器的威胁,并在不同初始条件下展现良好的泛化能力。实验验证了所提方法的优越性,为深度强化学习在高动态、非线性控制任务中的应用开辟了思路。
重要日期
  • 会议日期

    08月02日

    2025

    08月04日

    2025

  • 07月07日 2025

    初稿截稿日期

主办单位
国防科技大学系统工程学院
联系方式
历届会议
移动端
在手机上打开
小程序
打开微信小程序
客服
扫码或点此咨询