140 / 2025-06-30 16:37:00
水下无人航行器三维动态自主避障路径规划算法
路径规划,三维动态避障,水下无人航行器,强化学习
终稿
朱心如 / 大连理工大学
刘洋 / 大连理工大学
韦泽延 / 大连理工大学
无人水下航行器(Unmanned Underwater Vehicle, UUV)作为一种小型化、无人、自主的水下智能装备,在情报侦察、目标搜索、反水雷作战等任务中具有广泛的应用前景,受到了众多学者和领域专家的关注。在UUV执行水下探测搜索任务时,通常需要首先设置明确的目标位置,然后由UUV自主进行路径规划。需要注意的是,由于未知海底地形和水下环境的动态变化,UUV在航行过程中可能会遇到各种静态和动态的障碍物,如礁石、大型水生生物、沉船残骸、水雷、其他UUV等。这些静态和动态障碍物的存在,极大的影响了UUV的水下安全和任务的执行,一旦发生碰撞则不仅无法完成既定任务而且还可能导致UUV的设备损毁。因此,在设定了UUV拟到达的目标位置后,如何能够让UUV自主规避可能存在的静态和动态障碍物,以尽可能短的航行距离顺利到达目标位置,是完成水下探测搜索任务的基础。

目前,有关UUV三维避障路径规划问题的研究主要集中在以下两个方面:(1)研究UUV三维静态避障路径规划;(2)研究UUV在固定平面运动的三维动态避障路径规划。上述研究在一定程度上解决了UUV三维避障路径规划问题,但仍旧存在一定的局限:(1)由于UUV三维静态避障路径规划的研究,没有考虑到复杂水下环境中的动态障碍物的识别和轨迹预测,当水下环境中存在动态障碍物时,可能导致碰撞;(2)关于UUV在固定平面运动的三维动态避障路径规划,将UUV三维路径规划问题转换为水平和垂直两个平面的路径规划,先完成垂直方向的路径规划,再进行水平方向的路径规划。该航路设计方式增大了UUV航行的路径长度,导致UUV航行的效率较低。

为了克服已有研究中单一声呐在三维环境中感觉能力不足的局限,本文在设计了采用两个垂直交叉排布的声呐传感器基础上,提出一种UUV三维动态自主避障路径规划算法。该算法主要由以下三个阶段构成。

(1)传感器信息预处理阶段。UUV路径规划过程中需要通过传感器实时感知环境和自身状态,根据当前的环境及时做出决策,生成一条安全、合理的航路。但多个传感器收集到的数据维度、标度是不同的,不能直接使用,需要预处理。首先,声呐数据的维度由声波波束的数量决定,通常数量较大且存在冗余观测点,本文将声呐数据的扇形信号降维到几个确定的方向,使其更直观的反映UUV各个方向与障碍物的距离。其次,对降维后的声呐数据以及航行器的位姿数据(如,当前坐标位置、偏航角、俯仰角等)归一化处理,统一标度。

(2)基于GRU的障碍物轨迹预测阶段。结合单一时刻航行器位姿和声呐数据只能够反映静态障碍物的位置和该时刻动态障碍物的位置,不能反映动态障碍物的运动趋势,当动态障碍物进入声呐扫描的盲区时,依旧存在碰撞的风险。本文采用门控循环单元(Gated Recurrent Units, GRU)预测动态障碍物的轨迹,以便航行器提前做出避障决策。将处理后的声呐和航行器位姿多个时刻的数据输入到GRU网络中,根据该时间段内障碍物与航行器的相对位置,预测出动态障碍物的运动轨迹,以便后续生成动态避障的路径规划策略。

(3)动态避障路径规划阶段。考虑到强化学习算法特有的自适应学习能力,能够学习如何将状态映射到执行动作以获得最优策略,且无人水下航行器通过螺旋桨和方向舵产生的线速度和角速度是连续的,本文基于可以生成连续动作空间的强化学习算法SAC(Soft Actor-Critic, SAC)提出UUV三维动态自主避障算法。首先,为了使模型学习到环境的动态变化,将GRU网络的预测结果输入到SAC模型中,使模型学习到动态障碍物的运动轨迹,从而提高避障能力。其次,针对训练初期不成熟的策略网络容易导致航行器发生翻滚影响声呐对环境探测的问题,采用延迟循环步数策略,增加航行器的推进器反应时间,使其平稳航行。最后,航行器按照本文提出三维动态避障路径规划算法生成的避障、稳定策略航行。

依托UUVSimulator仿真平台进行了实验验证,通过仿真模拟真实的水下环境和传感器的工作状态,设置多个静态和多个直线往返运动的动态障碍物。在相同环境下随机设置起始点和目的地,多次实验验证,到达目的地的成功率约为95.2%,碰撞率为4.7%,损失率为0.1%。与目前UUV三维路径规划算法在存在动态障碍物的环境中仅有35%的成功率相比,本文提出的算法大幅度提高了三维动态环境下UUV路径规划的成功率。

本文提出了一种水下无人航行器三维动态自主避障路径规划算法,该算法在设计了两个垂直交叉排布声呐的基础上,完成了三个阶段的处理,包括传感器信息的预处理、基于GRU的障碍物轨迹预测和动态避障路径规划,使航行器在传感器探测受限的条件下安全航行,主要贡献如下:(1)用UUVSimulator仿真平台模拟真实的水下环境和传感器工作方式,缩小了仿真与真实环境的差距,在此平台中为航行器配备水平和垂直两个声呐,弥补了三维空间中声呐在垂直方向上探测能力不足的缺陷;(2)用GRU网络预测动态障碍物的运动轨迹,以便航行器提前做出避障决策;(3)将GRU预测网络与SAC模型相结合,使SAC模型充分学习到环境变化,生成动态避障策略。未来将进一步研究如何借助洋流等海洋特征节约能耗,寻找到一条安全、低能耗的路径。

 
重要日期
  • 会议日期

    08月02日

    2025

    08月04日

    2025

  • 07月07日 2025

    初稿截稿日期

主办单位
国防科技大学系统工程学院
联系方式
历届会议
移动端
在手机上打开
小程序
打开微信小程序
客服
扫码或点此咨询