基于强化学习的水下定位研究
【摘要】定位是水声传感网络的基本任务之一,准确的节点定位在海洋数据收集、污染监测、矿井勘测等应用中起着重要的作用。正常情况下,水下无人自主航行器(AUV)在水下无法完成自主定位,每隔一段时间需要浮到水面上通过卫星通信获取自身位置信息。但是,这会使得AUV的定位间隔时间较长,从而会导致较大的误差。因此,论文建立了水下定位的系统模型。该模型需要提前在水面上布放几个信标节点,信标节点可以根据全球定位系统获取自身位置,并向AUV发送携带位置信息的调制信号,AUV借助解调器解调出声波信号中的信息,测量各个信标节点与AUV的距离,通过最小二乘法求解出AUV的位置,完成定位。
论文首先提出了一个基于Q-learning的水下定位(QUWL)方案,其通过观察AUV的当前状态来改信标节点的选择,以实现定位;其次,论文还提出了一个基于深度强化学习的水下定位(DUWL)方案,进一步提高算法的收敛速度,从而使其达到更好的定位效果。论文对两种算法进行仿真实验并评估其性能。仿真结果表明,QUWL算法和 DUWL算法都可以提高AUV的定位效益,而DUWL算法可以在进一步提高定位效益的同时更好地降低定位误差和通信能耗。
【关键字】水下定位;水声通信;强化学习;能耗;
|
基于强化学习的水下定位研究
更新时间:2023-03-29