一种基于强化学习的无人机与无人船长续航协同搜索方法
技术特征:
1.一种基于强化学习的无人机与无人船长续航协同搜索方法,其特征在于,包括如下步骤:
2.根据权利要求1所述基于强化学习的无人机与无人船长续航协同搜索方法,其特征在于,所述步骤1中,将任务区域设定为一个长为,宽为的矩形区域,部署架无人机在高度为的任务区域上空飞行;艘无人船配备无线充电设备在任务过程中充当移动充电站;架无人机和艘无人船组成一个跨域无人集群协同执行搜索任务;无人机上有一个接收能量的天线,无人船安装发射天线;无人机监测自身的能量水平,当无人机能量不足时发送充电请求,无人船则会向无人机靠近,无线充电设备启动,无人船显示正在充电;无人机与无人船之间以及无人船与无人船之间信息传输通过无线电方式的通信链路建立初始连接。
3.根据权利要求1所述基于强化学习的无人机与无人船长续航协同搜索方法,其特征在于,所述步骤2中,将任务区域划分为个网格,表示任务区域在水平方向上划分的网格数量,表示任务区域在垂直方向上划分的网格数量;第个网格的中心坐标为,,,,表示第个网格在水平方向上的坐标,表示第个网格在垂直方向上的坐标;设置表示第个网格中存在目标或不存在目标,表示第个网格中存在目标,表示第个网格中不存在目标;
4.根据权利要求1所述基于强化学习的无人机与无人船长续航协同搜索方法,其特征在于,所述步骤3中,无人机在执行概率图更新过程中由于能量消耗和电池容量的限制不足以支撑任务完成,因此采用远程无线充电的方式,无人船发射波束成形能量给无人机,无人机获得的能量取决于它与无人船之间的距离,计算为:
5.根据权利要求1所述基于强化学习的无人机与无人船长续航协同搜索方法,其特征在于,所述步骤4中,无人船集群根据当前状态获得的无人机位置、能量信息、目标概率信息以及相邻无人船的状态信息采用基于多智能体深度确定性策略梯度算法进行强化学习,从而完成动作决策,优化轨迹;具体过程为:
6.根据权利要求5所述基于强化学习的无人机与无人船长续航协同搜索方法,其特征在于,在每艘无人船执行一步动作后,设置一个总奖励函数,具体如下:
7.根据权利要求6所述基于强化学习的无人机与无人船长续航协同搜索方法,其特征在于,所述基于多智能体深度确定性策略梯度方法的协同优化调度算法的具体过程为:
技术总结
本发明公开了一种基于强化学习的无人机与无人船长续航协同搜索方法,属于海洋环境下协同搜索技术领域,包括如下步骤:步骤1、在任务区域中部署多个无人机和无人船;步骤2、将任务区域离散化为网格,使用概率图模型记录每个单元格的目标存在概率;步骤3、无人机能量不足时向无人船发送充电请求,无人船根据无人机电池能量和目标存在概率规划路径;步骤4、无人船采用协同优化调度算法优化自身运动轨迹,为无人机提供充电服务并进行目标搜索;若未搜索到海面目标,则重新执行步骤2;若无人机能量不足以完成任务时,重复执行步骤3‑步骤4,直到通过目标概率识别出目标位置。本发明适用于海洋环境下大规模无人机与无人船长续航协同搜索任务。
技术研发人员:罗汉江,董鹏燕,陶航,刘佳鸿,周杰韩,刘奎
受保护的技术使用者:山东科技大学
技术研发日:
技术公布日:2024/11/26
技术研发人员:罗汉江,董鹏燕,陶航,刘佳鸿,周杰韩,刘奎
技术所有人:山东科技大学
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
