基于深度强化学习与时间约束的低空航空器冲突解脱方法
技术特征:
1.一种基于深度强化学习与时间约束的低空航空器冲突解脱方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于深度强化学习与时间约束的低空航空器冲突解脱方法,其特征在于,所述s2包括如下步骤:
3.根据权利要求2所述的基于深度强化学习与时间约束的低空航空器冲突解脱方法,其特征在于,所述s3包括如下步骤:
4.根据权利要求3所述的基于深度强化学习与时间约束的低空航空器冲突解脱方法,其特征在于,所述s4包括如下步骤:
5.根据权利要求4所述的基于深度强化学习与时间约束的低空航空器冲突解脱方法,其特征在于,所述s45包括如下步骤:
6.根据权利要求5所述的基于深度强化学习与时间约束的低空航空器冲突解脱方法,其特征在于,所述运行数据包括当前时刻下本体无人机的动作、状态、对应的奖励值和下一时刻本体无人机的状态,其中,智能体根据当前时刻的状态和动作,在执行完成当前时刻的动作后,得到当前时刻对应的奖励值和下一时刻智能体的状态。
技术总结
本发明公开了一种基于深度强化学习与时间约束的低空航空器冲突解脱方法,属于航空安全技术领域,包括如下步骤:设置静态障碍物和非合作目标航空器,以构建低空运行环境;构建低空运行环境中航空器的状态空间和动作空间;构建带有时间约束的奖励函数;根据带有时间约束的奖励函数、低空运行环境中航空器的状态空间和动作空间,基于深度强化学习模型在低空运行环境中进行低空航空器冲突解脱训练,得到训练好深度强化学习模型;获取本体航空器在执行实际冲突解脱任务中的当前状态,并利用训练好的深度强化学习模型输出奖励值最高时对应的动作,以避免冲突的同时及时达到目标位置。本发明解决了低空航空器的冲突解脱能力和准点率不足的问题。
技术研发人员:张志远,郑远,李诚龙,顾文勇,胡潇瀚,刘旭川,肖海滨
受保护的技术使用者:中国民用航空飞行学院
技术研发日:
技术公布日:2024/12/19
文档序号 :
【 40405342 】
技术研发人员:张志远,郑远,李诚龙,顾文勇,胡潇瀚,刘旭川,肖海滨
技术所有人:中国民用航空飞行学院
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
技术研发人员:张志远,郑远,李诚龙,顾文勇,胡潇瀚,刘旭川,肖海滨
技术所有人:中国民用航空飞行学院
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
