针对无人机群中辅助任务不确定到达时间特性的任务目标分配方法
技术特征:
1.一种针对无人机群中辅助任务不确定到达时间特性的任务目标分配方法,其特征是,无人机群在高动态博弈场景中需要执行的任务分为主要任务与辅助任务,辅助任务完成能对主要任务起辅助作用,降低其执行时间,具体步骤如下:首先构建任务之间的注意力模型,考虑辅助任务对其它任务的影响以及任务的到达时间特性,为每一个任务计算出一个新的特征向量;其次构建智能体和任务之间的注意力模型,为每个智能体计算出它对于每个任务的注意力分数,并使用任务的到达时间属性修正注意力分数,选出其中分数较高的任务作为当前智能体分配优先级较高的任务;最后使用分层强化学习的方法对任务进行分配处理。
2.根据权利要求1所述的一种针对无人机群中辅助任务不确定到达时间特性的任务目标分配方法,其特征是:高动态博弈场景下任务集合由主要任务集合与辅助任务集合组成,每个主要任务用四元组<ttype,tpos,tsize,tarr>来表示,其中ttype代表任务类型,即主要任务或是辅助任务,tpos代表任务所在位置,tsize代表任务大小,tarr代表任务的到达时间;每个辅助任务用六元组<ttype,tpos,tsize,tarr,trange,tco>表示,前四项代表含义与主要任务相同,trange代表辅助范围,在范围内的任务会受到辅助任务的影响,即减少范围内除自身外其它所有任务的大小,包括辅助任务,tco代表辅助系数。
3.根据权利要求1所述的一种针对无人机群中辅助任务不确定到达时间特性的任务目标分配方法,其特征是:高动态博弈场景中的任务分批次到来,任务到来后,在它被完成之前都不会主动消失,在整个场景中,一共会到来batch个批次的任务,每一个批次的时间长度为period,即每过period个单位时间,都会新到来一批任务,每一批任务的数量都相同,并且,在每一批任务中,主要任务和辅助任务的数量比值都不会改变。
4.根据权利要求1所述的一种针对无人机群中辅助任务不确定到达时间特性的任务目标分配方法,其特征是:所述方法包括:任务特征融合阶段,考虑高动态博弈场景风险信息、任务的到达时间特性以及任务之间的不确定辅助关系得到任务新的特征向量表示;任务到达优先级计算阶段,根据任务的到达时间特性计算出任务对于智能体的分配优先级;分层强化学习阶段,使用注意力权重修正系统观测空间,帮助指导智能体决策。
5.根据权利要求4所述的一种针对无人机群中辅助任务不确定到达时间特性的任务目标分配方法,其特征是:任务特征融合阶段包括:任务风险聚集、计算任务间的注意力分数、计算到达时间注意力偏置并修正注意力分数、使用新注意力分数更新任务特征向量。
6.根据权利要求5所述的一种针对无人机群中辅助任务不确定到达时间特性的任务目标分配方法,其特征是:所述任务风险聚集具体为,在给智能体分配任务时采用平均风险度衡量任务所在区域风险度,以任务为中心,构建一个边长为5的正方形,以此正方形内所有位置的风险度的平均值作为任务所在区域的风险度计算公式如下:
7.根据权利要求4所述的一种针对无人机群中辅助任务不确定到达时间特性的任务目标分配方法,其特征是:任务到达优先级计算阶段包括:智能体风险汇聚、计算智能体对于任务的原始注意力分数、计算到达时间注意力偏置、使用注意力偏置修正原始注意力分数、根据注意力权重更新智能体特征向量。
8.根据权利要求7所述的一种针对无人机群中辅助任务不确定到达时间特性的任务目标分配方法,其特征是:所述智能体风险汇聚具体为,智能体原始特征向量为<apos,avel,aabl,asur>,使用平均风险度判断智能体所处区域风险,以智能体为中心,构建边长为5的正方形,计算正方形内所有地块的风险度平均值作为智能体所处区域风险度,计算公式如下:
9.根据权利要求4所述的一种针对无人机群中辅助任务不确定到达时间特性的任务目标分配方法,其特征是:分层强化学习阶段设定一个注意力权重阈值wtthd=1/|t|,|t|为任务总数量,若智能体对于任务的注意力权重大于wtthd,则将任务纳入高优先级任务集合中;同时为高优先级任务数量设定下界和上界其中|a|为智能体总数量,限制高优先级任务集合中的任务数量范围:将智能体的观测任务限制到集合中,再采用分层强化学习方法指导智能体决策。
技术总结
本发明提供了一种针对无人机群中辅助任务不确定到达时间特性的任务目标分配方法,以解决大规模混杂智能无人机群体面对周期性到达的辅助任务决策时的局部最优性问题。在高动态博弈场景中,智能无人机群体需要执行的任务分为主要任务与辅助任务,辅助任务完成可以对主要任务起辅助作用,降低其执行时间。面对实际对抗环境中辅助任务的到达时间与影响范围不确定的情况,提出以下方法。首先,该方法构建任务之间的注意力模型为任务计算特征向量;其次,任务的到达时间等属性结合构建智能体和任务之间的注意力模型;最后,使用分层强化学习的方法对任务进行分配处理。本方法加快了任务整体的完成时间,提高了系统的存活率。
技术研发人员:蒋嶷川,刘越,陈文博,姜元爽,李攀,狄凯,白洋,郝创博,王宏君
受保护的技术使用者:东南大学
技术研发日:
技术公布日:2024/11/18
技术研发人员:蒋嶷川,刘越,陈文博,姜元爽,李攀,狄凯,白洋,郝创博,王宏君
技术所有人:东南大学
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
