一种基于案例推理的无人机协同攻击快速目标分配方法

本发明涉及自爆式无人机集群协同作战决策,尤其涉及一种基于案例推理的无人机协同攻击快速目标分配方法。
背景技术:
1、多自爆式无人机协同攻击策略是在复杂多变的军事作战需求下逐渐发展起来的一种新型武器作战样式,实质上是一种具有多重复杂性和时间敏感性的多维变量非线性的组合优化问题。自爆式无人机集群作战因其具备侦察打击一体化的独特优势,可以满足未来信息化作战需求,是目前常用的一种作战手段。自爆式无人机作为一种新型智能化武器弹药装备结合了先进的人工智能控制技术与无人机技术,多应用于大规模集群作战,同时协同作战模式也弥补了单个自爆式无人机毁伤能力的不足,可以对敌方目标造成杀伤力更强的攻击。在高度信息化的军事战争背景下,多弹协同打击策略在军事战斗任务中发挥着关键作用。
2、集群作战对比单体作战能够执行更加复杂的作战任务,如单目标会聚攻击、单目标时序攻击、多目标协同攻击,可以提高任务完成的成功率,具有更强的容错性和鲁棒性,在单体毁伤或失效的情况下仍可完成任务。目前自爆式无人机集群作战也面临众多挑战,除单体性能约束外,还需考虑自爆式无人机间的协同约束,如空间协同约束、时间协同约束,同时也增加了规划问题的难度,大大提高了算法复杂度和计算时间代价。
技术实现思路
1、针对现有技术的不足,本发明提供一种基于案例推理的无人机协同攻击快速目标分配方法,本发明对于自爆式无人机协同作战目标分配算法进行优化改进,设计了一种带有可切换机制的快速目标分配算法模型。该算法可以实现协同作战任务的优化算法模型解算,在不同作战任务需求下转换算法机制,提高了算法的求解效率,保障了解的最优性,对大规模高强度打击的目标分配任务具有极好的适应性。一定程度上可以克服传统分配算法解算时间长和解的质量随作战双方武器数量增加而不断下降的问题。
2、一种基于案例推理的无人机协同攻击快速目标分配方法,包括以下步骤:
3、步骤1、根据集群作战打击任务需求及战场环境,对战场空间环境进行统一建模;
4、假设,m枚自爆式无人机组建成无人机集群共同执行打击任务,对n个散落在战场不同位置的目标进行打击,并且战场中分布了t个威胁半径集合为r={r1,r2,r3...rt},坐标为{(xt1,yt1),(xt2,yt2)...(xtt,ytt)}的威胁源,并保证每枚自爆式无人机最多执行一次任务,打击一个目标;其中,初始化定义自爆式无人机集群m={m1,m2,...,mm},地面目标集合n={n1,n2,...,nn},设定目标初始位置为(xi,yj),目标nj的价值为qj;为顺利实施打击任务,在执行协同打击任务过程,自爆式无人机需要躲避战场中出现的威胁源,最终到达目标任务点实施打击。并根据目标类型规定每个目标被打击次数上限为djmax个,即每个目标被分配的无人机数量应小于等于djmax个;
5、步骤2、利用栅格法,设计二维战场仿真模型,对战场空间进行详细描述;
6、在二维战场仿真模型中,每个栅格代表一个坐标点,用来表示无人机、目标、障碍物的位置;规划空间表示为集合ω,(x,y)表示空间ω内某一位置点的横纵坐标,xmax和ymax分别表示横纵坐标规定的最大距离位置,如下式所示:
7、ω={(x,y)|0≤x≤xmax,0≤y≤ymax}
8、步骤3、面对战场威胁源进行建模,选取雷达威胁、防空火炮威胁和地形威胁作为威胁源参数并计算威胁源威胁度;
9、步骤3.1、计算战场范围内雷达威胁程度;
10、雷达回波信号功率用公式表示为:
11、
12、式中,pt为发射功率,g为发射天线增益,σ为雷达散射面积,r为目标到雷达的距离,单位为m,λ为电磁波波长;对于确定的无人机,雷达散射面积一定,上式简化为:
13、
14、式中,k为常数;雷达没有被干扰时,探测到目标的概率与接收到的信号品质有关,假设雷达可进行全方位的探测,雷达最大探测半径为rmax,则雷达对无人机的探测概率表示为:
15、
16、步骤3.2、计算防空火炮威胁程度;
17、当敌方雷达探测到无人机后,防空导弹会根据目标信息进行攻击,防空导弹的杀伤概率为:
18、pm=t·y·z[1-(1-a·e·w)q]
19、式中,t为地空导弹的雷达探测概率,y为雷达截击引导概率,z为信息传输转换概率,a为导弹成功发射概率,e为导弹飞行可靠概率,w为导弹的杀伤概率,q为一次发射的导弹数量。
20、步骤3.3、计算地形威胁程度;
21、计算得到地形的高度威胁、大小:
22、
23、式中,th表示地形海拔高度威胁大小,hm表示当前地形的海拔高度,hu表示无人机飞行上限高度,若地形海拔超过无人机低空飞行上限则设定无人机地形威胁为最大值;
24、当无人机实时飞行高度为hreal时,不同海拔障碍物对无人机的威胁表示为:
25、
26、步骤4、建立合理优化目标分配模型,根据优化模型约束条件,定义目标优化函数;
27、步骤4.1、计算航程代价;
28、步骤4.1.1、计算每个航迹段中的航迹距离;
29、lms为表示第m架无人机在第k个航迹段上的航迹长度,s为航迹段数量:
30、
31、式中,代表第m架无人机在第k个航迹段上的起始点坐标。
32、步骤4.1.2、计算每种打击方案的航程代价;
33、所述打击方案为:设m架无人机中的第1架无人机,攻击n个目标中的第1个目标,则为一个打击方案,若该无人机m架无人机中的第1架无人机攻击n个目标中的第2个目标,则为另一个打击方案,若打击n个目标中的第n个目标,则为第n个打击方案;每架无人机均有相同数量的打击方案,在每个打击方案中,一架无人机只攻击一个目标。
34、在航迹规划过程中将一条航迹划分为s个航迹段,第m架无人机攻击第n个目标的航迹距离lmn的公式表示为:
35、
36、步骤4.1.3、将航程代价值进行归一化处理;
37、统一至同一数量级后的航程代价fl用公式表示为:
38、
39、式中,lmn表示为第m架无人机攻击第n个目标的航迹距离,lnmax表示所有无人机进行攻击时的飞行距离的最大值,二者比值即可求得每种打击方案的航程代价。
40、步骤4.2、计算战场内威胁代价;
41、威胁代价与威胁源到航迹的距离成反比,将整条航迹分为s个航迹段,计算各航迹段的威胁代价值,则总体威胁代价为s个航迹段的威胁代价之和。
42、步骤4.2.1、计算每个航迹段中产生的的威胁代价值;
43、假设战场内有第m架无人机攻击第n个目标,首先将每条航迹划分为s个航迹段,无人机两个相邻航迹点表示为lk和lk+1,威胁源坐标表示为求取每段航迹的威胁代价,将每个航迹段等分成c份,通过求取威胁源到c个航迹点的距离间接计算威胁代价,具体表示为:
44、
45、式中,nth为威胁源个数,c为每段航迹等分的份数,为每个航迹点的坐标,t=1,2,…,nth,c=1,2,…,c;
46、步骤4.2.2、计算每条航迹中总体威胁代价;
47、对s个航迹段的威胁代价求和,得航迹中总的威胁代价ft为:
48、
49、步骤4.2.3、将威胁代价进行归一化处理,到统一尺度下进行计算;
50、将威胁代价归一到统一尺度下,威胁代价ft用公式表示为:
51、
52、式中,ftmn表示第m架无人机攻击第n个目标所在航迹的威胁代价,ftmax表示所有航迹中威胁总代价最大的航迹;
53、步骤4.3、计算总体攻击收益;
54、步骤4.3.1、计算每种打击方案中的总体攻击收益;
55、采用目标剩余价值量来评估目标的攻击收益代价,第m架无人机攻击第n个目标产生的攻击收益表示为:
56、fv=vn·pmn·xij
57、式中,vn为第n个目标的目标价值,pmn为第m架无人机打击第n个目标的毁伤概率,xij为决策变量;
58、步骤4.3.2、将攻击收益进行归一化处理;
59、将攻击收益fv统一至同一数量级,用公式表示为:
60、
61、式中,表示第m架无人机攻击第n个目标的攻击收益,fvmax表示所有打击方案中可获得的最大攻击收益。
62、步骤4.4、计算敌方目标价值;
63、结合每种武器装置的不同类型及其攻击范围,对目标设定0—1不同程度的威胁等级ityp,用于明确评估并区分每个目标在战场环境中的打击价值程度。
64、步骤4.5、分析目标分配中产生的约束条件;
65、所述约束条件如下:
66、(1)航程约束
67、每架自爆式无人机穿越的距离应小于其航程,表示为:
68、
69、式中,是架自爆式无人机的最大射程,为自爆式无人机的实际穿越距离,
70、nv为飞行最大高度约束。
71、(2)决策变量约束
72、
73、式中,决策变量xij为0-1变量,当无人机i作用于目标j时,xij=1表示实施打击,xij=0表示没有实施打击。决策变量表示如xij∈(0,1),i=1,...,m,j=1,...,n,表示一项任务至少由一架无人机执行一次,至多无人机分配数量不超过djmax架;表示一架无人机最多只能执行一次任务;
74、步骤4.6、根据目标分配优化指标,构造目标函数,并描述其中各代价函数;
75、目标分配优化指标要求使得无人机的攻击代价最小化,攻击收益最大化。
76、多无人机协同目标分配的优化目标函数表示为:
77、f=λ1fl+λ2ft-λ3fv
78、式中,λ=(λ1,λ2,λ3)为优化目标函数中各权重向量,表示各因素对目标分配结果的影响程度的不同,同时满足λi∈(0,1);fl为航程代价,ft为威胁代价,fv为攻击收益,当航程代价及威胁代价最小攻击收益达到最大时,输出最终的目标分配最优解。
79、步骤5、使用改进的基于自适应罚函数思想的遗传算法和贪婪算法切换机制来进行目标分配,在不同的作战环境中对两种算法进行算法切换操作,基于罚函数思想的遗传算法在传统遗传算法上进行改进,解决带有多组约束条件的目标函数优化问题;
80、步骤5.1、对战场环境进行初始化设置,设定自爆式无人机、打击目标及威胁源数量;
81、步骤5.2、设定初始种群大小,迭代次数、选择率、交叉率和变异率的初始大小;
82、步骤5.3、对初始种群设定编码操作方式;
83、步骤5.3.1、采用二进制编码方式进行编码操作,以自爆式无人机与目标的对应关系,即每一种可能的分配方案表示染色体,染色体中的每一位基因代表一个特定的无人机是否被分配给某个目标;
84、步骤5.3.2、将战场环境中m个自爆式无人机,n个目标进行二进制编码,利用1代表自爆式无人机对目标进行打击,0则为未进行打击,则每条染色体有m×n个数字,即“基因”;
85、步骤5.3.3、将每n个基因组成一组,每组基因纵向排列则获得多自爆式无人机目标分配矩阵cm×n;
86、步骤5.3.4、规定矩阵的第i行表示自爆式无人机,i=1,2,3......,m,矩阵的第j列表示目标,cij为自爆式无人机对目标的打击情况,,若cij=0则说明自爆式无人机mi对目标nj不进行打击,若cij=1则说明自爆式无人机mi号对目标nj进行打击;
87、步骤5.4、进行种群初始化,生成种群数量为n的个体;
88、步骤5.5、根据步骤4.5确定自爆式无人机的约束条件;
89、步骤5.6、构造罚函数,对于违反约束条件的个体,在计算适应度值时减去罚函数,使适应度值减小;
90、步骤5.6.1、将步骤4.5中的两个约束条件作为罚函数中惩罚项,并选取惩罚因子,即权重系数;构造惩罚函数p(x)=f(x)+h(x)g(x),其中,f(x)为目标函数值,h(x)为惩罚因子,g(x)为惩罚项。
91、步骤5.6.2、代入约束条件,罚函数表示为p(x)=f(x)+η(n+m),并按照累加惩罚原理,规定对违反总体约束项个数越多的个体惩罚力度越大;其中0<η≤1,可根据可行解的个数进行自适应调节;
92、步骤5.7、构造适应度函数,公式如下:fitness(x)=cmax-p(x)
93、
94、其中,f(x)为目标函数值,cmax为目标函数的最大估计值,通过预估得到。
95、步骤5.8、对种群进行选择,交叉,变异操作;
96、在进行构造适应度函数及罚函数之后,对种群进行选择,交叉,变异等遗传操作,依次迭代。
97、步骤5.8.1、按照适者生存原理,通过个体适应度函数值来衡量其对环境的适应度好坏,对初始种群个体进行排序;
98、步骤5.8.2、采用轮赌盘法选择出种群内具有符合适应标准度值的染色体,再用精英选择保留策略,在排序结果中选择保留优秀的个体;
99、步骤5.8.3、对保留下的优秀个体进行交叉和变异操作,产生子代种群,并将两个种群结合,形成规模为2n的新子代种群rt。
100、步骤5.9、产生自适应适应度函数值;
101、设每次迭代结束后可行解个数为p1,总数为n,惩罚因子即惩罚项权重随可行解的增加或减少呈正比变化,可行解过多时,在下一次迭代过程中惩罚因子也跟随增大,反之则减小;
102、步骤6、在改进自适应罚函数思想的遗传算法在无法达到作战要求的情况下,分配算法使用使用贪婪算法继续对算法进行求解。
103、步骤6.1、参数初始化:已知对于求解问题有n个目标作为输入,置问题的解集合j为空;对贪婪算法最大允许迭代次数、结束标志阂值及目标数量的参数进行初始化设置。
104、步骤6.2、定义目标函数:根据问题需求,随机生成自爆式无人机与打击目标的任务配对,并计算目标评价函数。选取一种度量标准,按照这种度量标准对n个输入排序;
105、步骤6.3、遍历所有m个自爆式无人机与n个目标的打击方案,通过代价函数公式计算出相应的代价数值;
106、步骤6.4、根据目标函数绝对值,建立代价矩阵,其中,定义a11,a12,a13...a1m的值为被打击目标1与m架无人机组成打击方案的代价值,其余行元素amn均代表第m架无人机打击第n个目标打击方案的攻击代价值,最后组成含有n×m个代价值元素的代价矩阵。
107、
108、步骤6.4.1、利用比较法,查找代价矩阵a中的最大元素,同时记录它的位置;
109、步骤6.4.2、假设代价矩阵a中的最大元素为a00,则说明我方无人机在综合目标代价和航迹代价后,敌方n0目标由m0实施打击收益最大,则实施m0对n0打击方案;
110、步骤6.4.3、由于n0已经成为m0的目标,将a00所在行列置为∞;
111、步骤6.4.4、将a00所在行列置为∞后,a00不再参与后续分配任务,之后返回步骤6.3继续循环迭代,寻找下一个最优解进行状态更新;
112、步骤6.4.5、在完成所有一对一分配后,恢复到原始代价矩阵构成,将所有已经分配的方案都置为∞,避免再次进行搜索,对于矩阵中其他剩余元素,重新搜索多对一分配结果;
113、步骤6.5、输出求解最优解:当所有的n个输入都被搜索完毕,如果满足任务条件,则搜索停止,即当前当前解集为全局最优解,输出搜索结果;
114、步骤7、设定目标分配算法主要切换机制;
115、步骤7.1、根据战场环境需求,初始化战场全局变量信息;
116、步骤7.2、按照对战武器不同数量等级定义不同规模的作战场景,并明确每次目标分配任务下达完成时间tc,其中,我方参与作战自爆无人机数量为m,敌方作战武器数量为n,并且规定每种战场规模下m>n,以下为定义的三种作战规模,后续实际战场也按此定义分类;
117、我方无人机目标m≤20与敌方目标数量n≤20,属于小规模冲突;
118、我方无人机目标20<m≤50与敌方目标数量20<m≤50,属于中等规模作战;
119、我方无人机目标50<m≤100与敌方目标数量50<m≤100,属于大规模战役;
120、其他情况不考虑在内。
121、步骤7.3、根据任务性质、规划时间以及优化性能的要求,明确切换算法的目标和条件,明确每次目标分配任务下达完成时间tf。
122、步骤7.4、建立任务规划模型数据库。对两种算法分别进行作战规模不同的对比试验,并且不断增加实验规模,获得多组不同作战态势下的计算时间和目标函数变化值。将实验结果进行储存,形成数据库,建立历史目标分配模型;
123、步骤7.5、在系统中输入实际战场作战参数。
124、步骤7.6、对实际战场态势进行特征指标识别,做出相似性判断;包括双方武器对战数量、作战规模、指令下达完成时间tf作为主要特征判断指标;
125、步骤7.7、制定切换策略;
126、步骤7.7.1、比较现有历史数据库内包括计算时间和目标函数变化值的案例数据和实际作战条件,在数据库中进行搜索,选择相似度最高的目标分配模型作为匹配对象。
127、步骤7.7.2、以作战下达任务中规定目标分配时间tc为基准,通过步骤7.6完成相似性判断,选择出与实际战场同等规模并且相似性最高案例;
128、步骤7.7.3、提取相似性最高的案例在基准时间范围内遗传算法和贪婪算法的优化性能比较及算法决策结果,根据比较结果,由于相似性高度一致,将数据库中战场环境与实战场景匹配,该案例中算法决策作为当前态势下决策最优结果进行反馈输出。
129、步骤7.8、监控和评估效果;若战场态势出现新的变化,则需要再次对新的态势下的特征指标进行识别,返回步骤7.6,做出新的算法规划决策结果,保证目标分配的实时性和准确性。
130、采用上述技术方案所产生的有益效果在于:
131、本发明提供一种基于案例推理的无人机协同攻击快速目标分配方法,本发明提供的优化模型算法相对于其他任务规划算法,本设计中的优化模型主要解决针对对传统作战任务场景下目标分配的计算时间过长,结果偏差随战场复杂度增大而增大问题;同时,设定大规模作战任务想定场景,结合可切换控制的目标分配算法进行仿真,结果表明该优化算法模型对大规模打击任务目标分配任务具有极好的适应性,同时,解的最优性也具有一定保证。
技术研发人员:孟光磊,王标,宋彬,周铭哲,孟田阔,梁宵,王昱,王竹筠,鹿丰,武炎明,宋崎
技术所有人:沈阳航空航天大学
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
