一种切换符号图下的智能体追踪控制系统及方法

2025-11-07 11:20:07 774次浏览

本发明涉及一种切换符号图下的智能体追踪控制系统及方法，属于多智能体系统追踪控制。

背景技术：

1、多智能体系统是由在同个环境中交互的多个智能体组成的计算系统。近年来，多智能体系统在无人机、传感器网络等方面都有着广泛的应用。在图论中，将智能体和相邻智能体之间的通信链路分别视为节点和边。为了刻画具有合作关系的相邻智能体，研究人员提出了无符号图的概念，并且定义了通信链路的权值为正。然而，现实系统中智能体之间既有合作，也会因为矛盾分歧而产生竞争对抗。因此，已有学者建立了符号图理论，并将其应用于相关问题中，合作-竞争交互的作用也得到了相应的阐述。符号图中考虑边的权值既可以是正的，也可以是负的。

2、追踪问题作为多智能体系统协同控制的基础，已成为众多学者所关注的热点问题之一。多个智能体系统在控制协议下，能追踪到事先给定的目标。到目前为止，已有学者对追踪问题进行了相关研究。如果用符号图刻画既包含友好合作也包含对抗竞争关系的多智能体系统，那么在控制协议下，智能体的状态最终可以趋于模值相同而符号相反的两部分，研究人员将其概括为二分追踪控制问题。目前，现有许多工作关注的是固定符号图连接下多智能体系统的二分追踪控制问题。

3、实际系统中，智能体通常表示为具有表示位置和速度信息的二阶动力系统。cn118068696a发明公开了一种二阶非线性多智能体系统二分追踪控制方法，该方法包括：对于包括跟随者和领导者的二阶非线性多智能体系统，根据跟随者的动力学模型和领导者的动力学模型设计了自适应控制协议，在二阶非线性多智能体系统对应的无向连通图是结构平衡图时，实现领导-跟随者的二分追踪控制，该方案为了实现多智能体系统的二分追踪控制，通常假设通信拓扑图时时连通或者具有生成树(生成树指所有智能体构成的通信拓扑图中存在一个根节点，这个根节点智能体可以到达任意智能体，即通信信息能传输到任意智能体)。另外，由于不可避免的攻击和噪声，信息传输的通信链路容易改变，若采用固定拓扑，无法有效应对通信链路攻击或噪声带来的影响，导致追踪控制的精度和实时性无法保证。

4、因此，考虑通信拓扑要求降低，即不需要时时连通或具有生成树，且通信拓扑结构同时可以切换的多智能体的控制系统和方法更具有现实意义和挑战性。

技术实现思路

1、为了解决目前采用固定拓扑无法有效应对通信链路攻击或噪声，导致多智能体追踪的精度和实时性无法保证的问题，本发明提供了一种切换符号图下的智能体追踪控制系统及方法，所述技术方案如下：

2、本发明的一种切换符号图下智能体系统的追踪控制方法，包括：

3、步骤1：构建二阶多智能体系统领导-跟随者动力学模型；

4、步骤2：将各智能体系统作为通信节点，将相邻智能体通信链路作为边，构建切换拓扑模型；

5、步骤3：根据所述动力学模型及切换拓扑模型，设计领导跟随追踪控制协议；

6、所述领导跟随追踪控制协议表示为：

7、

8、其中，u0(t)∈r表示虚拟领导者的控制协议，k＞0表示增益参数，v0(t)∈r表示虚拟领导者的速度，ui(t)∈r表示跟随者系统模型中第i个智能体的控制协议，i＝1,2,…,n，n表示跟随者系统模型中智能体的个数；vi(t)表示所述第i个智能体的速度；ni(t)表示所述第i个智能体的邻居集合；aij(t)表示所述第i个智能体与第j个邻居节点之间边的权重；xi(t)∈r表示所述第i个智能体的位置，aio(t)表示所述第i个智能体与所述虚拟领导者之间边的权重；

9、步骤4：构建领导跟随者之间追踪误差系统；

10、步骤41：令则在控制协议下的多智能体系统转化为：

11、

12、取则上述系统转化为：

13、

14、其中，lij(t)是拉普拉斯矩阵的元素；

15、步骤42：定义实现领导跟随者之间的追踪误差为ei(t)＝ηi(t)-σiη0(t)(i∈w)且e(t)＝(e1(t),e2(t),…,en(t))t，则追踪误差系统为：

16、

17、其中，hδ(t)＝lδ(t)+dδ(t)，lδ(t)为所述多智能体系统通信拓扑符号图的拉普拉斯矩阵，dδ(t)＝diag{|a10(t)|,|a20(t)|,…,|an0(t)|}，包含了来自虚拟领导者所有边的绝对权值；in表示单位矩阵；

18、步骤5：根据所述追踪误差系统，利用矩阵变换及克罗内克积性质，构建等价系统；

19、所述等价系统为：

20、

21、其中：

22、

23、步骤6：根据所述等价系统，利用李雅普诺夫稳定性，给出切换符号图下追踪控制结果；

24、当所述步骤3中的控制协议中参数k满足下式时时，切换符号图下二阶多智能体系统实现追踪控制：

25、

26、其中，lii(t)为所述拉普拉斯矩阵中第i行第i列的元素。

27、可选的，所述步骤1构建的二阶多智能体系统领导-跟随者动力学模型中，跟随者系统模型为：

28、

29、其中，表示第i个智能体位置状态xi(t)的导数，表示第i个智能体速度vi(t)的导数；

30、虚拟领导模型为：

31、

32、其中，表示虚拟领导者位置状态x0(t)的导数，表示虚拟领导者速度v0(t)的导数。

33、可选的，所述步骤2中构建切换拓扑模型的过程包括：

34、考虑有界、非重合和相邻时间间隔的无穷时间序列，设无限时间序列为：

35、[t0,t1)，[t1,t2)，…，[tm,tm+1)，…

36、其中，t0＝0，0＜tm+1-tm＜t，t＞0；

37、在每个时间间隔[tm,tm+1)内，存在一个不重合子区间的有限时间序列，表示为：

38、

39、其中，并且τ是最小停留时间；

40、当时，考虑多智能体系统的拓扑结构在时进行切换，记δ(t):[0,+∞)→{1,...,h}(h＞1)作为切换信号，从而多智能体系统的符号图表示为且表示时间[tm,tm+1)内多智能体系统的联合拓扑。

41、可选的，所述步骤3中虚拟领导者仅对部分跟随者进行牵引控制，所述虚拟领导者到所述第i个智能体有边，则ai0(t)≠0，否则ai0(t)＝0。

42、本发明的一种切换符号图下智能体系统的追踪控制系统，包括：

43、多智能体系统模型构建模块，被配置为构建二阶多智能体系统领导-跟随者动力学模型；

44、切换拓扑模型构建模块，被配置为将各智能体系统作为通信节点，将相邻智能体通信链路作为边，构建切换拓扑模型；

45、控制协议设计模块，被配置为根据所述动力学模型及切换拓扑模型，设计领导跟随追踪控制协议；

46、所述领导跟随追踪控制协议表示为：

47、

48、其中，u0(t)∈r表示虚拟领导者的控制协议，k＞0表示增益参数，v0(t)∈r表示虚拟领导者的速度，ui(t)∈r表示跟随者系统模型中第i个智能体的控制协议，i＝1,2,…,n，n表示跟随者系统模型中智能体的个数；vi(t)表示所述第i个智能体的速度；ni(t)表示所述第i个智能体的邻居集合；aij(t)表示所述第i个智能体与第j个邻居节点之间边的权重；xi(t)∈r表示所述第i个智能体的位置，aio(t)表示所述第i个智能体与所述虚拟领导者之间边的权重；

49、误差系统构建模块，被配置为构建领导跟随者之间追踪误差系统，构建过程包括：

50、令则在控制协议下的多智能体系统转化为：

51、

52、取则上述系统转化为：

53、

54、其中，lij(t)是拉普拉斯矩阵的元素；

55、定义实现领导跟随者之间的追踪误差为ei(t)＝ηi(t)-σiη0(t)(i∈w)且e(t)＝(e1(t),e2(t),…,en(t))t，则追踪误差系统为：

56、

57、其中，hδ(t)＝lδ(t)+dδ(t)，lδ(t)为所述多智能体系统通信拓扑符号图的拉普拉斯矩阵，dδ(t)＝diag{|a10(t)|,|a20(t)|,…,|an0(t)|}，包含了来自虚拟领导者所有边的绝对权值；in表示单位矩阵；

58、等价系统构建模块，被配置为根据所述追踪误差系统，利用矩阵变换及克罗内克积性质，构建等价系统；

59、所述等价系统为：

60、

61、其中：

62、

63、追踪控制模块，被配置为根据所述等价系统，利用李雅普诺夫稳定性，给出切换符号图下追踪控制结果；

64、当所述控制协议中参数k满足下式时时，切换符号图下二阶多智能体系统实现追踪控制：

65、

66、其中，lii(t)为所述拉普拉斯矩阵中第i行第i列的元素。

67、可选的，所述多智能体系统领导-跟随者动力学模型中，跟随者系统模型为：

68、

69、其中，表示第i个智能体位置状态xi(t)的导数，表示第i个智能体速度vi(t)的导数；

70、虚拟领导模型为：

71、

72、其中，表示虚拟领导者位置状态x0(t)的导数，表示虚拟领导者速度v0(t)的导数。

73、可选的，所述切换拓扑模型的构建过程包括：

74、考虑有界、非重合和相邻时间间隔的无穷时间序列，设无限时间序列为：

75、[t0,t1)，[t1,t2)，…，[tm,tm+1)，…

76、其中，t0＝0，0＜tm+1-tm＜t，t＞0；

77、在每个时间间隔[tm,tm+1)内，存在一个不重合子区间的有限时间序列，表示为：

78、

79、其中，并且τ是最小停留时间；

80、当时，考虑多智能体系统的拓扑结构在时进行切换，记δ(t):[0,+∞)→{1,...,h}(h＞1)作为切换信号，从而多智能体系统的符号图表示为且表示时间[tm,tm+1)内多智能体系统的联合拓扑。

81、可选的，如果存在时间t，所述虚拟领导者到所述第i个智能体有边，则ai0(t)≠0，否则ai0(t)＝0。

82、本发明提供一种电子设备，包括存储器和处理器；

83、所述存储器，用于存储计算机程序；

84、所述处理器，用于当执行所述计算机程序时，实现如上任一项所述的追踪控制方法。

85、本发明提供一种计算机可读存储介质，所述存储介质上存储有计算机程序，当所述计算机程序被处理器执行时，实现如上任一项所述的追踪控制方法。

86、本发明有益效果是：

87、针对追踪控制问题，本发明中二阶多智能体系统的通信拓扑图具有切换结构，相邻智能体之间不需要时时保持连通，只要固定时间间隔内具有生成树，极大地降低了连通性要求；且本发明通过设计简单新颖的控制方法，解决了通信链路可以发生改变，并且不需要保证时时连通情况下，二阶多智能体系统的二分追踪控制问题，达到了降低通信链路连通性的要求，相比于现有采用固定拓扑的方案，本发明可以有效地应对通信链路攻击或噪声带来的影响，从而保证多智能体追踪控制的精度和实时性，而且本发明控制方法简单，只需要控制增益满足相关条件即可。

文档序号 : 【 40202217 】

技术研发人员：舒冰,胡爱花
技术所有人：江南大学

备注：该技术已申请专利，仅供学习研究，如用于商业用途，请联系技术所有人。
声明 ：此信息收集于网络，如果你是此专利的发明人不想本网站收录此信息请联系我们，我们会在第一时间删除

舒冰丨胡爱花丨江南大学

一种分离锆和铪的溶剂萃取方法一种汽车压铸件生产用自动抛丸装置的制作方法