切换拓扑下时变非线性多智能体系统的一致性_聚星-聚星娱乐明星新闻博客站

摘要：0引言近年来，随着多智能体系统的协同控制在信息控制[1]、编队控制[2]、群集运动[3]等方面的广泛应用，已引起越来越多研究人员的关注.其中，一致性问题[1-4]作为协同控制的核心问题，更是得到了广泛的关注.多智能体一致性问题主要是研究多智能体系统中个体之间通过有限的信息交换，使所有智能体的状态达到某

0 引言

近年来，随着多智能体系统的协同控制在信息控制^[1]、编队控制^[2]、群集运动^[3]等方面的广泛应用，已引起越来越多研究人员的关注.其中，一致性问题^[1-4]作为协同控制的核心问题，更是得到了广泛的关注.多智能体一致性问题主要是研究多智能体系统中个体之间通过有限的信息交换，使所有智能体的状态达到某同一值的行为.在实际工程应用中，多智能体之间的信息交换因受到距离、障碍、干扰等多种不确定性因素的影响，会导致通信链路的中断或重建，使多智能体之间信息交换的准确性降低.通常使用切换拓扑来描述这种通信链路的改变.常见的切换拓扑有固定时间切换拓扑^[5]和随机时间切换拓扑，而随机时间切换拓扑又可分为任意切换拓扑^[6]、随机切换拓扑^[7]和马尔可夫切换拓扑，其中马尔可夫切换拓扑包含任意和随机切换拓扑的特性更具一般性^[8].因此，本文研究马尔可夫切换拓扑下多智能体系统的一致性.

目前，针对切换拓扑下线性多智能体一致性已经有诸多研究^[9-12].文[9]研究了带有多种噪声干扰的马尔可夫切换拓扑下的一阶多智能体系统，设计了一致性协议，使系统分别实现均方平均趋同和概率1平均趋同.文[10]研究了当领导者状态为时不变时，马尔可夫切换拓扑下二阶多智能体系统的领导—跟随一致性.文[11-12]研究了马尔可夫切换拓扑下高阶多智能体系统的一致性问题，并指出系统实现一致性的条件是联合切换拓扑包含有向生成树.

上述研究都是针对线性系统，然而，自然界中几乎所有的物理系统都是非线性的，比如异步电动机系统^[13]、飞控系统^[14]和电力系统^[15]，因此，研究非线性多智能体一致性更具应用价值.针对非线性多智能体一致性的研究也取得了很多成果^[16-22].文[16]以一阶非线性系统为研究对象，文[17-18]研究了二阶非线性系统，事实上，很多物理系统具有高阶性的特点，高阶非线性系统也成为目前的研究热点.文[19]设计了动态输出一致性协议，研究了无向网络下，一类高阶非线性多智能体系统的领导—跟随一致性.文[20]提出了确定有向网络中最小数量领导者的方法，并设计了控制协议保证高阶时变非线性多智能体系统的一致性.更进一步，为了解决具有不同和未知的非线性多智能体系统的一致性问题，文[21-22]设计了自适应的一致性协议.与此同时，也需要考虑干扰、拓扑切换等对非线性多智能体一致性的影响.

针对切换拓扑下非线性多智能体一致性也有诸多研究^[23-26].文[23]解决了具有通信时延的马尔可夫切换拓扑下高阶非线性多智能体系统的领导—跟随一致性问题，但其联合切换拓扑是无向连通的.文[24]对切换拓扑下非线性多智能体系统的领导—跟随一致性进行研究，但要求每个时刻的通信拓扑结构均包含有向生成树，且只讨论了两个拓扑在固定时间内切换.文[25]放宽了通信拓扑连接的限制，考虑部分时刻的拓扑结构包含有向生成树.文[26]得出了和线性系统相似的结论，指出实现马尔可夫切换拓扑下非线性多智能体系统一致性的条件是联合切换拓扑包含有向生成树.文[23]是针对无向通信网络.文[24-25]虽然是针对有向切换拓扑，但分别要求每一时刻和部分时刻的通信拓扑包含有向生成树.文[26]放宽了限制条件，只需联合切换拓扑包含有向生成树.分析上述研究成果可知，目前对切换拓扑下非线性多智能体系统一致性的研究中，仍对联合切换拓扑有限制，至少需要联合切换拓扑包含有向生成树，然而在大规模网络环境中确保网络的连通性仍是亟待解决的问题.在一般有向切换拓扑结构的通信条件下保证系统的一致性，更具实际意义.

本文考虑联合切换拓扑是任意有向网络结构，研究了马尔可夫切换拓扑下高阶非线性系统的一致性.相比于已有的研究成果，本文的创新之处在于：1)本文不需要对通信拓扑进行限制，考虑联合切换拓扑是任意有向网络结构；2)本文针对马尔可夫切换拓扑下高阶非线性系统设计了具有动态增益的一致性协议.

1 问题描述

符号和定义：用G={v，ε}表示由N个智能体组成的有向图，其中v={1，2，…，N}是图的顶点集合，ε?v×v是图的边集.有向图G的权值邻接矩阵为Λ=[a_ij]∈R^N×N，其中a_ij=1表示节点i可以接收到节点j的信息，否则a_ij=0.有向图G的入度矩阵表示为D=diag(d₁，d₂，…，d_N)，其中.有向图G的拉普拉斯矩阵定义为L=D-Λ.

本文用图G表示跟随者智能体之间的网络拓扑，用图表示虚拟领导者与所有跟随者之间的网络拓扑.虚拟领导者和跟随者之间的连接，用邻接矩阵表示Γ=diag(b₁，b₂，…，b_N)，其中，b_i>0表示虚拟领导者向第i个跟随者传递信息，否则，b_i=0.拓扑在s个不同的拓扑结构之间随机切换，当随机变量σ(t)=m∈{1，2，…，s}时，.联合切换拓扑图描述为的拉普拉斯矩阵为，则联合切换拓扑的拉普拉斯矩阵为.

1.1 构造联合切换拓扑

本文针对联合切换拓扑是任意网络拓扑结构的多智能体系统一致性问题进行研究.由文[9-12, 26]可知，切换拓扑下的多智能体系统实现一致性的条件是联合切换拓扑包含有向生成树.若联合切换拓扑是任意网络结构，特别是具有孤立的节点，如图 1(a)所示，则不能实现系统的一致性.因此，需要先对联合切换拓扑进行构造，使构造后的网络结构包含有向生成树.

图 1 构造联合切换拓扑 Fig.1 Constructing the union of switching topologies

图选项

本文借鉴文[20]的研究思想，研究马尔可夫切换拓扑下多智能体系统的一致性问题.图 1显示了对联合切换拓扑的构造过程，分两步进行：1)引入临时节点，如图 1(b)所示，通过最小树形图理论^[25]找到任意网络结构中最少数量的领导者，结果如图 1(c)；2)引入虚拟领导者与定位最少数量领导者相连，图 1(d)即为构建后的联合切换拓扑.

引理1^[20] 对于任意的有向网络G_u，找到最少数量的领导者，建立虚拟领导者与定位的最少数量的领导者相连，连接后的有向网络是连通的，其中，虚拟领导者为有向生成树的根.

注1文[26]证明了马尔可夫切换拓扑下非线性多智能体系统实现一致性的条件是联合切换拓扑包含有向生成树.本文针对联合切换拓扑可以是任意网络结构的多智能体系统进行研究，给出了将联合切换拓扑构造为有向生成树的方法，其应用更具普适性.

1.2 拓扑切换过程描述

用连续时间马尔可夫过程描述切换过程{σ(t)，t≥0}，它在有限的状态集合{1，2，…，s}上取值，其转移密度矩阵为Q=[q_ij]_s×s∈R^s×s.连续时间马尔可夫过程的转移概率密度表示为

其中，i，j∈s，t∈R⁺，q_ij表示从状态i到状态j的转移概率密度，表示状态发生转换的速度，q_ij≥0且.

引理2^[4] f(t)是F_t的测度，假定E{f(t)1_{σ(t)=i}}=f_i(t)存在，其中，1_{σ(t)=i}是集合{σ(t)=i}上的迪拉克测度.对于i∈s，下式成立：

(1)

其中，o(dt)表示dt的高阶无穷小.

1.3 多智能体模型

在引入虚拟领导者节点与任意网络结构的最少数量的领导者相连后，将联合切换拓扑为任意网络结构的多智能体系统的一致性问题转化为虚拟领导者节点和多智能体系统的领导—跟随一致性问题.这里，构造的联合切换拓扑，由原任意网络结构的联合切换拓扑和虚拟领导者结点组成.

考虑由N个跟随者智能体和一个虚拟领导者智能体组成的具有非线性动态模型为

(2)

其中，k=0表示虚拟领导者智能体，k=1，2，…，N表示跟随者智能体；x_k=[x_k，1，x_k，2，…，x_k，n]^T是第k个智能体的状态；A和B是任意常数矩阵；u_k，k=1，2，…，N是需要设计的控制协议，u₀是给出的虚拟领导者智能体的控制协议；f(·)=[f₁，f₂，f₃，…，f_n]^T，f_i是时间t和状态x_k，1，x_k，2，…，x_k，i(i=1，2，…，n)的函数.

定义1 在任何有限初始状态x₀下，存在正数C和t₀，使：

(3)

称以速度β实现领导—跟随一致.

为了使系统实现领导—跟随一致性，引入如下的假设和引理.

假设1^[27]对i=1，2，…，n，存在非负实数c₁和c₂，使非线性函数f(x)满足如下的Lipschitz条件：

(4)

其中，η(t)=c₁e^c₂t.

注2 η(t)是定义在[0，+∞)上任何已知的指数函数.通过选取适当的c₁和c₂，指数函数c₁e^c₂t可以作为许多时变函数的边界.因此，满足假设1的系统(2)包含了许多类型的时变系统.

引理3^[19]图是连通的，若拓扑图包含一个以虚拟领导者为根节点的生成树，则是正定的.

引理4^[27] 存在行向量K=[k₁，k₂，…，k_n]，使得是Hurwitz矩阵，这里表示克罗内克积，I_N表示N维单位矩阵，存在正定矩阵P，满足：

(5)

注3 可以通过引理3求得，其中Γ是虚拟领导者和多智能体系统之间的邻接矩阵.为了获得引理4中的行向量K和正定矩阵P，首先要找到的特征值λ₁，λ₂，…，λ_N，则可以通过A+λ_jBK，j=1，2，…，N是联立的Hurwitz矩阵确定K，正定矩阵P可以通过式(5)确定.

2 算法和一致性协议设计 2.1 寻找最少数量领导者算法

对于任意网络结构G_u，引入一个临时节点T与每一个结点连接构成拓扑图G^*.在拓扑图G^*中，令连接临时节点T的有向边，权值置1，如不连接临时节点，权值置0，如图 2(a)所示.由文[20]可知，寻找拓扑图G的最少数量领导者问题可转化为寻找图G^*的最小树形图问题，从而可使用朱刘算法^[28]解决.在图G^*的最小树形图中，与临时节点T相连的节点，即为图G_u的最少数量领导者节点，如图 2(b)所示，节点1、节点4、节点5即为图 1(a)所示网络拓扑的最少数量的领导者.

图 2 寻找最小树形图 Fig.2 Finding the minimum arborescence in a network

图选项

对有向图G^*(ν，ε)，求其最小树形图的算法过程如下：

步骤1：对除根节点以外的N-1个节点，选择权值最小的输入有向边，构成有向边集s.若没有形成环，G^*(ν，s)即为最小树形图；否则，转到步骤2.

步骤2：将每一个环中的节点收缩为一个伪节点m，修改每条从环外节点i指向环内节点j的有向边的权值：

其中，a(x(j)，j)是有向环内指向j的权值.

步骤3：对每个伪节点和实节点，选择权值最小的输入有向边.若有环，转到步骤2；否则，转到步骤4.

步骤4：记录当前的有向边，展开收缩点，去除环中与记录的有向边相同终点的边.

2.2 设计一致性协议

若拓扑结构为，选择合适的时变参数W(t)，设计如下的一致性协议：

(6)

其中，R(·)∈R^1×n将在之后确定，W(t)是时变方程，在t≥0时，都有W(t)≥1.在拓扑结构下，若节点i可以接收节点j的信息，a_ij=1，否则，a_ij=0；若节点k可以接收虚拟领导者节点的信息，b_k=1，否则，b_k=0. u₀是时间t的函数，表示虚拟领导者的输入信息.在式(6)中，为了便于表达，使用W和u₀表示W(t)和u₀(t)，省略变量t，下文同.

定义一致性误差为

(7)

由系统(2)，式(7)可写为

(8)

若一致性误差(8)在有限时间内收敛到零，则系统(2)可实现一致性.为了求解一致性协议中的时变参数W，对每个智能体的一致性误差进行如下状态变换：

(9)

其中，ξ=diag(Wⁿ，W^n-1，…，W).

由式(9)和一致性误差(8)，可得：

(10)

其中，H=diag(n，n-1，…，1)，k=1，2，…N，ψ_k=ξ(f(t，x_k)-f(t，x₀)).

因此，求解一致性误差(8)的稳定性问题又可转换为求取时变参数W保证系统(10)的稳定性问题.为求解系统(10)的稳定性，引入如下定理.

定理1 存在时变参数W(t)，使系统(10)的稳定性可通过如下的一致性协议解决：

(11)

其中，τ_k是的第k行.由引理1可知，联合切换拓扑是连通的，在此条件下，由引理3可得，K可由引理4得到，且.

证明：由系统(10)和一致性协议(11)，可以得到的动态为

(12)

考虑到，式(12)又可写为

(13)

其中，ψ=[ψ₁^T，ψ₂^T，…，ψ_N^T]^T.

定义李亚普诺夫函数V(t)：

(14)

其中，表示当前拓扑为，P通过引理4求解.

由引理2，V_m(t)的导数可以写为

(15)

将式(13)代入式(15)，得到

(16)

由于对j∈{1，2，…，s}都成立，由式(16)和引理4可得：

(17)

进一步可得：

(18)

其中，是的最大特征值.

由假设1和式(9)，可得：

(19)

其中，i=1，2，…，n，k=1，2，…，N.当t≥0时，都有W(t)≥1，式(19)可进一步写为

(20)

因此，

(21)

(22)

其中，.

将式(21)代入式(18)可得：

(23)

为了满足系统(10)稳定性，令：

(24)

进一步可以得到：

(25)

令，则，即V(t)≤V(0)·e^-βt，由定义1可知系统(10)以速度β达到领导—跟随一致.

进一步可以得到：

(26)

即，进行状态变换后的系统(10)满足，实现了期望的稳定性.

接下来，对状态变换前的一致性误差(8)的稳定性，即，系统(2)的一致性进行说明.

定理2在假设1的条件下，如果是连通的，系统(2)的一致性问题可以通过如下的一致性协议解决：

(27)

其中，ξ=diag(Wⁿ，W^n-1，…，W)，K可由引理4得到.

证明：由式(23)可知，t≥0时，W(t)≥1，对角矩阵满足，且 Wⁿ(t).由式(9)，有：

(28)

当t=0时，有：

(29)

其中，W(0)=2α+εμ₂+1.

由式(25)可以得到：

(30)

因此，一致性误差e=0，在，2，…，N时成立.从而，式(6)中的未知变量R(W)确定为R(W)=-Kξ.至此，系统(2)的一致性得证.

对于系统(2)，一致性协议的设计步骤如下：

步骤1：引入临时节点与任意网络拓扑的每个节点连接，将连接临时节点的有向边，权值置1，若没有连接，权值置0.

步骤2：通过朱刘算法，对步骤1的有向图求最小树形图，标记与临时节点相连的节点，并引入虚拟领导者与其相连.

步骤3：通过引理4获得K和P.

步骤4：通过假设1和从步骤3解出的K和P，根据式(18)~式(23)确定参数ε和α.

步骤5：通过步骤4获得的参数ε和α，由式(24)求解出W(t).

步骤6：通过步骤3和5获得K和W(t)，得到系统(2)的一致性协议(27).

3 数值仿真

本节通过具体实例来证明马尔可夫切换拓扑下时变非线性多智能体系统(2)在一致性协议(27)下的领导—跟随一致性.

考虑如图 3(a)所示的联合切换拓扑图G_u，使用朱刘算法可以确定最少数量的领导者为节点1、节点4和节点5，建立一个虚拟领导者结点0与节点1、节点4和节点5连接，构造的联合切换拓扑图，如图 3(b)所示，包含有向生成树.

图 3 联合切换拓扑图G_u和构造的联合切换拓扑图

Fig.3 A union of switching topologies G_u and the constructed network topology

图选项

选择系统参数：，则多智能体系统的动态方程为

(31)

其中，k=0，1，…，8，第k个智能体的状态是x_k=[x_k，1，x_k，2]^T∈R²，控制输入为u_k∈R².索引为0表示领导者智能体，索引为1，2，3，4，5，6，7，8表示跟随者智能体.多智能体系统在图 4所示的拓扑结构之间进行切换，有且只有联合切换拓扑，包含有向生成树.

图 4 联合切换拓扑包含有向生成树的网络拓扑图 Fig.4 A network topologiy with the union of switching topologies includes a directed spanning tree

图选项

通过本文的设计算法，选取控制增益K=[5 5]，系统(31)的领导—跟随一致性协议可以设计为

其中，k=1，2，…，8.令，可知，当η(t)=0.2e^2t时，假设1的条件满足.进一步选取W(t)=7e^2t+20，u₀=20+sin t.

用连续时间的马尔可夫过程m_t来描述拓扑切换过程，m_t的状态空间为S={1，2，3}，状态转移密度矩阵为Q=，初始概率分布为.图 5是马尔可夫过程m_t描述的拓扑切换信号，其中，状态1、2、3分别表示当前多智能体系统的网络拓扑结构为

图 5 网络拓扑的切换信号 Fig.5 Switching signal for network topology

图选项

随机给定多智能体系统的初始状态为：X(0)=[x₀^T，x₁^T，x₂^T，x₃^T，x₄^T，x₅^T，x₆^T，x₇^T，x₈^T]=[0, -1, -2, -4, -6, -8, -6, -4, -2, 0, 1, 2, 4, 6, 8, 6, 4, 2]，系统的拓扑结构随着图 5所示的拓扑状态切换信号在之间变换.系统的状态轨迹如图 6所示，可以看出，跟随者智能体的状态轨迹逐渐收敛到虚拟领导者智能体的状态轨迹，即联合切换拓扑是任意网络结构的多智能体系统实现了全局一致性.同时，实验结果说明通过引入虚拟领导者对联合切换拓扑进行构造，在所提的一致性协议下，构造后的网络能够实现马尔可夫切换拓扑下时变非线性多智能体系统的领导—跟随一致性.

图 6 系统的状态轨迹变化(构造的联合切换拓扑包含有向生成树) Fig.6 The states trajectories with the switching topology (the constructed network topology includes a direct spanning tree)

图选项

当构造的联合切换拓扑包含有向生成树时，在一致性协议(27)的作用下，多智能体系统能够确保实现领导—跟随一致性，验证了定理2的结论.为考察构造的联合切换拓扑不包含有向生成树对多智能体系统领导—跟随一致性的影响，在其余条件不改变的情况下，令多智能体系统的网络拓扑随着图 5所示的拓扑切换信号在图 7所示的三种拓扑之间进行变换，但联合切换拓扑不包含有向生成树.

图 7 联合切换拓扑不包含生成树的网络拓扑图 Fig.7 A network topology with the union of switching topologies doesn′t include a directed spanning tree

图选项

多智能体系统的状态轨迹如图 8所示，可以看出，跟随者智能体4的状态轨迹未收敛到领导者智能体的状态轨迹，其余智能体状态收敛到领导者智能体状态.因智能体4在3种拓扑中，均未与领导者智能体和其余智能体进行信息交换.可以看出，未对任意网络进行有效构造，多智能体系统不能实现领导—跟随一致性.

图 8 系统的状态轨迹变化(构造的联合切换拓扑不包含有向生成树) Fig.8 The states trajectories with the switching topology (the constructed network topology doesn′t include a direct spanning tree)

图选项

4 结论

本文研究了马尔可夫切换拓扑下时变非线性多智能体系统的领导—跟随一致性问题.首先，通过引入一个临时节点与任意网络结构中每一个智能体相连，将寻找最少数量的领导者问题转化为构建最小树形图问题，进而利用朱刘算法进行求解.接着，建立一个虚拟领导者连接所选取的最少数量的领导者，所构建的多智能体网络包含有向生成树，确保了多智能体系统的一致性.然后，设计了具有动态控制增益的一致性协议，通过引入一致性误差和状态变换，将具有动态增益的一致性协议的设计问题转化为动态参数的设计问题进行求解.最后，数值仿真结果验证了所提出的一致性协议能够使虚拟领导者与多智能体系统的状态实现全局一致，进一步证明了所提方法的有效性.