含匹配扰动的多智能体领航跟随一致性Matlab仿真

news2025/1/3 3:33:30

文章目录

    • @[TOC](文章目录)
  • 前言
  • 一、问题描述
  • 二、基于LQR的观测器和控制器设计
    • 1.观测器设计
    • 2.控制器设计
  • 三、数值仿真
  • 四、参考文献
  • 总结

前言

​本文探讨了带有匹配扰动的多智能体领航跟随一致性控制方法,并提供了相应的Matlab仿真代码。

具体的设计步骤如下:

  1. 将匹配扰动看为系统的扩张状态,设计扩张状态观测器,估计扰动的大小;
  2. 基于邻居节点间的状态误差设计控制器,并更具扰动估计值,在控制器中补偿扰动;
  3. 使用使用线性二次型调节器(Linear Quadratic Regulator,LQR)对控制器增益和观测器增益进行了优化设计。

​本文所涉及到的关于图论和LQR的基础知识可参考如下博客:

  • https://zhuanlan.zhihu.com/p/373435683
  • https://zhuanlan.zhihu.com/p/139145957
  • https://blog.csdn.net/qq_24649627/article/details/104690279

一、问题描述

多智能体系统由一个领航者和 N N N个含有匹配扰动跟随者组成。跟随者动力学模型为:
x ˙ i = A x i + B ( u i + d i ) y i = C x i \begin{array}{l} {{\dot x}_i} = A{x_i} + B({u_i} + {d_i})\\ {y_i} = C{x_i} \end{array} x˙i=Axi+B(ui+di)yi=Cxi
式中, i = 1 , 2 , . . . , N i=1,2,...,N i=1,2,...,N x i x_i xi u i u_i ui d i d_i di y i y_i yi分别是跟随者的状态、控制输入、匹配扰动和系统输出。

​ 领导者动力学模型为:
x ˙ 0 = A x 0 y 0 = C x 0 \begin{array}{c} {{\dot x}_0} = A{x_0}\\ {y_0} = C{x_0} \end{array} x˙0=Ax0y0=Cx0
式中, x 0 x_0 x0 y 0 y_0 y0分别为领航者的状态和系统输出。

二、基于LQR的观测器和控制器设计

1.观测器设计

将扰动 d i d_i di看为跟随者的状态,则模型(1)可重构为:
x ˉ ˙ i = A ˉ x ˉ i + B ˉ u i + E p i y i = C ˉ x ˉ i \begin{array}{c} {{\dot{\bar x}_i} } = \bar A{{\bar x}_i} + \bar B{u_i} + E{p_i}\\ {y_i} = \bar C{{\bar x}_i} \end{array} xˉ˙i=Aˉxˉi+Bˉui+Epiyi=Cˉxˉi
式中, x ˉ i = [ x i d i ] T \bar{x}_i=\left[ x_i \quad d_i \right]^{\rm{T}} xˉi=[xidi]T p i = d ˙ i p_i=\dot{d}_i pi=d˙i A ˉ = [ A B 0 0 ] \bar{A}=\left[ \begin{matrix} A & B \\ \textbf{0} & \textbf{0} \end{matrix} \right] Aˉ=[A0B0] B ˉ = [ B 0 ] T \bar{B}=\left[ B \quad \textbf{0} \right]^{\rm{T}} Bˉ=[B0]T C ˉ = [ C 0 ] \bar{C}=\left[ C \quad \textbf{0} \right] Cˉ=[C0],其中 0 \textbf{0} 0是适度维度的零矩阵。
假设模型(3)中 ( A ˉ , C ˉ ) (\bar{A},\bar{C}) (Aˉ,Cˉ)是可观的,可设计一个龙伯格扩张状态观测器为:
x ˉ ^ ˙ i = A ˉ x ˉ ^ i + B ˉ u i + G ( y i − C ˉ x ˉ ^ i ) \dot{\hat{\bar{x}}}_i = \bar A{\hat{\bar x} }_i + \bar B{u_i} + G({y_i} - \bar C{\hat{\bar x} }_i) xˉ^˙i=Aˉxˉ^i+Bˉui+G(yiCˉxˉ^i)
式中, x ˉ ^ i = \hat{\bar{x}}_i= xˉ^i=是对 x ˉ i \bar{x}_i xˉi的估计, G G G是观测器增益矩阵。

​ 增益 G G G常采用极点配置法求取,但理想的期望极点很难确定,且该方法无法通过误差和控制输入的优化来选取增益G,因此,可以使用LQR的方法设计 G G G,具体设计方法参考文献【1】。

2.控制器设计

​ 第 i i i个跟随者节点与其邻居节点之间的状态误差定义为:
ξ i = ∑ j ∈ N i ( ( a i j ( x ^ i − x ^ j ) + b i ( x ^ i − x 0 ) ) {\xi _i} = \sum\nolimits_{j \in {N_i}} {(({a_{ij}}(\hat{{ x}}_i - {\hat{ x}_j}) + {b_i}({\hat{ x}_i} - {x_0}))} ξi=jNi((aij(x^ix^j)+bi(x^ix0))
式中, N i N_i Ni表示 i i i节点邻居节点的集合; j j j节点对 i i i节点有信息传递时, a i j = 1 a_{ij}=1 aij=1,否则 a i j = 0 a_{ij}=0 aij=0;领航者对 i i i节点有信息传递时, b i = 0 b_i=0 bi=0,否则 b i = 0 b_i=0 bi=0

​ 假设模型(2)中(A,B)是可控的,根据扩张状态观测器得到的扰动估计值,可设计带扰动补偿的控制器为:
u i = K ξ i − d ^ i {u_i} = K{\xi _i} - {\hat d_i} ui=Kξid^i
式中, K = − τ K a K=-\tau{K_a} K=τKa,其中 τ \tau τ是一个与多智能体通讯拓扑结构相关的参数, K a K_a Ka为控制器增益矩阵。

​ 为了提高控制器的性能,同样可以使用LQR方法设计控制器增益 K a K_a Ka,具体设计方法参考文献【2】。
关于控制器和观测器的稳定性,感兴趣的读者可以自行证明。

三、数值仿真

考虑一个二阶领航跟随多智能体系统有1个领航者和4个跟随者,状态 x i = [ x 1 , i x 2 , i ] T x_i=\left[ x_{1,i} \quad x_{2,i} \right]^{\rm{T}} xi=[x1,ix2,i]T,系统矩阵 A = [ 0 1 0 0 ] A=\left[ \begin{matrix} 0 & 1 \\ 0 & 0 \end{matrix} \right] A=[0010] B = [ 0 1 ] T B=\left[ 0 \quad 1 \right]^{\rm{T}} B=[01]T C ˉ = [ 1 0 ] \bar{C}=\left[ 1 \quad 0 \right] Cˉ=[10]。领航跟随多智能体系统通讯拓扑图为:
在这里插入图片描述
设置外部扰动为:
d i = α i t + β i e χ i t sin ⁡ t + γ i i = 1 , 2 ⋯ 8 {d_i} = {\alpha _i}t + {\beta _i}{e^{{\chi _i}t}}\sin t + {\gamma _i}{\rm{ }}i = 1,2 \cdots 8 di=αit+βieχitsint+γii=1,28
式中,扰动参数 α = [ 0.001 − 0.001 0.002 0.001 ] T \alpha = \left[ 0.001 \quad -0.001 \quad 0.002 \quad 0.001 \right]^{\rm{T}} α=[0.0010.0010.0020.001]T β = [ 1 1.5 2 2.5 ] T \beta= \left[ 1 \quad 1.5 \quad 2 \quad 2.5 \right]^{\rm{T}} β=[11.522.5]T χ = [ − 0.3 − 0.3 − 0.5 0.3 ] T \chi= \left[ -0.3 \quad -0.3 \quad -0.5 \quad 0.3 \right]^{\rm{T}} χ=[0.30.30.50.3]T γ = [ 1 2 − 1 5 ] T \gamma= \left[ 1 \quad 2 \quad -1 \quad 5 \right]^{\rm{T}} γ=[1215]T
设置跟随者初始状态:
x 1 ( 0 ) = [ 2 0 4 0 ] T x 2 ( 0 ) = [ − 1 0 − 1 1 ] T \begin{align*} x_{1}(0) &= \left[ 2 \quad 0 \quad 4 \quad 0 \right]^{\rm{T}} \\ x_{2}(0) &= \left[ -1 \quad 0 \quad -1 \quad 1 \right]^{\rm{T}} \end{align*} x1(0)x2(0)=[2040]T=[1011]T
设置领航初始状态与运动轨迹为:
x 1 , 0 ( 0 ) = 2 x 2 , 0 ( 0 ) = 0 x ˙ 2 , 0 ( t ) = 0.2 cos ⁡ ( 0.15 t ) \begin{align*} x_{1,0}(0) &= 2 \\ x_{2,0}(0) &= 0 \\ \dot{x}_{2,0}(t)=0.2\cos (0.15t) \end{align*} x1,0(0)x2,0(0)x˙2,0(t)=0.2cos(0.15t)=2=0
Matlab仿真代码如下所示:

clear
clc

%% 预先设置
global L F K G A B A_bar B_bar D_Mar
%系统矩阵
A = [0 1; 0 0];
B = [0; 1];
C = [1 0];
A_bar = [A B; 0 0 0];
B_bar = [B; 0];
C_bar = [C 0];

%系统通讯拓扑图
L = [2 -1  0 -1
    -1  2 -1  0
     0 -1  2 -1
    -1  0 -1  2];% 拉普拉斯矩阵

F= diag([1  0  0  0]); % 牵引矩阵

%观测器Riccati方程
Qa = diag([15 15 15]);Ra = 0.1;
%控制器Riccati方程
Qb = diag([10 10]);Rb = 0.6;

% LQR方法求解观测器增益
[G,Pa] = lqr(A_bar', C_bar', Qa, Ra); 
G = G';

% LQR方法求解控制器增益
[Ka,Pb] = lqr(A, B, Qb, Rb);
tau = 1/(2*min(eig(L+F)));
K = -tau*Ka;

%扰动参数矩阵
D_Mar = [ 0.001 -0.001 0.002 0.001
          1 1.5 2 2.5
         -0.3 -0.3 -0.5 -0.3
          1  2 -1  5];

% 多智能体初始状态设置
X1l = 2;
X2l = 0;
X1f = [2 0 4 0];
X2f = [-1 0 -1 1];
X1hat = X1f; % 跟随者位置状态的初始估计
X2hat = X2f; % 跟随者速度状态的初始估计
Dhat = D_Mar(4,:);% 扰动的初始估计

%时间设置
tBegin = 0;
tFinal = 50;
tspan = [tBegin, tFinal];

%% Calculate ODE Function
In = [X1l X2l X1f X2f X1hat X2hat Dhat]';
[t, X] = ode23(@ctFun, tspan, In);

%% Draw Graphs
% 提取仿真结果
X1l_sim = X(:, 1);
X2l_sim = X(:, 2);
X1f_sim = X(:, 3:6);
X2f_sim = X(:, 7:10);
X1hat_sim = X(:, 11:14);
X2hat_sim = X(:, 15:18);
Dhat_sim = X(:, 19:22);

% 计算真实扰动

% 绘图
% 1-1.绘制领导者与跟随者的状态X1曲线
figure;
hold on
% 定义点画线样式
line_styles = {'--', ':', '-.', '-..'};
% 循环跟随者曲线
for j = 1:4
    plot(t, X1f_sim(:, j), line_styles{j}, 'linewidth', 1.5);
end
% 绘制 X1l_sim 曲线
plot(t, X1l_sim, 'r-', 'linewidth', 1);
hold off
% 添加图例
legend('Agent1','Agent2','Agent3','Agent4','Leader', 'FontSize', 16);
xlabel('$t(s)$', 'Interpreter','latex', 'FontSize', 26);
ylabel('$x_{1,i}$','Interpreter','latex', 'FontSize', 26);
% 添加上边框和右边框
box on;
grid on;

% 1-2.绘制领导者与跟随者的状态X2曲线
figure;
hold on
% 定义点画线样式
line_styles = {'--', ':', '-.', '-..'};
% 循环跟随者曲线
for j = 1:4
    plot(t, X2f_sim(:, j), line_styles{j}, 'linewidth', 1.5);
end
% 绘制 X2l_sim 曲线
plot(t, X2l_sim, 'r-', 'linewidth', 1);
hold off
set(gca, 'FontSize', 16); % 修改全局图的坐标数字字号为 16
% 添加图例
legend('Agent1','Agent2','Agent3','Agent4','Leader', 'FontSize', 16);
xlabel('$t(s)$', 'Interpreter','latex', 'FontSize', 26);
ylabel('$x_{2,i}$','Interpreter','latex', 'FontSize', 26);
% 添加上边框和右边框
box on;
grid on;

%绘制扰动与扰动观测值
% 计算真实扰动
Disturbance_true = zeros(size(Dhat_sim));
for i = 1:length(t)
    for j = 1:4
        Disturbance_true(i,j) = D_Mar(1,j)*t(i)+ D_Mar(2,j) * exp(D_Mar(3,j)*t(i))*sin (t(i)) + D_Mar(4,j);
    end
end

% 绘制扰动估计对比
for i = 1:4
    figure;
    plot(t, Disturbance_true(:,i), 'color', 'k', 'linewidth', 1.5);
    hold on;
    plot(t, Dhat_sim(:,i), '--', 'linewidth', 1.5);
    hold off;
    % 动态生成图例文本
    legend(sprintf('$d_%d$', i), sprintf('$\\hat{d}_%d$', i), 'Interpreter', 'latex', 'Location', 'northeast', 'FontSize', 16);
    set(gca, 'FontSize', 16); % 修改全局图的坐标数字字号为 16
    xlabel('$t(s)$', 'Interpreter', 'latex', 'FontSize', 26);
    ylabel(sprintf('$d_%d(t)$', i), 'Interpreter', 'latex', 'FontSize', 26);
    grid on;
end


%% ODE Function
function dX = ctFun(t,In)
    global L F K G A B A_bar B_bar D_Mar
     % 提取状态
    X1l = In(1);
    X2l = In(2);
    X1f = In(3:6);
    X2f = In(7:10);
    X1hat = In(11:14);
    X2hat = In(15:18);
    Dhat = In(19:22);

    % 初始化Disturbance为列向量
    Disturbance = zeros(length(X1f), 1);
    % 设置外部扰动
    for j = 1:4
        Disturbance(j) = D_Mar(1,j)*t + D_Mar(2,j) * exp(D_Mar(3,j)*t)*sin(t) + D_Mar(4,j);
    end

    % 领导者动力学
    dX1l = X2l;
    dX2l = 0.2*cos(0.15*t) ;
    
    % 跟随者动力学
    X1_Bar = X1hat - X1l; X2_Bar = X2hat - X2l;
    dX1f = A(1,2)*X2f;
    u = K(1)*(L+F) * X1_Bar + K(2)*(L+F) * X2_Bar - Dhat;%加了扰动补偿
    dX2f = B(2,1)*u + B(2,1)*Disturbance;
 
    % 扩张状态观测器
    dX1hat = A_bar(1,2)*X2hat + G(1) * (X1f - X1hat);
    dX2hat = A_bar(2,3)*Dhat + B_bar(2,1)*u + G(2)*(X1f - X1hat);
    dDhat = G(3) * (X1f - X1hat);
    
    % output 
    dX = [dX1l; dX2l; dX1f; dX2f; dX1hat; dX2hat; dDhat];
end

仿真结果:

由上图片可知,四个跟随者可以跟踪上领航者的运动状态。修改Matlab中LQR权重矩阵Qb和Rb,可改变一致性跟踪效果。

上面是扰动的真实值和观测值,修改Matlab中LQR权重矩阵Qa和Ra,可改变状态估计结果。

四、参考文献

【1】费红姿, 刘冰鑫, 柳一林, 等. 基于LQR的高压共轨系统喷油量观测器设计[J]. 内燃机学报, 2023, 41(03): 247-254.

【2】高琳琳, 唐风敏, 郭蓬, 等. 自动驾驶横向运动控制的改进LQR方法研究[J]. 机械科学与技术, 2021, 40(03): 435-441.

总结

我的个人站:JosephWen (rovn.ink)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1619298.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Algorius Net Viewer 2024.2.1 (Windows) - 网络可视化、管理、监控和清点

Algorius Net Viewer 2024.2.1 (Windows) - 网络可视化、管理、监控和清点 Comprehensive software product for visualizing, administering, monitoring, and inventorying computers network of any level 请访问原文链接:Algorius Net Viewer 2024.2.1 (Windo…

【动态规划】C++ 子序列问题(递增子序列、数对链、定差子序列、斐波那契子序列...)

文章目录 1. 前言2. 例题最长递增子序列 3. 算法题3.1_摆动序列3.2_最长递增子序列的个数3.3_最长数对链[3.4_ 最长定差子序列](https://leetcode.cn/problems/longest-arithmetic-subsequence-of-given-difference/description/)3.5_最长的斐波那契子序列的长度3.6_最长等差数…

剪画APP动漫AI工具|短剧轻松变动漫,开辟出海新方向

近期,剪画全新升级“AI动漫”功能,让创作者们打开全新的视频创作方式。 这个功能把我们的短剧作品快速转化为动漫风格,非常精准和细腻 在剪画将AI动漫功能升级后,越来越多的使用者将短剧变身成动漫效果发布到平台后,…

Git 保姆级教程(一):Git 基础

一、获取 Git 仓库 通常有两种获取 Git 项目仓库的方式: 1. 将尚未进行版本控制的本地目录转换为 Git 仓库; 2. 从其它服务器克隆 一个已存在的 Git 仓库。 两种方式都会在你的本地机器上得到一个工作就绪的 Git 仓库。 1.1 git init(本地…

Fisher判别示例:鸢尾花(iris)数据(R)

先读取iris数据,再用程序包MASS(记得要在使用MASS前下载好该程序包)中的线性函数lda()作判别分析: data(iris) #读入数据 iris #展示数据 attach(iris) #用变量名绑定对应数据 library(MASS) #加载MASS程序包 ldlda(Species~…

c++的策略模式,就是多态

一、定义: 策略模式定义了一系列的算法,并将每一个算法封装起来,而且使它们还可以相互替换。 策略模式让算法独立于使用它的客户而独立变化。 二,核心 抽象策略(抽象基类)(Strategy&#xff09…

Fork for Mac v2.42 激活版 Git客户端

Fork for Mac是一款运行在Mac平台上的Git客户端,Fork Mac版具备基本的取、推、提交、修改、创建和删除分支和标签、创建和删除远程备份等功能,还有实用的差异查看器,你可以通过清晰的视图快速发现源代码中的更改。 Fork for Mac v2.42 激活版…

【C++】优先队列

优先队结构的不同物理结构与常用操作算法 优先队列是一种特殊的队列,队列中的元素具有优先级,每次弹出操作会弹出优先级最高的元素。 优先队列常用的物理结构有: 1. 数组:简单但不高效,插入和删除操作需要移动大量元素,时间复杂度高。 2. 二叉堆:是一种完全二叉树,通常用数…

在Jupyter notebook中添加虚拟环境

通常我们打开Jupyter notebook,创建一个新文件,只有一个Python3,但是我们也会想使用自己创建的虚拟环境,很简单仅需几部即可将自己的conda环境添加到jupyter notebook中。 1. 创建并激活conda环境(已有可跳过&#xf…

【QT进阶】Qt http编程之实现websocket server服务器端

往期回顾 【QT进阶】Qt http编程之json解析的简单介绍-CSDN博客 【QT进阶】Qt http编程之nlohmann json库使用的简单介绍-CSDN博客 【QT进阶】Qt http编程之websocket的简单介绍-CSDN博客 【QT进阶】Qt http编程之实现websocket server服务器端 一、最终效果 通过ip地址和端口…

Redis入门到通关之Redis数据结构-Hash篇

文章目录 ☃️ 概述☃️底层实现☃️源码☃️其他 欢迎来到 请回答1024 的博客 🍓🍓🍓欢迎来到 请回答1024的博客 关于博主: 我是 请回答1024,一个追求数学与计算的边界、时间与空间的平衡,0与1的延伸的后…

使用 vllm 本地部署 cohere 的 command-r

使用 vllm 本地部署 cohere 的 command-r 0. 引言1. 安装 vllm2. 本地部署 cohere 的 command-r3. 使用 cohere 的 command-r 0. 引言 此文章主要介绍使用 使用 vllm 本地部署 cohere 的 command-r。 1. 安装 vllm 创建虚拟环境, conda create -n myvllm python…

微软开源了Phi-3-mini适用于移动硬件设备

🦉 AI新闻 🚀 微软开源了Phi-3-mini适用于移动硬件设备 摘要:微软最新开源的小参数大语言模型Phi-3-mini,包括其架构特点、训练数据、性能测试以及未来发布计划。该模型拥有38亿参数,占用内存少,且在语言…

JVM--Java对象到底存在哪?

Java对象存放在堆中,但堆又分为新生代和老年代,新生代又细分为 Eden、From Survivor、To Survivor。那我们创建的对象到底在哪里? 堆分为新生代和老年代,新生代用于存放使用后就要被回收的对象(朝生夕死)&a…

单片机学习过程

继电器光耦隔离电压转换步进电机直流电机 arduino是目前最好用的一种,他提供了完整的设备库文件,任何外部设备只要查找相应的库,就可以很方便的使用 , 但是如果不去学习51 或stm32 或 嵌入式玩玩还可以,如果碰到没有实…

Navicat和MySQL的安装、破解以及MySQL的使用(详细)

1、下载 Navicat Navicat 官网:www.navicat.com.cn/ 在产品中可以看到很多的产品,点击免费试用 Navicat Premium 即可,是一套多连数据库开发工具,其他的只能连接单一类型数据库 点击试用 选择系统直接下载 二、安装 Navicat 安…

【C++】---STL之vector的模拟实现

【C】---STL之vector的模拟实现 一、vector在源码中的结构:二、vector类的实现:1、vector的构造2、析构3、拷贝构造4、赋值运算符重载5、迭代器6、operator[ ]7、size()8、capacity()9、reserve()10、resize()11、empty()12、push_back()13、pop_back()1…

Pytorch常用的函数(八)常见优化器SGD,Adagrad,RMSprop,Adam,AdamW总结

Pytorch常用的函数(八)常见优化器SGD,Adagrad,RMSprop,Adam,AdamW总结 在深度学习中,优化器的目标是通过调整模型的参数,最小化(或最大化)一个损失函数。 优化器使用梯度下降等迭代方法来更新模型的参数,以使损失函数…

【JavaScriptthreejs】对于二维平面内的路径进行扩张或缩放

目标 对指定路径 [{x,y,z},{x,y,z},{x,y,z},{x,y,z}.........]沿着边缘向内或向外扩张,达到放大或缩小一定范围的效果,这里我们获取每个点(这里是Vector3(x,y,z)),获取前后两个点和当前点的坐标,计算前后两点的向量&a…

AJAX——案例

1.商品分类 需求&#xff1a;尽可能同时展示所有商品分类到页面上 步骤&#xff1a; 获取所有的一级分类数据遍历id&#xff0c;创建获取二级分类请求合并所有二级分类Promise对象等待同时成功后&#xff0c;渲染页面 index.html代码 <!DOCTYPE html> <html lang&qu…