机器人学基础[控制章]——其他控制方法
说明
在本期开始前我必须要说一下,我之所以不按照控制器的线性与非线性划分,是因为非线性控制其实是一个大类,就比如反馈线性化、极点配置法、李雅普诺夫稳定、模型控制等等,都包含了非线性控制的思路,甚至于模糊控制和滑膜也是如此,所以无法按照一般的分类去看待控制器,只能利用控制特点进行区分,所以本期博客介绍两类极强的、范围极广的控制即:鲁棒控制和智能控制。
鲁棒控制将会写$H\infty$控制、$\mu$综合、滑模控制,智能控制将会说模糊控制、优化控制器以及强化学习控制。
本期内容我们会引入广义坐标的概念,我们可以指定一种状态方程即:
存在一种时序上的递推,我们假设A是单位矩阵,我们可以写成表达式:
类似这种以初始状态的递推过程。所以其下角标可以理解为前一个变量的导数。
鲁棒控制
提到鲁棒控制不得不说一下鲁棒性(Robustness),它指的是一类在参数变化、建模误差、外界扰动或传感器噪声等不确定性下,仍能维持预期性能的能力。(我也不知道为什么要音译,不如叫抗干扰性)
这些不确定性大概可以分为两类:
- 结构化不确定性:系统模型参数的变化范围已知(如机械臂关节质量±10%)
- 非结构化不确定性:高频未建模动态、未知干扰(如风扰动对无人机的影响)
所以我们需要规避这两种不确定性进行控制,我们必须保证控制的稳定性和对突发情况的适应性。这些都是传统的、单纯的PID无法做到的事情:
特性 | 经典控制(如PID) | 鲁棒控制 |
---|---|---|
模型依赖 | 依赖精确数学模型 | 允许模型存在不确定性 |
抗干扰能力 | 依赖实时反馈补偿 | 提前设计时考虑干扰范围 |
适用范围 | 确定性系统 | 高不确定性复杂系统 |
典型方法 | 频域设计、根轨迹法 | $H\infty$控制、$\mu$综合、滑模控制 |
那么我们就可以开始本期博客
$H\infty$控制
又叫H无穷控制,关键在于定义了一种新范数(H无穷范数),这种范数并非平时常用的诱导范数,H范数是定义在频域上的而L范数是时域的,对于控制而言,我们可以在频域控制自然是最稳定的(因为我们可以找出最有可能的情况从而进行反馈),具体对比两组范数见下表:
特性 | $H\infty$范数 | $\mathcal{L}_\infty$诱导范数 |
---|---|---|
定义域 | 频域(频率响应矩阵的最大奇异值) | 时域(输入输出信号的无穷范数) |
物理意义 | 系统在频域上的最大增益 | 系统在时域上的最大幅值响应 |
计算方法 | 通过传递函数矩阵的频率响应计算奇异值 | 通过脉冲响应或阶跃响应的时域积分或幅值计算 |
首先我们定义一种状态空间表达式:
其中:
- x 是状态向量,
- u 是控制输入,
- w 是外部干扰或不确定性,
- z 是被控输出(性能指标),
- y 是测量输出。
然后我们引入H无穷范数,计算公式如下:
含义为频域响应函数G的最大奇异值,归根结底我们还是需要设置反馈矩阵K,由李氏稳定判据,我们需要让输出误差在一定的范围内在可以断定其稳定:
其中 $\gamma$ 是一个给定的性能指标。而T就是闭环系统的传递函数。
类似LQR,我们同样需要设定一个K用于反馈控制,我们可以求解一个Riccati方程进行设计:
而反馈增益矩阵K可以写作:
接下来只需要进行求解即可,通过求解以下线性矩阵不等式来设计控制器:
求解这个方程即可,我们看一下matlab代码:
1 |
|
输出为:
1 |
|
从图上可以看到,无论如何增加干扰项w,输出z永远稳定。
$\mu$综合
我们需要给出一种结构不确定的控制,即不确定性以特定的结构和形式出现,我们需要一种叫$\mu$分析的办法。
我们的$\mu$其实是一种结构化的奇异值,我们可以用下面的方法计算出来:
- $M$ 是系统的传递函数矩阵,
- $\Delta$ 是描述不确定性的矩阵。
我们需要设置一个控制器,使得闭环系统在所有允许的不确定性下能够满足如下的要求:
- 1、稳健性:所有不确定的情况下都是稳定的
- 2、性能:所有不确定的情况下都能满足性能要求
既然如此,我们需要进行如下的设计步骤:
- 1、建立广义系统,包括对模型的标准描述和不确定性描述
- 2、定义不确定性矩阵,这里一般采用块对角矩阵描述,诸如参数不确定性和未建模动态等。(个人感觉是表达性更强的隶属度函数)
- 3、设置$\mu$综合控制器,通过迭代优化法使得闭环系统的$\mu$最小
- 4、最后可以对系统进行分析
下面是Matlab代码仿真:
1 |
|
如图所示,其效果非常明显,这样我们完成了对不确定系统的稳健性控制。
非线性控制
在现代控制理论中也对非线性控制进行了介绍,其方法较为古老。比如反馈线性化和极点配置法等,其思路都是构建反馈矩阵。这一部分介绍反步法和滑模控制法,用于补充较为高级的非线性控制器,并且适合严格的反馈系统。
反步法
反步法是一种递归设计非线性控制器的方法,通过Lyapunov函数和虚拟控制律,将系统分解为多个子系统,逐步稳定每个子系统。我们假设一个反馈系统,我们可以写作:
其中:
- $x_i$ 是系统状态。
- $u$ 是控制输入。
- $f_i$ 和 $g_i$是已知的非线性函数。
我们的关键分为三步:1、分解系统2、设计虚拟控制律3、构造Lyapunov函数。
首先需要定义一个误差,我们通过如下的方式定义:
其中$ x_{1d}$为期望值,我们给误差提供一个比例,制定负反馈控制率:
其中k为设计参数,且$k_1>0$
其次我们构建一个Lyapunov函数,我们可以用标准的二次方程:
我们对其求导,可以得到:
其中的$x_2$为$x_1$的导数,其可以看作为广义坐标的一种表达方式(参考第一章机器人学基础——控制理论)我们可以通过虚拟控制率去保证Lyapunov导数小于0。
接下来我们需要对其进行递归设计,我们可以定义第二个误差:
我们就可以更新Lyapunov函数:
以此方法我们最终可以得出最终的控制率,因此我们实现matlab进行仿真:
1 |
|
我们可以看到设定了期望值后可以非常快速的收敛,通过两个控制增益非常快速的收敛。
滑模控制器
滑模控制是非常强大的非线性控制方法,对不确定性和扰动的系统有极强的控制效果,核心思想是通过控制滑动的模态使得系统在有限步数内收敛到滑动模态并保持稳定。与反步法类似,我们也需要设定控制律,正如下面的抽象表述:
- 等效控制$u_{eq}$用于保持系统在滑动面上。
- 切换控制$u_{sw}$用于驱动态到滑动面。
而u作为系统的输入控制,我们可以发现其对不确定性和外部扰动具有强稳健性。
既然是滑模控制,我们首先假设一个系统:
其中的d(t)为随机扰动,表示为一个时间函数,我们可以写出实际与期望的误差:
其中的$x_d$为期望值,我们就可以设定滑模面:
其中的$\lambda>0$是我们的设计参数。接下来设定等效控制:
以及切换控制律:
其中的K是整体的设计参数,然后我们构建Lyapunov函数:
同时满足李氏稳定判据即有界性:
其中$\eta > 0$。然后我们假设一个二阶系统,我们写作:
我们需要设定控制律u,使得$x_1$可以跟踪预设期望值,并抑制扰动。
重复上述步骤,首先定义误差:
设计滑动面:
这样我们就得到等效控制和切换控制:
同样的,李氏函数为:
1 |
|
可以看到其反应速度一般快,但是对外部的正弦周期性扰动控制的非常好,甚至是稳健的。
智能控制
提到智能控制,首先想到的就是神经网络控制,但是这是优化较为费时的优化控制器,针对一些特殊的场合是十分受用的。但是对于一般情况我们需要一些基础的控制器,比如pid。
模糊PID
模糊通常意味不清晰,在日常生活中我们通常会对一些事物进行模糊的描述比如:沙发上白色的手机而非使用我的手机,亦或者树上红色的苹果。这些都有共同点就是用一系列约束条件去约束一个事物,每一个约束多值连续的映射,而这些映射最终存在交集即我们的目标。对于一般的控制器,我们也可以这样去修改,如果是一个模糊系统,通常包含四部分:
- 模糊化
- 规则
- 内在推理
- 去模糊化
其中的模糊化大有话说,我们通过经验指定规则,利用隶属度函数描述交给控制器,通过合适的规则即可让控制器收敛。对于我们的PID控制器,我们也可以对其模糊化。
我们以模糊PID为,我们通过一系列描述函数进行动态系数变换,包括如下:
名称 | 作用 |
---|---|
NB | 负方向的大数 |
NM | 负方向的中等数 |
NS | 负方向的小数 |
ZO | 0位的数 |
PS | 正方向的小数 |
PM | 正方向的中等数 |
PB | 正方向的大数 |
我们通过这些函数既可以对PID进行动态变化。有一句描述非常正确的话处理pid:
IF e is NB AND de/dt is NB THEN ΔKp is PB, ΔKi is NB, ΔKd is PS
理解为:如果误差和误差变化率是NB的,则Kp是PB的,Ki是NB的,Kd是PS的,也就是Kp正大方向,Ki负大方向,Kd正小方向。
动态参数如下:
对模糊PID我们需要利用隶属度动态调节PID,初始状态需要一个合适的PID系数,再通过模糊用于提高鲁棒性。模糊PID的代码在Github有大佬写好了,我就直接给出github链接了。
1 |
|
隶属度函数包含很多形状,这些都是对信息过度进行不同强度的描述,代码给出了:
- 隶属度函数 Membership function
- 高斯隶属度函数 Gaussian membership function
- 广义钟形隶属度函数 Generalized bell-shaped membership function
- S形隶属度函数 Sigmoidal membership function
- 梯形隶属度函数 Trapezoidal membership function
- 三角形隶属度函数 Triangular membership function
- Z形隶属度函数 Z-shaped membership function
- 模糊算子 Fuzzy operator
- 并算子 Union operator
- 交算子 Intersection operator
- 平衡算子 Equilibrium operator
- 中心平均解模糊器 Mean of centers defuzzifier
按照大佬的C语言实例可以快速部署这个模糊pid到自己的C语言平台,我用Matlab简单仿真一下就好。
1 |
|
可以看出在给定一个高斯噪声的情况下,PID依然可以稳定的输出,对于这个传递函数,噪声会被放大很多很多,但是依然适应住了,所以模糊PID的鲁棒性要远远高于纯粹的PID。
遗传算法优化控制
在模糊控制后就是GA控制,这是一种模拟自然选择机制的优化算法,适合复杂的非线性多极值函数优化问题(一般的数值优化只能找到一个极值),对于GA利用类似DNA的过程进行基因的选择、交叉、变异等操作迭代出最优解。
我们可以写成下面的过程:
初始化种群:随机生成一组初始解,假设其完美
适应度评估:计算每个个体的性能指标(也就是衡量被优化对象好坏的指标)
选择:保留高适应度个体(轮盘赌、锦标赛选择等。就是随机杀死一些个体)。
交叉:交换部分基因,生成新个体。
假设个体 A:
[a1, a2, a3, a4]
,个体 B:[b1, b2, b3, b4]
交叉后可能变成
[a1, b2, a3, b4]
、[b1, a2, b3, a4]
等。变异:随机修改某些基因,增加多样性。
随机对个体的某个基因(变量)做小范围扰动,避免陷入局部最优。
比如将某个变量加上一个小随机数
x_i = x_i + randn() * σ
替换/进化: 把交叉和变异后的个体组成新的种群,继续下一代进化。回到第2步
终止条件:达到最大迭代次数或适应度收敛。
我们以PID为GA的优化对象,我们首先需要制定其性能指标,一般都是以积分项进行的,同时还有超调量的控制。我们首先制定误差的时间积分:
然后给出时间平方的积分误差:
我们写出matlab代码:
1 |
|
终端输出为:
1 |
|
结果如图所示:
我们可以看到经过GA优化的PID其性能小幅度提高,但是其输出力度下降。
总结
本期介绍了一些先进的控制算法,下一期就是最后的机器人学基础的控制章的最后一章了,之后会结合ROS进行相关仿真开发,希望读者可以学到一些先进技术。