这两个概念是卡尔曼在20世纪60年代提出的,是现代控制理论中的两个基本概念。
由于能控性只涉及用外部输入来改变系统状态的问题,故只考虑系统的状态方程:
其中, 是 维的状态向量(点), 是 维控制输入向量(点), 和 分别是已知的 和 维实常数矩阵。
定义: 对上述系统的一个状态 ,如果存在一个有限时刻 和时间段 上的控制信号 ,使得在这样一个控制信号(control)作用下,系统状态从 时刻的初始状态 ,转移到 时刻的零状态,即 ,则状态 称为是能控的。若系统的所有状态都是能控的,则称系统是状态完全能控的,简称系统是能控的,有时也记矩阵对 是能控的。
系统的能控性表明:若状态 是能控的,则一定可以通过设计一个适当的控制律(control law),将系统在有限时间内从 转移到零状态。
在实际的控制系统设计中,我们需要控制的往往是输出量,而不是系统的状态。这种情况下,系统状态能控性对实现输出量的控制既不充分也不必要。
输出能控性定义: 对上述系统,若对任意的初始输出 (状态的一个线性组合),存在有限时刻 和在时间段 上定义的控制信号 ,使得在该控制信号作用下,系统的输出从初始输出 转移到任意给定的最终输出 ,则系统称为是 输出完全能控 的,简称输出能控。
在实际控制系统设计中,我们总希望利用描述系统全部动态行为的状态信息来构造反馈控制器,以使得闭环系统具有尽可能满意的性能。但在一个实际的系统中,并不是所有的状态信息都是直接可测量得到的,能够测量的只是系统的输出,因此如何解决这个矛盾?
状态空间模型中的输出方程建立起了系统的状态变量和输出量之间的关系,从而系统的输出信号中或多或少总包含有系统的状态的信息 。那么,是否可以通过观测一段时间内的测量输出信号,或者再结合外加的输入信号(因为输出方程中输出有时也依赖输入信号)来确定出之前某个时刻系统的状态呢?这就是系统状态能否从外部观测或估计的问题,简称系统状态能观性问题。
在讨论能观性条件时,只需要考虑零输入系统:
其中, 是 维的系统状态向量, 是 维的测量输出, 和 分别是已知的 维和 维常数矩阵, 是 时刻的初始状态向量。
之所以只考虑零输入系统,是因为能观性问题考虑的是用外部的已知信号(如输出信号,控制信号)来估计内部的未知状态。由系统运动分析结论可知,从系统状态空间模型可得系统的状态关于时间的响应在给定初始条件 下:
从而,可得系统输出响应:
由于矩阵 均已知, 也已知(控制信号由我们设计),所以上式右端的积分项为已知,将它们移到等式的左边:
上式左边都是已知信号,而右边是带估计的状态 的线性组合。这和上述的零输入系统状态空间模型得到的输出 没有本质区别,即通过左边已知信号来估计右边的未知状态 。因此研究系统的状态估计或观测问题只需考虑零输入状态空间模型即可。
定义: 对上述系统,若以非零初始状态 产生的输出响应恒为零,即对所有的时间 :
则称状态 是不能观的。 若系统中没有不能观的状态(换句话说所有状态都能观),则称系统是完全能观的,简称是能观的, 有时也称矩阵对 是能观的。
系统的输出恒为零表明自治系统在 非零初始状态 的激励下仍然是静止的 ,初始状态对系统输出响应没有任何影响, 即在系统输出中不能反映状态 的任何信息 ,根据定义这样的状态 是不能观的。
在控制工程中,所设计的系统在受到扰动后,尽管系统会偏离原平衡工作点(稳定点),但在扰动消失后,设计者往往希望系统有能力自动回到并保持在原工作点附近,这就是系统稳定的基本含义。
稳定是一个控制系统能正常工作的基本要求,系统只有在稳定的前提下才能进一步探讨其他性能。因此,稳定性问题一直是控制理论中的一个最基本和最重要的问题,控制系统的稳定性分析是系统分析的首要任务。
1892年,俄国数学力学家李雅普诺夫(. Lyapunov)在他的博士论文《运动稳定性的一般问题》中,提出了著名的李雅普诺夫稳定性理论。该理论作为稳定性判别的一般方法,适用于各类动态系统。李雅普诺夫稳定性理论的核心是提出了判别系统稳定性的两种方法,分别被称为李雅普诺夫第一方法和第二方法。
李雅普诺夫第一方法是通过求解系统的动态方程,然后根据解的性质来判断系统的稳定性,其基本思路和分析方法与古典控制理论是一致的。由于需要求出系统动态方程的解后才能判别系统的稳定性,故也称为判别稳定性的李雅普诺夫间接法。
李雅普诺夫第二方法则是一种定性方法,它无需求解复杂的系统微分方程,而是通过 构造一个类似于能量函数的标量李雅普诺夫函数,然后再根据李雅普诺夫函数随时间变化的情况来直接判定系统的稳定性 。因此,它特别适合于那些难以求解的 非线性系统和时变系统 。李雅普诺夫第二方法不仅可以用来分析系统的稳定性,而且还可用于对系统过渡过程特性的评价以及求解参数最优化等问题。李雅普诺夫第二方法最大的优点是它可用于控制系统的设计,从而使得该方法在自动控制的各个分支中都有广泛的应用,是控制理论中最重要的理论和方法之一。
图中小球在没有任何外力作用下,它将保持在B点静止不动(稳态)。若给小球一个外力,使之移动到A点,然后让它做自由运动,则小球做震荡运动由于摩擦力的存在,最后在B点稳定下来并静止。
稳定性指的是系统在平衡状态下收到干扰后,系统自由运动的性质。 上述描述中,小球最终又稳定在了原平衡点,则这样的系统是稳定的。若小球初始静止状态在D点,则当小球受到干扰后,小球不能再回到D点,这样的系统是不稳定的。
在以上小球运动分析中有几个关键的概念。第一个就是 平衡状态 ,图中B点和D点处的状态就是平衡状态,即小球处于静止状态。其次是扰动,小球在受到外部干扰后偏离平衡状态,然后在没有任何外力和扰动作用下做自由运动(自治系统的自由运动)。因此, 小球受到的干扰只是初始干扰,而非持续干扰,这就是李雅普诺夫稳定性所处理干扰的特点,从而诸如持续风力干扰等(持续的输入干扰)就不在李雅普诺夫稳定性分析范围之内。 最后,系统的稳定与否依赖于小球受干扰前所处的平衡位置,如小球在B点是稳定的,在D点是不稳定的。因此,系统的稳定与否和平衡状态相关, 系统稳定性仅仅指的是在某个平衡状态处的稳定性(稳定性都是相对于某个平衡状态而言的)。 但若系统只有唯一的平衡状态,则在该平衡状态处的稳定性就可视为整个系统的稳定性;若具有多个平衡状态的系统,其稳定性必须逐个讨论。
由于稳定性是系统在自由运动下的特性,故只需要考虑自治系统:
对上述系统而言,若存在状态向量 ,使得对所有时间 ,都有
则称 为系统的 平衡状态或平衡点 。事实上,平衡状态指的就是系统的静止状态(稳态)。并不是所有的系统都一定存在平衡状态,有时即使存在也未必是唯一的。
以下总是假定原点 是系统 的平衡状态,即 对所有时间 成立。为了分析系统在原点处的稳定性,需要确定系统状态 偏离原点的距离 。在一般的 维实数空间中,点 到原点的距离定义为:
其中, 称为向量的2范数。
表示以原点为中心,半径为 的球域 。当 很小时,球域 也称为原点的一个邻域。
考虑系统的状态轨迹 , 对所有的时间 成立表明系统的这一状态轨迹在原点的一个小邻域中。对应于图1,相当于小球始终在B点附近。
在图1中,若要使小球运动轨迹不超过A点的高度,则只要初值位置的高度不超过A点高度,就可以保证在以后所有时间内,小球运动时的高度都不会超过A点的高度。对应于定义1,给定A点高度就相当于任意给定 ,存在 的和A点高度相等.
从几何上来看,定义1所定义的系统稳定性意味着:对任意选择的一个球域 ,必存在另一个球域 ,使得对所有的时间 ,始于球域 中(初始状态在球域 内,该球域表示了偏离平衡状态 的界)的状态轨迹总不脱离球域 (注意:球域 是任意的)。
在图1中,随着时间 趋向于无穷,在B点附近出发运动的小球在摩擦力作用下慢慢回到平衡状态B点,因此B点处的平衡状态是在李雅普诺夫意义下渐进稳定的。
图3和图4表明了所考虑的二阶系统在原点处的渐进稳定性。从图中可以清楚地看出,当时间 无限增加时,从球域 出发的状态轨迹不仅不会超出球域 ,而且最终收敛到原点。图3反映了状态轨迹 的 有界性和渐进性; 图4对状态轨迹 随时间变化的状况表示得更为清晰,它反映了初始状态在 内的状态轨迹随时间的推移,从球域 范围内被 压缩 到球域 范围内。
本文讨论的稳定性都是李雅普诺夫意义下的稳定性。在实际应用中,渐进稳定性比稳定性更重要,渐进稳定性表明系统能完全消除扰动的影响。同时需要注意的是, 渐进稳定性只是一个局部的概念,它依赖系统的平衡状态。 所以简单地确定了系统的渐进稳定性并不意味着系统能正常工作,通常有必要确定系统渐进稳定性的最大范围,即确定在多大范围内出发的状态轨迹将渐进趋向于所考虑的平衡状态。
由于从状态空间中任意点出发的状态轨迹都要收敛于原点,因此,大范围渐进稳定的系统在整个状态空间中只能有一个平衡状态,这也是系统大范围渐进稳定的必要条件。
图1中的平衡状态D点就复合定义4的条件,因此是不稳定的。在图5中,状态轨迹离开了球域,这说明平衡状态是不稳定的。然而,这种情况未必意味着状态轨迹一定将趋于无穷远处。比如图1中的D点虽然不稳定,但随着时间的推移最后可能趋向于另一个平衡点B。
在稳定、渐进稳定和大范围渐进稳定这些定义中的 一般总是与 和 有关。但很多时候 却与初始时间 是无关的,此时可进一步称系统为一致稳定、一致渐进稳定和一致大范围渐进稳定。
首先分析图1所示小球运动系统B点的稳定性。在一个初始外力的作用下,小球偏离原先的平衡状态到达A点(外力的作用给了小球能量),然后小球做自由运动(不受任何外力)。根据高中物理知识,小球不断做往复运动,能量(动、势能)不断转换。在这个过程中,系统没有从外部吸收能量(无外界输入),故系统总能量从不会增加(单调递减)。其次,在摩擦力的作用下,将消耗系统一定的能量,意味着系统最大的势能在减小,从而小球运动的最高点的高度不断下降。随着时间推移,系统总能量不断减少,最后系统的动能势能都将为零,小球静止在B点。这就是小球在B平衡点处的稳定性。
上面的例子说明系统的能量与系统稳定性之间的密切关系。那么这种能量与系统稳定性之间的关系能不能推广到更一般的系统呢?经过深入分析,李雅普诺夫给出了肯定的答案。然而,一般的系统未必具有那样物理意义清晰的能量函数。为此,李引入了 虚拟能量函数 的概念,并根据该虚拟能量函数沿系统状态轨迹随时间的变化情况,提出了一般系统基于能量函数的李雅普诺夫稳定性分析方法。
定理1: 考虑非线性系统:
原点是该系统的平衡状态,即 。如果 存在 一个具有连续一阶偏导数的标量函数 ,且满足一下条件: (1) 是正定的(标量函数恒大于0); (2)沿系统任意轨迹, 关于时间 的导数 是负定的; 则系统在原点处的平衡状态是 渐进稳定的 。满足以上条件(1)和(2)的标量函数 称为是系统的一个 李雅普诺夫函数。 进而,若 时,有 (径向无穷大),则在原点处的平衡状态 是大范围渐进稳定的。
(1)定理1给出的系统稳定性条件仅仅是充分的,即如果找到一个李雅普诺夫函数 ,则系统一定是渐进稳定的。但若找不到这样的李雅普诺夫函数,并不能说明系统是不稳定的。 (2)对于非线性系统,通过构造具体的李雅普诺夫函数,可以证明系统在某个稳定域内是渐进稳定的,但这并不意味着稳定域外的运动就是不稳定的。然后,可以证明:对于线性系统,如果存在渐进稳定的平衡点,则它必定是大范围渐进稳定的。 (3)若定理1条件(2)中的 是半负定的,则系统在平衡状态是稳定的。 (4)定理1既适用于线性系统、非线性系统,也适用于定常系统、时变系统。
注意:定理1中关于 必须是负定的条件还是比较苛刻的,因为它要求对所有非零的 , 都小于零。而事实上, 只需要在系统的状态轨迹上 是减少的,即在系统的状态轨迹上 小于零就可以了。
定理2: 考虑非线性系统:
原点是系统的平衡状态。若存在具有连续一阶偏导数的标量函数 ,满足以下条件: (1) 是正定的; (2)沿系统的任意轨迹, 关于时间的导数 是半负定的; (3)在系统的任意轨迹上, 不恒等于零; (4)当 时,有 ,则在原点处的平衡状态 是大范围渐进稳定的。
定理3 :考虑非线性系统:
原点是系统的平衡状态。若存在具有连续一阶偏导数的标量函数 ,满足以下条件: (1) 在原点附件的某一领域内是正定的; (2) 在同样的领域内也是正定的。 则系统在原点处的平衡状态是不稳定的。
显然,当 正定时,表示系统的能量在不断增大(不可能保持在原点的小邻域内),故系统的状态必将发散,远离原点。所以,系统是不稳定的。
李雅普诺夫稳定性方法在控制系统分析和设计中有着广泛的应用。它不仅可以用来判别一个系统(可以是非线性、时变)的稳定性,或者确定系统中某些参数的取值范围,使得系统保持稳定,还可以用于设计使得闭环系统稳定的控制器,即稳定化控制器的设计;线性系统时间常数的估计;确定系统的最优参数等。
考虑线性系统:
其中, 是系统的 维状态向量,系统矩阵中含有可调参数 。一般的,参数 不仅可以影响系统的稳定性,而且还可以影响系统的动态特性。因此,希望选取最优参数 ,使得系统不仅是渐近稳定的,同时还使得系统的性能指标:
最小化,其中 是对称正定加权矩阵,可以根据任务设计。这样一个问题称为参数优化问题,其目的在于保证系统稳定的前提下,使得系统具有较好的过渡特性(动态过程)。性能指标 越小,系统状态衰减到零的速度就越快,调节时间越短,震荡幅度也越小,故动态性能就越好。
我们可以用李雅普诺夫稳定性分析方法有效地解决这个问题,这种方法不仅能保证所求得的参数使系统渐近稳定,而且可以避免求解系统状态的微分方程和性能指标积分。
由于选择的参数 要保证系统是渐近稳定的,则必须对 任意给定的对称正定矩阵 ,李雅普诺夫方程:
存在唯一对称正定矩阵 (该矩阵需要我们去找)。此时, 是系统的一个李雅普诺夫函数,且沿着系统任意轨迹,李雅普诺夫函数的导数 :
两边分别对时间 积分,并利用系统的渐近稳定性:
因此,
由于矩阵 为任意对称正定阵,我们选 ,则可得:
其中矩阵 满足李雅普诺夫方程:
因此,我们得到了系统的性能指标可以通过求解以上一个 静态的李雅普诺夫矩阵方程 来计算,显然这比求解一个微分方程和积分要简单得多。从李雅普诺夫方程可以看出,李雅普诺夫矩阵 依赖参数 。因此,
从而,原来的参数优化问题,转为求解参数 使得 最小。由于 是凸的,我们可以通过求一个无约束的极值问题,得到参数 的解析解,一般情况下参数 的取值与初始状态 有关。
特别地,从LQR的视角我们还可以知道,求得的最优李雅普诺夫矩阵 就是在给定加权矩阵 和初始状态 下系统的 最优值函数 。