LQR的原理和步骤

LQR（线性二次调节器）是一种最优控制策略，用于线性时间不变系统。LQR旨在最小化一个关于系统状态和控制输入的二次代价函数。下面是LQR的原理和基本步骤：

LQR的目标是找到一个状态反馈控制器，使得以下的二次代价函数达到最小：

J = \int_{0}^{\infty} (x (t)^{T} Q x (t) + u (t)^{T} R u (t)) d t

其中：

以下是设计LQR控制器的基本步骤：

\begin{aligned} \dot{x} (t) = A x (t) + B u (t) \\ y (t) = C x (t) \end{aligned}

$A$ $B$ $C$ 是系统的状态空间矩阵。

求解Riccati方程 $J$ $u(t) = -Kx(t)$ ，需要求解连续时间阿尔杰布拉-里卡提方程(Continuous-Time Algebraic Riccati Equation, CARE)：
$A^{T} P + P A - P B R^{- 1} B^{T} P + Q = 0$
$P$ 是一个对称正定矩阵。
计算状态反馈增益 $P$ $K$ ：
$K = R^{- 1} B^{T} P$
实施控制律：使用计算得到的增益 ( K ) 控制系统。控制律为：
$u (t) = - K x (t)$

在实际应用中，可以使用现有的软件工具，如MATLAB的Control System Toolbox，来自动执行上述步骤并设计LQR控制器。

总之，LQR控制策略提供了一种方法来确定状态反馈增益，使得给定的二次代价函数达到最小。这种策略特别适用于线性系统，并已在各种应用中被证明是非常有效的。