矩阵值函数的微分运算

我们考虑的矩阵值函数, 其每个元素是关于 \(t\) 的单变量函数: \[ A(t) = [a_{ij}(t)] \]\(\mathbb{R} \mapsto \mathbb{R}^n\) 上的函数几乎可以将单变量函数的微分运算直接平推, 只要确定了范数度量 \(\|\cdot\|\) (从 \(\mathbb{R} \mapsto \mathbb{R}^n\) 的函数就没有那么平凡).

考虑如下微分 \[ \frac{\mathrm{d}~}{\mathrm{d} t} e^{At} = \frac{\mathrm{d}~}{\mathrm{d} t} \sum_{k=0}^{\infty} \frac{t^k}{k!}A^k = A\sum_{k=1}^{\infty} \frac{t^{k-1}}{(k-1)!}A^{k-1} = A e^{At} = e^{At} A \]\(\det A(t)\) 的导数, 可以有两种方式看. 一种是利用定义 \[ \det A(t) = \sum_{\{\sigma_i\}} (-1)^{\mathrm{sign} \{\sigma_i\}} a_{1\sigma_1}(t) a_{2\sigma_2}(t) \ldots a_{n\sigma_n}(t) \] 根据导数定义 \[ \det A(t+h) - \det A(t) \\ = \sum_{\{\sigma_i\}} (-1)^{\mathrm{sign} \{\sigma_i\}} (a_{1\sigma_1}(t+h) a_{2\sigma_2}(t+h) \ldots a_{n\sigma_n}(t+h) - a_{1\sigma_1}(t) a_{2\sigma_2}(t) \ldots a_{n\sigma_n}(t)) \\ = \sum_{\{\sigma_i\}} (-1)^{\mathrm{sign} \{\sigma_i\}} (a'_{1\sigma_1} a_{2\sigma_2} \ldots a_{n\sigma_n} + a_{1\sigma_1} a'_{2\sigma_2} \ldots a_{n\sigma_n} + \cdots + a_{1\sigma_1} a_{2\sigma_2} \ldots a'_{n\sigma_n}) \\ = \det(A'_1, A_2, \ldots, A_n) + \det(A_1, A'_2, \ldots, A_n) + \ldots + \det(A_1, A_2, \ldots, A'_n) \] 另一种证明要用到如下结论: 对于特征多项式 \(\det (A + \lambda I)\), 是关于 \(\lambda\)\(n\) 阶多项式, 多项式的前两项系数为 \[ \det (A + \lambda I) = \lambda^n + (\mathrm{tr} A )\lambda^{n-1} + \cdots + \det A \] 可以通过递归方法证明. \[ \det A(t+h) = \det [A(t) + h A'(t) + o(h)] = \det A(t) \det [I + h A^{-1}(t)A'(t) + o(h)] \\ = \det A(t) (1 + h\mathrm{tr}(A^{-1}A') + o(h) ) \] 因此 \[ \frac{\mathrm{d}~}{\mathrm{d} t} \det A(t) = \det A ~\mathrm{tr}(A^{-1}A') \] 上式要求 \(A(t)\) 可逆, 对于更一般的矩阵 \(A(t)\), 可以通过 adjugate 矩阵表示 \[ \frac{\mathrm{d}~}{\mathrm{d} t} \det A(t) = \mathrm{tr}(\mathrm{adj}(A) A') = \mathrm{cof}(A) : A' \] 积分得到 \[ \det A(t) = \det A(0) e^{\int_0^t \mathrm{tr}(A^{-1}(s)A'(s)) ~\mathrm{d}s} \] 如果将 \(A(t) = e^{At}\) 代入, 就会得到很有意思的等式 \[ \int_0^t \mathrm{tr}(e^{-As} A e^{As}) ~\mathrm{d}s = \mathrm{tr}(A)t \] 所以 \[ \det e^{At} = e^{\mathrm{tr}(A)t} \]