变分与微分法则形式一致性的说明

发表于 2025-10-30 更新于 2026-06-24 分类于数学阅读次数：

这篇文章旨在解释为什么在计算变分时，在形式上与计算微分是如此相似。这需要在符号以及符号遵循的规则之外，理解微分或变分究竟是什么。如果将一阶微分或变分解释成各自对偶空间中的线性泛函，那么就可以通过线性泛函的运算规律，说明为什么微分和变分运算在形式上是一致的。

一阶变分的重定义

对如下泛函 \[ \begin{equation} \Pi(\boldsymbol{u}) = \int_{\Omega} F(\boldsymbol{x},\boldsymbol{u},\nabla\boldsymbol{u}) \,\mathrm{d}V, \quad \boldsymbol{u}\in \mathcal{V}, \quad \mathcal{V} = \{ \boldsymbol{v} \mid \boldsymbol{v}\in H^1, \boldsymbol{v}|_{\partial\Omega_{u}} = \boldsymbol{v}_{0} \}, \label{eq:functional_def} \end{equation} \] 其关于 \(\boldsymbol{\eta}\) 的 Gâteaux 导数等于 \[ \begin{equation} D_{g}\Pi(\boldsymbol{u};\boldsymbol{\eta}) = \int_{\Omega} \frac{\partial F}{\partial \boldsymbol{u}} \cdot \boldsymbol{\eta} + \frac{\partial F}{\partial \nabla\boldsymbol{u}}:\nabla\boldsymbol{\eta} \,\mathrm{d}V. \label{eq:vari_1} \end{equation} \]

容易验证，式 \(\eqref{eq:vari_1}\) 在点 \(\boldsymbol{u}\) 处定义了测试函数空间 \(\mathcal{V}_{0}=\{ \boldsymbol{v} \mid \boldsymbol{v}\in H^1, \boldsymbol{v}|_{\partial\Omega_{u}} = \boldsymbol{0} \}\) 上的线性泛函，线性泛函组成的空间称为对偶空间，记作 \(\mathcal{V}_{0}^{*}\)。另一方面，根据变分的定义，该线性泛函其实就是泛函 \(\Pi\) 在点 \(\boldsymbol{u}\) 处的一阶变分： \[ \begin{equation} \delta\Pi(\boldsymbol{u}) = \int_{\Omega} \frac{\partial F}{\partial \boldsymbol{u}} \cdot \delta\boldsymbol{u} + \frac{\partial F}{\partial \nabla\boldsymbol{u}}:\nabla\delta\boldsymbol{u} \,\mathrm{d}V = D_{g}\Pi(\boldsymbol{u};\delta\boldsymbol{u}). \label{eq:vari_def} \end{equation} \]

因此，泛函在点 \(\boldsymbol{u}^{*}\) 处取极值的必要条件——其一阶变分等于零：\(\delta\Pi =0\)——另一种表述是：泛函在点 \(\boldsymbol{u}^{*}\) 处的 Gâteaux 导数是对偶空间 \(\mathcal{V}_{0}^{*}\) 中的零元素。

以上提供了另一种理解函数导数的思路：除了将导数（单变量函数）、方向导数（多变量函数）或变分理解为在原定义域上的新函数之外，还可以理解为在每一个导数有定义的点处定义了对应的线性泛函，并写成了微分或变分的形式。例如对于多变量函数 \(f(x,y,z)\)，微分表达式为 \[ \mathrm{d} f = \frac{\partial f}{\partial x} \ \mathrm{d}x + \frac{\partial f}{\partial y} \ \mathrm{d}y + \frac{\partial f}{\partial z} \ \mathrm{d}z. \] \(\mathrm{d}f\) 应该理解为 \(\mathbb{R}^{3}\) 空间中的线性泛函，由有限维空间中的 Rieze 表示定理可知，\(\mathbb{R}^{3}\) 空间中的线性泛函与 \(\mathbb{R}^{3}\) 中的元素一一对应，在本问题中，\(\mathrm{d}f\) 就等价为 \[ \mathrm{d}f \sim \left( \frac{\partial f}{\partial x} \ \frac{\partial f}{\partial y} \ \frac{\partial f}{\partial z} \right). \]

变分与微分法则在形式上的一致性

在从线性泛函的角度重新定义变分 \(\eqref{eq:vari_def}\) 之后，就不难理解变分法则遵循着与微分法则类似的公式： \[ \delta ( \alpha f + \beta g ) = \alpha \delta f + \beta \delta g, \\ \delta (f \otimes g) = (\delta f)\otimes g + f\otimes(\delta g). \] 以上给出的是加法和乘法法则，\(\otimes\) 可以表示点积，叉积等类乘法运算。因为复合函数和除法还需要指定函数等定义域和值域，所以不在此处列出。除以上法则之外，可能需要额外说明的是在求偏导数或积分运算下的变分法则。这里假设求极限和微分/积分总能交换顺序，因此有 \[ \delta ( \nabla f ) = \nabla ( \delta f ), \quad \delta \left( \int_{\Omega} f \,\mathrm{d}V \right) = \int_{\Omega} \delta f \,\mathrm{d}V. \]

其它与变分相关的内容

以下列出的变分相关的公式与这篇文章的主题无关。

若泛函包含多个 depend variables，例如 \(\Pi=\Pi( \boldsymbol{u},\boldsymbol{\varepsilon},\boldsymbol{\sigma} )\)，此时该泛函的变分等于对各个变量的 partial 变分： \[ \delta \Pi = \delta_{\boldsymbol{u}} \Pi + \delta_{\boldsymbol{\varepsilon}}\Pi + \delta_{\boldsymbol{\sigma}}\Pi. \]

泛函的高阶变分可以通过一元函数 \(I(\epsilon) = \Pi(\boldsymbol{u}+\epsilon \boldsymbol{\eta})\) 在 \(\epsilon=0\) 处的 Taylor 展开得到： \[ I(\epsilon) = I(0) + \underbrace{\epsilon \left.\frac{\mathrm{d} I}{\mathrm{d} \epsilon} \right|_{\epsilon=0}}_{\delta\Pi} + \underbrace{\frac{\epsilon^2}{2} \left.\frac{\mathrm{d}^2 I}{\mathrm{d} \epsilon^2} \right|_{\epsilon=0}}_{\delta^2\Pi} + \cdots + \underbrace{\frac{\epsilon^n}{n!} \left.\frac{\mathrm{d}^n I}{\mathrm{d} \epsilon^n} \right|_{\epsilon=0}}_{\delta^n\Pi} + \cdots. \]