变分与微分法则形式一致性的说明
这篇文章旨在解释为什么在计算变分时,在形式上与计算微分是如此相似。这需要在符号以及符号遵循的规则之外,理解微分或变分究竟是什么。如果将一阶微分或变分解释成各自对偶空间中的线性泛函,那么就可以通过线性泛函的运算规律,说明为什么微分和变分运算在形式上是一致的。
一阶变分的重定义
对如下泛函 \[ \begin{equation} \Pi(\boldsymbol{u}) = \int_{\Omega} F(\boldsymbol{x},\boldsymbol{u},\nabla\boldsymbol{u}) \,\mathrm{d}V, \quad \boldsymbol{u}\in \mathcal{V}, \quad \mathcal{V} = \{ \boldsymbol{v} \mid \boldsymbol{v}\in H^1, \boldsymbol{v}|_{\partial\Omega_{u}} = \boldsymbol{v}_{0} \}, \label{eq:functional_def} \end{equation} \] 其关于 \(\boldsymbol{\eta}\) 的 Gâteaux 导数等于 \[ \begin{equation} D_{g}\Pi(\boldsymbol{u};\boldsymbol{\eta}) = \int_{\Omega} \frac{\partial F}{\partial \boldsymbol{u}} \cdot \boldsymbol{\eta} + \frac{\partial F}{\partial \nabla\boldsymbol{u}}:\nabla\boldsymbol{\eta} \,\mathrm{d}V. \label{eq:vari_1} \end{equation} \]
容易验证,式 \(\eqref{eq:vari_1}\) 在点 \(\boldsymbol{u}\) 处定义了测试函数空间 \(\mathcal{V}_{0}=\{ \boldsymbol{v} \mid \boldsymbol{v}\in H^1, \boldsymbol{v}|_{\partial\Omega_{u}} = \boldsymbol{0} \}\) 上的线性泛函,线性泛函组成的空间称为对偶空间,记作 \(\mathcal{V}_{0}^{*}\)。另一方面,根据变分的定义,该线性泛函其实就是泛函 \(\Pi\) 在点 \(\boldsymbol{u}\) 处的一阶变分: \[ \begin{equation} \delta\Pi(\boldsymbol{u}) = \int_{\Omega} \frac{\partial F}{\partial \boldsymbol{u}} \cdot \delta\boldsymbol{u} + \frac{\partial F}{\partial \nabla\boldsymbol{u}}:\nabla\delta\boldsymbol{u} \,\mathrm{d}V = D_{g}\Pi(\boldsymbol{u};\delta\boldsymbol{u}). \label{eq:vari_def} \end{equation} \]
因此,泛函在点 \(\boldsymbol{u}^{*}\) 处取极值的必要条件——其一阶变分等于零:\(\delta\Pi =0\)——另一种表述是:泛函在点 \(\boldsymbol{u}^{*}\) 处的 Gâteaux 导数是对偶空间 \(\mathcal{V}_{0}^{*}\) 中的零元素。
以上提供了另一种理解函数导数的思路:除了将导数(单变量函数)、方向导数(多变量函数)或变分理解为在原定义域上的新函数之外,还可以理解为在每一个导数有定义的点处定义了对应的线性泛函,并写成了微分或变分的形式。例如对于多变量函数 \(f(x,y,z)\),微分表达式为 \[ \mathrm{d} f = \frac{\partial f}{\partial x} \ \mathrm{d}x + \frac{\partial f}{\partial y} \ \mathrm{d}y + \frac{\partial f}{\partial z} \ \mathrm{d}z. \] \(\mathrm{d}f\) 应该理解为 \(\mathbb{R}^{3}\) 空间中的线性泛函,由有限维空间中的 Rieze 表示定理可知,\(\mathbb{R}^{3}\) 空间中的线性泛函与 \(\mathbb{R}^{3}\) 中的元素一一对应,在本问题中,\(\mathrm{d}f\) 就等价为 \[ \mathrm{d}f \sim \left( \frac{\partial f}{\partial x} \ \frac{\partial f}{\partial y} \ \frac{\partial f}{\partial z} \right). \]
变分与微分法则在形式上的一致性
在从线性泛函的角度重新定义变分 \(\eqref{eq:vari_def}\) 之后,就不难理解变分法则遵循着与微分法则类似的公式: \[ \delta ( \alpha f + \beta g ) = \alpha \delta f + \beta \delta g, \\ \delta (f \otimes g) = (\delta f)\otimes g + f\otimes(\delta g). \] 以上给出的是加法和乘法法则,\(\otimes\) 可以表示点积,叉积等类乘法运算。因为复合函数和除法还需要指定函数等定义域和值域,所以不在此处列出。除以上法则之外,可能需要额外说明的是在求偏导数或积分运算下的变分法则。这里假设求极限和微分/积分总能交换顺序,因此有 \[ \delta ( \nabla f ) = \nabla ( \delta f ), \quad \delta \left( \int_{\Omega} f \,\mathrm{d}V \right) = \int_{\Omega} \delta f \,\mathrm{d}V. \]
其它与变分相关的内容
以下列出的变分相关的公式与这篇文章的主题无关。
若泛函包含多个 depend variables,例如 \(\Pi=\Pi( \boldsymbol{u},\boldsymbol{\varepsilon},\boldsymbol{\sigma} )\),此时该泛函的变分等于对各个变量的 partial 变分: \[ \delta \Pi = \delta_{\boldsymbol{u}} \Pi + \delta_{\boldsymbol{\varepsilon}}\Pi + \delta_{\boldsymbol{\sigma}}\Pi. \]
泛函的高阶变分可以通过一元函数 \(I(\epsilon) = \Pi(\boldsymbol{u}+\epsilon \boldsymbol{\eta})\) 在 \(\epsilon=0\) 处的 Taylor 展开得到: \[ I(\epsilon) = I(0) + \underbrace{\epsilon \left.\frac{\mathrm{d} I}{\mathrm{d} \epsilon} \right|_{\epsilon=0}}_{\delta\Pi} + \underbrace{\frac{\epsilon^2}{2} \left.\frac{\mathrm{d}^2 I}{\mathrm{d} \epsilon^2} \right|_{\epsilon=0}}_{\delta^2\Pi} + \cdots + \underbrace{\frac{\epsilon^n}{n!} \left.\frac{\mathrm{d}^n I}{\mathrm{d} \epsilon^n} \right|_{\epsilon=0}}_{\delta^n\Pi} + \cdots. \]