Hashin-Shtrikman 变分原理的特点

发表于 2025-11-14 更新于 2026-03-03 分类于细观力学阅读次数：

本文旨在阐述，为什么 Hashin-Shtrikman 变分原理能够得到相对 Voigt-Reuss 上下界更紧致的估计，并作为一种常见的变分技巧被广泛应用？一个简短的答案是：H-S 提供了一种技巧，放松了试验函数空间对连续性的约束条件。这就可以显式构造更复杂的试验函数，所以得到更准确的估计。

Voigt-Reuss 上下界

如果指定线性位移边界条件 \(\boldsymbol{u}|_{\partial\Omega} = \boldsymbol{\varepsilon}_{0}\cdot\boldsymbol{x}\)，那么最小势能原理要求真实位移解 \(\check{\boldsymbol{u}}\) 是如下变分问题的解： \[ \begin{equation} \check{\boldsymbol{u}} =\mathop{\mathrm{argmin}}_{\boldsymbol{u}\in \mathcal{U}}\ \Pi_{\boldsymbol{u}}(\boldsymbol{u}) = \frac{1}{2}\int_{\Omega} \nabla_{s}\boldsymbol{u}:\mathbb{L}:\nabla_{s}\boldsymbol{u} \ \mathrm{d}\Omega, \quad \mathcal{U} \triangleq \{ \boldsymbol{u} \mid \boldsymbol{u} \in H^{1},\ \boldsymbol{u}|_{\partial\Omega} = \boldsymbol{\varepsilon}_{0}\cdot\boldsymbol{x} \}, \label{eq:min_potential} \end{equation} \]

以及可以通过上述泛函的最小值 \(\check{\Pi}_{\boldsymbol{u}}\) 定义等效模量 \(\mathbb{L}_{\boldsymbol{u}}^{c}\)： \[ \frac{1}{2}|\Omega| \boldsymbol{\varepsilon}_{0} : \mathbb{L}_{\boldsymbol{u}}^{c} : \boldsymbol{\varepsilon}_{0} \triangleq \check{\Pi}_{\boldsymbol{u}}. \] 上下界的估计需要显示给出位移场的表达式，并且满足式 \(\eqref{eq:min_potential}\) 中的约束条件。最简单的构造方式是将位移场在边界处的表达式直接延拓到区域 \(\Omega\) 内，\(\hat{\boldsymbol{u}} = \boldsymbol{\varepsilon}_{0} \cdot\boldsymbol{x}\)，代入到变分问题中得到对等效模量上界的 Voigt 估计 \[ \frac{1}{2}|\Omega| \boldsymbol{\varepsilon}_{0} : \mathbb{L}_{\boldsymbol{u}}^{c} : \boldsymbol{\varepsilon}_{0} \leq \frac{1}{2}|\Omega| \boldsymbol{\varepsilon}_{0} : \left\langle \mathbb{L} \right\rangle : \boldsymbol{\varepsilon}_{0} \Rightarrow \mathbb{L}_{\boldsymbol{u}}^{c} \leq \mathbb{L}. \] 类似的，如果指定均匀应力边界条件 \(\boldsymbol{\sigma}|_{\partial \Omega} = \boldsymbol{\sigma}_{0}\)，那么最小余能原理要求真实的应力场 \(\check{\boldsymbol{\sigma}}\) 是如下变分问题的解： \[ \begin{equation} \check{\boldsymbol{\sigma}} =\mathop{\mathrm{argmin}}_{\boldsymbol{\sigma}\in \mathcal{S}}\ \Pi_{\boldsymbol{\sigma}}(\boldsymbol{\sigma}) = \frac{1}{2}\int_{\Omega} \boldsymbol{\sigma}:\mathbb{M}:\boldsymbol{\sigma} \ \mathrm{d}\Omega, \quad \mathcal{S} \triangleq \{ \boldsymbol{\sigma} \mid \boldsymbol{\sigma} \in L^{2},\ \boldsymbol{\sigma}|_{\partial \Omega} = \boldsymbol{\sigma}_{0},\ \boldsymbol{\sigma} \cdot \nabla = \boldsymbol{0} \}, \label{eq:min_cmpl} \end{equation} \] 并通过泛函的最小值 \(\check{\Pi}_{\boldsymbol{\sigma}}\) 定义等效模量 \(\mathbb{L}_{\boldsymbol{\sigma}}^{c}\)： \[ \frac{1}{2}|\Omega| \boldsymbol{\sigma}_{0} : \left( \mathbb{L}_{\boldsymbol{\sigma}}^{c} \right)^{-1} : \boldsymbol{\sigma}_{0} \triangleq \check{\Pi}_{\boldsymbol{\sigma}}. \] 同样，使用边界到区域内的自然延拓（也即内部应力场均匀分布），就可以得到对等效模量下界的 Reuss 估计： \[ \frac{1}{2}|\Omega| \boldsymbol{\sigma}_{0} : (\mathbb{L}_{\boldsymbol{\sigma}}^{c})^{-1} : \boldsymbol{\sigma}_{0} \leq \frac{1}{2}|\Omega| \boldsymbol{\sigma}_{0} : \langle \mathbb{L}^{-1} \rangle : \boldsymbol{\sigma}_{0} \Rightarrow \langle \mathbb{L}^{-1} \rangle^{-1} \leq \mathbb{L}_{\boldsymbol{\sigma}}^{c}. \] 注意，以上分别是在不同的边界条件下得到的等效模量 \(\mathbb{L}_{\boldsymbol{u}}^{c}\) 和 \(\mathbb{L}_{\boldsymbol{\sigma}}^{c}\)，一般并不相同，但如果应用 Hill 给出的代表性体积元的概念——等效模量与边界条件的类型无关——重定义与边界条件无关的等效模量 \(\mathbb{L}^{c}\triangleq\mathbb{L}_{\boldsymbol{u}}^{c}=\mathbb{L}_{\boldsymbol{\sigma}}^{c}\)，并有如下估计： \[ \begin{equation} \langle \mathbb{L}^{-1} \rangle^{-1} \leq \mathbb{L}^{c} \leq \langle \mathbb{L} \rangle. \label{eq:vrb} \end{equation} \] 如果考虑弹性模量是分片常值分布的，那么上式可以进一步化简为 \[ \begin{equation} \left( \sum_{\alpha=1}^{N} c^{(\alpha)} \mathbb{M}^{(\alpha)} \right)^{-1} \leq \mathbb{L}^{c} \leq \sum_{\alpha=1}^{N} c^{(\alpha)} \mathbb{L}^{(\alpha)} \label{eq:vrb_d} \end{equation} \]

应力场的连续性条件

V-R 上下界的获取仅用到了均匀分布的试验应变场或应力场，并没有应用更多关于材料相分布的信息。因此，为得到一个更加准确的估计，需要构造一个与真实解更加接近的试验场。然而，构造一个除均匀场之外的，通用且随材料相分布不断变化的试验场并不平凡。例如考虑分片常值分布的弹性模量 \(\mathbb{L}\)，在内部的界面 \(\Gamma\) 处不连续，如图所示：

maxmin.001

方程系数 \(\mathbb{L}\) 的不连续性不会对位移可行域 \(\mathcal{U}\) 产生额外的影响，因为位移场保证在内部界面 \(\Gamma\) 处连续；但是，在区域 \(\Omega\) 内显式构造一个 \(H^{1}\) 空间中的函数是困难的。对于应力可行域 \(\mathcal{S}\)，它只要求试验应力场在 \(L^{2}\) 当中，并且满足平衡方程，而分片常值函数恰好满足这两个要求。但是，因为方程系数 \(\mathbb{L}\) 在内部界面 \(\Gamma\) 不连续，这引入对应力场额外对连续性要求： \[ \begin{equation} [\boldsymbol{\sigma}] \cdot \boldsymbol{n} = \boldsymbol{0} \text{ at } \Gamma,\quad [\boldsymbol{\sigma}] = \boldsymbol{\sigma}^{+} - \boldsymbol{\sigma}^{-}. \label{eq:ctn_s} \end{equation} \] 当界面形状非常复杂时，很难找到一个分片常值的应力场，满足界面处的连续性条件 \(\eqref{eq:ctn_s}\)。H-S 变分原理的巧妙之处就在于构造了一个新的泛函，放松了对试验函数在界面处的连续性要求。

HS-变分原理

继续考虑方程系数不连续的问题 \(\eqref{eq:min_potential}\)。额外引入常值模量 \(\mathbb{L}_{0}\)，并将原模量分解为 \(\mathbb{L} = \Delta\mathbb{L} + \mathbb{L}_{0}\)，其中 \(\Delta\mathbb{L}=\mathbb{L}-\mathbb{L}_{0}\)，因此泛函也可以分解成以下两部分： \[ \begin{equation} \Pi_{\boldsymbol{u}}(\boldsymbol{u}) = \underbrace{\frac{1}{2} \int_{\Omega} \nabla_{s}\boldsymbol{u}:\Delta\mathbb{L}:\nabla_{s}\boldsymbol{u} \ \mathrm{d}\Omega}_{\triangleq \Delta \Pi(\boldsymbol{u})} + \underbrace{\frac{1}{2} \int_{\Omega} \nabla_{s}\boldsymbol{u}:\mathbb{L}_{0}: \nabla_{s}\boldsymbol{u} \ \mathrm{d}\Omega}_{\triangleq \Pi_{0}(\boldsymbol{u})}. \label{eq:fc_df} \end{equation} \] 如果保证 \(\Delta \mathbb{L}\) 正定，那么泛函 \(\Delta\Pi\) 是一个关于 \(\nabla \boldsymbol{u}\) 的正定的二次型，因此可以通过 Young-Fechel 变换得到等价的形式： \[ \frac{1}{2} \int_{\Omega} \nabla\boldsymbol{u}:\Delta \mathbb{L}:\nabla\boldsymbol{u} \ \mathrm{d}\Omega = \max_{\boldsymbol{p}} \int_{\Omega} \left( \boldsymbol{p} : \nabla\boldsymbol{u} - \frac{1}{2}\boldsymbol{p}:\Delta\mathbb{L}^{-1}:\boldsymbol{p} \right) \ \mathrm{d}\Omega. \] 于是原变分问题就可以写成它的对偶形式： \[ \begin{equation} \begin{aligned} \min_{u\in\mathcal{U}}\Pi_{\boldsymbol{u}}(\boldsymbol{u}) &= \min_{\boldsymbol{u}\in\mathcal{U}} \max_{\boldsymbol{p}\in\mathcal{P}} \int_{\Omega} \left( \frac{1}{2} \nabla\boldsymbol{u} : \mathbb{L}_{0} \cdot\nabla\boldsymbol{u} + \boldsymbol{p} : \nabla\boldsymbol{u} - \frac{1}{2}\boldsymbol{p}:\Delta\mathbb{L}^{-1}:\boldsymbol{p} \right) \ \mathrm{d}\Omega\\ &= \max_{\boldsymbol{p}\in\mathcal{P}} \left[ \min_{\boldsymbol{u}\in\mathcal{U}} \Phi(\boldsymbol{u},\boldsymbol{p}) - \int_{\Omega} \frac{1}{2}\boldsymbol{p}:\Delta\mathbb{L}^{-1}:\boldsymbol{p} \ \mathrm{d}\Omega \right], \end{aligned} \label{eq:dual} \end{equation} \] 式中， \[ \begin{equation} \Phi(\boldsymbol{u},\boldsymbol{p}) \triangleq \int_{\Omega} \left( \frac{1}{2} \nabla\boldsymbol{u} : \mathbb{L}_{0} :\nabla\boldsymbol{u} + \boldsymbol{p} : \nabla\boldsymbol{u} \right) \ \mathrm{d}\Omega. \label{eq:df_hs_phi} \end{equation} \] 这时就可以解释为什么要引入额外的模量 \(\mathbb{L}_{0}\)。式 \(\eqref{eq:df_hs_phi}\) 中泛函 \(\Phi\) 是关于 \(\nabla\boldsymbol{u}\) 的二次型泛函，并存在只与 \(\boldsymbol{p}\) 相关的下界： \[ \begin{aligned} \Phi(\boldsymbol{u},\boldsymbol{p}) &= \int_{\Omega} \frac{1}{2} \left(\nabla\boldsymbol{u} + \mathbb{L}_{0}^{-1}:\boldsymbol{p} \right) : \mathbb{L}_{0} : \left(\nabla\boldsymbol{u} + \mathbb{L}_{0}^{-1}:\boldsymbol{p} \right) \ \mathrm{d}\Omega - \int_{\Omega} \frac{1}{2} \boldsymbol{p} : \mathbb{L}_{0}^{-1} : \boldsymbol{p} \ \mathrm{d}\Omega \\ &\geq -\int_{\Omega} \frac{1}{2} \boldsymbol{p} : \mathbb{L}_{0}^{-1} : \boldsymbol{p} \ \mathrm{d}\Omega. \end{aligned} \] 所以，\(\min_{\boldsymbol{u}\in\mathcal{U}} \Phi(\boldsymbol{u},\boldsymbol{p})\) 存在极小值的必要条件仅要求函数 \(\boldsymbol{p}\) 平方可积。如果去除式 \(\eqref{eq:df_hs_phi}\) 中的二次项，那么泛函 \(\Phi\) 将是关于 \(\boldsymbol{u}\) 的线性泛函，因此最小值等于平凡的 \(-\infty\)，除非变量 \(\boldsymbol{p}\) 满足 \(\boldsymbol{p}\cdot\nabla=0\)，以及界面条件 \(\eqref{eq:ctn_s}\)，这才能使得式 \(\eqref{eq:dual}\) 中对偶泛函是适定的。这就回退到最小余能原理的形式 \(\eqref{eq:min_cmpl}\)。