下册 7.5 多元函数微分的应用 第6题
📝 题目
6.设 $f(x), x \in \mathbf{R}^{n}$ 存在二阶连续偏导数,$\nabla f(x)$ 表示 $f(x)$ 的梯度,$\nabla^{2} f(x)=\left(h_{i j}\right)_{n \times n}$ 表示 $f(x)$的 Hesse 矩阵,其中 $\displaystyle h_{i j}=\frac{\partial^{2} f}{\partial x_{i} \partial x_{j}}(i, j=1,2, \cdots, n)$ .
(1)设 $a \in \mathbf{R}^{n}$ 是 $f(x)$ 的稳定点,即:$\nabla f(a)=0$ .如果 $\nabla^{2} f(x)$ 在 $x=a$ 处正定,证明 $a$ 是 $f(x)$ 的一个局部极小值点。
(2)设 $f(x)$ 的 Hesse 矩阵在所有 $x \in \mathbf{R}^{n}$ 点处正定,证明 $f(x)$ 至多有一个稳定点.
💡 答案解析
\section*{解题过程:}
(1)由于 $\displaystyle f(x)-f(a)=\nabla f(a) \cdot(x-a)+\frac{1}{2}(x-a)^{\top} \nabla^{2} f(a)(x-a)+o\left(\|x-a\|^{2}\right), \nabla f(a)=0$ ,所以对 $\xi \in \mathbf{R}^{n},\|\xi\|=1$ 有
$$
\xi^{\top} \nabla^{2} f(a) \xi \geqslant C>0
$$
则当 $\|x-a\|$ 充分小时有
$$
\frac{f(x)-f(a)}{\|x-a\|}=\frac{1}{2}\left(\frac{x-a}{\|x-a\|}\right)^{\top} \nabla^{2} f(a)\left(\frac{x-a}{\|x-a\|}\right)+o(1)>0 .
$$
对 $a$ 的某个邻域中的点 $x, x \neq a$ 有 $f(x)>f(a)$ .所以 $a$ 是 $f(x)$ 的一个局部极小值点.
(2)用反证法.假若 $f(x)$ 有两个稳定点 $a, b \in \mathbf{R}^{n}, \nabla f(a)=0, \nabla f(b)=0$ ,则
$$
\nabla f(a)-\nabla f(b)=\int_{0}^{1} \frac{\mathrm{~d}}{\mathrm{~d} t} \nabla f(t a+(1-t) b) \mathrm{d} t=\int_{0}^{1} \nabla^{2} f(t a+(1-t) b)(a-b) \mathrm{d} t
$$
另一方面,由 $\nabla^{2} f(x)$ 在所有 $x \in \mathbf{R}^{n}$ 点处正定得
$$
(a-b)^{\mathrm{T}} \cdot(\nabla f(a)-\nabla f(b))=\int_{0}^{1}(a-b)^{\mathrm{T}} \nabla^{2} f(t a+(1-t) b)(a-b) \mathrm{d} t>0
$$
这是矛盾的.故原结论成立.
📋 详细解题步骤
步骤 1/8
目标:写出f(x)在a点的Taylor展开
由于$f(x)$存在二阶连续偏导数,在稳定点$a$处,$\nabla f(a)=0$,则$f(x)$在$a$点的二阶Taylor展开为:
$$f(x)-f(a)=\frac{1}{2}(x-a)^\top \nabla^2 f(a)(x-a)+o(\|x-a\|^2).$$
公式:$$f(x)-f(a)=\frac{1}{2}(x-a)^\top \nabla^2 f(a)(x-a)+o(\|x-a\|^2)$$
提示:注意展开式中一阶项为零,因为$\nabla f(a)=0$。
步骤 2/8
目标:利用Hesse矩阵正定性得到下界
因为$\nabla^2 f(a)$正定,所以存在常数$C>0$使得对任意单位向量$\xi$($\|\xi\|=1$)有$\xi^\top \nabla^2 f(a)\xi \geq C$。
公式:$$\xi^\top \nabla^2 f(a)\xi \geq C>0,\quad \forall \|\xi\|=1$$
提示:正定矩阵的最小特征值大于0,可取$C$为最小特征值。
步骤 3/8
目标:将展开式除以距离并取极限
令$\xi = \frac{x-a}{\|x-a\|}$,则当$x\neq a$时,
$$\frac{f(x)-f(a)}{\|x-a\|^2} = \frac{1}{2}\xi^\top \nabla^2 f(a)\xi + \frac{o(\|x-a\|^2)}{\|x-a\|^2}.$$
当$\|x-a\|\to 0$时,$\frac{o(\|x-a\|^2)}{\|x-a\|^2}\to 0$,因此存在$\delta>0$使得当$0<\|x-a\|<\delta$时,
$$\frac{f(x)-f(a)}{\|x-a\|^2} > \frac{C}{4} > 0.$$
公式:$$\frac{f(x)-f(a)}{\|x-a\|^2} = \frac{1}{2}\xi^\top \nabla^2 f(a)\xi + o(1)$$
提示:注意$o(\|x-a\|^2)$除以$\|x-a\|^2$后趋于0,因此可以控制其绝对值小于$C/4$。
步骤 4/8
目标:得出局部极小值结论
由上式,当$0<\|x-a\|<\delta$时,$f(x)-f(a)>0$,即$f(x)>f(a)$。因此$a$是$f(x)$的一个局部极小值点。
提示:局部极小值要求存在邻域内所有点函数值不小于该点值。
步骤 5/8
目标:反证法假设有两个稳定点
假设$f(x)$有两个不同的稳定点$a$和$b$,即$\nabla f(a)=0$,$\nabla f(b)=0$,且$a\neq b$。
提示:稳定点即梯度为零的点。
步骤 6/8
目标:利用梯度差与Hesse矩阵的关系
由梯度场的中值定理(或牛顿-莱布尼茨公式),有
$$\nabla f(a)-\nabla f(b) = \int_0^1 \frac{d}{dt} \nabla f(t a+(1-t)b) dt = \int_0^1 \nabla^2 f(t a+(1-t)b)(a-b) dt.$$
公式:$$\nabla f(a)-\nabla f(b) = \int_0^1 \nabla^2 f(t a+(1-t)b)(a-b) dt$$
提示:注意对向量值函数求导,$\frac{d}{dt}\nabla f(\gamma(t)) = \nabla^2 f(\gamma(t)) \gamma'(t)$,这里$\gamma(t)=ta+(1-t)b$,$\gamma'(t)=a-b$。
步骤 7/8
目标:利用正定性导出矛盾
将上式两边左乘$(a-b)^\top$,得
$$(a-b)^\top (\nabla f(a)-\nabla f(b)) = \int_0^1 (a-b)^\top \nabla^2 f(t a+(1-t)b)(a-b) dt.$$
由于$\nabla^2 f(x)$处处正定,且$a\neq b$,被积函数恒正,积分大于0。但左边$\nabla f(a)=\nabla f(b)=0$,左边为0,矛盾。
公式:$$0 = (a-b)^\top(0-0) = \int_0^1 (a-b)^\top \nabla^2 f(\cdot)(a-b) dt > 0$$
提示:注意正定矩阵的定义:对任意非零向量$v$,$v^\top A v > 0$。
步骤 8/8
目标:得出结论
因此假设不成立,$f(x)$至多有一个稳定点。
📷 拍照上传批改
拍照上传批改功能已预留入口,后续接入图片上传、OCR识别与AI批改。