💡 答案解析
(I )由 $|\lambda \boldsymbol{E}-\boldsymbol{A}|=\left|\begin{array}{cccc}\lambda-1 & -b & \cdots & -b \\ -b & \lambda-1 & \cdots & -b \\ \vdots & \vdots & & \vdots \\ -b & -b & \cdots & \lambda-1\end{array}\right|$
$$
=[\lambda-1-(n-1) b](\lambda-1+b)^{n-1}=0,
$$
得 $\boldsymbol{A}$ 的特征值为 $\lambda_{1}=1+(n-1) b, \lambda_{2}=\lambda_{3}=\cdots=\lambda_{n}=1-b$ .
情形一:$b \neq 0$
当 $\lambda_{1}=1+(n-1) b$ 时,因为 $\boldsymbol{A}$ 为实对称矩阵,所以 $\lambda_{1}=1+(n-1) b$ 只有一个线性无关
的特征向量,注意到 $[1+(n-1) b] \boldsymbol{E}-\boldsymbol{A}=\left(\begin{array}{cccc}(n-1) b & -b & \cdots & -b \\ -b & (n-1) b & \cdots & -b \\ \vdots & \vdots & & \vdots \\ -b & -b & \cdots & (n-1) b\end{array}\right)$ 的每
行元素不为零,于是 $\lambda_{1}=1+(n-1) b$ 对应的特征向量为 $\boldsymbol{\xi}_{1}=(1,1, \cdots, 1)^{\mathrm{T}}$ .
当 $\lambda_{2}=\lambda_{3}=\cdots=\lambda_{n}=1-b$ 时,
$$
(1-b) \boldsymbol{E}-\boldsymbol{A}=\left(\begin{array}{cccc}
-b & -b & \cdots & -b \\
-b & -b & \cdots & -b \\
\vdots & \vdots & & \vdots \\
-b & -b & \cdots & -b
\end{array}\right) \rightarrow\left(\begin{array}{cccc}
1 & 1 & \cdots & 1 \\
0 & 0 & \cdots & 0 \\
\vdots & \vdots & & \vdots \\
0 & 0 & \cdots & 0
\end{array}\right),
$$
则 $\lambda=1-b$ 对应的线性无关的特征向量为
$\boldsymbol{\xi}_{2}=(-1,1,0, \cdots, 0)^{\mathrm{T}}, \boldsymbol{\xi}_{3}=(-1,0,1,0, \cdots, 0)^{\mathrm{T}}, \cdots, \boldsymbol{\xi}_{n}=(-1,0, \cdots, 0,1)^{\mathrm{T}}$ ;
情形二:$b=0$
此时 $\lambda_{1}=\lambda_{2}=\cdots=\lambda_{n}=1$ ,任意非零向量皆为矩阵 $\boldsymbol{A}$ 的特征向量.
(II)当 $b \neq 0$ 时,取 $\boldsymbol{P}=\left(\boldsymbol{\xi}_{1}, \boldsymbol{\xi}_{2}, \cdots, \boldsymbol{\xi}_{n}\right)$ ,则
$$
\boldsymbol{P}^{-1} \boldsymbol{A} \boldsymbol{P}=\left(\begin{array}{cccc}
(n-1) b+1 & 0 & \cdots & 0 \\
0 & 1-b & \cdots & 0 \\
\vdots & \vdots & & \vdots \\
0 & 0 & \cdots & 1-b
\end{array}\right) ;
$$
当 $b=0$ 时,对于任意可逆矩阵 $\boldsymbol{P}$ ,有 $\boldsymbol{P}^{-1} \boldsymbol{A P}=\boldsymbol{E}$ .
📋 详细解题步骤
目标:将矩阵A分解为标准形式
已知矩阵 $A$ 为 $n$ 阶方阵,且题目中给出 $a=1$。观察矩阵 $A$ 的结构,发现其主对角线元素均为 $1$,非对角线元素均为 $b$。因此,矩阵 $A$ 可以写成如下形式:
$$A = \begin{pmatrix}
1 & b & \cdots & b \\
b & 1 & \cdots & b \\
\vdots & \vdots & \ddots & \vdots \\
b & b & \cdots & 1
\end{pmatrix}$$
这种矩阵具有“常对角”和“常非对角”的结构,即所有对角元相等,所有非对角元也相等。我们可以将其分解为两个矩阵的和:一个是对角线全为 $1$ 的单位矩阵 $I$ 的倍数,另一个是元素全为 $b$ 的矩阵 $bJ$,其中 $J$ 是元素全为 $1$ 的矩阵。但注意,单位矩阵 $I$ 的对角线为 $1$,非对角线为 $0$;而 $bJ$ 的所有元素均为 $b$。因此,$A$ 可以表示为:
$$A = (1-b)I + bJ$$
验证:$(1-b)I$ 的对角线元素为 $1-b$,非对角线为 $0$;$bJ$ 的所有元素为 $b$。相加后,对角线元素为 $(1-b)+b=1$,非对角线元素为 $0+b=b$,与 $A$ 一致。
这里 $I$ 是 $n$ 阶单位矩阵,$J$ 是 $n$ 阶全1矩阵。参数 $a=1$ 已经明确,因此分解完成。这种分解形式便于后续计算特征值和特征向量,因为 $J$ 矩阵具有简单的谱性质:$J$ 的特征值为 $n$(对应特征向量 $(1,1,\ldots,1)^T$)和 $0$(重数为 $n-1$)。
公式:$$A = (1-b)I + bJ$$
提示:注意对角元为1,非对角元为b,因此用 $(1-b)I$ 修正对角部分。
目标:分析全1矩阵J的特征性质
设 $J$ 为 $n \times n$ 的全1矩阵,即 $J$ 的所有元素均为1。首先分析 $J$ 的秩:由于 $J$ 的每一行都相同(均为行向量 $(1,1,\dots,1)$),因此 $J$ 的行向量组线性相关,且极大线性无关组只含一个行向量,故 $\operatorname{rank}(J)=1$。
接下来求 $J$ 的特征值。由于 $\operatorname{rank}(J)=1$,$J$ 的非零特征值至多只有一个。考虑向量 $\mathbf{v}_1 = (1,1,\dots,1)^\mathrm{T}$,则
$$ J \mathbf{v}_1 = \begin{pmatrix} 1 & 1 & \cdots & 1 \\ 1 & 1 & \cdots & 1 \\ \vdots & \vdots & \ddots & \vdots \\ 1 & 1 & \cdots & 1 \end{pmatrix} \begin{pmatrix} 1 \\ 1 \\ \vdots \\ 1 \end{pmatrix} = \begin{pmatrix} n \\ n \\ \vdots \\ n \end{pmatrix} = n \mathbf{v}_1, $$
所以 $\lambda_1 = n$ 是 $J$ 的一个特征值,对应的特征向量为全1向量。
对于与 $\mathbf{v}_1$ 正交的向量空间,即所有分量之和为零的向量 $\mathbf{x} = (x_1,x_2,\dots,x_n)^\mathrm{T}$ 满足 $\sum_{i=1}^n x_i = 0$。对这样的向量,有
$$ J \mathbf{x} = \begin{pmatrix} \sum_{i=1}^n x_i \\ \sum_{i=1}^n x_i \\ \vdots \\ \sum_{i=1}^n x_i \end{pmatrix} = \begin{pmatrix} 0 \\ 0 \\ \vdots \\ 0 \end{pmatrix} = 0 \cdot \mathbf{x}, $$
因此 $\lambda = 0$ 也是 $J$ 的特征值。该零特征值的几何重数等于齐次线性方程组 $J\mathbf{x}=0$ 的解空间维数,即 $n - \operatorname{rank}(J) = n-1$。由于 $J$ 是实对称矩阵,可对角化,故零特征值的代数重数也等于 $n-1$。
综上,$J$ 的特征值为 $\lambda_1 = n$(单重)和 $\lambda_2 = 0$($n-1$ 重)。
公式:$$ J \mathbf{v}_1 = n \mathbf{v}_1, \quad J \mathbf{x} = 0 \cdot \mathbf{x} \ (\text{当 } \sum x_i = 0) $$
提示:利用秩为1快速得到非零特征值,再通过向量和为零的条件得到零特征值的重数。
目标:推导A的特征值
已知矩阵$A = (1-b)E + bJ$,其中$E$是$n$阶单位矩阵,$J$是元素全为1的$n$阶矩阵。设$\lambda_J$是矩阵$J$的任一特征值,对应的特征向量为$\boldsymbol{x}$,则有$J\boldsymbol{x} = \lambda_J \boldsymbol{x}$。对$A$作用该特征向量:
$$
A\boldsymbol{x} = [(1-b)E + bJ]\boldsymbol{x} = (1-b)E\boldsymbol{x} + bJ\boldsymbol{x} = (1-b)\boldsymbol{x} + b\lambda_J\boldsymbol{x} = [(1-b) + b\lambda_J]\boldsymbol{x}.
$$
因此,$A$的特征值$\lambda_A$与$J$的特征值$\lambda_J$满足关系:
$$
\lambda_A = (1-b) + b\lambda_J.
$$
现在需要求出$J$的特征值。$J$是秩为1的实对称矩阵,其所有行向量相同。容易验证:
- 向量$\boldsymbol{1} = (1,1,\ldots,1)^T$是$J$的特征向量,对应的特征值为$n$,因为$J\boldsymbol{1} = n\boldsymbol{1}$。
- 任何与$\boldsymbol{1}$正交的非零向量$\boldsymbol{v}$(即$\boldsymbol{1}^T\boldsymbol{v}=0$)满足$J\boldsymbol{v} = \boldsymbol{0}$,因此对应的特征值为$0$。由于$\boldsymbol{1}$的正交补空间维数为$n-1$,所以特征值$0$的重数为$n-1$。
因此,$J$的特征值为:$\lambda_J = n$(单重)和$\lambda_J = 0$($n-1$重)。
代入$\lambda_A = (1-b) + b\lambda_J$:
- 当$\lambda_J = n$时,$\lambda_1 = (1-b) + b \cdot n = 1 - b + bn = 1 + (n-1)b$。
- 当$\lambda_J = 0$时,$\lambda_2 = (1-b) + b \cdot 0 = 1 - b$,且该特征值重复$n-1$次。
综上所述,矩阵$A$的特征值为:
$$
\lambda_1 = 1 + (n-1)b \quad (\text{单重}), \qquad \lambda_2 = 1 - b \quad (n-1\text{重}).
$$
公式:\lambda_A = (1-b) + b\lambda_J, \quad \lambda_1 = 1+(n-1)b, \quad \lambda_2 = 1-b\ (n-1\text{重})
提示:利用J的秩1结构快速得到特征值:一个为n,其余为0,再通过线性关系转换到A的特征值。
目标:求λ1对应的特征向量
已知矩阵$J$满足$J\boldsymbol{x}=n\boldsymbol{x}$,即所有分量之和等于$n$倍每个分量。设特征向量为$\boldsymbol{\alpha}=(x_1,x_2,\dots,x_n)^T$,则方程$J\boldsymbol{x}=n\boldsymbol{x}$给出:
$$\sum_{j=1}^n x_j = n x_i \quad (i=1,2,\dots,n).$$
这意味着所有$x_i$相等,因为从任意两个分量相减可得$x_i=x_j$。设公共值为$c$,则$\boldsymbol{\alpha}=c(1,1,\dots,1)^T$。取基础向量$\boldsymbol{\alpha}_1=(1,1,\dots,1)^T$,则$\lambda_1=n$对应的全部特征向量为$k\boldsymbol{\alpha}_1$,其中$k$为非零任意常数。
公式:$$J\boldsymbol{x}=n\boldsymbol{x} \Rightarrow \sum_{j=1}^n x_j = n x_i \Rightarrow x_1=x_2=\cdots=x_n$$
提示:注意全1矩阵乘向量相当于求和,利用分量相等性快速得到特征向量形式。
目标:求λ2对应的特征向量
由前一步可知,对于特征值 $\lambda_2 = 0$(重数为 $n-1$),我们需要求解齐次线性方程组 $(A - \lambda_2 I)\boldsymbol{x} = A\boldsymbol{x} = \boldsymbol{0}$。由于 $A$ 是全部元素为 $1$ 的 $n$ 阶矩阵,即 $A = \boldsymbol{1}\boldsymbol{1}^T$,其中 $\boldsymbol{1} = (1,1,\ldots,1)^T$,因此方程 $A\boldsymbol{x} = \boldsymbol{0}$ 等价于 $\boldsymbol{1}(\boldsymbol{1}^T\boldsymbol{x}) = \boldsymbol{0}$,即 $(\sum_{i=1}^n x_i)\boldsymbol{1} = \boldsymbol{0}$。这等价于各分量之和为零:$x_1 + x_2 + \cdots + x_n = 0$。
这是一个 $n$ 元一次方程,其解空间维数为 $n-1$。我们需要构造 $n-1$ 个线性无关的向量作为该特征值的一组基(即特征向量)。一个常用的构造方法是:取前 $n-1$ 个向量,每个向量中只有两个非零分量,且互为相反数。具体地,令
$$
\boldsymbol{\xi}_1 = (1, -1, 0, 0, \ldots, 0)^T,
\quad
\boldsymbol{\xi}_2 = (1, 0, -1, 0, \ldots, 0)^T,
\quad
\ldots,
\quad
\boldsymbol{\xi}_{n-1} = (1, 0, 0, \ldots, 0, -1)^T.
$$
显然,每个 $\boldsymbol{\xi}_i$ 的分量之和均为 $1 + (-1) = 0$,满足方程。而且这 $n-1$ 个向量线性无关(因为若将它们按列排成矩阵,前 $n-1$ 行构成一个下三角矩阵,主对角元全为 $1$,秩为 $n-1$)。因此,$\lambda_2 = 0$ 的全部特征向量为 $k_1\boldsymbol{\xi}_1 + k_2\boldsymbol{\xi}_2 + \cdots + k_{n-1}\boldsymbol{\xi}_{n-1}$,其中 $k_1,\ldots,k_{n-1}$ 不全为零。
注意:本题中 $n$ 的具体数值由题目给出(通常为 $n$ 阶矩阵),上述构造对任意 $n \geq 2$ 均成立。
公式:$$\sum_{i=1}^n x_i = 0, \quad \boldsymbol{\xi}_1 = (1,-1,0,\ldots,0)^T, \ldots, \boldsymbol{\xi}_{n-1} = (1,0,\ldots,0,-1)^T$$
提示:利用“和为零”条件构造基向量时,常用“一个1和一个-1”的组合,简单且线性无关。
目标:构造可逆矩阵P
根据题目条件,设矩阵$A$有一个特征值$\lambda_1$(单重)和另一个特征值$\lambda_2$($n-1$重)。前一步骤已求得对应于$\lambda_1$的特征向量$\boldsymbol{\xi}_1$,以及对应于$\lambda_2$的$n-1$个线性无关的特征向量$\boldsymbol{\xi}_2,\boldsymbol{\xi}_3,\dots,\boldsymbol{\xi}_n$。
现在构造可逆矩阵$P$,使得$P^{-1}AP$为对角矩阵。具体做法是:将$\lambda_1$的特征向量作为$P$的第一列,将$\lambda_2$的$n-1$个线性无关的特征向量依次作为$P$的第二列至第$n$列,即
$$
P = \begin{pmatrix}
\boldsymbol{\xi}_1 & \boldsymbol{\xi}_2 & \cdots & \boldsymbol{\xi}_n
\end{pmatrix}.
$$
由于特征向量组$\{\boldsymbol{\xi}_1,\boldsymbol{\xi}_2,\dots,\boldsymbol{\xi}_n\}$是线性无关的(不同特征值对应的特征向量线性无关,且同一特征值的$n-1$个线性无关特征向量与另一特征值的特征向量也线性无关),因此矩阵$P$是可逆的。
此时,有
$$
AP = A\begin{pmatrix}
\boldsymbol{\xi}_1 & \boldsymbol{\xi}_2 & \cdots & \boldsymbol{\xi}_n
\end{pmatrix} = \begin{pmatrix}
A\boldsymbol{\xi}_1 & A\boldsymbol{\xi}_2 & \cdots & A\boldsymbol{\xi}_n
\end{pmatrix} = \begin{pmatrix}
\lambda_1\boldsymbol{\xi}_1 & \lambda_2\boldsymbol{\xi}_2 & \cdots & \lambda_2\boldsymbol{\xi}_n
\end{pmatrix}.
$$
而
$$
P\begin{pmatrix}
\lambda_1 & 0 & \cdots & 0 \\
0 & \lambda_2 & \cdots & 0 \\
\vdots & \vdots & \ddots & \vdots \\
0 & 0 & \cdots & \lambda_2
\end{pmatrix} = \begin{pmatrix}
\boldsymbol{\xi}_1 & \boldsymbol{\xi}_2 & \cdots & \boldsymbol{\xi}_n
\end{pmatrix}
\begin{pmatrix}
\lambda_1 & 0 & \cdots & 0 \\
0 & \lambda_2 & \cdots & 0 \\
\vdots & \vdots & \ddots & \vdots \\
0 & 0 & \cdots & \lambda_2
\end{pmatrix} = \begin{pmatrix}
\lambda_1\boldsymbol{\xi}_1 & \lambda_2\boldsymbol{\xi}_2 & \cdots & \lambda_2\boldsymbol{\xi}_n
\end{pmatrix}.
$$
因此,$AP = P\Lambda$,其中$\Lambda = \operatorname{diag}(\lambda_1,\lambda_2,\dots,\lambda_2)$。由于$P$可逆,两边左乘$P^{-1}$得$P^{-1}AP = \Lambda$,即$A$可对角化。
注意:在具体构造时,需将已求得的特征向量按列排好,并确保$P$的行列式不为零(即向量组线性无关)。若题目中特征向量已归一化或取特定形式,则直接代入即可。
公式:P = \begin{pmatrix} \boldsymbol{\xi}_1 & \boldsymbol{\xi}_2 & \cdots & \boldsymbol{\xi}_n \end{pmatrix}
提示:构造P时,特征向量的排列顺序必须与对角矩阵中特征值的顺序一致。
目标:验证对角化结果
本步骤验证矩阵$A$是否被成功对角化。已知矩阵$A$的特征值为$\lambda_1 = 1+(n-1)b$(单重)和$\lambda_2 = 1-b$($n-1$重),且已构造出可逆矩阵$P$,其列向量为对应的特征向量。我们需要验证$P^{-1}AP = \operatorname{diag}(1+(n-1)b, 1-b, \ldots, 1-b)$。
首先,回顾矩阵$A$的形式:$A = (1-b)I + bJ$,其中$J$为全1矩阵。特征向量选取如下:
- 对应于$\lambda_1$的特征向量为$\alpha_1 = (1,1,\ldots,1)^T$。
- 对应于$\lambda_2$的特征向量可取为$\alpha_2 = (1,-1,0,\ldots,0)^T$,$\alpha_3 = (1,0,-1,\ldots,0)^T$,$\ldots$,$\alpha_n = (1,0,0,\ldots,-1)^T$。这些向量线性无关,且与$\alpha_1$正交。
构造矩阵$P = (\alpha_1, \alpha_2, \ldots, \alpha_n)$,则$P$可逆。由特征向量的定义,有$A\alpha_i = \lambda_i \alpha_i$($i=1,2,\ldots,n$),其中$\lambda_1 = 1+(n-1)b$,$\lambda_2 = \cdots = \lambda_n = 1-b$。因此,
$$
AP = A(\alpha_1, \alpha_2, \ldots, \alpha_n) = (A\alpha_1, A\alpha_2, \ldots, A\alpha_n) = (\lambda_1\alpha_1, \lambda_2\alpha_2, \ldots, \lambda_n\alpha_n).
$$
将上式右端写成矩阵乘积形式:
$$
(\lambda_1\alpha_1, \lambda_2\alpha_2, \ldots, \lambda_n\alpha_n) = P \cdot \operatorname{diag}(\lambda_1, \lambda_2, \ldots, \lambda_n).
$$
因为$P$可逆,左乘$P^{-1}$得
$$
P^{-1}AP = \operatorname{diag}(\lambda_1, \lambda_2, \ldots, \lambda_n) = \operatorname{diag}(1+(n-1)b, 1-b, \ldots, 1-b).
$$
至此,对角化完成。最终答案验证:当$b=0$时,$A=I$,对角矩阵为单位阵,符合;当$b=1$时,$A=J$,特征值为$n$和$0$($n-1$重),对角矩阵为$\operatorname{diag}(n,0,\ldots,0)$,也符合。因此结果正确。
公式:P^{-1}AP = \operatorname{diag}(1+(n-1)b, 1-b, \ldots, 1-b)
提示:验证对角化时,只需确认每个特征向量对应正确的特征值即可。