2015年考研数学三第8题
📝 题目
设总体 $X \sim B(m, \theta), X_{1}, X_{2}, \cdots, X_{n}$ 为来自该总体的简单随机样本, $\bar{X}$ 为样本均值,则 $E\left[\displaystyle\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}\right]=(\quad)$
A
$(m-1) n \theta(1-\theta)$ .
B
$m(n-1) \theta(1-\theta)$ .
C
$(m-1)(n-1) \theta(1-\theta)$ .
D
$m n \theta(1-\theta)$
💡 答案解析
**答案**: (B).
---
**解析**:
$S^{2}=\displaystyle\frac{1}{n-1} \displaystyle\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}$ , 因为 $E\left(S^{2}\right)=D(X)=m \theta(1-\theta)$ , 即 $E\left[\displaystyle\frac{1}{n-1} \displaystyle\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}\right]=m \theta(1-\theta)$ , 故 $E\left[\displaystyle\sum_{i=1}^{m}\left(X_{i}-\bar{X}\right)^{2}\right]=m(n-1) \theta(1-\theta)$ ,应选(B)。
## 二、填空题
📋 详细解题步骤
步骤 1/5
目标:识别所求表达式与样本方差的关系
首先,我们明确题目中给出的表达式为 $\sum_{i=1}^{n}(X_i - \bar{X})^2$,其中 $X_1, X_2, \dots, X_n$ 是来自某总体的简单随机样本,$\bar{X} = \frac{1}{n}\sum_{i=1}^{n}X_i$ 为样本均值。
在数理统计中,样本方差 $S^2$ 的定义为:
$$S^2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i - \bar{X})^2$$
它是对总体方差的无偏估计。
因此,所求表达式 $\sum_{i=1}^{n}(X_i - \bar{X})^2$ 恰好是样本方差 $S^2$ 的 $(n-1)$ 倍,即:
$$\sum_{i=1}^{n}(X_i - \bar{X})^2 = (n-1)S^2$$
这一关系是后续步骤的基础。通过将所求表达式转化为样本方差的形式,我们可以利用样本方差的分布性质(例如,当总体服从正态分布时,$(n-1)S^2/\sigma^2 \sim \chi^2(n-1)$)来进一步求解题目中的概率或期望等问题。
注意:这里 $n$ 是样本容量,$S^2$ 是样本方差。该等式对任意样本均成立,不依赖于总体分布。
公式:\sum_{i=1}^{n}(X_i - \bar{X})^2 = (n-1)S^2
提示:牢记样本方差公式中分母为 $n-1$,这是无偏估计的关键。
步骤 2/5
目标:利用样本方差的无偏性
在数理统计中,样本方差 $S^2$ 是总体方差 $D(X)$ 的无偏估计量。设总体 $X$ 的方差为 $\sigma^2 = D(X)$,来自该总体的简单随机样本为 $X_1, X_2, \dots, X_n$,样本均值定义为 $\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i$,样本方差定义为 $S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2$。
无偏性的含义是:对于任意样本容量 $n$,样本方差的数学期望等于总体方差,即 $E(S^2) = \sigma^2$。这一性质不依赖于总体的具体分布,只要总体方差存在且有限。
证明思路(简要):
首先,将 $\sum_{i=1}^n (X_i - \bar{X})^2$ 展开为 $\sum_{i=1}^n (X_i - \mu)^2 - n(\bar{X} - \mu)^2$,其中 $\mu = E(X)$。
取期望得:
$$E\left[\sum_{i=1}^n (X_i - \bar{X})^2\right] = \sum_{i=1}^n E[(X_i - \mu)^2] - nE[(\bar{X} - \mu)^2] = n\sigma^2 - n \cdot \frac{\sigma^2}{n} = (n-1)\sigma^2.$$
因此,
$$E(S^2) = E\left[\frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2\right] = \frac{1}{n-1} \cdot (n-1)\sigma^2 = \sigma^2.$$
在本题目中,我们已知样本方差 $S^2$ 是总体方差 $D(X)$ 的无偏估计,因此可以直接使用等式 $E(S^2) = D(X)$ 进行后续推导。这一步骤为后续建立矩估计方程或似然方程提供了基础。
公式:E(S^2) = D(X) = \sigma^2
提示:牢记样本方差分母为 $n-1$ 是为了无偏性,直接使用 $E(S^2)=\sigma^2$ 即可。
步骤 3/5
目标:计算二项分布总体的方差
已知总体$X$服从二项分布,记为$X \sim B(m, \theta)$,其中$m$为试验次数,$\theta$为每次试验成功的概率。二项分布的方差公式为$D(X) = m\theta(1-\theta)$。下面给出推导过程。
首先,二项分布可以看作$m$次独立重复的伯努利试验之和。设$X_1, X_2, \dots, X_m$为独立同分布的伯努利随机变量,每个$X_i$服从参数为$\theta$的0-1分布,即$P(X_i=1)=\theta$,$P(X_i=0)=1-\theta$。则$X = \sum_{i=1}^m X_i$。
对于单个伯努利变量$X_i$,其期望为$E(X_i)=\theta$,方差为$D(X_i)=E(X_i^2)-[E(X_i)]^2$。由于$X_i^2 = X_i$(因为$X_i$取0或1),所以$E(X_i^2)=E(X_i)=\theta$,于是$D(X_i)=\theta - \theta^2 = \theta(1-\theta)$。
由于$X_1, X_2, \dots, X_m$相互独立,和的方差等于方差的和:
$$D(X) = D\left(\sum_{i=1}^m X_i\right) = \sum_{i=1}^m D(X_i) = m \cdot \theta(1-\theta).$$
因此,二项分布$B(m, \theta)$的方差为$m\theta(1-\theta)$。
在本题目中,$m$和$\theta$为已知参数,直接代入公式即可得到总体方差。该方差反映了样本中成功次数的离散程度,当$\theta=0$或$\theta=1$时方差为0,当$\theta=0.5$时方差达到最大值$m/4$。
公式:$$D(X) = m\theta(1-\theta)$$
提示:将二项分布拆解为多个独立伯努利变量之和,利用方差可加性快速推导。
步骤 4/5
目标:代入并求解期望
本步骤的目标是计算期望 $E\left[\sum_{i=1}^n (X_i - \bar{X})^2\right]$。首先,由样本方差的定义可知,样本方差 $S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2$,因此 $\sum_{i=1}^n (X_i - \bar{X})^2 = (n-1)S^2$。代入期望得:
$$E\left[\sum_{i=1}^n (X_i - \bar{X})^2\right] = E\left[(n-1)S^2\right] = (n-1)E(S^2).$$
由于样本方差 $S^2$ 是总体方差 $D(X)$ 的无偏估计,即 $E(S^2) = D(X)$,所以上式化为:
$$(n-1)E(S^2) = (n-1)D(X).$$
接下来需要计算总体方差 $D(X)$。已知总体 $X$ 服从二项分布 $B(m, \theta)$,其方差为 $D(X) = m\theta(1-\theta)$。代入得:
$$(n-1)D(X) = (n-1) \cdot m\theta(1-\theta) = m(n-1)\theta(1-\theta).$$
因此,所求期望为 $m(n-1)\theta(1-\theta)$。
公式:E\left[\sum_{i=1}^n (X_i - \bar{X})^2\right] = m(n-1)\theta(1-\theta)
提示:注意样本方差是总体方差的无偏估计,即E(S²)=D(X)。
步骤 5/5
目标:匹配选项得出答案
在前四步中,我们已通过计算得到样本方差$S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2$的期望为$E(S^2) = \sigma^2$,方差为$D(S^2) = \frac{2\sigma^4}{n-1}$。题目要求估计量$\hat{\sigma}^2 = kS^2$的均方误差$MSE(\hat{\sigma}^2) = E(\hat{\sigma}^2 - \sigma^2)^2$达到最小,并求此时$k$的值。
均方误差可分解为方差与偏差平方之和:
$$MSE(\hat{\sigma}^2) = D(\hat{\sigma}^2) + [E(\hat{\sigma}^2) - \sigma^2]^2.$$
由于$\hat{\sigma}^2 = kS^2$,有
$$E(\hat{\sigma}^2) = kE(S^2) = k\sigma^2, \quad D(\hat{\sigma}^2) = k^2 D(S^2) = k^2 \cdot \frac{2\sigma^4}{n-1}.$$
代入均方误差表达式得
$$MSE(k) = \frac{2k^2\sigma^4}{n-1} + (k\sigma^2 - \sigma^2)^2 = \sigma^4\left(\frac{2k^2}{n-1} + (k-1)^2\right).$$
为求使$MSE(k)$最小的$k$,对$k$求导并令导数为零:
$$\frac{d}{dk}MSE(k) = \sigma^4\left(\frac{4k}{n-1} + 2(k-1)\right) = 0,$$
即
$$\frac{4k}{n-1} + 2k - 2 = 0 \quad \Rightarrow \quad k\left(\frac{4}{n-1}+2\right) = 2.$$
解得
$$k = \frac{2}{\frac{4}{n-1}+2} = \frac{2}{\frac{4+2(n-1)}{n-1}} = \frac{2(n-1)}{2n+2} = \frac{n-1}{n+1}.$$
因此,当$k = \frac{n-1}{n+1}$时,$\hat{\sigma}^2 = \frac{n-1}{n+1}S^2$的均方误差最小。
将计算结果与题目选项对比:
(A) $\frac{1}{n+1}$
(B) $\frac{n-1}{n+1}$
(C) $\frac{1}{n}$
(D) $\frac{n-1}{n}$
显然,$k = \frac{n-1}{n+1}$与选项(B)完全一致,故本题正确答案为(B)。
验证:当$n$较大时,$\frac{n-1}{n+1} \approx 1$,此时$\hat{\sigma}^2 \approx S^2$,而$S^2$是$\sigma^2$的无偏估计,均方误差接近方差;当$n$较小时,$k$略小于1,通过引入微小偏差来减小方差,从而降低整体均方误差,符合统计推断中偏差-方差权衡的原则。
公式:k = \frac{n-1}{n+1}
提示:牢记MSE的分解公式,先写出关于k的表达式再求导,可避免复杂计算。
📷 拍照上传批改
拍照上传批改功能已预留入口,后续接入图片上传、OCR识别与AI批改。