📝 题目
设总体 $X$ 服从正态分布 $N\left(\mu_{1}, \sigma^{2}\right)$ ,总体 $Y$ 服从正态分布 $N\left(\mu_{2}, \sigma^{2}\right), X_{1}, X_{2}, \cdots, X_{n_{1}}$ 和 $Y_{1}, Y_{2}$ , $\cdots, Y_{n_{2}}$ 分别是来自总体 $X$ 和 $Y$ 的简单随机样本,则
$$
E\left[\frac{\sum_{i=1}^{n_{1}}\left(X_{i}-\bar{X}\right)^{2}+\sum_{j=1}^{n_{2}}\left(Y_{j}-\bar{Y}\right)^{2}}{n_{1}+n_{2}-2}\right]=
$$
$\_\_\_\_$ .
💡 答案解析
**答案**: $\sigma^{2}$ .
---
**解析**:
$$
\frac{\sum_{i=1}^{n_{1}}\left(X_{i}-\bar{X}\right)^{2}}{\sigma^{2}} \sim \chi^{2}\left(n_{1}-1\right), \quad \frac{\sum_{j=1}^{n_{2}}\left(Y_{j}-\bar{Y}\right)^{2}}{\sigma^{2}} \sim \chi^{2}\left(n_{2}-1\right),
$$
由 $E\left[\displaystyle\frac{\displaystyle\sum_{i=1}^{n_{1}}\left(X_{i}-\bar{X}\right)^{2}}{\sigma^{2}}\right]=n_{1}-1, \quad E\left[\displaystyle\frac{\displaystyle\sum_{j=1}^{n_{2}}\left(Y_{j}-\bar{Y}\right)^{2}}{\sigma^{2}}\right]=n_{2}-1$ ,得
$$
E\left[\sum_{i=1}^{n_{1}}\left(X_{i}-\bar{X}\right)^{2}\right]=\left(n_{1}-1\right) \sigma^{2}, \quad E\left[\sum_{j=1}^{n_{2}}\left(Y_{j}-\bar{Y}\right)^{2}\right]=\left(n_{2}-1\right) \sigma^{2},
$$
于是 $E\left[\displaystyle\frac{\displaystyle\sum_{i=1}^{n_{1}}\left(X_{i}-\bar{X}\right)^{2}+\displaystyle\sum_{j=1}^{n_{2}}\left(Y_{j}-\bar{Y}\right)^{2}}{n_{1}+n_{2}-2}\right]=\displaystyle\frac{\left(n_{1}-1\right) \sigma^{2}+\left(n_{2}-1\right) \sigma^{2}}{n_{1}+n_{2}-2}=\sigma^{2}$ .
## 二、选择题
📋 详细解题步骤
目标:识别统计量分布
首先,我们有两个独立的正态总体:$X \sim N(\mu_1, \sigma^2)$ 和 $Y \sim N(\mu_2, \sigma^2)$,方差相等但未知。从第一个总体中抽取容量为 $n_1$ 的样本 $X_1, X_2, \dots, X_{n_1}$,样本均值为 $\bar{X}$;从第二个总体中抽取容量为 $n_2$ 的样本 $Y_1, Y_2, \dots, Y_{n_2}$,样本均值为 $\bar{Y}$。
根据正态总体样本方差的性质,样本方差与总体方差之比服从卡方分布。具体地,对于第一个总体,有:
$$\frac{\sum_{i=1}^{n_1}(X_i - \bar{X})^2}{\sigma^2} \sim \chi^2(n_1 - 1)$$
类似地,对于第二个总体,有:
$$\frac{\sum_{j=1}^{n_2}(Y_j - \bar{Y})^2}{\sigma^2} \sim \chi^2(n_2 - 1)$$
这两个卡方分布是相互独立的,因为两个样本是独立抽取的。
记 $S_1^2 = \frac{1}{n_1-1}\sum_{i=1}^{n_1}(X_i - \bar{X})^2$ 和 $S_2^2 = \frac{1}{n_2-1}\sum_{j=1}^{n_2}(Y_j - \bar{Y})^2$ 分别为两个样本的样本方差。则上述关系也可写为:
$$\frac{(n_1-1)S_1^2}{\sigma^2} \sim \chi^2(n_1-1), \quad \frac{(n_2-1)S_2^2}{\sigma^2} \sim \chi^2(n_2-1)$$
这一步骤为后续构造 $t$ 统计量或 $F$ 统计量奠定了基础,因为我们需要利用这些卡方分布来构造分母中的方差估计量。
公式:$$\frac{\sum_{i=1}^{n_1}(X_i - \bar{X})^2}{\sigma^2} \sim \chi^2(n_1-1), \quad \frac{\sum_{j=1}^{n_2}(Y_j - \bar{Y})^2}{\sigma^2} \sim \chi^2(n_2-1)$$
提示:牢记样本方差除以总体方差服从自由度为 $n-1$ 的卡方分布,这是构造 $t$ 和 $F$ 统计量的基础。
目标:求离差平方和的期望
设总体 $X \sim N(\mu, \sigma^2)$,$Y \sim N(\mu, \sigma^2)$,且两样本独立。样本容量分别为 $n_1$ 和 $n_2$。样本均值分别为 $\bar{X} = \frac{1}{n_1}\sum_{i=1}^{n_1}X_i$,$\bar{Y} = \frac{1}{n_2}\sum_{j=1}^{n_2}Y_j$。
考虑第一组样本的离差平方和 $\sum_{i=1}^{n_1}(X_i - \bar{X})^2$。由抽样分布理论可知,当总体服从正态分布时,
$$
\frac{\sum_{i=1}^{n_1}(X_i - \bar{X})^2}{\sigma^2} \sim \chi^2(n_1-1)
$$
即该统计量服从自由度为 $n_1-1$ 的卡方分布。
卡方分布的一个重要性质是:若 $Z \sim \chi^2(k)$,则 $E(Z) = k$。因此,
$$
E\left[\frac{\sum_{i=1}^{n_1}(X_i - \bar{X})^2}{\sigma^2}\right] = n_1-1
$$
两边同时乘以 $\sigma^2$,得
$$
E\left[\sum_{i=1}^{n_1}(X_i - \bar{X})^2\right] = (n_1-1)\sigma^2
$$
同理,对于第二组样本,有
$$
\frac{\sum_{j=1}^{n_2}(Y_j - \bar{Y})^2}{\sigma^2} \sim \chi^2(n_2-1)
$$
从而
$$
E\left[\sum_{j=1}^{n_2}(Y_j - \bar{Y})^2\right] = (n_2-1)\sigma^2
$$
这两个期望值将在后续步骤中用于计算 $\sigma^2$ 的无偏估计量。
公式:E\left[\sum_{i=1}^{n_1}(X_i - \bar{X})^2\right] = (n_1-1)\sigma^2, \quad E\left[\sum_{j=1}^{n_2}(Y_j - \bar{Y})^2\right] = (n_2-1)\sigma^2
提示:牢记卡方分布期望等于自由度,且样本离差平方和除以方差后服从卡方分布。
目标:代入所求表达式并化简
本步骤的目标是将前两步得到的期望结果代入原表达式,并完成化简,最终验证统计量的无偏性。
原表达式为:
$$
E\left[ \frac{\sum_{i=1}^{n_1}(X_i-\bar{X})^2 + \sum_{j=1}^{n_2}(Y_j-\bar{Y})^2}{n_1+n_2-2} \right]
$$
根据前两步的结论,有:
$$
E\left[ \sum_{i=1}^{n_1}(X_i-\bar{X})^2 \right] = (n_1-1)\sigma^2
$$
$$
E\left[ \sum_{j=1}^{n_2}(Y_j-\bar{Y})^2 \right] = (n_2-1)\sigma^2
$$
由于期望的线性性质,可以将期望运算分配到分子中的两个部分:
$$
E\left[ \frac{\sum_{i=1}^{n_1}(X_i-\bar{X})^2 + \sum_{j=1}^{n_2}(Y_j-\bar{Y})^2}{n_1+n_2-2} \right] = \frac{1}{n_1+n_2-2} \left( E\left[ \sum_{i=1}^{n_1}(X_i-\bar{X})^2 \right] + E\left[ \sum_{j=1}^{n_2}(Y_j-\bar{Y})^2 \right] \right)
$$
代入已知期望:
$$
= \frac{1}{n_1+n_2-2} \left[ (n_1-1)\sigma^2 + (n_2-1)\sigma^2 \right]
$$
合并同类项:
$$
= \frac{1}{n_1+n_2-2} \cdot (n_1+n_2-2)\sigma^2 = \sigma^2
$$
因此,该统计量的期望等于总体方差 $\sigma^2$,说明它是 $\sigma^2$ 的一个无偏估计量。最终答案验证:所求表达式的期望为 $\sigma^2$。
公式:E\left[ \frac{\sum_{i=1}^{n_1}(X_i-\bar{X})^2 + \sum_{j=1}^{n_2}(Y_j-\bar{Y})^2}{n_1+n_2-2} \right] = \sigma^2
提示:注意分母的自由度是合并自由度,分子期望相加后恰好与分母约简。