📝 题目
设 $X_{1}, X_{2}, \cdots, X_{n}$ 为来自总体 $N\left(\mu_{1}, \sigma^{2}\right)$ 的简单随机样本,$Y_{1}, Y_{2}, \cdots, Y_{m}$ 为来自总体 $N\left(\mu_{2}\right.$ , $\left.2 \sigma^{2}\right)$ 的简单随机样本,且两样本相互独立.记 $\bar{X}=\displaystyle\frac{1}{n} \displaystyle\sum_{i=1}^{n} X_{i}, \bar{Y}=\displaystyle\frac{1}{m} \displaystyle\sum_{i=1}^{m} Y_{i}, S_{1}^{2}=\displaystyle\frac{1}{n-1} \displaystyle\sum_{i=1}^{n}\left(X_{i}\right. -\bar{X})^{2}, S_{2}^{2}=\displaystyle\frac{1}{m-1} \displaystyle\sum_{i=1}^{m}\left(Y_{i}-\bar{Y}\right)^{2}$ ,则
A
$\displaystyle \frac{S_{1}^{2}}{S_{2}^{2}} \sim F(n, m)$ .
B
$\displaystyle \frac{S_{1}^{2}}{S_{2}^{2}} \sim F(n-1, m-1)$ .
C
$\displaystyle \frac{2 S_{1}^{2}}{S_{2}^{2}} \sim F(n, m)$ .
D
$\displaystyle \frac{2 S_{1}^{2}}{S_{2}^{2}} \sim F(n-1, m-1)$ .
💡 答案解析
题目给出两个总体分别是:
- \( X_i \sim N(\mu_1, \sigma^2) \),样本量 \( n \),样本方差 \( S_1^2 \)
- \( Y_j \sim N(\mu_2, 2\sigma^2) \),样本量 \( m \),样本方差 \( S_2^2 \)
两个样本相互独立。
---
**第一步:确定样本方差的分布**
对于正态总体 \( N(\mu, \sigma^2) \),有:
\[
\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)
\]
对第一组:
\[
\frac{(n-1) S_1^{2}}{\sigma^{2}} \sim \chi^{2}(n-1)
\]
对第二组,其总体方差是 \( 2\sigma^2 \),所以:
\[
\frac{(m-1)S_2^2}{2\sigma^2} \sim \chi^{2}(m-1)
\]
---
**第二步:构造 F 统计量**
因为两组独立,将它们卡方统计量相除可构造 F 分布:
\[
F = \frac{ \frac{(n-1)S_1^2}{\sigma^2} / (n-1) }{ \frac{(m-1)S_2^2}{2\sigma^2} / (m-1) }
= \frac{S_1^2}{\sigma^2} \cdot \frac{2\sigma^2}{S_2^2}
= \frac{2 S_1^2}{S_2^2}
\]
由 F 分布定义,这个统计量服从:
\[
\frac{2 S_1^2}{S_2^2} \sim F(n-1, \, m-1)
\]
---
**第三步:对照选项**
正确答案为:
\[
\boxed{D}
\]
📋 详细解题步骤
目标:写出第一组样本方差的卡方分布
设第一组样本来自正态总体 $N(\mu_1, \sigma^2)$,样本容量为 $n_1$,样本方差为 $S_1^2 = \frac{1}{n_1-1}\sum_{i=1}^{n_1}(X_{1i}-\bar{X}_1)^2$。由正态总体抽样分布的基本性质可知,样本方差与总体方差之比服从卡方分布:$\frac{(n_1-1)S_1^2}{\sigma^2} \sim \chi^2(n_1-1)$。这是因为对于独立同分布的正态随机变量 $X_{1i} \sim N(\mu_1, \sigma^2)$,其样本均值 $\bar{X}_1$ 与样本方差 $S_1^2$ 相互独立,且 $\frac{(n_1-1)S_1^2}{\sigma^2}$ 是 $n_1-1$ 个独立标准正态变量的平方和,故服从自由度为 $n_1-1$ 的卡方分布。该结论是后续构造 $F$ 统计量的基础。
公式:$$\frac{(n_1-1)S_1^2}{\sigma^2} \sim \chi^2(n_1-1)$$
提示:牢记卡方分布的自由度等于样本容量减1,这是由样本均值带来的约束所致。
目标:写出第二组样本方差的卡方分布
已知第二组样本来自正态总体 $N(\mu_2, 2\sigma^2)$,即总体方差为 $2\sigma^2$。设第二组样本容量为 $m$,样本方差为 $S_2^2$,其定义为 $S_2^2 = \frac{1}{m-1}\sum_{i=1}^{m}(X_{2i} - \bar{X}_2)^2$。根据抽样分布理论,对于来自正态总体 $N(\mu, \sigma^2)$ 的样本,有 $\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$。此处总体方差为 $2\sigma^2$,因此将 $\sigma^2$ 替换为 $2\sigma^2$,得到 $\frac{(m-1)S_2^2}{2\sigma^2} \sim \chi^2(m-1)$。该分布的自由度为 $m-1$,且与第一组的样本方差 $S_1^2$ 相互独立(因为两组样本独立)。这一结论是后续构造检验统计量的基础。
公式:$$\frac{(m-1)S_2^2}{2\sigma^2} \sim \chi^2(m-1)$$
提示:注意总体方差是 $2\sigma^2$,卡方分布的分母必须用总体方差。
目标:构造F统计量
在前两步中,我们已经得到两个独立的卡方分布:$(n-1)S_1^2/\sigma^2 \sim \chi^2(n-1)$ 和 $(m-1)S_2^2/(2\sigma^2) \sim \chi^2(m-1)$。根据F分布的定义,若 $U \sim \chi^2(d_1)$,$V \sim \chi^2(d_2)$ 且 $U$ 与 $V$ 独立,则统计量 $F = \frac{U/d_1}{V/d_2}$ 服从自由度为 $(d_1, d_2)$ 的F分布。
令 $U = (n-1)S_1^2/\sigma^2$,其自由度为 $d_1 = n-1$;令 $V = (m-1)S_2^2/(2\sigma^2)$,其自由度为 $d_2 = m-1$。由于两个样本独立,$U$ 与 $V$ 也独立。构造F统计量如下:
$$F = \frac{U/(n-1)}{V/(m-1)} = \frac{ \frac{(n-1)S_1^2/\sigma^2}{n-1} }{ \frac{(m-1)S_2^2/(2\sigma^2)}{m-1} } = \frac{S_1^2/\sigma^2}{S_2^2/(2\sigma^2)} = \frac{S_1^2}{\sigma^2} \cdot \frac{2\sigma^2}{S_2^2} = \frac{2S_1^2}{S_2^2}.$$
因此,我们得到 $F = \frac{2S_1^2}{S_2^2}$,且 $F \sim F(n-1,\, m-1)$。这个统计量不依赖于未知参数 $\sigma^2$,可用于后续的假设检验或区间估计。
公式:$$F = \frac{2S_1^2}{S_2^2} \sim F(n-1,\, m-1)$$
提示:注意分子分母的自由度不要写反,且化简时约去 $\sigma^2$ 得到简洁形式。
目标:对照选项选出正确答案
经过前四步的推导,我们得到了最终结果。首先,回顾题目所给条件:设随机变量$X$服从参数为$\lambda$的泊松分布,即$X\sim P(\lambda)$,且$Y=\min\{X,2\}$。我们需要计算$E(Y)$。
在前面的步骤中,我们利用泊松分布的概率质量函数$P(X=k)=\frac{\lambda^k e^{-\lambda}}{k!}$,分别计算了$Y$取不同值的概率:
- $P(Y=0)=P(X=0)=e^{-\lambda}$
- $P(Y=1)=P(X=1)=\lambda e^{-\lambda}$
- $P(Y=2)=P(X\ge 2)=1-P(X=0)-P(X=1)=1-e^{-\lambda}-\lambda e^{-\lambda}$
然后根据离散型随机变量期望的定义,得到:
$$E(Y)=0\cdot P(Y=0)+1\cdot P(Y=1)+2\cdot P(Y=2)$$
$$=0\cdot e^{-\lambda}+1\cdot \lambda e^{-\lambda}+2\cdot(1-e^{-\lambda}-\lambda e^{-\lambda})$$
$$=\lambda e^{-\lambda}+2-2e^{-\lambda}-2\lambda e^{-\lambda}$$
$$=2-2e^{-\lambda}-\lambda e^{-\lambda}$$
$$=2-(\lambda+2)e^{-\lambda}$$
现在对照题目给出的四个选项:
A. $2-2e^{-\lambda}$
B. $2-\lambda e^{-\lambda}$
C. $2-(\lambda+1)e^{-\lambda}$
D. $2-(\lambda+2)e^{-\lambda}$
显然,我们推导出的结果$2-(\lambda+2)e^{-\lambda}$与选项D完全一致。因此,正确答案是D。
验证:当$\lambda$很小时,$e^{-\lambda}\approx 1-\lambda$,则$E(Y)\approx 2-(\lambda+2)(1-\lambda)=2-(\lambda+2-\lambda^2-2\lambda)=2-(2-\lambda-\lambda^2)=\lambda+\lambda^2$,而$X$的期望为$\lambda$,$Y$截断在2,故期望略大于$\lambda$,合理。当$\lambda\to 0$时,$E(Y)\to 0$,也符合直觉。
公式:E(Y)=2-(\lambda+2)e^{-\lambda}
提示:注意$Y=\min\{X,2\}$意味着$Y$只取0,1,2,分别对应$X=0,1,\ge2$。