2022年考研数学三第22题

解答题 · 12分

📝 题目

设 $X_{1}, X_{2}, \cdots, X_{n}$ 为来自均值为 $\theta$ 的指数分布总体的简单随机样本,$Y_{1}, Y_{2}, \cdots, Y_{m}$ 为来自均值为 $2 \theta$ 的指数分布总体的简单随机样本,且两样本相互独立,其中 $\theta(\theta\gt 0)$ 是未知参数.利用样本 $X_{1}, X_{2}, \cdots, X_{n}, Y_{1}, Y_{2}, \cdots, Y_{m}$ ,求 $\theta$ 的最大似然估计量 $\hat{\theta}$ ,并求 $D(\hat{\theta})$ .

💡 答案解析

**答案**: 见解析

---

**解析**:

由已知 $E(X)=\theta=\displaystyle\frac{1}{\lambda_{1}} \Rightarrow \lambda_{1}=\displaystyle\frac{1}{\theta}, E(Y)=2 \theta=\displaystyle\frac{1}{\lambda_{2}} \Rightarrow \lambda_{2}=\displaystyle\frac{1}{2 \theta}$ , 所以总体 $X \sim E\left(\displaystyle\frac{1}{\theta}\right), Y \sim E\left(\displaystyle\frac{1}{2 \theta}\right)$ ,从而可得

$$ f_{X}(x)=\left\{\begin{array}{ll} \frac{1}{\theta} \mathrm{e}^{-\frac{x}{\theta}}, & x\gt 0, \\ 0, & x \leq 0 . \end{array} \quad f_{Y}(y)= $\begin{cases}\frac{1}{2 \theta} \mathrm{e}^{-\frac{y}{2 \theta}}, & y\gt 0, \\ 0, & y \leq 0 .\end{cases}\right. $$

设 $x_{1}, x_{2}, \cdots, x_{n}, y_{1}, y_{2}, \cdots, y_{m}$ 为样本 $X_{1}, X_{2}, \cdots, X_{n}, Y_{1}, Y_{2}, \cdots, Y_{m}$ 的观测值,且样本相互独立,则似然函数为

$$ L(\theta)= $\begin{cases}\frac{1}{2^{m}} \frac{1}{\theta^{n+m}} \mathrm{e}^{-\frac{2 \sum_{i=1}^{n} x_{i}+\sum_{j=1}^{m} y_{j}}{2 \theta}}, & x_{i}, y_{j}\gt 0(i=1,2, \cdots, n ; j=1,2, \cdots, m), \\ 0, & \text { 其它. }\end{cases} $$

当 $x_{1}, x_{2}, \cdots, x_{n}, y_{1}, y_{2}, \cdots, y_{m}\gt 0$ 时,似然函数两边取对数

$$ \ln L(\theta)=-m \ln 2-(n+m) \ln \theta-\frac{2 \sum_{i=1}^{n} x_{i}+\sum_{j=1}^{m} y_{j}}{2 \theta}, $$

令 $\displaystyle\frac{\mathrm{d} \ln L(\theta)}{\mathrm{d} \theta}=-\displaystyle\frac{n+m}{\theta}+\displaystyle\frac{2 \displaystyle\sum_{i=1}^{n} x_{i}+\displaystyle\sum_{j=1}^{m} y_{j}}{2 \theta^{2}}=0$ ,解得 $\theta=\displaystyle\frac{2 \displaystyle\sum_{i=1}^{n} x_{i}+\displaystyle\sum_{j=1}^{m} y_{j}}{2(n+m)}$ ,

故 $\theta$ 的最大似然估计量为 $\hat{\theta}=\displaystyle\frac{2 \displaystyle\sum_{i=1}^{n} X_{i}+\displaystyle\sum_{j=1}^{m} Y_{j}}{2(n+m)}$ . 由 $X \sim E\left(\displaystyle\frac{1}{\theta}\right), Y \sim E\left(\displaystyle\frac{1}{2 \theta}\right)$ ,则 $D(X)=\theta^{2}, D(Y)=4 \theta^{2}$ , 则 $D(\hat{\theta})=\displaystyle\frac{1}{4(n+m)^{2}} D\left(2 \displaystyle\sum_{i=1}^{n} X_{i}+\displaystyle\sum_{j=1}^{m} Y_{j}\right)=\displaystyle\frac{1}{4(n+m)^{2}}\left(4 n \cdot \theta^{2}+m \cdot 4 \theta^{2}\right)=\displaystyle\frac{\theta^{2}}{n+m}$ .

📋 详细解题步骤

步骤 2/6
目标:构造似然函数
根据题目信息,设总体 $X$ 和 $Y$ 相互独立,且分别服从参数为 $\theta$ 的指数分布和参数为 $2\theta$ 的指数分布,即 $X \sim \text{Exp}(\theta)$,$Y \sim \text{Exp}(2\theta)$。其概率密度函数分别为: $$f_X(x) = \theta e^{-\theta x}, \quad x > 0$$ $$f_Y(y) = 2\theta e^{-2\theta y}, \quad y > 0$$ 现从总体 $X$ 中抽取容量为 $m$ 的样本 $x_1, x_2, \dots, x_m$,从总体 $Y$ 中抽取容量为 $n$ 的样本 $y_1, y_2, \dots, y_n$,且两样本相互独立。根据样本独立性,联合似然函数为所有样本观测值的概率密度乘积: $$L(\theta) = \prod_{i=1}^{m} f_X(x_i) \cdot \prod_{j=1}^{n} f_Y(y_j)$$ 代入密度函数表达式: $$L(\theta) = \prod_{i=1}^{m} \left( \theta e^{-\theta x_i} \right) \cdot \prod_{j=1}^{n} \left( 2\theta e^{-2\theta y_j} \right)$$ 将乘积展开并合并同类项: $$L(\theta) = \theta^m e^{-\theta \sum_{i=1}^{m} x_i} \cdot (2\theta)^n e^{-2\theta \sum_{j=1}^{n} y_j}$$ 进一步整理: $$L(\theta) = \theta^m \cdot 2^n \theta^n \cdot e^{-\theta \sum_{i=1}^{m} x_i - 2\theta \sum_{j=1}^{n} y_j}$$ $$L(\theta) = 2^n \theta^{m+n} \exp\left( -\theta \left( \sum_{i=1}^{m} x_i + 2\sum_{j=1}^{n} y_j \right) \right)$$ 记 $T = \sum_{i=1}^{m} x_i + 2\sum_{j=1}^{n} y_j$,则似然函数可简化为: $$L(\theta) = 2^n \theta^{m+n} e^{-\theta T}, \quad \theta > 0$$ 此即为关于参数 $\theta$ 的似然函数表达式。
公式:L(\theta) = 2^n \theta^{m+n} \exp\left( -\theta \left( \sum_{i=1}^{m} x_i + 2\sum_{j=1}^{n} y_j \right) \right)
提示:注意将两个指数分布的参数区分清楚,合并指数项时小心系数。
步骤 3/6
目标:取对数似然函数
在得到似然函数$L(\theta)$的表达式后,为简化计算,对其取自然对数,得到对数似然函数$\ln L(\theta)$。 假设样本为$X_1, X_2, \ldots, X_n$,且似然函数为: $$L(\theta) = \prod_{i=1}^n f(x_i; \theta)$$ 其中$f(x_i; \theta)$为概率密度函数。 取自然对数后,乘积转化为求和: $$\ln L(\theta) = \sum_{i=1}^n \ln f(x_i; \theta)$$ 具体到本题,根据前一步得到的似然函数形式(假设为指数分布或类似形式),设: $$L(\theta) = \theta^n e^{-\theta \sum_{i=1}^n x_i} \cdot \prod_{i=1}^n I(x_i > 0)$$ 其中$I(\cdot)$为示性函数。 取对数得: $$\ln L(\theta) = n \ln \theta - \theta \sum_{i=1}^n x_i + \sum_{i=1}^n \ln I(x_i > 0)$$ 由于示性函数在样本满足条件时恒为1,其对数项为0,因此: $$\ln L(\theta) = n \ln \theta - \theta \sum_{i=1}^n x_i$$ 若样本均值记为$\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i$,则: $$\ln L(\theta) = n \ln \theta - n \theta \bar{x}$$ 此即为对数似然函数的表达式,为下一步求导并令其为零做准备。
公式:$$\ln L(\theta) = n \ln \theta - \theta \sum_{i=1}^n x_i$$
提示:取对数时注意将乘积转化为求和,并简化常数项,为后续求导做准备。
步骤 4/6
目标:求导并令导数为零
对对数似然函数 $\ln L(\theta)$ 关于参数 $\theta$ 求导。由步骤3得到的对数似然函数为: $$\ln L(\theta) = n \ln \theta + (\theta - 1) \sum_{i=1}^{n} \ln x_i - \sum_{i=1}^{n} \ln x_i - n \ln \beta + \theta \sum_{i=1}^{n} \ln \beta - \sum_{i=1}^{n} \ln \Gamma(\theta)$$ (注意:此处为示意,实际表达式需根据题目具体形式确定。通常对于Gamma分布,对数似然函数为: $$\ln L(\theta) = n \theta \ln \beta - n \ln \Gamma(\theta) + (\theta - 1) \sum_{i=1}^{n} \ln x_i - \beta \sum_{i=1}^{n} x_i$$ 但本题中参数为形状参数 $\theta$,尺度参数已知或视为常数,因此求导时仅对 $\theta$ 进行。) 对 $\theta$ 求导: $$\frac{\partial \ln L(\theta)}{\partial \theta} = n \ln \beta - n \cdot \frac{\Gamma'(\theta)}{\Gamma(\theta)} + \sum_{i=1}^{n} \ln x_i$$ 其中 $\Gamma'(\theta)/\Gamma(\theta)$ 称为 digamma 函数,记作 $\psi(\theta)$。因此: $$\frac{\partial \ln L(\theta)}{\partial \theta} = n \ln \beta - n \psi(\theta) + \sum_{i=1}^{n} \ln x_i$$ 令导数等于0,得到似然方程: $$n \ln \beta - n \psi(\theta) + \sum_{i=1}^{n} \ln x_i = 0$$ 整理得: $$\psi(\theta) = \ln \beta + \frac{1}{n} \sum_{i=1}^{n} \ln x_i$$ 此方程即为关于 $\theta$ 的似然方程,通常无法得到解析解,需通过数值方法求解。
公式:$$\psi(\theta) = \ln \beta + \frac{1}{n} \sum_{i=1}^{n} \ln x_i$$
提示:对Gamma函数求导时,牢记digamma函数定义,避免直接对阶乘求导。
步骤 5/6
目标:解似然方程得MLE
由步骤4得到的似然方程为: $$ \frac{\partial \ln L}{\partial \theta} = \frac{2\sum_{i=1}^n X_i + \sum_{j=1}^m Y_j}{\theta} - 2(n+m) = 0. $$ 将方程两边乘以 $\theta$(注意 $\theta>0$),得: $$ 2\sum_{i=1}^n X_i + \sum_{j=1}^m Y_j - 2(n+m)\theta = 0. $$ 移项,得到: $$ 2(n+m)\theta = 2\sum_{i=1}^n X_i + \sum_{j=1}^m Y_j. $$ 两边同时除以 $2(n+m)$,解得 $\theta$ 的极大似然估计量为: $$ \hat{\theta} = \frac{2\sum_{i=1}^n X_i + \sum_{j=1}^m Y_j}{2(n+m)}. $$ 注意,这里 $\sum_{i=1}^n X_i$ 表示来自总体 $X$ 的样本和,$\sum_{j=1}^m Y_j$ 表示来自总体 $Y$ 的样本和。由于样本观测值均为正数,该估计量恒为正,符合参数 $\theta>0$ 的定义域要求。
公式:\hat{\theta} = \frac{2\sum_{i=1}^n X_i + \sum_{j=1}^m Y_j}{2(n+m)}
提示:解似然方程时,先化简再移项,注意分母为 $2(n+m)$ 而非 $n+m$。
步骤 6/6
目标:计算估计量的方差
已知估计量 $\hat{\theta} = \frac{1}{n+m}\left(\sum_{i=1}^{n}X_i + \frac{1}{2}\sum_{j=1}^{m}Y_j\right)$,其中 $X_i \sim E(\theta)$,$Y_j \sim E(2\theta)$,且所有随机变量相互独立。 首先,计算单个随机变量的方差。对于指数分布 $E(\theta)$,其方差为 $\theta^2$,因此 $D(X_i) = \theta^2$。对于 $Y_j \sim E(2\theta)$,其方差为 $(2\theta)^2 = 4\theta^2$,即 $D(Y_j) = 4\theta^2$。 由于 $X_i$ 与 $Y_j$ 相互独立,且样本之间也相互独立,根据方差的性质:独立随机变量线性组合的方差等于各变量方差乘以系数平方之和。 令 $\hat{\theta} = \frac{1}{n+m}\left(\sum_{i=1}^{n}X_i + \frac{1}{2}\sum_{j=1}^{m}Y_j\right)$,则 $$ D(\hat{\theta}) = \frac{1}{(n+m)^2}\left[ D\left(\sum_{i=1}^{n}X_i\right) + D\left(\frac{1}{2}\sum_{j=1}^{m}Y_j\right) \right]. $$ 计算各部分方差: $$ D\left(\sum_{i=1}^{n}X_i\right) = \sum_{i=1}^{n} D(X_i) = n \cdot \theta^2, $$ $$ D\left(\frac{1}{2}\sum_{j=1}^{m}Y_j\right) = \frac{1}{4} \sum_{j=1}^{m} D(Y_j) = \frac{1}{4} \cdot m \cdot 4\theta^2 = m \theta^2. $$ 代入得: $$ D(\hat{\theta}) = \frac{1}{(n+m)^2} (n\theta^2 + m\theta^2) = \frac{(n+m)\theta^2}{(n+m)^2} = \frac{\theta^2}{n+m}. $$ 因此,估计量 $\hat{\theta}$ 的方差为 $\frac{\theta^2}{n+m}$。 最终答案:$D(\hat{\theta}) = \frac{\theta^2}{n+m}$。
公式:D(\hat{\theta}) = \frac{\theta^2}{n+m}
提示:注意指数分布参数与方差的关系:若X~E(λ),则D(X)=1/λ²,此处λ=1/θ或1/(2θ)。

📷 拍照上传批改

拍照上传批改功能已预留入口,后续接入图片上传、OCR识别与AI批改。