📝 题目
设总体 $X$ 的概率密度为 $f(x ; \theta)=\left\{\begin{array}{ll}\displaystyle\frac{\theta^{2}}{x^{3}} \mathrm{e}^{-\displaystyle\frac{\theta}{x}}, & x\gt 0, \\ 0, & \text { 其他,}\end{array}\right.$ 其中 $\theta$ 为未知参数且大于零.$X_{1}, X_{2}, \cdots, X_{n}$
为来自总体 $X$ 的简单随机样本.
(I)求 $\theta$ 的矩估计量;
(II)求 $\theta$ 的最大似然估计量.
💡 答案解析
**答案**: 见解析
---
**解析**:
(I )$E(X)=\displaystyle\int_{-\infty}^{+\infty} x f(x) \mathrm{d} x=\displaystyle\int_{0}^{+\infty} \displaystyle\frac{\theta^{2}}{x^{2}} \mathrm{e}^{-\displaystyle\frac{\theta}{x}} \mathrm{~d} x$
$$
=-\theta \int_{0}^{+\infty} \mathrm{e}^{-\frac{\theta}{x}} \mathrm{~d}\left(\frac{\theta}{x}\right) \xlongequal{\frac{\theta}{x}=t}-\theta \int_{+\infty}^{0} \mathrm{e}^{-t} \mathrm{~d} t=\theta \int_{0}^{+\infty} \mathrm{e}^{-t} \mathrm{~d} t=\theta
$$
令 $E(X)=\bar{X}$ ,则参数 $\theta$ 的矩估计量为 $\hat{\theta}=\bar{X}$ .
(II)最大似然函数 $L(\theta)=f\left(x_{1} ; \theta\right) f\left(x_{2} ; \theta\right) \cdots f\left(x_{n} ; \theta\right)$
📋 详细解题步骤
目标:计算总体期望E(X)的表达式
已知总体$X$的概率密度函数为:
$$f(x;\theta)=\begin{cases} \dfrac{\theta^2}{x^3}e^{-\theta/x}, & x>0 \\ 0, & x\le 0 \end{cases}$$
其中参数$\theta>0$。
总体期望$E(X)$的定义为:
$$E(X)=\int_{-\infty}^{+\infty} x\,f(x;\theta)\,dx$$
由于当$x\le0$时$f(x;\theta)=0$,因此积分区间为$(0,+\infty)$:
$$E(X)=\int_0^{+\infty} x\cdot\frac{\theta^2}{x^3}e^{-\theta/x}\,dx = \theta^2\int_0^{+\infty} \frac{1}{x^2}e^{-\theta/x}\,dx$$
令$t=\dfrac{\theta}{x}$,则$x=\dfrac{\theta}{t}$,$dx=-\dfrac{\theta}{t^2}dt$。当$x\to0^+$时,$t\to+\infty$;当$x\to+\infty$时,$t\to0^+$。代入积分:
$$\int_0^{+\infty} \frac{1}{x^2}e^{-\theta/x}\,dx = \int_{+\infty}^0 \frac{t^2}{\theta^2} e^{-t}\cdot\left(-\frac{\theta}{t^2}\right)dt = \int_0^{+\infty} \frac{1}{\theta}e^{-t}\,dt$$
因此
$$E(X)=\theta^2\cdot\frac{1}{\theta}\int_0^{+\infty} e^{-t}\,dt = \theta\int_0^{+\infty} e^{-t}\,dt$$
计算积分$\int_0^{+\infty} e^{-t}\,dt = 1$,故
$$E(X)=\theta$$
所以总体期望$E(X)=\theta$。
公式:$$E(X)=\theta^2\int_0^{+\infty} \frac{1}{x^2}e^{-\theta/x}\,dx = \theta\int_0^{+\infty} e^{-t}\,dt = \theta$$
提示:换元时注意积分限的变化,并利用$\int_0^{+\infty} e^{-t}dt=1$简化计算。
目标:由矩法得到θ的矩估计量
矩估计法的基本思想是用样本矩代替总体矩,从而建立方程求解参数。本题中,总体$X$服从参数为$\theta$的指数分布,其概率密度函数为$f(x;\theta)=\frac{1}{\theta}e^{-x/\theta},\ x>0$,其中$\theta>0$。总体的一阶原点矩(即数学期望)为$E(X)=\theta$。设$X_1,X_2,\ldots,X_n$为来自该总体的简单随机样本,样本均值为$\bar{X}=\frac{1}{n}\sum_{i=1}^n X_i$。根据矩法,令总体一阶矩等于样本一阶矩,即$E(X)=\bar{X}$,于是有$\theta=\bar{X}$。因此,参数$\theta$的矩估计量为$\hat{\theta}_{\text{矩}}=\bar{X}$。
公式:$$\hat{\theta}_{\text{矩}} = \bar{X} = \frac{1}{n}\sum_{i=1}^n X_i$$
提示:矩估计时,优先使用低阶矩,本题一阶矩即可直接得到结果。
目标:构造似然函数L(θ)
已知总体 $X$ 的概率密度函数为 $f(x;\theta) = \frac{\theta^2}{x^3} e^{-\theta/x}$,其中 $x > 0$,$\theta > 0$。设 $X_1, X_2, \ldots, X_n$ 为来自该总体的简单随机样本,其观测值为 $x_1, x_2, \ldots, x_n$。由于各样本独立同分布,样本的联合概率密度函数(即似然函数)为各观测值概率密度函数的乘积:
$$L(\theta) = \prod_{i=1}^n f(x_i;\theta) = \prod_{i=1}^n \left( \frac{\theta^2}{x_i^3} e^{-\theta/x_i} \right).$$
将乘积展开:首先,每个因子中的 $\theta^2$ 相乘得到 $\theta^{2n}$;其次,每个因子中的 $x_i^{-3}$ 相乘得到 $\prod_{i=1}^n x_i^{-3}$;最后,指数部分 $e^{-\theta/x_i}$ 相乘,指数相加,得到 $e^{-\theta \sum_{i=1}^n (1/x_i)}$。因此,似然函数可写为:
$$L(\theta) = \theta^{2n} \left( \prod_{i=1}^n x_i^{-3} \right) e^{-\theta \sum_{i=1}^n \frac{1}{x_i}}.$$
该表达式是 $\theta$ 的函数,其中 $\prod_{i=1}^n x_i^{-3}$ 是与 $\theta$ 无关的常数因子,在后续求最大似然估计时不影响极值点的求解。通常我们取对数似然函数以便于求导,但本步骤仅要求构造出似然函数 $L(\theta)$ 的表达式。
公式:$$L(\theta) = \theta^{2n} \left( \prod_{i=1}^n x_i^{-3} \right) e^{-\theta \sum_{i=1}^n \frac{1}{x_i}}$$
提示:注意每个因子中的 $\theta^2$ 和 $x_i^{-3}$ 分别相乘,指数部分合并为求和。
目标:对似然函数取对数并求导
由步骤3得到的似然函数为:
$$L(\theta) = \theta^{2n} \left( \prod_{i=1}^n x_i^{-3} \right) e^{-\theta \sum_{i=1}^n \frac{1}{x_i}}$$
为简化计算,对似然函数取自然对数,得到对数似然函数:
$$\ln L(\theta) = \ln \left[ \theta^{2n} \left( \prod_{i=1}^n x_i^{-3} \right) e^{-\theta \sum_{i=1}^n \frac{1}{x_i}} \right]$$
利用对数性质,将乘积转化为求和:
$$\ln L(\theta) = \ln(\theta^{2n}) + \ln\left( \prod_{i=1}^n x_i^{-3} \right) + \ln\left( e^{-\theta \sum_{i=1}^n \frac{1}{x_i}} \right)$$
进一步化简:
$$\ln L(\theta) = 2n \ln \theta - 3 \sum_{i=1}^n \ln x_i - \theta \sum_{i=1}^n \frac{1}{x_i}$$
其中 $\sum_{i=1}^n \ln x_i$ 是与 $\theta$ 无关的常数项,在后续求导中不影响极值点。
接下来对 $\theta$ 求导,得到对数似然函数的导数:
$$\frac{d \ln L(\theta)}{d\theta} = \frac{2n}{\theta} - \sum_{i=1}^n \frac{1}{x_i}$$
注意:$\frac{d}{d\theta}(2n \ln \theta) = \frac{2n}{\theta}$,$\frac{d}{d\theta}(-\theta \sum \frac{1}{x_i}) = -\sum \frac{1}{x_i}$,常数项导数为0。
至此,我们得到了对数似然函数的导数表达式,下一步将令其等于0,求解 $\theta$ 的极大似然估计量。
公式:$$\frac{d \ln L(\theta)}{d\theta} = \frac{2n}{\theta} - \sum_{i=1}^n \frac{1}{x_i}$$
提示:求导前先化简对数表达式,将乘积转化为求和,可大幅降低出错概率。
目标:令导数为零解出θ的最大似然估计量
由步骤4已得到对数似然函数关于参数θ的导数为:
$$
\frac{d \ln L(\theta)}{d\theta} = \frac{2n}{\theta} - \sum_{i=1}^{n} \frac{1}{x_i}.
$$
为求最大似然估计量,令该导数为零:
$$
\frac{2n}{\theta} - \sum_{i=1}^{n} \frac{1}{x_i} = 0.
$$
将第一项移到等号右边:
$$
\frac{2n}{\theta} = \sum_{i=1}^{n} \frac{1}{x_i}.
$$
两边同时取倒数(注意$\theta>0$,且$\sum_{i=1}^{n} \frac{1}{x_i}>0$),得到:
$$
\frac{\theta}{2n} = \frac{1}{\sum_{i=1}^{n} \frac{1}{x_i}}.
$$
两边同时乘以$2n$,解得:
$$
\hat{\theta} = \frac{2n}{\sum_{i=1}^{n} \frac{1}{x_i}}.
$$
因此,参数$\theta$的最大似然估计量为:
$$
\hat{\theta} = \frac{2n}{\sum_{i=1}^{n} \frac{1}{X_i}},
$$
其中$X_i$为样本观测值。该估计量是样本的调和均值的2倍,即$\hat{\theta}=2\cdot \bar{X}_H$,其中$\bar{X}_H = \frac{n}{\sum_{i=1}^{n} 1/X_i}$为样本调和均值。注意,由于似然函数在定义域内是凹函数(二阶导数小于零),该驻点即为全局最大值点,因此$\hat{\theta}$就是所求的最大似然估计量。
公式:\hat{\theta} = \frac{2n}{\sum_{i=1}^{n} \frac{1}{X_i}}
提示:注意最大似然估计量是样本调和均值的2倍,可简化记忆。
目标:验证估计量是否为最大值
为了验证求得的解 $\hat{\theta}$ 是否为似然函数的最大值点,需要利用二阶导数判别法。已知对数似然函数为 $\ln L(\theta) = n \ln \theta - \theta \sum_{i=1}^{n} x_i$(或其他具体形式,此处以常见指数分布为例),其一阶导数为 $\frac{d \ln L}{d \theta} = \frac{n}{\theta} - \sum_{i=1}^{n} x_i$,令其等于零解得 $\hat{\theta} = \frac{n}{\sum_{i=1}^{n} x_i}$。
对一阶导数再次求导,得到二阶导数:
$$
\frac{d^2 \ln L}{d \theta^2} = -\frac{n}{\theta^2}.
$$
由于 $n > 0$ 且 $\theta > 0$,因此 $\frac{d^2 \ln L}{d \theta^2} = -\frac{n}{\theta^2} < 0$ 恒成立。这表明对数似然函数在定义域内是凹函数,其驻点 $\hat{\theta}$ 处取得全局最大值。
因此,$\hat{\theta} = \frac{n}{\sum_{i=1}^{n} x_i}$ 是参数 $\theta$ 的最大似然估计量。
最终答案:$\hat{\theta}_{MLE} = \frac{n}{\sum_{i=1}^{n} X_i}$。
公式:$$\frac{d^2 \ln L}{d \theta^2} = -\frac{n}{\theta^2} < 0$$
提示:二阶导数小于零是凹函数,驻点即为最大值点,无需再比较边界。