2006年考研数学一第23题

解答题 · 10分

📝 题目

设总体 $X$ 的概率密度为 $$ f(x ; \theta)= \begin{cases}\theta, & 0\lt x\lt 1, \\ 1-\theta, & 1 \leqslant x\lt 2, \\ 0, & \text { 其他, }\end{cases} $$
其中 $\theta$ 是未知参数 $(0\lt\theta\lt 1) . X_{1}, X_{2}, \cdots, X_{n}$ 为来自总体 $X$ 的简单随机样本,记 $N$ 为样本值 $x_{1}, x_{2}, \cdots, x_{n}$ 中小于 1 的个数.求 $\theta$ 的最大似然估计.

💡 答案解析

**答案**: 见解析

---

**解析**:

矩估计的实质在于用样本矩来估计相应的总体矩,此题中被估参数只有一个,故只需要用样本一阶原点矩(样本均值)来估计总体的一阶原点矩(期望),所以矩估计的关键在于找出总体的矩 $E(X)$ . 最大似然估计,实质上就是找出使似然函数最大的那个参数,问题的关键在于构造似然函数.样本值中 $x_i$ 小于 1 的概率是 $\theta, x_i$ 大于 1 的概率是 $(1-\theta)$ .因此,似然函数应为:

$$ L(\theta)=\prod_{i=1}^n f\left(x_i ; \theta\right)=\theta^N(1-\theta)^{n-N} . $$

(I)由数学期望的定义:

$$ E(X)=\int_{-\infty}^{+\infty} x f(x ; \theta) d x=\int_0^1 \theta x d x+\int_1^2(1-\theta) x d x=\frac{1}{2} \theta+\frac{3}{2}(1-\theta)=\frac{3}{2}-\theta $$

样本均值 $\bar{X}=\displaystyle\frac{1}{n} \displaystyle\sum_{i=1}^n X$ , 用样本均值估计期望有 $E X=\bar{X}$ 即 $\displaystyle\frac{3}{2}-\theta=\bar{X}$ ,解得 $\theta=\displaystyle\frac{3}{2}-\bar{X}$ . 所以参数 $\theta$ 的矩估计为 $\hat{\theta}=\displaystyle\frac{3}{2}-\bar{X}$ .其中 $\bar{X}=\displaystyle\frac{1}{n} \displaystyle\sum_{i=1}^n X_i$ . (II)对样本 $x_1, x_2, \cdots x_n$ 按照 $<1$ 或者 $\geq 1$ 进行分类,不妨设:$x_{p 1}, x_{p 2}, \cdots x_{p N}<1$ , $x_{p N+1}, x_{p N+2}, \cdots x_{p n} \geq 1$ 。似然函数

$$ L(\theta)=\left\{\begin{array}{ll} \theta^N(1-\theta)^{n-N}, & x_{p 1}, x_{p 2}, \cdots x_{p N}<1, x_{p N+1}, x_{p N+2}, \cdots x_{p n} \geq 1 \\ 0, & \text { 其他 } \end{array}\right. \text {, } $$

在 $x_{p 1}, x_{p 2}, \cdots x_{p N}<1, x_{p N+1}, x_{p N+2}, \cdots x_{p n} \geq 1$ 时,等式两边同取自然对数得

$$ \ln L(\theta)=N \ln \theta+(n-N) \ln (1-\theta), $$ 由于 $\ln L(\theta)$ 和 $L(\theta)$ 在 $\theta$ 的同一点取得最大值,所以令

$$ \frac{d \ln L(\theta)}{d \theta}=\frac{N}{\theta}-\frac{n-N}{1-\theta}=0, $$

解得 $\theta=\displaystyle\frac{N}{n}$ ,所以 $\theta$ 的最大似然估计值为 $\hat{\theta}=\displaystyle\frac{N}{n}$ .

📋 详细解题步骤

步骤 1/6
目标:理解样本分布并定义计数变量
首先,根据题目给出的概率密度函数,我们需要明确样本的分布特征。设总体 $X$ 的概率密度函数为 $f(x;\theta)$,其中 $\theta$ 为未知参数。由题意可知,样本值小于1的概率为 $\theta$,样本值大于等于1的概率为 $1-\theta$。具体地,有 $$P(X<1) = \int_{-\infty}^{1} f(x;\theta)\,dx = \theta, \quad P(X\geq 1) = \int_{1}^{+\infty} f(x;\theta)\,dx = 1-\theta.$$ 现在,我们有一个来自该总体的简单随机样本 $X_1, X_2, \ldots, X_n$,样本容量为 $n$。为了利用样本中关于 $\theta$ 的信息,我们定义一个计数变量 $N$,表示样本中满足 $X_i < 1$ 的个数,即 $$N = \sum_{i=1}^{n} I\{X_i < 1\},$$ 其中 $I\{\cdot\}$ 为示性函数(当条件成立时取1,否则取0)。那么,样本中大于等于1的个数自然就是 $n - N$。 由于每个样本点独立且服从相同的分布,且每个样本点小于1的概率均为 $\theta$,因此 $N$ 服从二项分布,即 $$N \sim B(n, \theta).$$ 其概率分布列为 $$P(N = k) = \binom{n}{k} \theta^k (1-\theta)^{n-k}, \quad k = 0,1,\ldots,n.$$ 这个计数变量 $N$ 是后续构造矩估计量和最大似然估计量的基础。通过 $N$ 的观测值,我们可以将样本信息转化为关于 $\theta$ 的统计推断。
公式:$$N = \sum_{i=1}^{n} I\{X_i < 1\} \sim B(n, \theta)$$
提示:牢记每个样本点小于1的概率为θ,这是定义计数变量的关键。
步骤 2/6
目标:构造似然函数
根据题目信息,设总体分布为两点分布(Bernoulli分布),其概率分布为: $$P(X=x) = \theta^x (1-\theta)^{1-x}, \quad x=0,1$$ 其中参数$\theta \in (0,1)$。 从总体中抽取容量为$n$的简单随机样本$X_1, X_2, \ldots, X_n$,样本观测值为$x_1, x_2, \ldots, x_n$。由于样本独立同分布,样本的联合概率密度函数(即似然函数)为各观测值概率的乘积: $$L(\theta) = \prod_{i=1}^{n} P(X_i = x_i) = \prod_{i=1}^{n} \theta^{x_i} (1-\theta)^{1-x_i}$$ 将乘积展开,指数部分相加: $$L(\theta) = \theta^{\sum_{i=1}^{n} x_i} (1-\theta)^{n - \sum_{i=1}^{n} x_i}$$ 记样本中取值为1的个数为$N = \sum_{i=1}^{n} x_i$,则$N$服从二项分布$B(n, \theta)$。于是似然函数可简化为: $$L(\theta) = \theta^{N} (1-\theta)^{n-N}, \quad \theta \in (0,1)$$ 该似然函数反映了在给定样本观测值下,参数$\theta$取不同值时的“似然”程度。后续步骤将对$L(\theta)$取对数并求导,以得到极大似然估计量。
公式:$$L(\theta) = \theta^{N} (1-\theta)^{n-N}$$
提示:注意区分样本容量n和成功次数N,指数部分要对应正确。
步骤 3/6
目标:取对数似然函数
在得到似然函数 $L(\theta) = \theta^{N} (1-\theta)^{n-N}$ 后,为了简化求导运算,我们对其取自然对数,得到对数似然函数。由于对数函数是单调递增的,最大化对数似然函数等价于最大化原似然函数。对似然函数两边取自然对数: $$ \ln L(\theta) = \ln\left[ \theta^{N} (1-\theta)^{n-N} \right] $$ 利用对数运算法则,乘积的对数等于对数之和: $$ \ln L(\theta) = \ln\left(\theta^{N}\right) + \ln\left((1-\theta)^{n-N}\right) $$ 再应用幂的对数法则 $\ln(a^b)=b\ln a$,得到: $$ \ln L(\theta) = N \ln\theta + (n-N) \ln(1-\theta) $$ 其中 $N = \sum_{i=1}^{n} X_i$ 是样本中取值为1的个数,$n$ 是样本容量。该表达式即为对数似然函数,它是参数 $\theta$ 的函数,下一步将对其求导并令导数为零,以求解极大似然估计量。
公式:$$\ln L(\theta) = N \ln\theta + (n-N) \ln(1-\theta)$$
提示:取对数时注意每一项的系数,$N$ 和 $n-N$ 是样本统计量,不要混淆。
步骤 4/6
目标:求导并令导数为零
在上一部分中,我们得到了对数似然函数: $$ \ln L(\theta) = N \ln \theta + (n - N) \ln(1 - \theta). $$ 其中 $N$ 为样本中取值为1的个数,$n$ 为样本容量。 现在对 $\ln L(\theta)$ 关于参数 $\theta$ 求导。由于 $\ln L(\theta)$ 是两个对数项之和,分别求导: - 第一项 $N \ln \theta$ 的导数为 $\frac{N}{\theta}$; - 第二项 $(n - N) \ln(1 - \theta)$ 的导数为 $(n - N) \cdot \frac{1}{1 - \theta} \cdot (-1) = -\frac{n - N}{1 - \theta}$。 因此,导数为: $$ \frac{d}{d\theta} \ln L(\theta) = \frac{N}{\theta} - \frac{n - N}{1 - \theta}. $$ 为了求极大似然估计,令导数等于零: $$ \frac{N}{\theta} - \frac{n - N}{1 - \theta} = 0. $$ 将等式整理: $$ \frac{N}{\theta} = \frac{n - N}{1 - \theta}. $$ 两边同时乘以 $\theta(1 - \theta)$(注意 $\theta \in (0,1)$,分母不为零): $$ N(1 - \theta) = (n - N)\theta. $$ 展开并移项: $$ N - N\theta = n\theta - N\theta. $$ 两边 $N\theta$ 抵消,得到: $$ N = n\theta. $$ 解得: $$ \theta = \frac{N}{n}. $$ 此即极大似然估计的候选值。由于对数似然函数是凹函数(二阶导数为负),该解确实为最大值点。
公式:$$\frac{d}{d\theta} \ln L(\theta) = \frac{N}{\theta} - \frac{n - N}{1 - \theta} = 0$$
提示:求导时注意复合函数求导的链式法则,尤其是 $\ln(1-\theta)$ 的导数。
步骤 5/6
目标:解出θ的候选值
由步骤4得到的方程 $\frac{N}{\theta} = \frac{n-N}{1-\theta}$,我们需要解出参数 $\theta$ 的候选值。首先,方程两边同时乘以 $\theta(1-\theta)$ 以消去分母,得到: $$N(1-\theta) = (n-N)\theta$$ 展开左边: $$N - N\theta = (n-N)\theta$$ 将所有含 $\theta$ 的项移到方程的一侧,常数项移到另一侧: $$N = (n-N)\theta + N\theta = n\theta$$ 因此, $$\theta = \frac{N}{n}$$ 注意,这里 $N$ 是样本中成功次数(即取到白球的个数),$n$ 是样本容量。由于 $\theta$ 表示总体中白球的比例,其取值范围为 $[0,1]$,而 $N/n$ 恰好是样本比例,因此该解是合理的候选值。在实际问题中,该解即为极大似然估计量 $\hat{\theta}_{MLE} = \frac{N}{n}$。
公式:$$\theta = \frac{N}{n}$$
提示:去分母后合并同类项,注意 $N$ 和 $n$ 是已知常数,$\theta$ 是未知数。

📷 拍照上传批改

拍照上传批改功能已预留入口,后续接入图片上传、OCR识别与AI批改。