2006年考研数学一第23题

解答题 · 10分

📝 题目

设总体 $X$ 的概率密度为 $$ f(x ; \theta)= \begin{cases}\theta, & 0\lt x\lt 1, \\ 1-\theta, & 1 \leqslant x\lt 2, \\ 0, & \text { 其他, }\end{cases} $$
其中 $\theta$ 是未知参数 $(0\lt\theta\lt 1) . X_{1}, X_{2}, \cdots, X_{n}$ 为来自总体 $X$ 的简单随机样本，记 $N$ 为样本值 $x_{1}, x_{2}, \cdots, x_{n}$ 中小于 1 的个数．求 $\theta$ 的最大似然估计．

💡 答案解析

**答案**: 见解析

---

**解析**:

矩估计的实质在于用样本矩来估计相应的总体矩，此题中被估参数只有一个，故只需要用样本一阶原点矩（样本均值）来估计总体的一阶原点矩（期望），所以矩估计的关键在于找出总体的矩 $E(X)$ ．最大似然估计，实质上就是找出使似然函数最大的那个参数，问题的关键在于构造似然函数．样本值中 $x_i$ 小于 1 的概率是 $\theta, x_i$ 大于 1 的概率是 $(1-\theta)$ ．因此，似然函数应为：

$$ L(\theta)=\prod_{i=1}^n f\left(x_i ; \theta\right)=\theta^N(1-\theta)^{n-N} . $$

（I）由数学期望的定义：

$$ E(X)=\int_{-\infty}^{+\infty} x f(x ; \theta) d x=\int_0^1 \theta x d x+\int_1^2(1-\theta) x d x=\frac{1}{2} \theta+\frac{3}{2}(1-\theta)=\frac{3}{2}-\theta $$

样本均值 $\bar{X}=\displaystyle\frac{1}{n} \displaystyle\sum_{i=1}^n X$ ，用样本均值估计期望有 $E X=\bar{X}$ 即 $\displaystyle\frac{3}{2}-\theta=\bar{X}$ ，解得 $\theta=\displaystyle\frac{3}{2}-\bar{X}$ ．所以参数 $\theta$ 的矩估计为 $\hat{\theta}=\displaystyle\frac{3}{2}-\bar{X}$ ．其中 $\bar{X}=\displaystyle\frac{1}{n} \displaystyle\sum_{i=1}^n X_i$ ．（II）对样本 $x_1, x_2, \cdots x_n$ 按照 $<1$ 或者 $\geq 1$ 进行分类，不妨设：$x_{p 1}, x_{p 2}, \cdots x_{p N}<1$ ， $x_{p N+1}, x_{p N+2}, \cdots x_{p n} \geq 1$ 。似然函数

$$ L(\theta)=\left\{\begin{array}{ll} \theta^N(1-\theta)^{n-N}, & x_{p 1}, x_{p 2}, \cdots x_{p N}<1, x_{p N+1}, x_{p N+2}, \cdots x_{p n} \geq 1 \\ 0, & \text { 其他 } \end{array}\right. \text {, } $$

在 $x_{p 1}, x_{p 2}, \cdots x_{p N}<1, x_{p N+1}, x_{p N+2}, \cdots x_{p n} \geq 1$ 时，等式两边同取自然对数得

$$ \ln L(\theta)=N \ln \theta+(n-N) \ln (1-\theta), $$ 由于 $\ln L(\theta)$ 和 $L(\theta)$ 在 $\theta$ 的同一点取得最大值，所以令

$$ \frac{d \ln L(\theta)}{d \theta}=\frac{N}{\theta}-\frac{n-N}{1-\theta}=0, $$

解得 $\theta=\displaystyle\frac{N}{n}$ ，所以 $\theta$ 的最大似然估计值为 $\hat{\theta}=\displaystyle\frac{N}{n}$ ．

📋 详细解题步骤

步骤 1/6

目标：理解样本分布并定义计数变量

首先，根据题目给出的概率密度函数，我们需要明确样本的分布特征。设总体 $X$ 的概率密度函数为 $f(x;\theta)$，其中 $\theta$ 为未知参数。由题意可知，样本值小于1的概率为 $\theta$，样本值大于等于1的概率为 $1-\theta$。具体地，有 $$P(X<1) = \int_{-\infty}^{1} f(x;\theta)\,dx = \theta, \quad P(X\geq 1) = \int_{1}^{+\infty} f(x;\theta)\,dx = 1-\theta.$$ 现在，我们有一个来自该总体的简单随机样本 $X_1, X_2, \ldots, X_n$，样本容量为 $n$。为了利用样本中关于 $\theta$ 的信息，我们定义一个计数变量 $N$，表示样本中满足 $X_i < 1$ 的个数，即 $$N = \sum_{i=1}^{n} I\{X_i < 1\},$$ 其中 $I\{\cdot\}$ 为示性函数（当条件成立时取1，否则取0）。那么，样本中大于等于1的个数自然就是 $n - N$。由于每个样本点独立且服从相同的分布，且每个样本点小于1的概率均为 $\theta$，因此 $N$ 服从二项分布，即 $$N \sim B(n, \theta).$$ 其概率分布列为 $$P(N = k) = \binom{n}{k} \theta^k (1-\theta)^{n-k}, \quad k = 0,1,\ldots,n.$$ 这个计数变量 $N$ 是后续构造矩估计量和最大似然估计量的基础。通过 $N$ 的观测值，我们可以将样本信息转化为关于 $\theta$ 的统计推断。

公式：$$N = \sum_{i=1}^{n} I\{X_i < 1\} \sim B(n, \theta)$$

提示：牢记每个样本点小于1的概率为θ，这是定义计数变量的关键。

步骤 2/6

目标：构造似然函数

根据题目信息，设总体分布为两点分布（Bernoulli分布），其概率分布为： $$P(X=x) = \theta^x (1-\theta)^{1-x}, \quad x=0,1$$ 其中参数$\theta \in (0,1)$。从总体中抽取容量为$n$的简单随机样本$X_1, X_2, \ldots, X_n$，样本观测值为$x_1, x_2, \ldots, x_n$。由于样本独立同分布，样本的联合概率密度函数（即似然函数）为各观测值概率的乘积： $$L(\theta) = \prod_{i=1}^{n} P(X_i = x_i) = \prod_{i=1}^{n} \theta^{x_i} (1-\theta)^{1-x_i}$$ 将乘积展开，指数部分相加： $$L(\theta) = \theta^{\sum_{i=1}^{n} x_i} (1-\theta)^{n - \sum_{i=1}^{n} x_i}$$ 记样本中取值为1的个数为$N = \sum_{i=1}^{n} x_i$，则$N$服从二项分布$B(n, \theta)$。于是似然函数可简化为： $$L(\theta) = \theta^{N} (1-\theta)^{n-N}, \quad \theta \in (0,1)$$ 该似然函数反映了在给定样本观测值下，参数$\theta$取不同值时的“似然”程度。后续步骤将对$L(\theta)$取对数并求导，以得到极大似然估计量。

公式：$$L(\theta) = \theta^{N} (1-\theta)^{n-N}$$

提示：注意区分样本容量n和成功次数N，指数部分要对应正确。

步骤 3/6

目标：取对数似然函数

在得到似然函数 $L(\theta) = \theta^{N} (1-\theta)^{n-N}$ 后，为了简化求导运算，我们对其取自然对数，得到对数似然函数。由于对数函数是单调递增的，最大化对数似然函数等价于最大化原似然函数。对似然函数两边取自然对数： $$ \ln L(\theta) = \ln\left[ \theta^{N} (1-\theta)^{n-N} \right] $$ 利用对数运算法则，乘积的对数等于对数之和： $$ \ln L(\theta) = \ln\left(\theta^{N}\right) + \ln\left((1-\theta)^{n-N}\right) $$ 再应用幂的对数法则 $\ln(a^b)=b\ln a$，得到： $$ \ln L(\theta) = N \ln\theta + (n-N) \ln(1-\theta) $$ 其中 $N = \sum_{i=1}^{n} X_i$ 是样本中取值为1的个数，$n$ 是样本容量。该表达式即为对数似然函数，它是参数 $\theta$ 的函数，下一步将对其求导并令导数为零，以求解极大似然估计量。

公式：$$\ln L(\theta) = N \ln\theta + (n-N) \ln(1-\theta)$$

提示：取对数时注意每一项的系数，$N$ 和 $n-N$ 是样本统计量，不要混淆。

步骤 4/6

目标：求导并令导数为零

在上一部分中，我们得到了对数似然函数： $$ \ln L(\theta) = N \ln \theta + (n - N) \ln(1 - \theta). $$ 其中 $N$ 为样本中取值为1的个数，$n$ 为样本容量。现在对 $\ln L(\theta)$ 关于参数 $\theta$ 求导。由于 $\ln L(\theta)$ 是两个对数项之和，分别求导： - 第一项 $N \ln \theta$ 的导数为 $\frac{N}{\theta}$； - 第二项 $(n - N) \ln(1 - \theta)$ 的导数为 $(n - N) \cdot \frac{1}{1 - \theta} \cdot (-1) = -\frac{n - N}{1 - \theta}$。因此，导数为： $$ \frac{d}{d\theta} \ln L(\theta) = \frac{N}{\theta} - \frac{n - N}{1 - \theta}. $$ 为了求极大似然估计，令导数等于零： $$ \frac{N}{\theta} - \frac{n - N}{1 - \theta} = 0. $$ 将等式整理： $$ \frac{N}{\theta} = \frac{n - N}{1 - \theta}. $$ 两边同时乘以 $\theta(1 - \theta)$（注意 $\theta \in (0,1)$，分母不为零）： $$ N(1 - \theta) = (n - N)\theta. $$ 展开并移项： $$ N - N\theta = n\theta - N\theta. $$ 两边 $N\theta$ 抵消，得到： $$ N = n\theta. $$ 解得： $$ \theta = \frac{N}{n}. $$ 此即极大似然估计的候选值。由于对数似然函数是凹函数（二阶导数为负），该解确实为最大值点。

公式：$$\frac{d}{d\theta} \ln L(\theta) = \frac{N}{\theta} - \frac{n - N}{1 - \theta} = 0$$

提示：求导时注意复合函数求导的链式法则，尤其是 $\ln(1-\theta)$ 的导数。

步骤 5/6

目标：解出θ的候选值

由步骤4得到的方程 $\frac{N}{\theta} = \frac{n-N}{1-\theta}$，我们需要解出参数 $\theta$ 的候选值。首先，方程两边同时乘以 $\theta(1-\theta)$ 以消去分母，得到： $$N(1-\theta) = (n-N)\theta$$ 展开左边： $$N - N\theta = (n-N)\theta$$ 将所有含 $\theta$ 的项移到方程的一侧，常数项移到另一侧： $$N = (n-N)\theta + N\theta = n\theta$$ 因此， $$\theta = \frac{N}{n}$$ 注意，这里 $N$ 是样本中成功次数（即取到白球的个数），$n$ 是样本容量。由于 $\theta$ 表示总体中白球的比例，其取值范围为 $[0,1]$，而 $N/n$ 恰好是样本比例，因此该解是合理的候选值。在实际问题中，该解即为极大似然估计量 $\hat{\theta}_{MLE} = \frac{N}{n}$。

公式：$$\theta = \frac{N}{n}$$

提示：去分母后合并同类项，注意 $N$ 和 $n$ 是已知常数，$\theta$ 是未知数。

📷 拍照上传批改

拍照上传批改功能已预留入口，后续接入图片上传、OCR识别与AI批改。

← 第22题返回列表已是最后一题