2024年考研数学一第22题

解答题 · 12分

📝 题目

设总体 $X \sim U(0, \theta), ~ \theta$ 木知,$X_{1}, X_{2} \cdots X_{n}$ 为简单掋机样本, $X_{(n)}=\max \left(X_{1}, X_{2} \cdots X_{n}\right), \quad T_{c}=c X_{(n)}$. (1)求 $c$ 时,使得 $T_{c}$ 为 $\theta$ 的无偏估计。 (2)记 $h(c)=E\left(T_{e}-\theta\right)^{2}$ ,求 $c$ 使得 $h(c)$ 取最小值.

💡 答案解析

【解析】

(1)$X$ 的概率密度为 $f(x)=\left\{\begin{array}{l}\displaystyle\frac{1}{\theta}, 0\lt x\lt \theta \\ 0, \text { 其它 }\end{array}\right.$ , $X$ 的分布函数为 $F(x)=\left\{\begin{array}{l}0, x\lt 0 \\ \displaystyle\frac{1}{\theta} x, 0 \leq x\lt \theta \\ 1, x \geq \theta\end{array}\right.$ .

$X_{(n)}$ 的分布函数为:

$$ \begin{aligned} & F_{X_{(n)}}(x)=P\left\{\max \left\{X_1, X_2, \cdots, X_n\right\} \leq x\right\} \\ & =P\left\{X_1 \leq x, X_2 \leq x, \cdots, X_n \leq x\right\} \\ & =P\left\{X_1 \leq x\right\} \cdot P\left\{X_2 \leq x\right\} \cdots \cdot P\left\{X_n \leq x\right\}=F^n(x) \end{aligned} $$

$X_{(n)}$ 概率密度为 $f_{X_{(n)}}(x)=n F^{n-1}(x) \cdot f(x)=\left\{\begin{array}{l}\displaystyle\frac{n}{\theta^n} x^{n-1}, 0\lt x\lt \theta \\ 0, \text { 其它 }\end{array} \quad\right.$.

$$ E\left(T_c\right)=c E\left(X_{(n)}\right)=c \int_0^\theta x \cdot \frac{n}{\theta^n} x^{n-1} d x=\frac{c n}{n+1} \theta \text {, 令 } E\left(T_c\right)=\frac{c n}{n+1} \theta=\theta \text {, } $$

得 $c=\displaystyle\frac{n+1}{n}$ .

(2)$E\left(T_c^2\right)=c^2 E\left(X_{(n)}^2\right)=c^2 \displaystyle\int_0^\theta x^2 \cdot \displaystyle\frac{n}{\theta^n} x^{n-1} d x=\displaystyle\frac{c^2 n}{n+2} \theta^2$

$$ \begin{aligned} & h(c)=E\left(T_c-\theta\right)^2 \\ & =E\left(T_c^2-2 \theta T_c+\theta^2\right) \\ & =E\left(T_c^2\right)-2 \theta E\left(T_c\right)+\theta^2 \\ & =\frac{c^2 n}{n+2} \theta^2-\frac{2 c n}{n+1} \theta^2+\theta^2 . \end{aligned} $$

$$ h^{\prime}(c)=\frac{2 c n}{n+2} \theta^2-\frac{2 n}{n+1} \theta^2 \text {, 令 } h^{\prime}(c)=0 \text { 得 } c=\frac{n+2}{n+1} . h^{\prime \prime}(c)=\frac{2 n}{n+2} \theta^2\gt 0 \text {, } $$

所以当 $c=\displaystyle\frac{n+2}{n+1}$ 时,$h(c)$ 最小.

📋 详细解题步骤

步骤 1/7
目标:写出总体分布函数和密度函数
由题意,总体 $X$ 服从区间 $(0,\theta)$ 上的均匀分布,记为 $X \sim U(0,\theta)$,其中 $\theta > 0$ 为未知参数。均匀分布的密度函数在区间内为常数,且区间长度为 $\theta$,因此概率密度函数为: $$f(x;\theta) = \begin{cases} \dfrac{1}{\theta}, & 0 < x < \theta, \\ 0, & \text{其他}. \end{cases}$$ 分布函数 $F(x;\theta) = P(X \le x)$ 需分段讨论: - 当 $x < 0$ 时,$P(X \le x) = 0$; - 当 $0 \le x < \theta$ 时,$P(X \le x) = \int_0^x \frac{1}{\theta} \, dt = \frac{x}{\theta}$; - 当 $x \ge \theta$ 时,$P(X \le x) = 1$。 因此总体分布函数为: $$F(x;\theta) = \begin{cases} 0, & x < 0, \\ \dfrac{x}{\theta}, & 0 \le x < \theta, \\ 1, & x \ge \theta. \end{cases}$$ 注意:在端点 $x=0$ 处,由于连续型随机变量在单点概率为0,定义 $F(0)=0$ 或 $F(0)=0/\theta=0$ 均可;在 $x=\theta$ 处,$F(\theta)=1$。本步骤为后续参数估计(如矩估计、极大似然估计)提供基础。
公式:f(x;\theta) = \frac{1}{\theta},\quad 0
提示:注意均匀分布密度函数在区间外为0,分布函数要分段写出。
步骤 2/7
目标:推导最大顺序统计量X_{(n)}的分布
设总体$X$的分布函数为$F(x)$,概率密度函数为$f(x)$,且$X_1,X_2,\dots,X_n$为来自该总体的简单随机样本,相互独立且与总体同分布。最大顺序统计量定义为$X_{(n)}=\max\{X_1,X_2,\dots,X_n\}$。 首先推导$X_{(n)}$的分布函数$F_{X_{(n)}}(x)$。由定义: $$F_{X_{(n)}}(x)=P(X_{(n)}\le x)=P(\max\{X_1,\dots,X_n\}\le x)$$ 由于最大值小于等于$x$等价于所有样本都小于等于$x$,利用独立性可得: $$F_{X_{(n)}}(x)=P(X_1\le x,\dots,X_n\le x)=\prod_{i=1}^n P(X_i\le x)=[F(x)]^n$$ 对分布函数求导即得概率密度函数: $$f_{X_{(n)}}(x)=\frac{d}{dx}F_{X_{(n)}}(x)=n[F(x)]^{n-1}f(x)$$ 本题中总体$X$服从均匀分布$U(0,\theta)$,其分布函数为: $$F(x)=\begin{cases}0, & x<0\\ \frac{x}{\theta}, & 0\le x<\theta\\ 1, & x\ge\theta\end{cases}$$ 概率密度函数为: $$f(x)=\begin{cases}\frac{1}{\theta}, & 0
公式:$$F_{X_{(n)}}(x)=F^n(x),\quad f_{X_{(n)}}(x)=nF^{n-1}(x)f(x)=\frac{n}{\theta^n}x^{n-1}\;(0
提示:牢记最大值小于等于x等价于所有样本小于等于x,利用独立性将概率相乘。
步骤 3/7
目标:计算T_c的期望并求无偏条件
首先,由步骤2已知样本的最大顺序统计量$X_{(n)}$的概率密度函数为: $$f_{X_{(n)}}(x) = \frac{n}{\theta^n} x^{n-1}, \quad 0 \le x \le \theta.$$ 构造的估计量$T_c = c X_{(n)}$,其期望为: $$E(T_c) = E(c X_{(n)}) = c E(X_{(n)}) = c \int_0^\theta x \cdot \frac{n}{\theta^n} x^{n-1} \, dx = c \cdot \frac{n}{\theta^n} \int_0^\theta x^n \, dx.$$ 计算积分: $$\int_0^\theta x^n \, dx = \left[ \frac{x^{n+1}}{n+1} \right]_0^\theta = \frac{\theta^{n+1}}{n+1}.$$ 代入得: $$E(T_c) = c \cdot \frac{n}{\theta^n} \cdot \frac{\theta^{n+1}}{n+1} = c \cdot \frac{n}{n+1} \theta.$$ 为使$T_c$成为$ heta$的无偏估计量,需满足$E(T_c) = \theta$,即: $$c \cdot \frac{n}{n+1} \theta = \theta.$$ 解得: $$c = \frac{n+1}{n}.$$ 因此,当$c = \frac{n+1}{n}$时,$T_c$是$ heta$的无偏估计量。
公式:E(T_c) = c \cdot \frac{n}{n+1} \theta, \quad c = \frac{n+1}{n}
提示:注意积分上下限和指数运算,无偏条件即令期望等于待估参数。
步骤 4/7
目标:计算T_c的二阶矩
我们需要计算统计量 $T_c = c X_{(n)}$ 的二阶矩 $E(T_c^2)$。由于 $T_c^2 = c^2 X_{(n)}^2$,且 $X_{(n)}$ 是来自均匀分布 $U(0,\theta)$ 的样本最大值,其概率密度函数为 $f_{X_{(n)}}(x) = \frac{n}{\theta^n} x^{n-1}, \ 0 \le x \le \theta$。因此,二阶矩为: $$E(T_c^2) = c^2 E(X_{(n)}^2) = c^2 \int_0^\theta x^2 \cdot \frac{n}{\theta^n} x^{n-1} \, dx = \frac{c^2 n}{\theta^n} \int_0^\theta x^{n+1} \, dx.$$ 计算积分:$\int_0^\theta x^{n+1} \, dx = \frac{\theta^{n+2}}{n+2}$。代入得: $$E(T_c^2) = \frac{c^2 n}{\theta^n} \cdot \frac{\theta^{n+2}}{n+2} = \frac{c^2 n}{n+2} \theta^2.$$ 因此,$T_c$ 的二阶矩为 $\frac{c^2 n}{n+2} \theta^2$。
公式:$$E(T_c^2) = \frac{c^2 n}{n+2} \theta^2$$
提示:注意顺序统计量的密度函数中指数是n-1,积分时指数加1。
步骤 5/7
目标:写出均方误差h(c)的表达式
本步骤的目标是推导均方误差 $h(c) = E(T_c - \theta)^2$ 的具体表达式。首先,将均方误差展开为: $$h(c) = E(T_c^2) - 2\theta E(T_c) + \theta^2.$$ 由前几步已知,$T_c = c \cdot \frac{1}{n}\sum_{i=1}^n X_i^2$,且 $X_i$ 独立同分布于 $N(0,\theta)$,因此 $\frac{X_i^2}{\theta} \sim \chi^2(1)$。记 $Y = \sum_{i=1}^n X_i^2$,则 $Y/\theta \sim \chi^2(n)$,其期望 $E(Y) = n\theta$,方差 $Var(Y) = 2n\theta^2$。 首先计算 $E(T_c)$: $$E(T_c) = E\left( c \cdot \frac{Y}{n} \right) = \frac{c}{n} E(Y) = \frac{c}{n} \cdot n\theta = c\theta.$$ 其次计算 $E(T_c^2)$: $$E(T_c^2) = E\left( \frac{c^2}{n^2} Y^2 \right) = \frac{c^2}{n^2} E(Y^2).$$ 由于 $Var(Y) = E(Y^2) - [E(Y)]^2$,可得 $E(Y^2) = Var(Y) + [E(Y)]^2 = 2n\theta^2 + (n\theta)^2 = n^2\theta^2 + 2n\theta^2 = n(n+2)\theta^2$。因此 $$E(T_c^2) = \frac{c^2}{n^2} \cdot n(n+2)\theta^2 = \frac{c^2 (n+2)}{n} \theta^2.$$ 将上述结果代入均方误差表达式: $$h(c) = \frac{c^2 (n+2)}{n} \theta^2 - 2\theta \cdot (c\theta) + \theta^2 = \frac{c^2 (n+2)}{n} \theta^2 - 2c\theta^2 + \theta^2.$$ 整理得: $$h(c) = \left( \frac{c^2 (n+2)}{n} - 2c + 1 \right) \theta^2.$$ 此即均方误差 $h(c)$ 关于 $c$ 的表达式。
公式:$$h(c) = \left( \frac{c^2 (n+2)}{n} - 2c + 1 \right) \theta^2$$
提示:利用卡方分布的性质简化矩的计算,注意 $E(Y^2)$ 需通过方差间接求得。
步骤 6/7
目标:求导并令导数为零,解出c
首先,写出风险函数$h(c)$的表达式。由前一步骤可知, $$h(c) = \frac{2n}{n+2}c\theta^2 - \frac{2n}{n+1}\theta^2 + \frac{2n}{n+1}\theta^2 \cdot \frac{1}{c} - \frac{2n}{n+2}\theta^2 \cdot \frac{1}{c}.$$ 为简化求导,将$h(c)$整理为关于$c$的多项式形式: $$h(c) = \frac{2n}{n+2}\theta^2 \cdot c - \frac{2n}{n+1}\theta^2 + \left(\frac{2n}{n+1} - \frac{2n}{n+2}\right)\theta^2 \cdot \frac{1}{c}.$$ 注意,$\frac{2n}{n+1} - \frac{2n}{n+2} = 2n\left(\frac{1}{n+1} - \frac{1}{n+2}\right) = 2n\cdot\frac{1}{(n+1)(n+2)} = \frac{2n}{(n+1)(n+2)}$,因此 $$h(c) = \frac{2n}{n+2}\theta^2 \cdot c - \frac{2n}{n+1}\theta^2 + \frac{2n}{(n+1)(n+2)}\theta^2 \cdot \frac{1}{c}.$$ 现在对$c$求导。$h(c)$对$c$的导数为: $$h'(c) = \frac{2n}{n+2}\theta^2 \cdot 1 - \frac{2n}{(n+1)(n+2)}\theta^2 \cdot \frac{1}{c^2}.$$ 令$h'(c)=0$,得 $$\frac{2n}{n+2}\theta^2 - \frac{2n}{(n+1)(n+2)}\theta^2 \cdot \frac{1}{c^2} = 0.$$ 由于$n>0$,$\theta>0$,可约去公因子$\frac{2n}{n+2}\theta^2$,得到 $$1 - \frac{1}{(n+1)c^2} = 0,$$ 即 $$\frac{1}{(n+1)c^2} = 1,$$ 所以 $$c^2 = \frac{1}{n+1}.$$ 因此,$c = \frac{1}{\sqrt{n+1}}$(取正值,因为$c>0$)。注意,题目步骤概要中给出的结果$c=(n+2)/(n+1)$与这里的推导不一致,请以实际数学推导为准。
公式:$$h'(c)=\frac{2n}{n+2}\theta^2 - \frac{2n}{(n+1)(n+2)}\theta^2\cdot\frac{1}{c^2}=0 \Rightarrow c=\frac{1}{\sqrt{n+1}}$$
提示:求导前先合并同类项简化表达式,可减少计算错误。
步骤 7/7
目标:验证二阶导数正定性,确认最小值
我们已经求得对数似然函数关于参数 $c$ 的二阶导数为: $$ h''(c) = \frac{2n}{(n+2)\theta^2}. $$ 由于样本量 $n > 0$,参数 $ heta > 0$,因此分母 $(n+2)\theta^2 > 0$,分子 $2n > 0$,故 $h''(c) > 0$ 恒成立。这说明 $h(c)$ 是一个严格凸函数,其驻点 $c = \frac{n+2}{n+1}$ 是唯一的全局极小值点。 因此,当 $c = \frac{n+2}{n+1}$ 时,$h(c)$ 取得最小值,即对应的估计量 $\hat{\theta} = c \cdot \bar{X}$ 是均方误差意义下的最优估计。 最终结论:在均方误差准则下,参数 $ heta$ 的最优估计量为 $$ \hat{\theta} = \frac{n+2}{n+1} \bar{X}. $$ 该估计量不仅无偏(可通过期望验证),而且具有最小的均方误差。至此,整个求解过程完成。
公式:$$h''(c) = \frac{2n}{(n+2)\theta^2} > 0$$
提示:二阶导数为正说明函数是凸函数,驻点即为全局最小值点。

📷 拍照上传批改

拍照上传批改功能已预留入口,后续接入图片上传、OCR识别与AI批改。