当前位置：首页 > news >正文

Fisher信息与最大似然估计的渐进正态性（附有在Bernoulli分布上的计算）

news 来源：原创 2024/4/29 14:15:25

写在前面

最大似然估计具有很多好的性质，包括相合性，同变性，渐进正态性等。本文主要关注的是渐进正态性。渐近正态性表明，估计量的极限分布是正态分布。而该正态分布的方差，与Fisher信息有着密不可分的关系。

Fisher信息

（定义）记分函数（Score Function):
$s(X;\theta)=\frac{\partial logf(X;\theta)}{\partial \theta}.$
（定义）Fisher信息量(Fisher Information):
$\begin{aligned} I_n(\theta)&=\mathbb{V}(\sum_{i=1}^{n}s(X_i;\theta))\\ &=\sum_{i=1}^{n}\mathbb{V}(s(X_i;\theta)) \end{aligned}$
（定理）
$\mathbb{E}_\theta[s(X;\theta)]=0$
证明：
$\begin{aligned} \mathbb{E}_\theta[s(X;\theta)] &= \int_x\frac{\partial logf(x;\theta)}{\partial \theta}f(x;\theta)dx\\ &=\int_x\frac{1}{f(x;\theta)}\frac{\partial f(x;\theta)}{\partial \theta}f(x;\theta)dx\\ &=\int_x\frac{\partial f(x;\theta)}{\partial \theta}dx\\ &=\frac{\partial}{\partial \theta} \int_xf(x;\theta)dx=\frac{\partial}{\partial \theta}1\\ &=0 \end{aligned}$
（定理）若 $f(X;\theta)$ 二阶可导，则Fisher信息矩阵可以写为如下形式：
$I_n(\theta)=nI(\theta)=-n\int_x\frac{\partial^2logf(x;\theta)}{\partial\theta^2}f(x;\theta)dx$
证明：
$\begin{aligned} \mathbb{V}_\theta[s(X;\theta)] &= E_{\theta}[s(X;\theta)^2]-E_\theta[s(X;\theta)]^2\\ &= E_{\theta}[s(X;\theta)^2]\\ &= \int_x\frac{\partial logf(x;\theta)}{\partial \theta}\frac{\partial logf(x;\theta)}{\partial \theta}f(x;\theta)dx\\ \int_x\frac{\partial^2logf(x;\theta)}{\partial\theta^2}f(x;\theta)dx &= \int_x \frac{\partial}{\partial \theta}(\frac{1}{f(x;\theta)}\frac{\partial f(x;\theta)}{\partial \theta})dx\\ &=\int_x-\frac{(\frac{\partial f(x;\theta)}{\partial \theta})^2}{f(x;\theta)^2}+\frac{(\frac{\partial ^2f(x;\theta)}{\partial \theta^2})}{f(x;\theta)}f(x;\theta)dx \\ &= \int_x-\frac{(\frac{\partial f(x;\theta)}{\partial \theta})^2}{f(x;\theta)^2}dx\\ &=-\int_x\frac{\partial^2logf(x;\theta)}{\partial\theta^2}f(x;\theta)dx \end{aligned}$

渐进正态性

极大似然估计具有渐进正态性
$\frac{\hat{\theta}_n-\theta}{se}\rightarrow N(0,1)$
其中， $se\approx\sqrt{\frac{1}{I_n(\theta)}}\approx\sqrt{\frac{1}{I_n(\hat{\theta})}}$
证明从略，资料比较多。

由此可以构建估计的置信区间。

Bernoulli分布的最大似然估计及其方差

设 $X_1, \cdots,X_n \sim Bernoulli(p)$ ,则其似然函数是 $L(p)=\prod_{i=1}^{n} p^{X_i}(1-p)^{1-X_i}$ $logL(p)=\sum_{i}^{n}X_ilogp+(1-X_i)log(1-p)$
最大化对数似然，就得到：
$\begin{aligned} &\frac{d}{dx}logL(p)=0\\ &\sum_{i}^{n}X_i \frac{1}{p}-(1-X_i) \frac{1}{1-p}=0\\ &p=\frac{1}{n}\sum_{i=1}^{n}X_i \end{aligned}$
其记分函数是：
$\frac{\partial logL(p)}{\partial p}=\frac{X}{p}-\frac{1-X}{1-p}$
$I(p)=-E_\theta[\frac{d(\frac{X}{p}-\frac{1-X}{1-p})}{dp}]=\frac{1}{1-p}+\frac{1}{p}\\=\frac{1}{p(1-p)}$
$I_n(p)=nI(p)$ ，估计的方差 $\approx n\hat{p}(1-\hat{p})$