当前位置: 首页 > news >正文

一维/二维高斯分布的负对数似然推导

参考wikipedia Multivariate normal distribution 及 Normal distribution

基础公式

多元高斯分布公式
f ( X ) = f ( x 1 , x 2 , . . . , x k ) = 1 ( 2 π ) k ∣ ∑ ∣ e − 1 2 ( X − μ ) T ∑ − 1 ( X − μ ) f(X)=f(x_1,x_2,...,x_k)=\frac{1}{\sqrt{{(2\pi)}^k|\sum|}}e^{-\frac{1}{2}(X-\mu)^T\sum^{-1}(X-\mu)} f(X)=f(x1,x2,...,xk)=(2π)k 1e21(Xμ)T1(Xμ)
其中, μ = ( μ x 1 , μ x 2 , . . . , μ x k ) \mu=(\mu_{x_1},\mu_{x_2},...,\mu_{x_k}) μ=(μx1,μx2,...,μxk)
那么一维高斯分布公式
f ( x ) = 1 2 π σ 2 e − ( x − μ x ) 2 2 σ 2 f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{(x-\mu_x)^2}{2\sigma^2} } f(x)=2πσ2 1e2σ2(xμx)2
二维高斯分布公式
f ( x , y ) = 1 2 π ∣ ∑ ∣ e − 1 2 ( x − μ x y − μ y ) ∑ − 1 ( x − μ x y − μ y ) f(x,y)=\frac{1}{2\pi\sqrt{|\sum|}}e^{-\frac{1}{2} \begin{pmatrix}x-\mu_x &y-\mu_y\end{pmatrix}\sum^{-1}\begin{pmatrix}x-\mu_x \\ y-\mu_y\end{pmatrix}}\\ f(x,y)=2π 1e21(xμxyμy)1(xμxyμy)

为简化推导,后文将 d x = x − μ x d_x=x-\mu_x dx=xμx 记为x

一维高斯分布的负对数似然

N L L ( x , μ ∣ σ 2 ) = − l o g ( f ( x ) ) = − l o g ( 1 2 π σ 2 e − x 2 2 σ 2 ) = − ( − l o g ( 2 π σ 2 ) − x 2 2 σ 2 ) = l o g ( 2 π ) 2 + l o g ( σ ) + x 2 2 σ 2 NLL(x, \mu|\sigma^2)=-log(f(x))=-log(\frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{x^2}{2\sigma^2} })\\ = -(-log(\sqrt{2\pi\sigma^2})-\frac{x^2}{2\sigma^2})\\ =\frac{log(2\pi)}{2}+log(\sigma)+\frac{x^2}{2\sigma^2} NLL(x,μσ2)=log(f(x))=log(2πσ2 1e2σ2x2)=(log(2πσ2 )2σ2x2)=2log(2π)+log(σ)+2σ2x2

二维高斯分布的负对数似然

二维高斯分布公式展开如下
f ( x , y ) = 1 2 π ∣ ∑ ∣ e − 1 2 ( x y ) ∑ − 1 ( x y ) = 1 2 π ∣ ∑ ∣ e − 1 2 x 2 σ y 2 − 2 ρ x y σ x σ y + y 2 σ x 2 d e t ( ∣ ∑ ∣ ) = 1 2 π ∣ ∑ ∣ e − 1 2 x 2 σ y 2 − 2 ρ x y σ x σ y + y 2 σ x 2 ( 1 − ρ 2 ) σ x 2 σ y 2 = 1 2 π σ x σ y 1 − ρ 2 e − 1 2 ( 1 − ρ 2 ) ( x 2 σ x 2 − 2 ρ x y σ x σ y + y 2 σ y 2 ) \begin{align}f(x,y)&=\frac{1}{2\pi\sqrt{|\sum|}}e^{-\frac{1}{2} \begin{pmatrix}x &y\end{pmatrix}\sum^{-1}\begin{pmatrix}x \\ y\end{pmatrix}}\\ &=\frac{1}{2\pi\sqrt{|\sum|}}e^{-\frac{1}{2}\frac{x^2\sigma_y^2-2\rho xy\sigma_x\sigma_y+y^2\sigma_x^2}{det(|\sum|)}}\\ &=\frac{1}{2\pi\sqrt{|\sum|}}e^{-\frac{1}{2}\frac{x^2\sigma_y^2-2\rho xy\sigma_x\sigma_y+y^2\sigma_x^2}{(1-\rho^2)\sigma_x^2\sigma_y^2}}\\ &=\frac{1}{2\pi\sigma_x\sigma_y\sqrt{1-\rho^2}}e^{-\frac{1}{2(1-\rho^2)}(\frac{x^2}{\sigma_x^2}-\frac{2\rho xy}{\sigma_x\sigma_y}+\frac{y^2}{\sigma_y^2})} \end{align} f(x,y)=2π 1e21(xy)1(xy)=2π 1e21det()x2σy22ρxyσxσy+y2σx2=2π 1e21(1ρ2)σx2σy2x2σy22ρxyσxσy+y2σx2=2πσxσy1ρ2 1e2(1ρ2)1(σx2x2σxσy2ρxy+σy2y2)
其中,
∑ = ( σ x 2 σ x y σ x y σ y 2 ) = ( σ x 2 ρ σ x σ y ρ σ x σ y σ y 2 ) \sum = \begin{pmatrix}{\sigma_x}^2 & \sigma_{xy}\\ \sigma_{xy} &{\sigma_y}^2 \end{pmatrix} = \begin{pmatrix}{\sigma_x}^2 & \rho\sigma_x\sigma_y\\ \rho\sigma_x\sigma_y &{\sigma_y}^2 \end{pmatrix} =(σx2σxyσxyσy2)=(σx2ρσxσyρσxσyσy2)
∑ − 1 = 1 ∣ ∑ ∣ ( σ y 2 − ρ σ x σ y − ρ σ x σ y σ x 2 ) {\sum}^{-1} = \frac{1}{|\sum|}\begin{pmatrix} \sigma_y^2 & -\rho\sigma_x\sigma_y\\ -\rho\sigma_x\sigma_y &\sigma_x^2\end{pmatrix} 1=1(σy2ρσxσyρσxσyσx2)
那么负对数似然为
− l o g ( f ( x , y ) ) = − l o g ( 1 2 π σ x σ y 1 − ρ 2 e − 1 2 ( 1 − ρ 2 ) ( x 2 σ x 2 − 2 ρ x y σ x σ y + y 2 σ y 2 ) ) = − ( − l o g ( 2 π σ x σ y ) − 1 2 l o g ( 1 − ρ 2 ) + ( − 1 2 ( 1 − ρ 2 ) ( x 2 σ x 2 − 2 ρ x y σ x σ y + y 2 σ y 2 ) ) ) = l o g ( 2 π σ x σ y ) + 1 2 l o g ( 1 − ρ 2 ) + 1 2 ( 1 − ρ 2 ) ( x 2 σ x 2 − 2 ρ x y σ x σ y + y 2 σ y 2 ) \begin{align}-log(f(x,y))&=-log(\frac{1}{2\pi\sigma_x\sigma_y\sqrt{1-\rho^2}}e^{-\frac{1}{2(1-\rho^2)}(\frac{x^2}{\sigma_x^2}-\frac{2\rho xy}{\sigma_x\sigma_y}+\frac{y^2}{\sigma_y^2})})\\ &=-(-log(2\pi\sigma_x\sigma_y)-\frac{1}{2}log(1-\rho^2)+(-\frac{1}{2(1-\rho^2)}(\frac{x^2}{\sigma_x^2}-\frac{2\rho xy}{\sigma_x\sigma_y}+\frac{y^2}{\sigma_y^2})))\\ &=log(2\pi\sigma_x\sigma_y)+\frac{1}{2}log(1-\rho^2)+\frac{1}{2(1-\rho^2)}(\frac{x^2}{\sigma_x^2}-\frac{2\rho xy}{\sigma_x\sigma_y}+\frac{y^2}{\sigma_y^2}) \end{align} log(f(x,y))=log(2πσxσy1ρ2 1e2(1ρ2)1(σx2x2σxσy2ρxy+σy2y2))=(log(2πσxσy)21log(1ρ2)+(2(1ρ2)1(σx2x2σxσy2ρxy+σy2y2)))=log(2πσxσy)+21log(1ρ2)+2(1ρ2)1(σx2x2σxσy2ρxy+σy2y2)

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 前后端分离的security角色权限实现
  • 智能合约漏洞(四)
  • 接口测试 —— 如何设计高效的测试用例!
  • 使用 nuxi build-module 命令构建 Nuxt 模块
  • C语言中的“#”和“##”
  • 三维前缀和 C++
  • 【Centos】制作一键安装包.bin 文件
  • 【论文阅读】:Mamba YOLO SSMs-Based YOLO For Object Detection
  • 学懂C++(四十四):C++ 自定义内存管理的深入解析:内存池与自定义分配器
  • milvus使用milvus migration工具迁移数据
  • Kubernetes 上安装 Jenkins
  • 滑动窗口系列(定长滑动窗口长度)8/31
  • CRMEB商城系统功能解读——渠道码
  • Ant Design vue 多层for循环form表单自定义校验
  • css中的伪类
  • 《Javascript高级程序设计 (第三版)》第五章 引用类型
  • 【402天】跃迁之路——程序员高效学习方法论探索系列(实验阶段159-2018.03.14)...
  • 【Redis学习笔记】2018-06-28 redis命令源码学习1
  • Android 初级面试者拾遗(前台界面篇)之 Activity 和 Fragment
  • css的样式优先级
  • Docker: 容器互访的三种方式
  • happypack两次报错的问题
  • JavaScript中的对象个人分享
  • Koa2 之文件上传下载
  • Netty源码解析1-Buffer
  • SegmentFault 技术周刊 Vol.27 - Git 学习宝典:程序员走江湖必备
  • 从输入URL到页面加载发生了什么
  • 分布式事物理论与实践
  • 缓存与缓冲
  • 力扣(LeetCode)56
  • 利用阿里云 OSS 搭建私有 Docker 仓库
  • 猫头鹰的深夜翻译:Java 2D Graphics, 简单的仿射变换
  • 前端性能优化——回流与重绘
  • 前端之Sass/Scss实战笔记
  • 携程小程序初体验
  • 由插件封装引出的一丢丢思考
  • AI算硅基生命吗,为什么?
  • ​LeetCode解法汇总1276. 不浪费原料的汉堡制作方案
  • ​用户画像从0到100的构建思路
  • #git 撤消对文件的更改
  • (04)odoo视图操作
  • (1)(1.19) TeraRanger One/EVO测距仪
  • (20050108)又读《平凡的世界》
  • (java版)排序算法----【冒泡,选择,插入,希尔,快速排序,归并排序,基数排序】超详细~~
  • (纯JS)图片裁剪
  • (分享)一个图片添加水印的小demo的页面,可自定义样式
  • (附源码)springboot“微印象”在线打印预约系统 毕业设计 061642
  • (数据结构)顺序表的定义
  • (原創) 如何優化ThinkPad X61開機速度? (NB) (ThinkPad) (X61) (OS) (Windows)
  • (自适应手机端)响应式服装服饰外贸企业网站模板
  • .[hudsonL@cock.li].mkp勒索加密数据库完美恢复---惜分飞
  • .Net IE10 _doPostBack 未定义
  • .net 中viewstate的原理和使用
  • .NET/C# 中你可以在代码中写多个 Main 函数,然后按需要随时切换
  • .net利用SQLBulkCopy进行数据库之间的大批量数据传递