当前位置: 首页 > news >正文

机器学习专题记录

有偏估计和无偏估计

无偏估计和有偏估计的区别

无偏估计
无偏估计是用样本统计量来估计总体参数时的一种无偏推断。估计量的数学期望等于被估计参数的真实值,则称此估计量为被估计参数的无偏估计,即具有无偏性,是一种用于评价估计量优良性的准则。无偏估计的意义是:在多次重复下,它们的平均数接近所估计的参数真值。

有偏估计
有偏估计(biased estimate)是指由样本值求得的估计值与待估参数的真值之间有系统误差,其期望值不是待估参数的真值。在统计学中,估计量的偏差(或偏差函数)是此估计量的期望值与估计参数的真值之差。偏差为零的估计量或决策规则称为无偏的。否则该估计量是有偏的。

moment matching

数理统计7:矩法估计(MM)、极大似然估计(MLE),定时截尾实验
对于随机变量 X X X, 其 k k k阶原点矩和 k k k阶中心矩为
a k = E ( X k ) , m k = E [ X − E ( X ) ] k a_k=E(X^k), m_k=E[X-E(X)]^k ak=E(Xk),mk=E[XE(X)]k
特别地,一阶原点矩就是随机变量的期望,二阶中心矩就是随机变量的方差。
现实生活中,我们不知道 X X X的客观分布,因而需要通过样本 ( X 1 , X 2 , X 3 , . . . . , X n ) (X_1,X_2,X_3,....,X_n) (X1,X2,X3,....,Xn)来估计总体矩。其样本 k k k阶原点矩样本 k k k阶中心矩计算为
a n , k = 1 n ∑ j = 1 n E j ( X k ) , m n , k = 1 n ∑ j = 1 n ( X j − X ˉ ) k a_{n,k}=\frac{1}{n}\sum^n_{j=1} E_j(X^k), m_{n,k}=\frac{1}{n}\sum^n_{j=1} (X_j-\bar{X})^k an,k=n1j=1nEj(Xk),mn,k=n1j=1n(XjXˉ)k

显然,它们都是统计量,因为给出样本之后它们都是可计算的。形式上,样本矩是对总体矩中元素的直接替换后求平均,因此总是比较容易计算的。容易验证, a n , k a_{n,k} an,k a k a_{k} ak的无偏估计,但 m n , k m_{n,k} mn,k则不是。

矩匹配

The method of moments can be very useful in obtaining approximations to the distributions of statistics. This technique is called moment matching.

Normal method of moments

假设数据 X 1 , . . . . , X n X_1,.... ,X_n X1,....,Xn服从正太分布 N ( θ , σ 2 ) N(\theta,\sigma^2) N(θ,σ2). 我们可以计算样本1阶矩和样本2阶矩
a n , 1 = X ˉ , a n , 2 = 1 n ∑ i = 1 n X i 2 a_{n,1}=\bar{X},a_{n,2}=\frac{1}{n}\sum^n_{i=1}X^2_i an,1=Xˉ,an,2=n1i=1nXi2

根据客观分布 N ( θ , σ 2 ) N(\theta,\sigma^2) N(θ,σ2), 1阶矩和2阶矩的计算公式为
a 1 = θ , a 2 = θ 2 + σ 2 a_1=\theta, a_2=\theta^2+\sigma^2 a1=θ,a2=θ2+σ2

我们将样本矩带入矩的计算公式,两个方程即可以解出两个未知数 θ , σ 2 \theta,\sigma^2 θ,σ2的估计值 θ ~ , σ ~ 2 \tilde{\theta},\tilde{\sigma}^2 θ~,σ~2
θ ~ = X ˉ , σ ~ 2 = 1 n ∑ i = 1 n ( X i − X ˉ ) 2 \tilde{\theta}=\bar{X}, \tilde{\sigma}^2=\frac{1}{n}\sum^n_{i=1}(X_i-\bar{X})^2 θ~=Xˉ,σ~2=n1i=1n(XiXˉ)2

在贝叶斯机器学习中,矩匹配(Moment Matching)是种基于KL-散度最小化的近似方法——期望传播( Expectation Propagation)的一种形式。

相关文章:

  • 机器学习作业6——svm支持向量机
  • 探索AOSP中的RRO:运行时资源覆盖的奥秘
  • tmux 移植到ARM板端运行环境搭建
  • Leetcode3174. 清除数字
  • 107.网络游戏逆向分析与漏洞攻防-装备系统数据分析-装备信息更新的处理
  • webshell三巨头 综合分析(蚁剑,冰蝎,哥斯拉)
  • 汇编:保护模式下的寻址方式
  • Linux配置uwsgi环境
  • <题海拾贝>[递归]1.汉诺塔
  • PyCharm中 Fitten Code插件的使用说明一
  • 云计算——武汉理工期末复习
  • 迈向『闭环』| PlanAgent:基于MLLM的自动驾驶闭环规划新SOTA!
  • 【Python】(一)复习重点——控制流
  • 【经验】Ubuntu上离线安装VsCode插件浏览Linux kernel源码
  • Nginx配置详细解释:(4)高级配置
  • ----------
  • [deviceone开发]-do_Webview的基本示例
  • [译] React v16.8: 含有Hooks的版本
  • eclipse的离线汉化
  • electron原来这么简单----打包你的react、VUE桌面应用程序
  • Javascript编码规范
  • Laravel5.4 Queues队列学习
  • node-glob通配符
  • Python - 闭包Closure
  • spring学习第二天
  • Sublime text 3 3103 注册码
  • vue--为什么data属性必须是一个函数
  • 给第三方使用接口的 URL 签名实现
  • 关于 Cirru Editor 存储格式
  • 开发了一款写作软件(OSX,Windows),附带Electron开发指南
  • 面试遇到的一些题
  • 如何正确配置 Ubuntu 14.04 服务器?
  • 适配mpvue平台的的微信小程序日历组件mpvue-calendar
  • 用mpvue开发微信小程序
  • 在weex里面使用chart图表
  • 自定义函数
  • MiKTeX could not find the script engine ‘perl.exe‘ which is required to execute ‘latexmk‘.
  • mysql面试题分组并合并列
  • ​LeetCode解法汇总2304. 网格中的最小路径代价
  • ​LeetCode解法汇总2696. 删除子串后的字符串最小长度
  • ‌移动管家手机智能控制汽车系统
  • # 睡眠3秒_床上这样睡觉的人,睡眠质量多半不好
  • $Django python中使用redis, django中使用(封装了),redis开启事务(管道)
  • (办公)springboot配置aop处理请求.
  • (附源码)计算机毕业设计SSM疫情下的学生出入管理系统
  • (每日持续更新)jdk api之FileReader基础、应用、实战
  • (亲测成功)在centos7.5上安装kvm,通过VNC远程连接并创建多台ubuntu虚拟机(ubuntu server版本)...
  • (五)关系数据库标准语言SQL
  • (转)详解PHP处理密码的几种方式
  • (转载)在C#用WM_COPYDATA消息来实现两个进程之间传递数据
  • **python多态
  • .[backups@airmail.cc].faust勒索病毒的最新威胁:如何恢复您的数据?
  • .mkp勒索病毒解密方法|勒索病毒解决|勒索病毒恢复|数据库修复
  • .NET Framework 3.5安装教程
  • .NET(C#) Internals: as a developer, .net framework in my eyes