当前位置: 首页 > news >正文

最大似然估计,存在即合理

一、感性认识

认识的第一步来自感性的认识,先来感性的了解一下最大似然估计。现在,假设有两个学院,物理和外语学院。两个学院都各有特点,物理学院的男生占比大,外语学院女生占比大。如果在一次实验从两个学院中随机的抽取出一个人,结果取出的是男生。现在问你,男生从哪个学院中取出?我们的第一印象就是,此男生最可能从物理学院抽取的,因为物理学院出男生的概率最大,这种估计的想法就是最大似然估计的原理。

图片

在模型的参数估计中也是一样的,已知某个随机样本满足某种概率分布,即知道样本的描述模型,但是其中具体的参数未知。参数估计就是通过若干次试验并记录样本结果,最后认为出现的样本结果就是模型最真实的表现,即样本结果对于这个模型来说出现的概率最大(存在即合理),通过极大化这种概率来获得估计的参数,这就是最大似然估计的核心。

最大似然估计是遗传学家以及统计学家罗纳德·费雪在1921年至1922年间开始使用,是频率学派的主张,利用已知的样本结果,反推最有可能导致这样结果的参数值,它与回归模型一样是参数估计的方法之一。在参数估计上,相对于贝叶斯学派,频率主义学派认为参数虽然未知,但确实客观存在的固定值,因此,可通过优化似然函数等准则来确定参数值。

二、最大似然函数

简单起见,我们假设这些观测值都是相同独立的,也就是这些观测值独立分布。由于样本集中的样本都是独立分布,可以只考虑一类样本集D,来估计参数向量 。记已知的样本集为:

图片

我们将样本的联合概率密度函数称为相对于θ的似然函数。

图片

如果θ'是参数空间中能使似然函数l(θ)最大的θ值,那么θ'就是θ的最大似然估计量,也就是我们要求的估计参数向量。它是样本集的函数,记作:

图片

称作最大似然函数估计值。

三、求解最大似然函数

目标是求使得出现该样本概率最大的 值(arg max解释为后面表达式中取最大值时参数的取值,毕竟我们是参数估计)。

图片

这里运用了一点技巧,定义了一个对数似然函数,将连乘转为求和从而方便计算。

图片

接下来就好处理了,对 求偏导获得参数。

图片

最大似然估计只是一种粗略的数学期望,要知道它的误差大小还需要做区间估计。最大似然估计在样本趋于无穷大时,就收敛率而言是最好的渐近估计,最大似然估计通常是机器学习中的首选估计方法。

四、最大似然函数与最小二乘法

二者的都是参数估计的方法,都把参数估计问题变成了最优化问题。最小二乘法是一个凸优化问题,最大似然估计却不一定是。另外,样本误差服从高斯分布的情况下,最小二乘法等价于极大似然估计。

假设有:

图片

样本误差服从高斯分布的情况下有:

图片

两边都加一个yi,那么,则有:

图片

那么:

图片

最终化简为:

图片

这正是最小二乘法的目标函数。

将会将《算法成长之路》写成一个系列,喜欢的加关注,精彩内容

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Python自动化测试中替代Seleium库的解决方案
  • JSONC:为JSON注入注释的力量
  • 手把手教你CNVD漏洞挖掘 + 资产收集
  • 最新版电子发票样式html+css--普通发票+增值发票
  • Java+Spring Cloud +UniApp 智慧工地源码,用户PC端、移动端数据同步,支持多端展示
  • Recorder录音插件使用日记
  • 【linux进程】深度理解进程--什么是进程什么是pcb进程创建
  • 【Python 基础学习笔记】文件的基础操作
  • cmake查看 编译信息里面的详细的gcc/g++的编译参数
  • 在Gin框架中实现Token令牌认证
  • CSS的盒子模型(Box Model)
  • 2024百度的组织架构和产品分布
  • SegFormer网络结构的学习和重构
  • LCR 029
  • [Web安全 网络安全]-CSRF跨站请求伪造
  • 《网管员必读——网络组建》(第2版)电子课件下载
  • 【许晓笛】 EOS 智能合约案例解析(3)
  • 【跃迁之路】【669天】程序员高效学习方法论探索系列(实验阶段426-2018.12.13)...
  • 2017届校招提前批面试回顾
  • AHK 中 = 和 == 等比较运算符的用法
  • CNN 在图像分割中的简史:从 R-CNN 到 Mask R-CNN
  • CSS实用技巧干货
  • mysql innodb 索引使用指南
  • Puppeteer:浏览器控制器
  • 给github项目添加CI badge
  • 技术攻略】php设计模式(一):简介及创建型模式
  • 力扣(LeetCode)965
  • 前端临床手札——文件上传
  • 通过几道题目学习二叉搜索树
  • 写代码的正确姿势
  • Java总结 - String - 这篇请使劲喷我
  • 湖北分布式智能数据采集方法有哪些?
  • 基于django的视频点播网站开发-step3-注册登录功能 ...
  • ​VRRP 虚拟路由冗余协议(华为)
  • #我与Java虚拟机的故事#连载12:一本书带我深入Java领域
  • ${factoryList }后面有空格不影响
  • $NOIp2018$劝退记
  • (1)Hilt的基本概念和使用
  • (c语言)strcpy函数用法
  • (Java岗)秋招打卡!一本学历拿下美团、阿里、快手、米哈游offer
  • (附源码)c#+winform实现远程开机(广域网可用)
  • (每日一问)设计模式:设计模式的原则与分类——如何提升代码质量?
  • (学习日记)2024.03.12:UCOSIII第十四节:时基列表
  • (一)、软硬件全开源智能手表,与手机互联,标配多表盘,功能丰富(ZSWatch-Zephyr)
  • (转)C语言家族扩展收藏 (转)C语言家族扩展
  • (转)visual stdio 书签功能介绍
  • .NET Core IdentityServer4实战-开篇介绍与规划
  • .NET MVC 验证码
  • .net 使用$.ajax实现从前台调用后台方法(包含静态方法和非静态方法调用)
  • .NET 自定义中间件 判断是否存在 AllowAnonymousAttribute 特性 来判断是否需要身份验证
  • .NET/C# 获取一个正在运行的进程的命令行参数
  • .NET/C# 如何获取当前进程的 CPU 和内存占用?如何获取全局 CPU 和内存占用?
  • .NET/C#⾯试题汇总系列:⾯向对象
  • .net开发引用程序集提示没有强名称的解决办法
  • .NET框架设计—常被忽视的C#设计技巧