当前位置: 首页 > news >正文

sheng的学习笔记-AI-生成式方法

 AI目录:sheng的学习笔记-AI目录-CSDN博客

需要额外的知识对应连接:

EM:sheng的学习笔记-AI-EM算法-CSDN博客

贝叶斯: sheng的学习笔记-AI-贝叶斯(Bayesian)分类-CSDN博客

高斯混合模型:sheng的学习笔记-AI-高斯混合模型(GMM)-CSDN博客

什么是生成式方法

生成式方法(generative methods)是直接基于生成式模型的方法。此类方法假设所有数据(无论是否有标记)都是由同一个潜在的模型“生成”的。这个假设使得我们能通过潜在模型的参数将未标记数据与学习目标联系起来,而未标记数据的标记则可看作模型的缺失参数,通常可基于EM算法进行极大似然估计求解。此类方法的区别主要在于生成式模型的假设,不同的模型假设将产生不同的方法

给定样本x,其真实类别标记为y∈Y,其中Y={1,2,...,N}为所有可能的类别。假设样本由高斯混合模型生成,且每个类别对应一个高斯混合成分。换言之,数据样本是基于如下概率密度生成:

 

 假设类簇与真实的类别按照顺序一一对应,即第i个类簇对应第i个高斯混合成分。与高斯混合聚类类似地,这里的主要任务也是估计出各个高斯混合成分的参数以及混合系数,不同的是:对于有标记样本,不再是可能属于每一个类簇,而是只能属于真实类标对应的特定类簇。

给定有标记样本集Dl={(x1,y1),(x2,y2),...,(xl,yl)}和未标记样本集Du={xl+1,xl+2,...,xl+u},l≪u,l+u=m.假设所有样本独立同分布,且都是由同一个高斯混合模型生成的。用极大似然法来估计高斯混合模型的参数的对数似然是

公式由两项组成:基于有标记数据Dl的有监督项和基于未标记数据Du的无监督项。显然,高斯混合模型参数估计可用EM算法求解,迭代更新式如下:

以上过程不断迭代直至收敛 

对于待预测样本x,便可以像贝叶斯分类器那样计算出样本属于每个类簇的后验概率,接着找出概率最大的即可

将上述过程中的高斯混合模型换成混合专家模型、朴素贝叶斯模型 等即可推导出其他的生成式半监督学习方法。此类方法简单,易于实现,在有标记数据极少的情形下往往比其他方法性能更好。然而,此类方法有一个关键:模型假设必须准确,即假设的生成式模型必须与真实数据分布吻合;否则利用未标记数据反倒会降低泛化性能​。遗憾的是,在现实任务中往往很难事先做出准确的模型假设,除非拥有充分可靠的领域知识

 

参考文章:14 半监督学习 - 14.1 生成式方法 - 《周志华《机器学习》学习笔记》 - 书栈网 · BookStack

书:机器学习 

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 【PyQt6 应用程序】QTDesigner生成ui文件转成py源码并执行
  • 编译报错declaration may not appear after executable statement in block
  • 图数据库查询语言 cypher 与 memgraph
  • vscode附着调试
  • Day47 | 110.字符串接龙 105.有向图的完全可达性 106.岛屿的周长
  • openGuass——一般元命令
  • Vue JS执行机制和nextTick
  • Python算法工程师面试整理-微积分
  • SAP商业地产管理(RE-FX)
  • 微信小程序如何存储值
  • 集成mybatis-plus框架
  • 3.3、matlab彩色图和灰度图的二值化算法汇总
  • 如何在不格式化的情况下解锁 Android 智能手机密码
  • ue5远程渲染和本地渲染的区别,及云渲染的联系
  • 【MySQL 11】索引 (带思维导图)
  • HomeBrew常规使用教程
  • in typeof instanceof ===这些运算符有什么作用
  • laravel5.5 视图共享数据
  • Linux快速配置 VIM 实现语法高亮 补全 缩进等功能
  • Mysql数据库的条件查询语句
  • ng6--错误信息小结(持续更新)
  • Redux系列x:源码分析
  • spring security oauth2 password授权模式
  • Webpack4 学习笔记 - 01:webpack的安装和简单配置
  • 复杂数据处理
  • ------- 计算机网络基础
  • 理清楚Vue的结构
  • 利用DataURL技术在网页上显示图片
  • 前端每日实战:70# 视频演示如何用纯 CSS 创作一只徘徊的果冻怪兽
  • 如何正确配置 Ubuntu 14.04 服务器?
  • 手机app有了短信验证码还有没必要有图片验证码?
  • “十年磨一剑”--有赞的HBase平台实践和应用之路 ...
  • Nginx实现动静分离
  • postgresql行列转换函数
  • 回归生活:清理微信公众号
  • 新海诚画集[秒速5センチメートル:樱花抄·春]
  • 选择阿里云数据库HBase版十大理由
  • 曜石科技宣布获得千万级天使轮投资,全方面布局电竞产业链 ...
  • ​​​​​​​​​​​​​​Γ函数
  • ​学习一下,什么是预包装食品?​
  • # Redis 入门到精通(七)-- redis 删除策略
  • # 安徽锐锋科技IDMS系统简介
  • #NOIP 2014# day.2 T2 寻找道路
  • #免费 苹果M系芯片Macbook电脑MacOS使用Bash脚本写入(读写)NTFS硬盘教程
  • (Arcgis)Python编程批量将HDF5文件转换为TIFF格式并应用地理转换和投影信息
  • (C++二叉树05) 合并二叉树 二叉搜索树中的搜索 验证二叉搜索树
  • (pycharm)安装python库函数Matplotlib步骤
  • (vue)页面文件上传获取:action地址
  • (二)windows配置JDK环境
  • (含笔试题)深度解析数据在内存中的存储
  • (删)Java线程同步实现一:synchronzied和wait()/notify()
  • (实测可用)(3)Git的使用——RT Thread Stdio添加的软件包,github与gitee冲突造成无法上传文件到gitee
  • (算法)大数的进制转换
  • (一)插入排序
  • (一)硬件制作--从零开始自制linux掌上电脑(F1C200S) <嵌入式项目>