当前位置: 首页 > news >正文

机器学习——白板推导系列三——线性回归

白板推导系列三——线性回归


文章目录

  • 白板推导系列三——线性回归
  • 前言
  • Part 1 最小二乘法
      • 问题描述
      • 最小二乘参数估计
      • 最小二乘法直接求解
      • 从几何意义求解最小二乘估计
  • Part 2 概率视角
  • Part 3 正则化 岭回归 频率角度
      • 正则化框架
      • 频率角度解释岭回归
  • Part 4 正则化 岭回归 概率角度
      • 前置知识
      • 贝叶斯角度
    • 课堂小结


前言

视频链接:
https://www.bilibili.com/video/BV1aE411o7qd?p=9&spm_id_from=pageDriver&vd_source=db82cedead5da076759f8f459895dbd4


Part 1 最小二乘法

线性回归——最简单的模型
——矩阵形式表达和几何意义

问题描述

在这里插入图片描述

最小二乘参数估计

预测值和真实值差值的平方(L2范数的几何意义是绝对值)
在这里插入图片描述

最小二乘法直接求解

——得到最小二乘估计的公式后,可以直接进行矩阵运算得到w的解。
——L(w) 为总的误差,由累加公式,可以看作误差分散在N个样本点上。
在这里插入图片描述

从几何意义求解最小二乘估计

——L(w) 为总的误差,可以看作是分散在p维特征上 。
——注意:W是一维向量,X是矩阵,f(w) 是标量,它的转置是自己,所以下图第三行可以理解为将 WTX 进行转置得到 WTTXT ,即WXT,即XTβ
在这里插入图片描述
两种不同的思路的算法结果一致。

Part 2 概率视角

——结论:最小二乘法等价于噪声为高斯分布的极大似然估计(MLE)。

首先,数据具有随机性,包含一定的噪声,假设噪声服从高斯分布,则 y 也服从高斯分布,虽然两者均值不同。后面通过计算log似然函数来计算极大似然估计的解。
在这里插入图片描述

Part 3 正则化 岭回归 频率角度

——引入原因:观察线性回归的损失函数 L(w) 与 W 的解,很有可能 XTX 矩阵不可逆导致无法求解。
——问题背景:N个样本,P个特征,较好的情况是N>>P,但在样本数量不够或者特征数目非常多的时候,从数学方面矩阵不可逆,从拟合直线方面容易造成过拟合,从没有办法根据公式求解。
——过拟合解决方案:

  1. 增加数据
  2. 特征选择/特征提取 (降维 PCA)
  3. 正则化 (对参数空间W的一种约束)

正则化框架

——argmin(损失函数+惩罚项)
—— L1正则化项(Lasso) 和 L2 正则化项(Ridage 岭回归)
在这里插入图片描述
第二种L2范数的正则化项较为常用。

频率角度解释岭回归

——对目标函数进行求导可得岭回归的解,相比线性回归多了正则化项。
在这里插入图片描述

Part 4 正则化 岭回归 概率角度

——概率角度解释正则化框架(岭回归)

前置知识

已经证明,当噪声服从高斯分布时,最小二乘估计等价于极大似然估计,由于噪声服从正态分布,真实函数值也服从正态分布,如图。
在这里插入图片描述

贝叶斯角度

y 服从正态分布,具体的概念如图上画的,以预测值为均值的正态分布。
通过计算后验概率,进行最大后验估计,计算出岭回归的解。
在这里插入图片描述

课堂小结

机器学习的课程涉及到理论知识,但听老师读ppt又觉得很乏味,所以又继续了本科的找网课路线。这位清华博士大佬讲的很耐心,深入浅出。前面的数学知识我可能不补笔记了,后面的算法要坚持写!!

内心os:字体丑不要介意,主要是觉得敲公式太浪费时间 QAQ 涉及到的代码可以参考 吴恩达老师等老师网课对应的代码 或者网上有很多代码,我自己的时间也不多所以就不敲这些代码了,还有很多琐碎的工作要做 QUQ ~

相关文章:

  • 【MySQL 第10章_索引优化与查询优化】
  • Supervised Machine Learning Regression and Classification(吴恩达机器学习课程笔记)
  • 改进YOLOv5系列:30.结合即插即用的动态卷积ODConv
  • MYSQL介绍——数据库查询
  • PySnooper – 永远不要使用print进行调试
  • 【PTA】输出学生成绩
  • 数据结构栈的使用——马踏棋盘
  • 网络知识之跨区域网络的通信
  • C#三层架构
  • 动态内存开辟(上)
  • 【云原生】阿里云容器镜像服务产品ACR EE之国内外场景应用模拟
  • html之网页结构
  • 手把手教你使用LabVIEW人工智能视觉工具包快速实现传统Opencv算子的调用(含源码)
  • Python小知识点
  • 目标检测 YOLOv5 - 最新版本v6.2模型在瑞芯微 Rockchip设备上运行的方案
  • [译]前端离线指南(上)
  • Angular 响应式表单 基础例子
  • avalon2.2的VM生成过程
  • CoolViewPager:即刻刷新,自定义边缘效果颜色,双向自动循环,内置垂直切换效果,想要的都在这里...
  • github指令
  • javascript数组去重/查找/插入/删除
  • k个最大的数及变种小结
  • Spring Cloud中负载均衡器概览
  • Spring框架之我见(三)——IOC、AOP
  • Vue小说阅读器(仿追书神器)
  • 多线程 start 和 run 方法到底有什么区别?
  • 关于使用markdown的方法(引自CSDN教程)
  • 今年的LC3大会没了?
  • 模型微调
  • 区块链共识机制优缺点对比都是什么
  • 使用API自动生成工具优化前端工作流
  • 适配mpvue平台的的微信小程序日历组件mpvue-calendar
  • 职业生涯 一个六年开发经验的女程序员的心声。
  • Oracle Portal 11g Diagnostics using Remote Diagnostic Agent (RDA) [ID 1059805.
  • k8s使用glusterfs实现动态持久化存储
  • 说说我为什么看好Spring Cloud Alibaba
  • ​人工智能之父图灵诞辰纪念日,一起来看最受读者欢迎的AI技术好书
  • #HarmonyOS:软件安装window和mac预览Hello World
  • (5)STL算法之复制
  • (AtCoder Beginner Contest 340) -- F - S = 1 -- 题解
  • (Java实习生)每日10道面试题打卡——JavaWeb篇
  • (二)丶RabbitMQ的六大核心
  • (附源码)计算机毕业设计SSM智能化管理的仓库管理
  • (更新)A股上市公司华证ESG评级得分稳健性校验ESG得分年均值中位数(2009-2023年.12)
  • (南京观海微电子)——I3C协议介绍
  • (一)Java算法:二分查找
  • (转) SpringBoot:使用spring-boot-devtools进行热部署以及不生效的问题解决
  • (转)Android学习笔记 --- android任务栈和启动模式
  • (转)使用VMware vSphere标准交换机设置网络连接
  • (转)为C# Windows服务添加安装程序
  • .form文件_SSM框架文件上传篇
  • .NET Core WebAPI中使用swagger版本控制,添加注释
  • .Net 垃圾回收机制原理(二)
  • .net反编译工具
  • .sh 的运行