当前位置: 首页 > news >正文

✨机器学习笔记(二)—— 线性回归、代价函数、梯度下降

Course1-Week1:
https://github.com/kaieye/2022-Machine-Learning-Specialization/tree/main/Supervised%20Machine%20Learning%20Regression%20and%20Classification/week1

1️⃣线性回归(linear regression)

f w , b ( x ) = w x + b f_{w,b}(x) = wx + b fw,b(x)=wx+b

🎈A linear regression model predicting house prices:

在这里插入图片描述

如图是机器学习通过监督学习运用线性回归模型来预测房价的例子,当房屋大小为1250 f e e t 2 feet^2 feet2时,预测的价格为 220k$。

在这里插入图片描述

🎈Terminology:
线性回归中可能用到的术语及含义
在这里插入图片描述

2️⃣代价函数(cost function)

为了预测出更准确的结果,需要模型更好的拟合程度,对于线性回归模型 f w , b ( x ) = w x + b f_{w,b}(x) = wx + b fw,b(x)=wx+b,我们需要找到合适的参数 w w w b b b,使得拟合程度最高。

在这里插入图片描述
🎉而如何找到合适的 w w w b b b 呢,这时需要通过代价函数(cost function)来进行衡量。我们希望对于每组数据,模型通过 x ( i ) x^{(i)} x(i) 预测出的 y ^ ( i ) \hat{y}^{(i)} y^(i) 接近真实的 y ( i ) y^{(i)} y(i) ,于是有如下的代价函数:

J = 1 2 m ∑ i = 1 m ( y ^ ( i ) − y ( i ) ) 2 J = \frac{1}{2m}\sum_{i=1}^{m}(\hat{y}^{(i)}-y^{(i)})^2 J=2m1i=1m(y^(i)y(i))2

J ( w , b ) = 1 2 m ∑ i = 1 m ( f w , b ( x ( i ) ) − y ( i ) ) 2 J(w,b)=\frac{1}{2m}\sum_{i=1}^{m}(f_{w,b}(x^{(i)})-y^{(i)})^2 J(w,b)=2m1i=1m(fw,b(x(i))y(i))2

✨现在的目标就变为 minimize w , b J ( w , b ) \underset{w, b}{\text{minimize}}J(w,b) w,bminimizeJ(w,b)


为了简单理解代价函数,让 b = 0 b=0 b=0 简化函数,针对 f ( x ) = w x f(x) = wx f(x)=wx 讨论。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

对所有的 w w w 取值最终可以列出一个代价函数:

在这里插入图片描述
可以看到当 w = 1 w=1 w=1 J ( w ) J(w) J(w) 最小,此时的 w w w 即为我们找到的最合适的参数。


当我们不再忽略 b b b ,来研究两个参数 w w w b b b 影响下的代价函数时,它的函数是一个三维图形,此时 J J J 的最小值在这个3D图形的底部:
在这里插入图片描述

假设我们拿一把小刀🔪去水平地给这样的三维图形砍一刀,去看这个横切面,大概可以得到这样的图形:
在这里插入图片描述

回归函数 f w , b f_{w,b} fw,b 和代价函数中的点的对应关系如下:
在这里插入图片描述

3️⃣梯度下降(gradient descent)

✨​ 用于求代价函数 J ( w , b ) J(w,b) J(w,b) 的最小值的方法, α \alpha α 为学习率(learning rate)。
w = w − α ∂ ∂ w J ( w , b ) w=w-\alpha\frac{\partial}{\partial w} J(w, b) w=wαwJ(w,b)

b = b − α ∂ ∂ b J ( w , b ) b=b-\alpha\frac{\partial}{\partial b} J(w, b) b=bαbJ(w,b)

对于一个三维的代价函数,想象成有个小人站在山上一个点,对于自己的360度的方向,需要选择一个方向迈出一步,确保这一步比其他各个方向下降的都要快,然后到达下一个点后以此类推,最终下降到最低点。
在这里插入图片描述
如果从不同的 ( w , b ) (w,b) (w,b) 作为起点,最后降低到的最低点不同,这些谷底被称为 local mininum(局部极小值)

🎉这个梯度下降的过程就是不断调整 w w w b b b 的过程:

在这里插入图片描述


学习率 α \alpha α
在这里插入图片描述

在这里插入图片描述

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Windows本地制作nginx证书
  • python中的循环结构
  • MonoHuman: Animatable Human Neural Field from Monocular Video 精读
  • 树莓派5_opencv笔记27:Opencv录制视频(无声音)
  • 使用Spring Boot集成Spring Data JPA和单例模式构建库存管理系统
  • v0.dev快速开发
  • 两数之和--力扣1
  • JS手写实现深拷贝
  • 深入探究 Spring 的扫描原理
  • 探索国产编程工具:如何实现工作效率翻倍
  • VMware安装Ubuntu虚拟机
  • linux 安装redis
  • 以太网--TCP/IP协议(一)
  • “阡陌云旅”黄河九省文化旅游平台
  • LabVIEW FIFO详解
  • __proto__ 和 prototype的关系
  • 2017 前端面试准备 - 收藏集 - 掘金
  • 2017-08-04 前端日报
  • 2019年如何成为全栈工程师?
  • Angular 响应式表单 基础例子
  • CSS进阶篇--用CSS开启硬件加速来提高网站性能
  • java小心机(3)| 浅析finalize()
  • uva 10370 Above Average
  • 笨办法学C 练习34:动态数组
  • 从零开始学习部署
  • 第十八天-企业应用架构模式-基本模式
  • 记录一下第一次使用npm
  • 漫谈开发设计中的一些“原则”及“设计哲学”
  • 面试总结JavaScript篇
  • 前端性能优化--懒加载和预加载
  • 如何胜任知名企业的商业数据分析师?
  • 如何学习JavaEE,项目又该如何做?
  • 我建了一个叫Hello World的项目
  • 小程序01:wepy框架整合iview webapp UI
  • 以太坊客户端Geth命令参数详解
  • AI又要和人类“对打”,Deepmind宣布《星战Ⅱ》即将开始 ...
  • python最赚钱的4个方向,你最心动的是哪个?
  • 数据可视化之下发图实践
  • 资深实践篇 | 基于Kubernetes 1.61的Kubernetes Scheduler 调度详解 ...
  • ​【已解决】npm install​卡主不动的情况
  • ​1:1公有云能力整体输出,腾讯云“七剑”下云端
  • ​configparser --- 配置文件解析器​
  • ​数据链路层——流量控制可靠传输机制 ​
  • ​用户画像从0到100的构建思路
  • # Python csv、xlsx、json、二进制(MP3) 文件读写基本使用
  • #if #elif #endif
  • #QT(串口助手-界面)
  • #单片机(TB6600驱动42步进电机)
  • ( 用例图)定义了系统的功能需求,它是从系统的外部看系统功能,并不描述系统内部对功能的具体实现
  • (2/2) 为了理解 UWP 的启动流程,我从零开始创建了一个 UWP 程序
  • (SpringBoot)第二章:Spring创建和使用
  • (ZT)薛涌:谈贫说富
  • (附源码)php新闻发布平台 毕业设计 141646
  • (接口封装)
  • (四十一)大数据实战——spark的yarn模式生产环境部署