当前位置: 首页 > news >正文

梯度提升决策树(GBDT)的训练过程




以下通过案例(根据行为习惯预测年龄)帮助我们深入理解梯度提升决策树(GBDT)的训练过程

假设训练集有4个人(A、B、C、D),他们的年龄分别是14、16、24、26。其中A、B分别是高一和高三学生;C、D分别是应届毕业生和工作两年的员工

下面我们将分别使用回归树和GBDT,通过他们的日常行为习惯(购物、上网等)预测每个人的年龄

1、使用回归树训练

回归树训练得到的结果如图所示:

在这里插入图片描述
2、使用GBDT训练

由于我们的样本数据较少,所以我们限定叶子节点最多为2(即每棵树都只有一个分枝),并且限定树的棵树为2

梯度提升决策树(GBDT)的训练过程如下:

1) 第一棵树:假设初始值为平均年龄20,得到的结果如图所示:

在这里插入图片描述
上图中,A、B的购物金额不超过1k,C、D的购物金额超过1k,因此被分为左右两个分支,每个分支使用平均年龄作为预测值

分别计算A、B、C、D的残差(实际值减预测值):

  • A残差 = 14 − 15 = − 1 \tt =14-15=-1 =1415=1
  • B残差 = 16 − 15 = 1 \tt =16-15=1 =1615=1
  • C残差 = 24 − 25 = − 1 \tt =24-25=-1 =2425=1
  • D残差 = 26 − 25 = 1 \tt =26-25=1 =2625=1

以A为例,这里A的预测值是指前面所有树预测结果的累加和,当前由于只有一棵树,所以直接是15,其他同理

2) 第二棵树:拟合前一棵树的残差-1、1、-1、1,得到的结果如图所示:

在这里插入图片描述
上图中,A、C的上网时间超过1h,B、D的上网时间不超过1h,因此被分为左右两个分支,每个分支使用平均残差作为预测值

分别计算A、B、C、D的残差(实际值减预测值):

  • A残差 = − 1 − ( − 1 ) = 0 \tt =-1-(-1)=0 =1(1)=0
  • B残差 = 1 − 1 = 0 \tt =1-1=0 =11=0
  • C残差 = − 1 − ( − 1 ) = 0 \tt =-1-(-1)=0 =1(1)=0
  • D残差 = 1 − 1 = 0 \tt =1-1=0 =11=0

第二棵树学习第一棵树的残差,在当前这个简单场景下,已经能够保证预测值与实际值(上一轮残差)相等了,此时停止迭代

3) 迭代终止后,最后就是集成,累加所有决策树的预测结果作为最终GBDT的预测结果

在这里插入图片描述
本案例中,我们最终得到GBDT的预测结果为第一棵树的预测结果加第二棵树的预测结果

  • A:真实年龄14岁,预测年龄 15 + ( − 1 ) = 14 \tt 15+(-1)=14 15+(1)=14
  • B:真实年龄16岁,预测年龄 15 + 1 = 16 \tt 15+1=16 15+1=16
  • C:真实年龄24岁,预测年龄 25 + ( − 1 ) = 24 \tt 25+(-1)=24 25+(1)=24
  • D:真实年龄26岁,预测年龄 25 + 1 = 26 \tt 25+1=26 25+1=26

综上所述,GBDT需要将多棵树的预测结果累加,得到最终的预测结果,且每轮迭代都是在当前树的基础上,增加一棵新树去拟合前一个树预测值与真实值之间的残差


相关文章:

  • P10552 [THUPC2024] 警钟长鸣
  • 【安全】Linux Fanotify使用入门
  • 计算机基础学习有多重要?学哪些?如何学?
  • 基于SpringBoot+Vue大学生网络教学平台设计和实现(源码+LW+调试文档+讲解等)
  • mongodb嵌套聚合
  • DataWhale - 吃瓜教程学习笔记(二)
  • 【ThreeJS】Threejs +Vue3 开发基础
  • ASCII 空字符 ‘\0’ ,与空格字符‘ ’
  • 【技巧】Leetcode 201. 数字范围按位与【中等】
  • 定义多个类对象,分别输入和输出各对象中的时间(时:分:秒)
  • Vue82-组件内路由守卫
  • Sourcetree:Git版本控制的最佳伴侣
  • CGFloat转NSString保持原有的精度,末尾不添加0
  • 『大模型笔记』如何让小型语言模型发挥作用!
  • 【odoo】常用的基本视图类型
  • 【腾讯Bugly干货分享】从0到1打造直播 App
  • 【跃迁之路】【585天】程序员高效学习方法论探索系列(实验阶段342-2018.09.13)...
  • axios 和 cookie 的那些事
  • CSS魔法堂:Absolute Positioning就这个样
  • Docker 笔记(1):介绍、镜像、容器及其基本操作
  • docker容器内的网络抓包
  • ES学习笔记(12)--Symbol
  • js ES6 求数组的交集,并集,还有差集
  • python docx文档转html页面
  • QQ浏览器x5内核的兼容性问题
  • 力扣(LeetCode)21
  • 如何合理的规划jvm性能调优
  • 微信小程序实战练习(仿五洲到家微信版)
  • 小李飞刀:SQL题目刷起来!
  • ​iOS实时查看App运行日志
  • ​你们这样子,耽误我的工作进度怎么办?
  • ​油烟净化器电源安全,保障健康餐饮生活
  • ​中南建设2022年半年报“韧”字当头,经营性现金流持续为正​
  • # 达梦数据库知识点
  • #单片机(TB6600驱动42步进电机)
  • #周末课堂# 【Linux + JVM + Mysql高级性能优化班】(火热报名中~~~)
  • (02)Cartographer源码无死角解析-(03) 新数据运行与地图保存、加载地图启动仅定位模式
  • (160)时序收敛--->(10)时序收敛十
  • (20)目标检测算法之YOLOv5计算预选框、详解anchor计算
  • (BFS)hdoj2377-Bus Pass
  • (day18) leetcode 204.计数质数
  • (分布式缓存)Redis持久化
  • (解决办法)ASP.NET导出Excel,打开时提示“您尝试打开文件'XXX.xls'的格式与文件扩展名指定文件不一致
  • (九)c52学习之旅-定时器
  • (论文阅读40-45)图像描述1
  • (每日持续更新)jdk api之FileReader基础、应用、实战
  • (转)使用VMware vSphere标准交换机设置网络连接
  • .NET Framework、.NET Core 、 .NET 5、.NET 6和.NET 7 和.NET8 简介及区别
  • .NET MVC第三章、三种传值方式
  • .NET 的静态构造函数是否线程安全?答案是肯定的!
  • .NET/C# 阻止屏幕关闭,阻止系统进入睡眠状态
  • .Net的C#语言取月份数值对应的MonthName值
  • .net实现客户区延伸至至非客户区
  • .考试倒计时43天!来提分啦!
  • @for /l %i in (1,1,10) do md %i 批处理自动建立目录