当前位置：首页 > news >正文

机器学习神器:GBDT,XGBOOST

news 来源：原创 2024/5/6 16:22:27

AdaBoost原理
原始的AdaBoost算法是在算法开始的时候，为每一个样本赋上一个权重值，初始的时候，大家都是一样重要的。在每一步训练中得到的模型，会使得数据点的估计有对有错，我们就在每一步结束后，增加分错的点的权重，减少分对的点的权重，这样使得某些点如果老是被分错，那么就会被“重点关注”，也就被赋上一个很高的权重。然后等进行了N次迭代（由用户指定），将会得到N个简单的分类器（basic learner），然后我们将它们组合起来（比如说可以对它们进行加权、或者让它们进行投票等），得到一个最终的模型。

GBDT概述
GBDT（Gradient Boosting Decison Tree）中的树都是回归树，GBDT用来做回归预测，调整后也可以用于分类（设定阈值，大于阈值为正例，反之为负例），可以发现多种有区分性的特征以及特征组合。GBDT是把所有树的结论累加起来做最终结论的，GBDT的核心就在于，每一棵树学的是之前所有树结论和的残差(负梯度)，这个残差就是一个加预测值后能得真实值的累加量。比如A的真实年龄是18岁，但第一棵树的预测年龄是12岁，差了6岁，即残差为6岁。那么在第二棵树里我们把A的年龄设为6岁去学习，如果第二棵树真的能把A分到6岁的叶子节点，那累加两棵树的结论就是A的真实年龄；如果第二棵树的结论是5岁，则A仍然存在1岁的残差，第三棵树里A的年龄就变成1岁，继续学。 Boosting的最大好处在于，每一步的残差计算其实变相地增大了分错instance的权重，而已经分对的instance则都趋向于0。这样后面的树就能越来越专注那些前面被分错的instance。

相关文章：

hyperledge简要命令

chaincde shim包的方法名称及其相应功能

Got permission denied while trying to connect to the Docker daemon socket at unix:///var/run/docker.

docker重要细节

docker运行tomcat

docker启动nginx

docker中的命令

Hyperledger Fabric介绍

下载hyperledger-fabric源码

谷歌浏览器安装

docker 安装mysql8

区块链相关网站

dokcer通过 Dockerfile 构建部署tomcat图文详解

SOLID原则

json注意事项

【跃迁之路】【733天】程序员高效学习方法论探索系列（实验阶段490-2019.2.23）...

android高仿小视频、应用锁、3种存储库、QQ小红点动画、仿支付宝图表等源码...

FineReport中如何实现自动滚屏效果

iOS仿今日头条、壁纸应用、筛选分类、三方微博、颜色填充等源码

JavaScript类型识别

MySQL Access denied for user 'root'@'localhost' 解决方法

react 代码优化(一) ——事件处理

React系列之 Redux 架构模式

UEditor初始化失败（实例已存在，但视图未渲染出来，单页化）

猴子数据域名防封接口降低小说被封的风险

技术发展面试

简单实现一个textarea自适应高度

来，膜拜下android roadmap，强大的执行力

前端自动化解决方案

实现菜单下拉伸展折叠效果demo

思否第一天

我的zsh配置, 2019最新方案

一份游戏开发学习路线

云大使推广中的常见热门问题

回归生活：清理微信公众号

sokit v1.3抓手机应用socket数据包： Socket是传输控制层协议，WebSocket是应用层协议。

人工智能之父图灵诞辰纪念日，一起来看最受读者欢迎的AI技术好书

业务双活的数据切换思路设计（下）

#Linux（Source Insight安装及工程建立）

#Lua：Lua调用C++生成的DLL库

#WEB前端（HTML属性）

${factoryList }后面有空格不影响

$GOPATH/go.mod exists but should not goland

(04)odoo视图操作

（Java实习生）每日10道面试题打卡——JavaWeb篇

(Spark3.2.0)Spark SQL 初探：使用大数据分析2000万KF数据

（附源码）springboot码头作业管理系统毕业设计 341654

(附源码)计算机毕业设计SSM智能化管理的仓库管理

（九）信息融合方式简介

（算法）前K大的和

（一）Linux+Windows下安装ffmpeg

（一）SpringBoot3---尚硅谷总结

(转)C语言家族扩展收藏 (转)C语言家族扩展

(转)Linq学习笔记

(转)linux自定义开机启动服务和chkconfig使用方法