当前位置: 首页 > news >正文

【机器学习】过拟合和欠拟合怎么判断,如何解决?(面试回答)

过拟合和欠拟合怎么判断,如何解决?

(1)判断:训练集误差和验证集误差,从而判断算法达到什么效果

  • 训练误差大和验证误差都大,是欠拟合
  • 训练误差和验证误差差不多,都较低,是适度拟合
  • 训练误差小,验证误差大,是过拟合

(2)过拟合的解决方法

  • 数据集角度

    • 增加样本量
    • 数据集扩增
    • 原有数据加随机噪声

    • 重采样

  • 特征角度

    • 特征选择

    • 特征降维

  • 模型角度

    • 降低模型复杂度

    • 正则化 ,正则化正是通过在损失函数上添加额外的参数稀疏性惩罚项(正则项),来限制网络的稀疏性,以此约束网络的实际容量,从而防止模型出现过拟合。L1正则化是将权值的绝对值之和加入损失函数,使得权值中0值比重增大,因此得到的权值较为稀疏。L2正则化是将权重的平方之和加入损失函数,使得权值分布更加平均,所以权值较为平滑。

    • Dropout舍弃,在深度学习网络的训练过程中,对于神经网络单元,按照一定的概率将其暂时从网络中丢弃,使得每次训练的网络结构多样。

  • 训练角度

    • 早停止,如在训练中多次迭代后发现模型性能没有显著提高就停止训练

    • 交叉验证

(3)欠拟合的解决方法

  1. 增加新特征,可以考虑加入进特征组合、高次特征,来增大假设空间,添加多项式特征
  2. 减少正则化参数,正则化的目的是用来防止过拟合的,但是模型出现了欠拟合,则需要减少正则化参数
  3. 使用非线性模型,比如核SVM 、决策树、深度学习等模型
  4. 使用集成学习方法,如Bagging ,将多个弱学习器Bagging

相关文章:

  • 2022年数模国赛冲刺之模型复习2
  • 程序包lombok不存在,纠正网上错误答案
  • css知识点总结
  • 【Rust日报】2022-08-29 RLS 谢幕
  • 【Python黑科技】图片太大不能上传?三种压缩图片大小的方法(代码注释详细)
  • hadoop生态圈面试精华之Yarn
  • 阿里云:加大NoSQL数据库软硬件一体化技术自研
  • 机构用户注册/登录的设计
  • 面向对象-多态
  • C语言高级教程-C语言数组(二)
  • 【JS】JavaScript入门笔记第三弹~
  • 关于写文章怎样才能制作出优质封面?看完这篇博客就够了(数千字手把手教学)
  • nodejs 模块
  • lLinux环境变量
  • 基于SD卡的嵌入式Linux系统镜像制作
  • Google 是如何开发 Web 框架的
  • python3.6+scrapy+mysql 爬虫实战
  • [ 一起学React系列 -- 8 ] React中的文件上传
  • C语言笔记(第一章:C语言编程)
  • electron原来这么简单----打包你的react、VUE桌面应用程序
  • ERLANG 网工修炼笔记 ---- UDP
  • Flannel解读
  • Fundebug计费标准解释:事件数是如何定义的?
  • Gradle 5.0 正式版发布
  • Java 最常见的 200+ 面试题:面试必备
  • java取消线程实例
  • mysql 5.6 原生Online DDL解析
  • Python 反序列化安全问题(二)
  • React16时代,该用什么姿势写 React ?
  • 动态规划入门(以爬楼梯为例)
  • 排序(1):冒泡排序
  • 跳前端坑前,先看看这个!!
  • 学习笔记TF060:图像语音结合,看图说话
  • 一起来学SpringBoot | 第十篇:使用Spring Cache集成Redis
  • 译米田引理
  • 云大使推广中的常见热门问题
  • 正则与JS中的正则
  • mysql 慢查询分析工具:pt-query-digest 在mac 上的安装使用 ...
  • Prometheus VS InfluxDB
  • 阿里云API、SDK和CLI应用实践方案
  • 选择阿里云数据库HBase版十大理由
  • # Python csv、xlsx、json、二进制(MP3) 文件读写基本使用
  • #Java第九次作业--输入输出流和文件操作
  • #在线报价接单​再坚持一下 明天是真的周六.出现货 实单来谈
  • (C#)获取字符编码的类
  • (iPhone/iPad开发)在UIWebView中自定义菜单栏
  • (java版)排序算法----【冒泡,选择,插入,希尔,快速排序,归并排序,基数排序】超详细~~
  • (三)docker:Dockerfile构建容器运行jar包
  • (五)关系数据库标准语言SQL
  • (转载)微软数据挖掘算法:Microsoft 时序算法(5)
  • .java 指数平滑_转载:二次指数平滑法求预测值的Java代码
  • .NET 8 中引入新的 IHostedLifecycleService 接口 实现定时任务
  • .NET大文件上传知识整理
  • .project文件
  • .vue文件怎么使用_vue调试工具vue-devtools的安装