当前位置: 首页 > news >正文

Loss上升,精度却也上升?

1、情况说明

在训练中遇到了下图验证集损失先降后升,这是典型的过拟合,但是此时验证集精度却仍然在上升(直觉认为Loss上升变差应当精度下降变差),这种反直觉的现象引发了思考

在这里插入图片描述

2、分析

首先说的比较详细的是这篇博客深度学习相关问题的记录:验证集loss上升,准确率却上升,其实原理也很简单,比如你的BatchSize=5,其中有1个错了,那么你的精度为80%,但是如果错了的这个输出非常离谱计算出来的Loss很大(比如[0.000001,0.2,0.33339,0.2,0.2]和[1,0,0,0,0]这个输出虽然错误了,但是根据0.00001和1计算出的Loss却会很大)(也就是数据集中存在hard case导致突变),那么5个Loss的均值Loss也就很大。反之如果有2个错了,但是输出和正确的差一丢丢,计算出来的Loss可能比较小,平均Loss也就比较小。所以可以看出Loss和精度并非强相关联系。而且如果你设计的Loss不同,那么更有可能出现或者避免这种现象。

综上,Loss只是指导模型优化的指标,而不是模型性能的指标,所以要看模型效果,到底怎么样:看精度不看Loss

3、解决办法(只是收集,未验证)

  • Droupout太猛了:训练时加了dropout后train loss正常下降,解决了过拟合,但是验证时没有dropout层,Loss就慢慢上升了,也就是在训练和验证时区别太大。

对于Val Loss先降后升,其实就是针对过拟合的解决办法:

  • 增加训练样本
  • 增加正则项系数权重,减小过拟合
  • 加入早停机制,ValLoss上升几个epoch直接停止
  • 采用Focal Loss
  • 加入Label Smoothing

4、引用

  • https://www.cnblogs.com/emanlee/p/14815390.html
  • https://www.zhihu.com/question/291369144
  • 我们真的需要把训练集的损失降低到零吗?

相关文章:

  • 【Linux---06】远程登陆 「ssh登陆 | Xshell登陆 | 上传下载文件」
  • 基于阶梯式Tent混沌和模拟退火的樽海鞘群算法
  • 【Linux 基础笔记】(二)
  • 关于gdb调试: 你的问题可能会在这里找到答案
  • J9数字论:什么是Web3.0概念?
  • MediaCodec_Analyze-1-create
  • vue3中<script setup> 和 setup函数的区别
  • c语言进阶 数据的存储(上)
  • A8.2022年全国数学建模竞赛 B题-赛题分析与讨论
  • Vue指令总结
  • 离开二线城市石家庄(勉强算二线吧)去北漂,入职外包测试岗一个月想辞职了~
  • 瑞康医药与亚马逊云科技达成战略合作,全国上百家子公司业务上云
  • 内存取证工具Volatility学习
  • MySQL 中的排序在底层是怎样实现的呢?
  • HID 异步访问和同步访问
  • [ JavaScript ] 数据结构与算法 —— 链表
  • Android组件 - 收藏集 - 掘金
  • Apache Zeppelin在Apache Trafodion上的可视化
  • js中forEach回调同异步问题
  • vagrant 添加本地 box 安装 laravel homestead
  • VirtualBox 安装过程中出现 Running VMs found 错误的解决过程
  • Vue UI框架库开发介绍
  • VuePress 静态网站生成
  • 从 Android Sample ApiDemos 中学习 android.animation API 的用法
  • 机器学习学习笔记一
  • 前端自动化解决方案
  • 什么是Javascript函数节流?
  • 使用API自动生成工具优化前端工作流
  • 为视图添加丝滑的水波纹
  • 原生js练习题---第五课
  • Linux权限管理(week1_day5)--技术流ken
  • scrapy中间件源码分析及常用中间件大全
  • 蚂蚁金服CTO程立:真正的技术革命才刚刚开始
  • !!java web学习笔记(一到五)
  • # 数据结构
  • #define、const、typedef的差别
  • (2022版)一套教程搞定k8s安装到实战 | RBAC
  • (32位汇编 五)mov/add/sub/and/or/xor/not
  • (HAL)STM32F103C6T8——软件模拟I2C驱动0.96寸OLED屏幕
  • (附源码)springboot人体健康检测微信小程序 毕业设计 012142
  • (十三)Flask之特殊装饰器详解
  • (五)MySQL的备份及恢复
  • (一)认识微服务
  • (原創) 物件導向與老子思想 (OO)
  • (转)Android学习笔记 --- android任务栈和启动模式
  • (转)大道至简,职场上做人做事做管理
  • ***通过什么方式***网吧
  • *上位机的定义
  • .【机器学习】隐马尔可夫模型(Hidden Markov Model,HMM)
  • .Net Core缓存组件(MemoryCache)源码解析
  • .net redis定时_一场由fork引发的超时,让我们重新探讨了Redis的抖动问题
  • .net安装_还在用第三方安装.NET?Win10自带.NET3.5安装
  • .Net高阶异常处理第二篇~~ dump进阶之MiniDumpWriter
  • .NET命令行(CLI)常用命令
  • .NET使用存储过程实现对数据库的增删改查