当前位置: 首页 > news >正文

深度学习:记一次由model.train() 引发的模型训练效果变差事故

记一次由model.train() 引发的模型训练效果变差事故

详情说明

在参考多份github代码复现深度学习模型时,完成后发现模型可以正常跑起来,但效果和模型原始论文效果差距有点大。

  • 【❌】一开始以为是模型使用最新的torch函数导致的错误,然后将直接使用参考的模型代码,但结果还是有问题。
  • 【❌】发现数据集使用的处理版本不一样,改为原始论文的数据集。但实验结果还是有问题。
  • 【❌】发现计算acc方式不一致,切换后发现结果没有变化,还是有问题。
  • 【✌️】排除以上因素后,只能是训练代码有问题了,经过一步步替换代码,原来是 model.train() 位置放错误了,应该放在epoch循环里面的。如果放在外面,因为每次epoch评估模型时都使用model.eval(),导致 model.train()只起一次作用。

样例

错误

model.train()
for epoch in range(epochs):# xxx 模型运行和反向传播# 模型评估evaluate(model, data)def evaluate(model, data):model.eval()# xxx 模型测试	

正确

for epoch in range(epochs):model.train()# xxx 模型运行和反向传播# 模型评估evaluate(model, data)def evaluate(model, data):model.eval()# xxx 模型测试	

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 纯手工在内网部署一个Docker私有仓库
  • 【RISC-V设计-09】- RISC-V处理器设计K0A之CIC
  • android10 系统定制:增加应用锁功能
  • DS1302实时时钟(51单片机)
  • Flink cdc正确打开方式(flink on yarn)
  • Kotlin 和 Java区别
  • Netty学习笔记01--出入站处理器顺序
  • 学习记录702@计算机组成原理之计算机硬件组成细化
  • FFmpeg源码:av_packet_move_ref、av_packet_make_refcounted函数分析
  • C语言典型例题32
  • ElementUI修改主题色
  • 【Pytorch】topk函数
  • Postgresql导入矢量数据
  • LVS详细配置
  • javacpp使用入门
  • 9月CHINA-PUB-OPENDAY技术沙龙——IPHONE
  • 【翻译】babel对TC39装饰器草案的实现
  • 【腾讯Bugly干货分享】从0到1打造直播 App
  • canvas 绘制双线技巧
  • create-react-app做的留言板
  • CSS3 变换
  • ES6核心特性
  • js ES6 求数组的交集,并集,还有差集
  • Web标准制定过程
  • 安装python包到指定虚拟环境
  • 闭包--闭包之tab栏切换(四)
  • 从0实现一个tiny react(三)生命周期
  • 读懂package.json -- 依赖管理
  • 罗辑思维在全链路压测方面的实践和工作笔记
  • 每天一个设计模式之命令模式
  • 前端临床手札——文件上传
  • 使用Swoole加速Laravel(正式环境中)
  • 小程序、APP Store 需要的 SSL 证书是个什么东西?
  • 在weex里面使用chart图表
  • 3月27日云栖精选夜读 | 从 “城市大脑”实践,瞭望未来城市源起 ...
  • PostgreSQL 快速给指定表每个字段创建索引 - 1
  • 教程:使用iPhone相机和openCV来完成3D重建(第一部分) ...
  • ​必胜客礼品卡回收多少钱,回收平台哪家好
  • # 消息中间件 RocketMQ 高级功能和源码分析(七)
  • #include
  • #数据结构 笔记一
  • #我与虚拟机的故事#连载20:周志明虚拟机第 3 版:到底值不值得买?
  • %3cscript放入php,跟bWAPP学WEB安全(PHP代码)--XSS跨站脚本攻击
  • (02)Cartographer源码无死角解析-(03) 新数据运行与地图保存、加载地图启动仅定位模式
  • (C语言)二分查找 超详细
  • (Redis使用系列) SpringBoot 中对应2.0.x版本的Redis配置 一
  • (阿里巴巴 dubbo,有数据库,可执行 )dubbo zookeeper spring demo
  • (附源码)计算机毕业设计ssm基于Internet快递柜管理系统
  • (精确度,召回率,真阳性,假阳性)ACC、敏感性、特异性等 ROC指标
  • (考研湖科大教书匠计算机网络)第一章概述-第五节1:计算机网络体系结构之分层思想和举例
  • (排序详解之 堆排序)
  • (三)c52学习之旅-点亮LED灯
  • (三)Kafka 监控之 Streams 监控(Streams Monitoring)和其他
  • (十八)devops持续集成开发——使用docker安装部署jenkins流水线服务
  • (四)Tiki-taka算法(TTA)求解无人机三维路径规划研究(MATLAB)