当前位置: 首页 > news >正文

北京交通大学《深度学习》专业课,实验3卷积、空洞卷积、残差神经网络实验

一、实验要求

1. 二维卷积实验(平台课与专业课要求相同)

⚫ 手写二维卷积的实现,并在至少一个数据集上进行实验,从训练时间、预测精 度、Loss变化等角度分析实验结果(最好使用图表展示)

⚫ 使用torch.nn实现二维卷积,并在至少一个数据集上进行实验,从训练时间、 预测精度、Loss变化等角度分析实验结果(最好使用图表展示)

⚫ 不同超参数的对比分析(包括卷积层数、卷积核大小、batchsize、lr等)选其 中至少1-2个进行分析

⚫ 使用PyTorch实现经典模型AlexNet并在至少一个数据集进行试验分析 (平台 课同学选做,专业课同学必做)(无GPU环境则至少实现模型)

⚫ 使用实验2中的前馈神经网络模型来进行实验,并将实验结果与卷积模型结果 进行对比分析(选作)

2. 空洞卷积实验(专业课)

⚫ 使用torch.nn实现空洞卷积,要求dilation满足HDC条件(如1,2,5)且要 堆叠多层并在至少一个数据集上进行实验,从训练时间、预测精度、Loss 变化等角度分析实验结果(最好使用图表展示)

⚫ 将空洞卷积模型的实验结果与卷积模型的结果进行分析比对,训练时间、 预测精度、Loss变化等角度分析

⚫ 不同超参数的对比分析(包括卷积层数、卷积核大小、不同dilation的选择, batchsize、lr等)选其中至少1-2个进行分析(选做) 

3. 残差网络实验(专业课)

⚫ 实现给定结构的残差网络,在 至少一个数据集上进行实验, 从训练时间、预测精度、Loss 变化等角度分析实验结果(最 好使用图表展示)

⚫ 将残差网络与空洞卷积相结合, 在至少一个数据集上进行实验, 从训练时间、预测精度、Loss 变化等角度分析实验结果(最 好使用图表展示) (选做) 

二、源代码

见资源“北京交通大学《深度学习》专业课,实验3卷积神经网络、空洞卷积、残差神经网络实验”

三、实验问题

问题一: 变形函数无法使用

教学视频中对图片进行变形时使用的代码——Image.ANTIALIAS报错

解决办法:更换新代码 ——Image.Resampling.LANCZOS

问题二: 记录测试时间时函数无法使用

解决办法:在python3.8中,time模块下不支持clock,更换新代码——time.perf_counter()

问题三: 显存爆炸

在不断调整参数时,突然出现报错:

RuntimeError: CUDA out of memory. Tried to allocate 20.00 MiB (GPU 0; 4.00 GiB total capacity; 2.44 GiB already allocated; 0 bytes free; 2.45 GiB reserved in total by PyTorch)

解决办法:在执行代码前输入释放显存:

if hasattr(torch.cuda, 'empty_cache'):torch.cuda.empty_cache()

补充: 此方法不一定生效!

大概率是因为实验机器性能问题,也就是显卡不够用了。。。

此时更有效的办法是降低参数量,或者简单粗暴的换更好的显卡。

 问题四: 设置卷积核参数

训练输入的样本和分类对象是已定的。

训练的深度(隐藏层的层数)和卷积核 (神经元)的数量、大小都是训练前根据经验设定的。 

如果训练参数设置不合理会导致过拟合或者欠拟合!!

卷积网络也可以通过误差反向传播算法来进行参数学习,参数为卷积核中权重以及偏置

即在训练过程中,网络会自动调整卷积核的参数,使得输出特征最优化。

同时,卷积神经网络也可以使用预训练模型来初始化卷积核的参数,以加速网络的训练过程。预训练模型可以使用已经在大规模数据上训练好的模型参数,这些参数已经学习到了一些通用的特征,可以在新的任务中进行微调,以提高网络的性能。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 基于trace_id实现SpringCloudGateway网关的链路追踪
  • 比较 WordPress 、 Baklib 和 BetterDocs
  • Qt开发网络嗅探器02
  • webSocket模块组件
  • 八股文之java基础
  • python大小写转换、驼峰大小写转换
  • NodeJS系列面试题
  • SwiftUI 5.0(iOS 17)滚动视图的滚动目标行为(Target Behavior)解惑和实战
  • Quectel EM05-CE 模块测试
  • VScode通过Graphviz插件和dot文件绘制层次图,导出svg
  • 前端面试题整理
  • 揭开黑箱:目标检测中可解释性的重要性与实现
  • kail-linux如何使用NAT连接修改静态IP
  • Java面试题系列 - 第17天
  • FreeRTOS的互斥锁(互斥信号量)使用
  • crontab执行失败的多种原因
  • egg(89)--egg之redis的发布和订阅
  • EOS是什么
  • input的行数自动增减
  • java多线程
  • Java知识点总结(JavaIO-打印流)
  • java中的hashCode
  • Js基础——数据类型之Null和Undefined
  • JS数组方法汇总
  • Python_OOP
  • unity如何实现一个固定宽度的orthagraphic相机
  • ViewService——一种保证客户端与服务端同步的方法
  • Vue.js源码(2):初探List Rendering
  • 从零开始的无人驾驶 1
  • 利用阿里云 OSS 搭建私有 Docker 仓库
  • 在Unity中实现一个简单的消息管理器
  • 智能合约Solidity教程-事件和日志(一)
  • puppet连载22:define用法
  • #include<初见C语言之指针(5)>
  • #宝哥教你#查看jquery绑定的事件函数
  • (3)nginx 配置(nginx.conf)
  • (Redis使用系列) SpringBoot中Redis的RedisConfig 二
  • (solr系列:一)使用tomcat部署solr服务
  • (附源码)基于SSM多源异构数据关联技术构建智能校园-计算机毕设 64366
  • (介绍与使用)物联网NodeMCUESP8266(ESP-12F)连接新版onenet mqtt协议实现上传数据(温湿度)和下发指令(控制LED灯)
  • (十五)devops持续集成开发——jenkins流水线构建策略配置及触发器的使用
  • (收藏)Git和Repo扫盲——如何取得Android源代码
  • (一)基于IDEA的JAVA基础12
  • (终章)[图像识别]13.OpenCV案例 自定义训练集分类器物体检测
  • (转)菜鸟学数据库(三)——存储过程
  • ***详解账号泄露:全球约1亿用户已泄露
  • *++p:p先自+,然后*p,最终为3 ++*p:先*p,即arr[0]=1,然后再++,最终为2 *p++:值为arr[0],即1,该语句执行完毕后,p指向arr[1]
  • .md即markdown文件的基本常用编写语法
  • .NET / MSBuild 扩展编译时什么时候用 BeforeTargets / AfterTargets 什么时候用 DependsOnTargets?
  • .NET C# 使用GDAL读取FileGDB要素类
  • .NET Framework .NET Core与 .NET 的区别
  • .NET/C# 编译期间能确定的相同字符串,在运行期间是相同的实例
  • .net8.0与halcon编程环境构建
  • ??如何把JavaScript脚本中的参数传到java代码段中
  • @RequestMapping 的作用是什么?